14 novembre 2014

Astrologia e statistica. 8^ parte.

Oggi parliamo della distribuzione dei dati in parti uguali (per esempio dobbiamo dividere 100 persone in gruppi della stessa estensione). Seguitemi nel discorso perché è molto interessante e occorre non distrarsi visto che cominciamo con dei calcoli un po' più complicati. 
La distribuzione può essere divisa in un numero di parti variabile in base alle nostre esigenze. Le suddivisioni sono dette quantili. Generalmente la divisione è in quattro parti chiamate quartili ( i tre valori che dividono in quattro parti uguali la distribuzione dei dati), o in dieci parti chiamate decili. Se dividiamo le osservazioni in 4 parti uguali ognuna costituirà il 25% delle osservazioni totali ovviamente, perché 25%x4 parti=100%

Il secondo quartile ovviamente corrisponde alla mediana dato che appunto corrisponde alla divisione in due parti uguali della distribuzione dei dati (il 50% delle osservazioni da un lato e l'altro 50% dall'altro) è naturale a questo punto che il primo quartile corrisponde al 25% dei dati rispetto al rimanente 75% costituito da tutti gli altri dati e che per ovvie ragioni, il terzo quartile corrisponde al 75% delle osservazioni totali. E' altrettanto ovvio che il quinto decile (5 su 10) corrisponde al secondo quartile, visto che divide a metà precisa il numero delle osservazioni (10/5=2). Naturale ed estremamente semplice concludere che sia il secondo quartile che il quinto decile corrispondono alla mediana di una distribuzione. Lo abbiamo visto nei primi articoli che la mediana è il punto che divide in due metà precise il numero delle osservazioni. I quartili sono indicati con la lettera Q, i decili con la D, i percentili con la P e i quintili con K. 

  
Su 7 numeri la mediana è quello che sta nel mezzo preciso, il numero 5 in questo caso, e che corrisponde al secondo quartile. Esistono anche le divisioni in terzili dove ogni rango rappresenta il 33% delle osservazioni, e i quintili dove ogni rango vale il 20%. 

In sostanza tutto questo ambaradan serve a comprendere in quale posizione (in percentuale) ricade un nostro punteggio in una determinata performance. Facciamo un esempio. Mettiamo il caso il mio voto è 6 dovendo per esempio rispondere a 10 domande. Vorrà dire che è il 75% superiore a tutti gli altri che hanno preso 3 4 o 5. Ma il 25% in meno di chi ha preso 8, naturalmente in una scala numerica che va da 3 a 8.

 In questo caso di 7 voti, la media è di 5,5 e corrisponde alla mediana, cioè precisamente al secondo quartile. 
La formula per calcolare la nostra posizione in percentuale, ossia la posizione nel quantile è:  
 (n+1)xj
_______  nel caso del quartile, dove "j" sta per il numero del quartile che si vuol cercare. 
     4
Fratto 10 nel caso del decile e fratto 100 nel percentile.
Facciamo subito una prova. 

Immaginiamo 25 astrologi che hanno sostenuto un esame e hanno preso i seguenti voti: 18, 18, 20, 20, 20, 21, 22, 22, 22, 23, 25, 25, 26, 26, 27, 27, 27, 27, 28, 28, 28, 28, 29, 30, 30.
La mediana è il numero 26, perché attorno a questo valore abbiamo la divisione in due parti precise delle osservazioni. La media risulta essere 24,68.

Vogliamo calcolare la posizione del terzo quartile. 25+1=26; 26xj = 26X3=78; 78/4=19,5 alla 19^ posizione e un mezzo, abbiamo soggetti che han preso 28. Ma si approssima alla 20^ posizione dove abbiamo ancora il voto 28. Dunque il 28 corrisponde al 75% in meglio rispetto agli altri ma il 25% in meno rispetto a chi ha preso 30.

Immaginiamo di voler calcolare il 2° decile. 25+1=26; 26x2=52; 52/10=5,2. Alla quinta posizione abbiamo il voto 20 che dunque corrisponde al secondo decile, ossia un risultato buono al 20%. Se facciamo due conti, è un voto scarso rispetto alla votazione massima, ma poco distante dal valore medio di tutte le performance.
Il discorso davvero assai semplice si complica un poco se dobbiamo invece fare il calcolo per scale divise in classi. Facciamo come al solito un esempio pratico considerando le tematiche astrologiche. Immaginiamo di voler calcolare su 52 casi come si distribuisce la posizione di Venere  nel cerchio zodiacale, dividendolo in 4 classi di 90 gradi ciascuna. 

Classe         Limite gradi          frequenza          frequenza cumulata
1                 0 - 89°                 25                      25
2                 90 - 179               18                      43
3                180 - 269               2                       45
4                270- 359                7                       52
               totale 360      n persone a classe      totale persone

Il calcolo del quantile in questo caso è dato dalla formula: totale frequenza cumulata (52) x il numero del quantile (per esempio 6) fratto il numero delle classi del quantile (10 per il decile, 4 per il quartile, 5 per il pentile etc. etc.) 

Per esempio mettiamo che vogliamo individuare il sesto decile, allora 52x6/10=31,2.
Questo valore significa che su 52 persone, 31,2 sono comprese in quello spazio che va dalla prima alla sesta parte di un gruppo diviso in dieci parti. 

Ora vediamo questi 31,2 soggetti (ossia il 60% dei 52 casi) come sono distribuiti nel cerchio zodiacale. 

Si prende il limite inferiore della classe che contiene il sesto decile. In questo caso è 89,5 (90-0,5) perché 31,2 supera la frequenza cumulata di 25 e quindi rientra nella categoria successiva, quella del 43.

Alla frequenza cumulata del limite inferiore si somma il sesto decile ossia 31,2 meno la frequenza cumulata della classe che precede il valore di 31,2 ossia 25

Il tutto si fraziona alla frequenza cumulata della classe che contiene il sesto decile, ossia 43. 

Il risultato viene poi moltiplicato per l'ampiezza della classe che contiene il sesto decile. L'ampiezza di ogni classe è di 90 gradi.

Riassumendo:
Limite inferiore della classe che contiene il sesto decile: 89,5 più
L'indice numerico del sesto decile: 31,2 meno
La frequenza cumulata della classe che precede il valore del sesto decile: 25, tutto fratto
La frequenza cumulata della classe che contiene il quantile: 43 , tutto moltiplicato per
L'ampiezza della classe: 90.

           31,2-25
89,5+ ________x90=200,3022
               43

Questa cifra indica il fatto che 31,2 persone sono raggruppate in uno spazio che va da 0 gradi a 200,3022. All'interno di questo spazio è contenuto il 60% dei 52 casi.