20 novembre 2014

Astrologia e statistica. 10^ parte.

Ora passiamo al calcolo della posizione interquartile su scala ordinale. In questo tipo di scala abbiamo i dati ordinati appunto in base a un giudizio. Facciamo come al solito un esempio usando il solito gruppo di astrologi di 52 elementi, che questa volta viene valutato a un esame in base a una scala non numerica:

voto               frequenza          freq.cum.
scarso             15                     15            
mediocre         2                      17
insufficiente    7                      24
sufficiente       6                      30
discreto          15                     45
buono              5                      50
ottimo             2                      52
Vediamo di calcolare la differenza interquartile, dunque tra Q1 e Q3
52x1/4 (primo quartile)=13
52x3/4 (terzo quartile)= 39
39-13=26. La posizione interquartile è il voto insufficiente perché il numero 26 è compreso nella frequenza cumulata che va da 24 a 30. 

Per quanto concerne invece una scala metrica, composta da 9 astrologi che devono rispondere esattamente a 20 domande, vediamo come calcolare la posizione interquartile. 

soggetto    risposte esatte  
1                1                     
2                6                    risultato primo quartile 6,5 dato dalla media tra 6 e 7 
3                7
4                8                    
5                9                     
6               10
7               15                   risultato terzo quartile 17 dato dalla media tra 19 e 15
8               19
9               20                

Calcoliamo il primo quartile:
(9+1)x1/4=2,5
Calcoliamo il terzo quartile: 
(9+1)x3/4=7,5
si fa la differenza tra le frequenze cumulate delle colonne relative al valore di 2,5 (6) e 7,5 (15)
Quindi primo quartile: 7-6x0,5+6=6,5
e terzo quartile: 19-15x0,5+15=17
Q1=7,5
Q3=21
17-6,5=10,5

Ora invece passiamo ad altri calcoli. Parliamo dello scostamento semplice medio SSM che serve a stabilire quanto in media, ogni valore si discosta dalla media totale. 
Usiamo sempre lo stesso esempio di poco fa. Abbiamo il numero totale dei partecipanti che è 9 mentre la media è 10,5 che corrisponde alla posizione interquartile data dalla differenza tra Q3 e Q1 come abbiamo visto poc'anzi. 
Si procede a stabilire lo scarto esistente tra la media e ogni punteggio ottenuto. 

10,5-1=9,5
10,5-6=4,5
10,5-7=3,5
10,5-8=2,5
10,5-9=1,5
10,5-10=0,5
15-10,5=4,5
19-10,5=8,5
20-10,5=9,5
A questo punto si procede con la sommatoria di tutti i punteggi: 


e poi si fraziona tutto per il numero delle osservazioni (in questo caso sono 9 partecipanti)
44,5/9=4,94 che possiamo approssimare a 5.
In alternativa a questo calcolo abbiamo la varianza che è un indice più informativo e che consiste nell'elevare al quadrato gli scarti dalla media ottenuti con la devianza e quindi sommare i risultati e poi frazionarli per il numero delle osservazioni. 

La devianza viene indicata con SS che è l'acronimo di sum of square, cioè la somma dei quadrati, che appunto sta nell'elevazione al quadrato di ogni punteggio risultante tra il punteggio grezzo meno la media. I punteggi grezzi erano: 1, 6, 7, 8, 9, 10, 15, 19, 20. La media 10,5
10,5-1=9,5²=90,25
10,5-6=4,5²=20,25
10,5-7=3,5²=12,25
10,5-8=2,5²=6,25
10,5-9=1,5²=2,25
10,5-10=0,5²=0,25
15-10,5=4,5²=20,25
19-10,5=8,5²=72,25
20-10,5=9,5²=90,25
Se naturalmente tutti i valori sono uguali alla media e ovvio che la somma dei quadrati dei valori che si discostano dalla media stessa porta a zero (infatti non esisterebbe scostamento dal valore medio). È sottinteso che si fraziona il risultato per il numero di osservazioni. Naturalmente possiamo confrontare questo scostamento a quello che otterremmo da un test eseguito sugli stessi soggetti a un'altra prova. 

Il risultato è SS= 314,25
Per ottenere la varianza bisogna frazionare la devianza al numero delle osservazioni: 314,25/9= 34,91667
Il simbolo è s² 
s² = 34,91667 che corrisponde alla media dei quadrati degli scarti dalla media.

Si estrae la radice quadrata alla varianza per così ottenere la deviazione standard (scarto quadratico medio). In definitiva serve a comprendere quanto mediamente i dati osservati si discostano dalla media non ragionando più in termini di quadrati. Il simbolo è s  σ

Procediamo con l'esempio degli stessi voti elevati a potenza e sommati tra loro, e poi applichiamo la radice quadrata a quel risultato: 

s=34,91667=5,90903 (approssimiamo a 6)

Però è possibile ottenere lo stesso risultato con una formula "abbreviante" in cui si prendono tutti i punteggi grezzi 1, 6, 7, 8, 9, 10, 15, 19, 20,  e si elevano al quadrato: 1x1+6x6+7x7+8x8+9x9+10x10+15x15+19x19+20x20=1+36+49+64+81+100+225+361+400=1317 che si fraziona al numero dei casi: 9
1317/9=146,33333

A questo risultato si sottrae la media al quadrato: 10,5x10,5= 110,25 
146,33333-110,25=36,09333
 Da questo risultato si estrae la radice quadrata. Vediamo:

            1317
  s=   _____- (10,5x10,5)= 146,333-110,25=6 e qualcosa...
              9