Elementi di Psicometria con Laboratorio di SPSS 1
04-Grafici delle distribuzioni vers. 1.0 (17 ottobre 2014)
Germano Rossi1
germano.rossi@unimib.it
1Dipartimento di Psicologia, Università di Milano-Bicocca
2014-2015
Istogramma vs curva
−4 −2 0 2 4
0.00.10.20.30.40.50.6
x
Probabilità
Curva normale con M=0 (sd=1)
Forme di distribuzione
la forma grafica della distribuzione permette di identificare alcune sue caratteristiche
i picchi rappresentano i valori più frequenti
si classificano in unimodali, bimodali e multimodali
si identificano facilmente le distribuzioni simmetriche o vicino alla simmetria
Una particolare curva simmetrica con forma a campana è chiamata “normale” o “gaussiana”
Gaussianaperché studiata da Gauss
Normaleperché moltissime misurazioni di eventi fisici e/o naturali si distribuiscono con questa forma, che diventa un punto di riferimento in tutta la statistica
Possibili forme di distribuzione
A, B e C sono simmetriche; C è bimodale; le altre sono asimmetriche
Curva normale
−4 −2 0 2 4
0.00.10.20.30.40.50.6
x
Probabilità
Curva normale con M=0 (sd=1) è una “famiglia” di curve
è simmetria
ha la forma “a campana”
l’altezza cambia in base alla dev st
la dev st corrisponde al punto di flesso
media, mediana e moda coincidono
la più usata è la normale standardizzata (media=0;
ds=1)
Curva normale e analisi dei dati
la curva normale non è universale ma molte distribuzioni si approssimano
i teorici hanno sviluppato molte tecniche statistiche basandosi sull’assunzione che le distribuzioni dei punteggi abbiano forma a campana, o normale
tecniche che possono essere applicate anche a dati con forma di campana molto approssimativa, senza che questo sia causa di una eccessiva inaccuratezza
però, quanto una variabile può allontanarsi dalla normalità?
Quanto è normale una variabile?
non è sempre necessario che una variabile si distribuisca in modo perfettamente normale
ma esistono indici statistici che ci danno informazioni sulla normalità
asimmetria(oskewness): quanto la curva dei nostri dati è diversa dalla perfetta simmetria della normale
curtosi(okurtosis): quanto la curva dei nostri dati è più piatta o più acuta di quella della normale
Asimmetria
L’asimmetria è data da
(P Xi− X)3 (N − 1)s3
ed è pari a 0 se la distribuzione è perfettamente normale Un valore positivo indica
un accumulo di valori a destra, quindi sopra la media media e mediana hanno valori inferiori rispetto alla moda Un valore negativo indica
un accumulo di valori a sinistra, quindi sotto la media media e mediana hanno valori superiori rispetto alla moda
Curtosi
La curtosi è calcolata tramite
(P Xi− X)4 (N − 1)s4
ed è pari a 3 se la distribuzione è perfettamente normale;
di solito si sottrae 3, in modo da ottenere 0 Un valore positivo indica
un accumulo di valori attorno alla media una deviazione standard piccola
la curva è più stretta e acuta (leptocurtica) della normale Un valore negativo indica
una maggiore dispersione di valori attorno alla media una deviazione standard grande
la curva è più larga e piatta (platicurtica) della normale
Percentili
Oltre ad una distribuzione di frequenza possiamo fare una distribuzione di frequenza cumulativa
Nella frequenza cumulata, il valore indica tutti i valori minori o uguali a (≤)
Se trasformiamo le frequenze in percentuali e usiamo le % cumulative, possiamo usare ipercentili
Ipercentilisono il punteggio che (se incluso) corrisponde ad una certa percentuale.
Percentili
Soddisfazione
f % % cumulata
0 6 ,5 ,5
1 67 5,4 5,9
2 82 6,6 12,6
3 167 13,5 26,1
4 138 11,2 37,2
5 243 19,7 56,9
6 177 14,3 71,3
7 110 8,9 80,2
8 141 11,4 91,6
9 38 3,1 94,7
10 66 5,3 100,0
Totale 1235 100,0
il 25mo percentile corrisponde al valore 3 e così via
In realtà, questa è un’approssimazione
se usiamo il 3, il vero percentile che corrisponde a ≤ 3 è 26,1 I percentili si utilizzano spesso con gli strumenti psicologici standardizzati (i “test psicologici”) Nei manuali del loro utilizzo vengono in genere riportati i valori corrispondenti ai percentili 5, 10, 25, 50, 75, 90, 95