Elementi di Psicometria con Laboratorio di SPSS 1
05-Deviazione standard e punteggi z vers. 1.1 (22 ottobre 2014)
Germano Rossi1
1Dipartimento di Psicologia, Università di Milano-Bicocca
2014-2015
Introduzione
Per le variabili quantitative usiamo delle unità di misura (anni, numero di errori. . . )
I punteggi grezzi (ciò che abbiamo misurato) sono semplici da interpretare se conosciamo la scala su cui sono misurati (i metri, i gradi centigradi e simili)
Non sono facili da interpretare se usano scale non conosciute (ad es. intervallo 6-36 oppure 30-180)
Variabili diverse possono usare unità diverse (età,
soddisfazione. . . ) con metriche diverse (età -> 0-n; soddisfazione -> 0-10, . . . ) che possono cambiare da una cultura all’altra (kg o libbre, km o miglia, . . . )
Introduzione
Non sono molto utili neppure per confrontare fra loro variabili diverse: un 25 in un test di abilità matematica (AM) è migliore o peggiore di un 55 in un test di abilità verbale (AV)?
Dipende dalle relative scale:
se AM ha un range 1-30 e AV un range 10-60
entrambi i punteggi sono abbastanza vicini al valore massimo Ma uno è “migliore” dell’altro?
Introduzione
Nella vita reale, le unità di misura sono già un’enorme semplificazione della nostra vita
Confrontare variabili diverse fra loro non è possibile se non usando la stessa scala di misura e lo stesso metro
È come decidere se 3 banane sono di più di 3 arance Sono cose diverse e non possiamo confrontarle
A meno di non trasformarle in una stessa unità di misura
Confrontare variabili
Ad esempio
“3 bananepesano di più di 3 arance?”
“In 3 banane cisono più vitamine che in 3 arance?”
“3 banane occupanopiù spazio di 3 arance?”
“ci sonopiù frutti di tipo ’banane’ o di tipo ’arance’?”
Ma in statistica vorremmo avere un’unica un’unità di misura che valga per misurare qualsiasi variabile
Quale potrebbe essere questa unità di misura?
Distanze dalla media
0 1 2 3 4 5 6 7 8 9 10
L’unità di misura parte da 0 e va fino a 10. Se sottraiamo 5 a tutti i punteggi otteniamo:
-5 -4 -3 -2 -1 0 +1 +2 +3 +4 +5
L’unità di misura parte da -5 e va fino a +5
Non cambia nulla, abbiamo trasformato lo zero assoluto in uno zero relativo.
La nuova unità di misura è la deviazione dalla media (x − M ); in termini più precisi è “quante unità di misura diquesta variabile, ogni punteggio dista
Deviazione standard
Non basta modificare la metrica ed esprimere tutto in base a
“quanti scarti ci sono da qui alla media”
perché ogni variabile ha una sua estensione e una sua unità di misura specifica
Anche se diciamo che “X dista 2 dalla sua media” e “Y dista 3 dalla sua media”, seX misura i chilometri e Y il peso. . . . non possiamo fare confronti.
Ma la deviazione standard è la radice quadrata della varianza
ds =√ var =
s
P(Xi− X)2 N
e se esprimiamo gli scarti in termini di distanza. . . .
Trasformazioni lineari
Abbiamo visto che se aggiungo o sottraggo una costante ad una distribuzione, la media subisce la stessa trasformazione
X =X
X ⇒X
(X + k) = X + k
per cui se io tolgo ad AM e AV la loro media, trasformo le due variabili in modo che abbiano entrambe M=0
X(X − X) = X − X = 0
Ho semplicemente spostato le misure in modo che la media di entrambe fosse 0.
Trasformazioni lineari
Adesso hanno la stessa media (zero) ma hanno ancora varianza diversa Come possiamo rendere i campi di variazione uguali?
Una prima possibilità è di dividere tutto per un determinato valore (ad es. le rispettive gamme) e poi moltiplicare tutto per uno stesso valore (ad es. 100)
Un’altra possibilità è quella di usare la deviazione standard come unità di misura
In pratica, ci chiediamo“Quante deviazioni standard ci sono fra un determinato valore X e la media?”
Variabili standardizzate
Punti z
“Quante deviazioni standard ci sono fra un determinato valore X e la media?”
La risposta implica utilizzare la deviazione standard (σ) come nuova unità di misura
Gli scarti dalla media (X − X) vengono divisi per la dev. st.:
zx= X − X σ
Il punteggio trasformato in “numero di scarti dalla media” si chiamapunto zo punteggio z
Variabili standardizzate
Punti z
Ilpunto z è una misura standard
La media dei punti z è 0 (z = 0), visto che un qualunque punteggio corrispondente alla media sarebbe a 0 scarti dalla media
La somma dei punti z è 0 (X
z = 0), perché i punti z sono scarti dalla media trasformati in modo uniforme e la somma degli scarti è 0
La deviazione standard dei punti z è 1 (σz= 1), perché la deviazione standard è l’unità di misura
Valori negativi indicano punteggi inferiori alla media Valori positivi, punteggi sopra la media
Variabili standardizzate
Punti z
Ilpunto z è una misura standard
La media dei punti z è 0 (z = 0), visto che un qualunque punteggio corrispondente alla media sarebbe a 0 scarti dalla media
La somma dei punti z è 0 (X
z = 0), perché i punti z sono scarti dalla media trasformati in modo uniforme e la somma degli scarti è 0
La deviazione standard dei punti z è 1 (σz= 1), perché la deviazione standard è l’unità di misura
Valori negativi indicano punteggi inferiori alla media Valori positivi, punteggi sopra la media
Variabili standardizzate
Punti z
Ilpunto z è una misura standard
La media dei punti z è 0 (z = 0), visto che un qualunque punteggio corrispondente alla media sarebbe a 0 scarti dalla media
La somma dei punti z è 0 (X
z = 0), perché i punti z sono scarti dalla media trasformati in modo uniforme e la somma degli scarti è 0
La deviazione standard dei punti z è 1 (σz= 1), perché la deviazione standard è l’unità di misura
Valori negativi indicano punteggi inferiori alla media Valori positivi, punteggi sopra la media
Variabili standardizzate
Punti z
Ilpunto z è una misura standard
La media dei punti z è 0 (z = 0), visto che un qualunque punteggio corrispondente alla media sarebbe a 0 scarti dalla media
La somma dei punti z è 0 (X
z = 0), perché i punti z sono scarti dalla media trasformati in modo uniforme e la somma degli scarti è 0
La deviazione standard dei punti z è 1 (σz= 1), perché la deviazione standard è l’unità di misura
Valori negativi indicano punteggi inferiori alla media Valori positivi, punteggi sopra la media
Variabili standardizzate
Punti z
Ilpunto z è una misura standard
La media dei punti z è 0 (z = 0), visto che un qualunque punteggio corrispondente alla media sarebbe a 0 scarti dalla media
La somma dei punti z è 0 (X
z = 0), perché i punti z sono scarti dalla media trasformati in modo uniforme e la somma degli scarti è 0
La deviazione standard dei punti z è 1 (σz= 1), perché la deviazione standard è l’unità di misura
Valori negativi indicano punteggi inferiori alla media
Valori positivi, punteggi sopra la media
Variabili standardizzate
Punti z
Ilpunto z è una misura standard
La media dei punti z è 0 (z = 0), visto che un qualunque punteggio corrispondente alla media sarebbe a 0 scarti dalla media
La somma dei punti z è 0 (X
z = 0), perché i punti z sono scarti dalla media trasformati in modo uniforme e la somma degli scarti è 0
La deviazione standard dei punti z è 1 (σz= 1), perché la deviazione standard è l’unità di misura
Valori negativi indicano punteggi inferiori alla media Valori positivi, punteggi sopra la media
Variabili standardizzate
Punti Z
La trasformazione in punti z, si dice anche “standardizzazione”
La distribuzione dei punti z si dice “distribuzione standardizzata”
perché è una delle tante possibili curve di frequenza, ma con media e ds conosciute a priori
I punti z permettono di confrontare fra loro punteggi provenienti da distribuzioni di frequenza diverse
Esempio
x=70, M=82, σ=12 (z=-1) x=23, M=35, σ= 6 (z=-2)
23 è 2 ds al di sotto della sua media, mentre 70 è solo 1 ds sotto la sua media; se fossero punteggi di profitto, confrontandoli, dovremmo dire 23 è un valore “peggiore” rispetto a 70 non perché è più piccolo ma perché il suo punto z è inferiore
Variabili standardizzate
Esempi d’uso dei punti z
Conoscendo media, varianza e il punto z, si può calcolare il valore di X (cioè il punto grezzo):
X = X + zxσx
Esempio
Se un test di profitto ha M=82 è σ=12, a quale punteggio corrisponde il punto z=1.2?
X = 82 + 1.2 ∗ 12 = 96.4
Variabili standardizzate
Scale derivate dai punti z
Ci sono scale standardizzate utilizzate comunemente in psicologia (specie per i test) che derivano dai punti z
punteggi T: hanno media 50 e ds=10. Si ottengono con T = 10z + 50
punteggi SAT: hanno media 500 e ds=100. Si ottengono con SAT = 100z + 500
QI o IQ: la maggior parte dei test d’intelligenza (come il WAIS) utilizza una media di 100 e ds=15. Si ottengono con
QI = 15z + 100
QI o IQ: il test d’intelligenza Stanford-Binet utilizza una media di 100 e ds=16. Si ottengono con QI = 16z + 100
Variabili standardizzate
Spss: punti z
Spss permette di calcolare i punti z di una variabile per ogni unità statistica, tramite Analizza | Statistiche descrittive
| Descrittive... e attivando il flag Salva valori standardizzati come variabili
Variabili standardizzate
Spss: punti z
Viene aggiunta una variabile con il nome corrispondente preceduto da Z
Questa variabile può essere usata come qualsiasi altra
Variabili standardizzate
Tavole della distr. normale
Nella curva normale ogni z corrisponde ad un area
L’area può essere proposta in modi diversi Ad ogni z corrisponde un’area fino a z=−∞
Fra z=−3 e z=−∞ c’è un’area del 99.87%
La tavola del vostro libro (Howitt) propone l’area per determinati
Variabili standardizzate
Tavole della distr. normale
Alcuni punti z corrispondono ad aree particolari
z=-1.64 corrisponde al 5%/95%
z=-1.96 corrisponde al 2.5%/97.5%
Variabili standardizzate
Tavole della distr. normale
La curva normale è simmetrica Quindi ogni metà è il 50%
Allontanandoci da z=0 abbiamo aree simili per z simili
z=-0.10 -> 53.98% (cioè 3.98%
sotto)
z=0.10 -> 46.02% (cioè
Variabili standardizzate
Tavole della distr. normale
z=1.64 corrisponde al 95%/5%
z=1.96 corrisponde al 97.5%/2.5%
Variabili standardizzate
Tavole della distr. normale
Altri libri riportano tavole più complete (ad es. Welkowitz, Cohen, Ewen:
Tavola A, p. 473 ss.)
La tavola riporta le proporzione di area sottese alla curva normale calcolate a partire dalla media (ricordarsi che l’intera area è simmetrica)
Per ogni punto z viene indicata l’area fra z=0 e il punto z stesso (area in grigio)
Variabili standardizzate
Tavole della distr. normale
La prima colonna indica il primo decimale del punto z, ogni colonna successiva indica il secondo decimale
All’incrocio fra una riga (ad es. 0,3) e una colonna (0,05) troviamo l’area corrispondente (ad es. 0,35)
Es. l’area fra z=0,35 e 0 è pari a 13,68
Variabili standardizzate
Esempi d’uso dei punti z
Qual è la % di soggetti con un punteggio inferiore o uguale a 120 (M=100, s=20)?
calcolo il punto z [(120-100)/20=1]
tavole della normale; cerco la riga corrispondente a z=1.0, avanzo fino alla colonna 0 e leggo l’area corrispondente [34,13]
questa è l’area fra la z=0 e z=|1|;
mi interessa anche la metà inferiore, sommo 50,00 [50,00 + 34.13 = 84.13%]
Variabili standardizzate
Esempi d’uso dei punti z
Qual è la % di soggetti con un punteggio inferiore a 80 (M=100, s=20)?
calcolo il punto z [(80-100)/20=-1]
negativo perché sotto la media tavole della normale; cerco la riga corrispondente a z 1.0, avanzo fino alla colonna 0 e leggo l’area corrispondente [34,13]
poiché questa è l’area fra la z=0 e z=|1| e mi interessa l’area inferiore, faccio il complemento [50,00 - 34,13 = 15.87%]
oppure Howitt; cerco -1.00, trovo 84.13%, ma è quella superiore, quindi 100-84.13=15.87%
Variabili standardizzate
Esempi d’uso dei punti z
Qual è la % di soggetti con punteggio compreso fra 80 e 120?
calcolo i punti z [-1 e +1]
tavole della normale; cerco la riga corrispondete al punto z 1.0, avanzo fino alla colonna 0 e leggo l’area corrispondente [34,13]
poiché questa è l’area fra la z=0 e z=|1| ed entrambe sono uguali, sommo l’area 2 volte [34,13 + 34,13 = 68.26%]
oppure Howitt; cerco 1.00, trovo
Variabili standardizzate
Esempi d’uso dei punti z
A quale punto z corrisponde l’area con il 10% di punteggi superiori?
poiché le tavole indicano l’area fra z=0 e z=x, devo trovare il resto di 10,00 [50,00-10,00=40,00]
cerco dentro le tavole una proporzione che si avvicini a 40,00. . . corrisponde a z=1.28 i punteggi il cui z è >= di 1.28, rientrano nel 10% superiore oppure Howitt; cerco un’area vicina al 10% sul lato positivo;
trovo 9.68% -> z=1.30