Elementi di Psicometria con Laboratorio di SPSS 1 05-Deviazione standard e punteggi z vers. 1.1 (22 ottobre 2014) Germano Rossi

(1)

Elementi di Psicometria con Laboratorio di SPSS 1

05-Deviazione standard e punteggi z vers. 1.1 (22 ottobre 2014)

Germano Rossi¹

[email protected]

1Dipartimento di Psicologia, Università di Milano-Bicocca

2014-2015

(2)

Introduzione

Per le variabili quantitative usiamo delle unità di misura (anni, numero di errori. . . )

I punteggi grezzi (ciò che abbiamo misurato) sono semplici da interpretare se conosciamo la scala su cui sono misurati (i metri, i gradi centigradi e simili)

Non sono facili da interpretare se usano scale non conosciute (ad es. intervallo 6-36 oppure 30-180)

Variabili diverse possono usare unità diverse (età,

soddisfazione. . . ) con metriche diverse (età -> 0-n; soddisfazione -> 0-10, . . . ) che possono cambiare da una cultura all’altra (kg o libbre, km o miglia, . . . )

(3)

Introduzione

Non sono molto utili neppure per confrontare fra loro variabili diverse: un 25 in un test di abilità matematica (AM) è migliore o peggiore di un 55 in un test di abilità verbale (AV)?

Dipende dalle relative scale:

se AM ha un range 1-30 e AV un range 10-60

entrambi i punteggi sono abbastanza vicini al valore massimo Ma uno è “migliore” dell’altro?

(4)

Introduzione

Nella vita reale, le unità di misura sono già un’enorme semplificazione della nostra vita

Confrontare variabili diverse fra loro non è possibile se non usando la stessa scala di misura e lo stesso metro

È come decidere se 3 banane sono di più di 3 arance Sono cose diverse e non possiamo confrontarle

A meno di non trasformarle in una stessa unità di misura

(5)

Confrontare variabili

Ad esempio

“3 bananepesano di più di 3 arance?”

“In 3 banane cisono più vitamine che in 3 arance?”

“3 banane occupanopiù spazio di 3 arance?”

“ci sonopiù frutti di tipo ’banane’ o di tipo ’arance’?”

Ma in statistica vorremmo avere un’unica un’unità di misura che valga per misurare qualsiasi variabile

Quale potrebbe essere questa unità di misura?

(6)

Distanze dalla media

0 1 2 3 4 5 6 7 8 9 10

L’unità di misura parte da 0 e va fino a 10. Se sottraiamo 5 a tutti i punteggi otteniamo:

-5 -4 -3 -2 -1 0 +1 +2 +3 +4 +5

L’unità di misura parte da -5 e va fino a +5

Non cambia nulla, abbiamo trasformato lo zero assoluto in uno zero relativo.

La nuova unità di misura è la deviazione dalla media (x − M ); in termini più precisi è “quante unità di misura diquesta variabile, ogni punteggio dista

(7)

Deviazione standard

Non basta modificare la metrica ed esprimere tutto in base a

“quanti scarti ci sono da qui alla media”

perché ogni variabile ha una sua estensione e una sua unità di misura specifica

Anche se diciamo che “X dista 2 dalla sua media” e “Y dista 3 dalla sua media”, seX misura i chilometri e Y il peso. . . . non possiamo fare confronti.

Ma la deviazione standard è la radice quadrata della varianza

ds =√ var =

s

P(X_i− X)² N

e se esprimiamo gli scarti in termini di distanza. . . .

(8)

Trasformazioni lineari

Abbiamo visto che se aggiungo o sottraggo una costante ad una distribuzione, la media subisce la stessa trasformazione

X =X

X ⇒X

(X + k) = X + k

per cui se io tolgo ad AM e AV la loro media, trasformo le due variabili in modo che abbiano entrambe M=0

X(X − X) = X − X = 0

Ho semplicemente spostato le misure in modo che la media di entrambe fosse 0.

(9)

Trasformazioni lineari

Adesso hanno la stessa media (zero) ma hanno ancora varianza diversa Come possiamo rendere i campi di variazione uguali?

Una prima possibilità è di dividere tutto per un determinato valore (ad es. le rispettive gamme) e poi moltiplicare tutto per uno stesso valore (ad es. 100)

Un’altra possibilità è quella di usare la deviazione standard come unità di misura

In pratica, ci chiediamo“Quante deviazioni standard ci sono fra un determinato valore X e la media?”

(10)

Variabili standardizzate

Punti z

“Quante deviazioni standard ci sono fra un determinato valore X e la media?”

La risposta implica utilizzare la deviazione standard (σ) come nuova unità di misura

Gli scarti dalla media (X − X) vengono divisi per la dev. st.:

z_x= X − X σ

Il punteggio trasformato in “numero di scarti dalla media” si chiamapunto zo punteggio z

(11)

Punti z

Ilpunto z è una misura standard

La media dei punti z è 0 (z = 0), visto che un qualunque punteggio corrispondente alla media sarebbe a 0 scarti dalla media

La somma dei punti z è 0 (X

z = 0), perché i punti z sono scarti dalla media trasformati in modo uniforme e la somma degli scarti è 0

La deviazione standard dei punti z è 1 (σ_z= 1), perché la deviazione standard è l’unità di misura

Valori negativi indicano punteggi inferiori alla media Valori positivi, punteggi sopra la media

(12)

Punti z

(13)

Punti z

(14)

Punti z

(15)

Punti z

Valori negativi indicano punteggi inferiori alla media

Valori positivi, punteggi sopra la media

(16)

Punti z

(17)

Punti Z

La trasformazione in punti z, si dice anche “standardizzazione”

La distribuzione dei punti z si dice “distribuzione standardizzata”

perché è una delle tante possibili curve di frequenza, ma con media e ds conosciute a priori

I punti z permettono di confrontare fra loro punteggi provenienti da distribuzioni di frequenza diverse

Esempio

x=70, M=82, σ=12 (z=-1) x=23, M=35, σ= 6 (z=-2)

23 è 2 ds al di sotto della sua media, mentre 70 è solo 1 ds sotto la sua media; se fossero punteggi di profitto, confrontandoli, dovremmo dire 23 è un valore “peggiore” rispetto a 70 non perché è più piccolo ma perché il suo punto z è inferiore

(18)

Esempi d’uso dei punti z

Conoscendo media, varianza e il punto z, si può calcolare il valore di X (cioè il punto grezzo):

X = X + z_xσ_x

Esempio

Se un test di profitto ha M=82 è σ=12, a quale punteggio corrisponde il punto z=1.2?

X = 82 + 1.2 ∗ 12 = 96.4

(19)

Scale derivate dai punti z

Ci sono scale standardizzate utilizzate comunemente in psicologia (specie per i test) che derivano dai punti z

punteggi T: hanno media 50 e ds=10. Si ottengono con T = 10z + 50

punteggi SAT: hanno media 500 e ds=100. Si ottengono con SAT = 100z + 500

QI o IQ: la maggior parte dei test d’intelligenza (come il WAIS) utilizza una media di 100 e ds=15. Si ottengono con

QI = 15z + 100

QI o IQ: il test d’intelligenza Stanford-Binet utilizza una media di 100 e ds=16. Si ottengono con QI = 16z + 100

(20)

Spss: punti z

Spss permette di calcolare i punti z di una variabile per ogni unità statistica, tramite Analizza | Statistiche descrittive

| Descrittive... e attivando il flag Salva valori standardizzati come variabili

(21)

Spss: punti z

Viene aggiunta una variabile con il nome corrispondente preceduto da Z

Questa variabile può essere usata come qualsiasi altra

(22)

Tavole della distr. normale

Nella curva normale ogni z corrisponde ad un area

L’area può essere proposta in modi diversi Ad ogni z corrisponde un’area fino a z=−∞

Fra z=−3 e z=−∞ c’è un’area del 99.87%

La tavola del vostro libro (Howitt) propone l’area per determinati

(23)

Tavole della distr. normale

Alcuni punti z corrispondono ad aree particolari

z=-1.64 corrisponde al 5%/95%

z=-1.96 corrisponde al 2.5%/97.5%

(24)

Tavole della distr. normale

La curva normale è simmetrica Quindi ogni metà è il 50%

Allontanandoci da z=0 abbiamo aree simili per z simili

z=-0.10 -> 53.98% (cioè 3.98%

sotto)

z=0.10 -> 46.02% (cioè

(25)

Tavole della distr. normale

z=1.64 corrisponde al 95%/5%

z=1.96 corrisponde al 97.5%/2.5%

(26)

Tavole della distr. normale

Altri libri riportano tavole più complete (ad es. Welkowitz, Cohen, Ewen:

Tavola A, p. 473 ss.)

La tavola riporta le proporzione di area sottese alla curva normale calcolate a partire dalla media (ricordarsi che l’intera area è simmetrica)

Per ogni punto z viene indicata l’area fra z=0 e il punto z stesso (area in grigio)

(27)

Tavole della distr. normale

La prima colonna indica il primo decimale del punto z, ogni colonna successiva indica il secondo decimale

All’incrocio fra una riga (ad es. 0,3) e una colonna (0,05) troviamo l’area corrispondente (ad es. 0,35)

Es. l’area fra z=0,35 e 0 è pari a 13,68

(28)

Esempi d’uso dei punti z

Qual è la % di soggetti con un punteggio inferiore o uguale a 120 (M=100, s=20)?

calcolo il punto z [(120-100)/20=1]

tavole della normale; cerco la riga corrispondente a z=1.0, avanzo fino alla colonna 0 e leggo l’area corrispondente [34,13]

questa è l’area fra la z=0 e z=|1|;

mi interessa anche la metà inferiore, sommo 50,00 [50,00 + 34.13 = 84.13%]

(29)

Esempi d’uso dei punti z

Qual è la % di soggetti con un punteggio inferiore a 80 (M=100, s=20)?

calcolo il punto z [(80-100)/20=-1]

negativo perché sotto la media tavole della normale; cerco la riga corrispondente a z 1.0, avanzo fino alla colonna 0 e leggo l’area corrispondente [34,13]

poiché questa è l’area fra la z=0 e z=|1| e mi interessa l’area inferiore, faccio il complemento [50,00 - 34,13 = 15.87%]

oppure Howitt; cerco -1.00, trovo 84.13%, ma è quella superiore, quindi 100-84.13=15.87%

(30)

Esempi d’uso dei punti z

Qual è la % di soggetti con punteggio compreso fra 80 e 120?

calcolo i punti z [-1 e +1]

tavole della normale; cerco la riga corrispondete al punto z 1.0, avanzo fino alla colonna 0 e leggo l’area corrispondente [34,13]

poiché questa è l’area fra la z=0 e z=|1| ed entrambe sono uguali, sommo l’area 2 volte [34,13 + 34,13 = 68.26%]

oppure Howitt; cerco 1.00, trovo

(31)

Esempi d’uso dei punti z

A quale punto z corrisponde l’area con il 10% di punteggi superiori?

poiché le tavole indicano l’area fra z=0 e z=x, devo trovare il resto di 10,00 [50,00-10,00=40,00]

cerco dentro le tavole una proporzione che si avvicini a 40,00. . . corrisponde a z=1.28 i punteggi il cui z è >= di 1.28, rientrano nel 10% superiore oppure Howitt; cerco un’area vicina al 10% sul lato positivo;

trovo 9.68% -> z=1.30