• Non ci sono risultati.

Elementi di Psicometria con Laboratorio di SPSS 1 05-Deviazione standard e punteggi z vers. 1.1 (22 ottobre 2014) Germano Rossi

N/A
N/A
Protected

Academic year: 2021

Condividi "Elementi di Psicometria con Laboratorio di SPSS 1 05-Deviazione standard e punteggi z vers. 1.1 (22 ottobre 2014) Germano Rossi"

Copied!
31
0
0

Testo completo

(1)

Elementi di Psicometria con Laboratorio di SPSS 1

05-Deviazione standard e punteggi z vers. 1.1 (22 ottobre 2014)

Germano Rossi1

[email protected]

1Dipartimento di Psicologia, Università di Milano-Bicocca

2014-2015

(2)

Introduzione

Per le variabili quantitative usiamo delle unità di misura (anni, numero di errori. . . )

I punteggi grezzi (ciò che abbiamo misurato) sono semplici da interpretare se conosciamo la scala su cui sono misurati (i metri, i gradi centigradi e simili)

Non sono facili da interpretare se usano scale non conosciute (ad es. intervallo 6-36 oppure 30-180)

Variabili diverse possono usare unità diverse (età,

soddisfazione. . . ) con metriche diverse (età -> 0-n; soddisfazione -> 0-10, . . . ) che possono cambiare da una cultura all’altra (kg o libbre, km o miglia, . . . )

(3)

Introduzione

Non sono molto utili neppure per confrontare fra loro variabili diverse: un 25 in un test di abilità matematica (AM) è migliore o peggiore di un 55 in un test di abilità verbale (AV)?

Dipende dalle relative scale:

se AM ha un range 1-30 e AV un range 10-60

entrambi i punteggi sono abbastanza vicini al valore massimo Ma uno è “migliore” dell’altro?

(4)

Introduzione

Nella vita reale, le unità di misura sono già un’enorme semplificazione della nostra vita

Confrontare variabili diverse fra loro non è possibile se non usando la stessa scala di misura e lo stesso metro

È come decidere se 3 banane sono di più di 3 arance Sono cose diverse e non possiamo confrontarle

A meno di non trasformarle in una stessa unità di misura

(5)

Confrontare variabili

Ad esempio

“3 bananepesano di più di 3 arance?”

“In 3 banane cisono più vitamine che in 3 arance?”

“3 banane occupanopiù spazio di 3 arance?”

“ci sonopiù frutti di tipo ’banane’ o di tipo ’arance’?”

Ma in statistica vorremmo avere un’unica un’unità di misura che valga per misurare qualsiasi variabile

Quale potrebbe essere questa unità di misura?

(6)

Distanze dalla media

0 1 2 3 4 5 6 7 8 9 10

L’unità di misura parte da 0 e va fino a 10. Se sottraiamo 5 a tutti i punteggi otteniamo:

-5 -4 -3 -2 -1 0 +1 +2 +3 +4 +5

L’unità di misura parte da -5 e va fino a +5

Non cambia nulla, abbiamo trasformato lo zero assoluto in uno zero relativo.

La nuova unità di misura è la deviazione dalla media (x − M ); in termini più precisi è “quante unità di misura diquesta variabile, ogni punteggio dista

(7)

Deviazione standard

Non basta modificare la metrica ed esprimere tutto in base a

“quanti scarti ci sono da qui alla media”

perché ogni variabile ha una sua estensione e una sua unità di misura specifica

Anche se diciamo che “X dista 2 dalla sua media” e “Y dista 3 dalla sua media”, seX misura i chilometri e Y il peso. . . . non possiamo fare confronti.

Ma la deviazione standard è la radice quadrata della varianza

ds =√ var =

s

P(Xi− X)2 N

e se esprimiamo gli scarti in termini di distanza. . . .

(8)

Trasformazioni lineari

Abbiamo visto che se aggiungo o sottraggo una costante ad una distribuzione, la media subisce la stessa trasformazione

X =X

X ⇒X

(X + k) = X + k

per cui se io tolgo ad AM e AV la loro media, trasformo le due variabili in modo che abbiano entrambe M=0

X(X − X) = X − X = 0

Ho semplicemente spostato le misure in modo che la media di entrambe fosse 0.

(9)

Trasformazioni lineari

Adesso hanno la stessa media (zero) ma hanno ancora varianza diversa Come possiamo rendere i campi di variazione uguali?

Una prima possibilità è di dividere tutto per un determinato valore (ad es. le rispettive gamme) e poi moltiplicare tutto per uno stesso valore (ad es. 100)

Un’altra possibilità è quella di usare la deviazione standard come unità di misura

In pratica, ci chiediamo“Quante deviazioni standard ci sono fra un determinato valore X e la media?”

(10)

Variabili standardizzate

Punti z

“Quante deviazioni standard ci sono fra un determinato valore X e la media?”

La risposta implica utilizzare la deviazione standard (σ) come nuova unità di misura

Gli scarti dalla media (X − X) vengono divisi per la dev. st.:

zx= X − X σ

Il punteggio trasformato in “numero di scarti dalla media” si chiamapunto zo punteggio z

(11)

Variabili standardizzate

Punti z

Ilpunto z è una misura standard

La media dei punti z è 0 (z = 0), visto che un qualunque punteggio corrispondente alla media sarebbe a 0 scarti dalla media

La somma dei punti z è 0 (X

z = 0), perché i punti z sono scarti dalla media trasformati in modo uniforme e la somma degli scarti è 0

La deviazione standard dei punti z è 1 (σz= 1), perché la deviazione standard è l’unità di misura

Valori negativi indicano punteggi inferiori alla media Valori positivi, punteggi sopra la media

(12)

Variabili standardizzate

Punti z

Ilpunto z è una misura standard

La media dei punti z è 0 (z = 0), visto che un qualunque punteggio corrispondente alla media sarebbe a 0 scarti dalla media

La somma dei punti z è 0 (X

z = 0), perché i punti z sono scarti dalla media trasformati in modo uniforme e la somma degli scarti è 0

La deviazione standard dei punti z è 1 (σz= 1), perché la deviazione standard è l’unità di misura

Valori negativi indicano punteggi inferiori alla media Valori positivi, punteggi sopra la media

(13)

Variabili standardizzate

Punti z

Ilpunto z è una misura standard

La media dei punti z è 0 (z = 0), visto che un qualunque punteggio corrispondente alla media sarebbe a 0 scarti dalla media

La somma dei punti z è 0 (X

z = 0), perché i punti z sono scarti dalla media trasformati in modo uniforme e la somma degli scarti è 0

La deviazione standard dei punti z è 1 (σz= 1), perché la deviazione standard è l’unità di misura

Valori negativi indicano punteggi inferiori alla media Valori positivi, punteggi sopra la media

(14)

Variabili standardizzate

Punti z

Ilpunto z è una misura standard

La media dei punti z è 0 (z = 0), visto che un qualunque punteggio corrispondente alla media sarebbe a 0 scarti dalla media

La somma dei punti z è 0 (X

z = 0), perché i punti z sono scarti dalla media trasformati in modo uniforme e la somma degli scarti è 0

La deviazione standard dei punti z è 1 (σz= 1), perché la deviazione standard è l’unità di misura

Valori negativi indicano punteggi inferiori alla media Valori positivi, punteggi sopra la media

(15)

Variabili standardizzate

Punti z

Ilpunto z è una misura standard

La media dei punti z è 0 (z = 0), visto che un qualunque punteggio corrispondente alla media sarebbe a 0 scarti dalla media

La somma dei punti z è 0 (X

z = 0), perché i punti z sono scarti dalla media trasformati in modo uniforme e la somma degli scarti è 0

La deviazione standard dei punti z è 1 (σz= 1), perché la deviazione standard è l’unità di misura

Valori negativi indicano punteggi inferiori alla media

Valori positivi, punteggi sopra la media

(16)

Variabili standardizzate

Punti z

Ilpunto z è una misura standard

La media dei punti z è 0 (z = 0), visto che un qualunque punteggio corrispondente alla media sarebbe a 0 scarti dalla media

La somma dei punti z è 0 (X

z = 0), perché i punti z sono scarti dalla media trasformati in modo uniforme e la somma degli scarti è 0

La deviazione standard dei punti z è 1 (σz= 1), perché la deviazione standard è l’unità di misura

Valori negativi indicano punteggi inferiori alla media Valori positivi, punteggi sopra la media

(17)

Variabili standardizzate

Punti Z

La trasformazione in punti z, si dice anche “standardizzazione”

La distribuzione dei punti z si dice “distribuzione standardizzata”

perché è una delle tante possibili curve di frequenza, ma con media e ds conosciute a priori

I punti z permettono di confrontare fra loro punteggi provenienti da distribuzioni di frequenza diverse

Esempio

x=70, M=82, σ=12 (z=-1) x=23, M=35, σ= 6 (z=-2)

23 è 2 ds al di sotto della sua media, mentre 70 è solo 1 ds sotto la sua media; se fossero punteggi di profitto, confrontandoli, dovremmo dire 23 è un valore “peggiore” rispetto a 70 non perché è più piccolo ma perché il suo punto z è inferiore

(18)

Variabili standardizzate

Esempi d’uso dei punti z

Conoscendo media, varianza e il punto z, si può calcolare il valore di X (cioè il punto grezzo):

X = X + zxσx

Esempio

Se un test di profitto ha M=82 è σ=12, a quale punteggio corrisponde il punto z=1.2?

X = 82 + 1.2 ∗ 12 = 96.4

(19)

Variabili standardizzate

Scale derivate dai punti z

Ci sono scale standardizzate utilizzate comunemente in psicologia (specie per i test) che derivano dai punti z

punteggi T: hanno media 50 e ds=10. Si ottengono con T = 10z + 50

punteggi SAT: hanno media 500 e ds=100. Si ottengono con SAT = 100z + 500

QI o IQ: la maggior parte dei test d’intelligenza (come il WAIS) utilizza una media di 100 e ds=15. Si ottengono con

QI = 15z + 100

QI o IQ: il test d’intelligenza Stanford-Binet utilizza una media di 100 e ds=16. Si ottengono con QI = 16z + 100

(20)

Variabili standardizzate

Spss: punti z

Spss permette di calcolare i punti z di una variabile per ogni unità statistica, tramite Analizza | Statistiche descrittive

| Descrittive... e attivando il flag Salva valori standardizzati come variabili

(21)

Variabili standardizzate

Spss: punti z

Viene aggiunta una variabile con il nome corrispondente preceduto da Z

Questa variabile può essere usata come qualsiasi altra

(22)

Variabili standardizzate

Tavole della distr. normale

Nella curva normale ogni z corrisponde ad un area

L’area può essere proposta in modi diversi Ad ogni z corrisponde un’area fino a z=−∞

Fra z=−3 e z=−∞ c’è un’area del 99.87%

La tavola del vostro libro (Howitt) propone l’area per determinati

(23)

Variabili standardizzate

Tavole della distr. normale

Alcuni punti z corrispondono ad aree particolari

z=-1.64 corrisponde al 5%/95%

z=-1.96 corrisponde al 2.5%/97.5%

(24)

Variabili standardizzate

Tavole della distr. normale

La curva normale è simmetrica Quindi ogni metà è il 50%

Allontanandoci da z=0 abbiamo aree simili per z simili

z=-0.10 -> 53.98% (cioè 3.98%

sotto)

z=0.10 -> 46.02% (cioè

(25)

Variabili standardizzate

Tavole della distr. normale

z=1.64 corrisponde al 95%/5%

z=1.96 corrisponde al 97.5%/2.5%

(26)

Variabili standardizzate

Tavole della distr. normale

Altri libri riportano tavole più complete (ad es. Welkowitz, Cohen, Ewen:

Tavola A, p. 473 ss.)

La tavola riporta le proporzione di area sottese alla curva normale calcolate a partire dalla media (ricordarsi che l’intera area è simmetrica)

Per ogni punto z viene indicata l’area fra z=0 e il punto z stesso (area in grigio)

(27)

Variabili standardizzate

Tavole della distr. normale

La prima colonna indica il primo decimale del punto z, ogni colonna successiva indica il secondo decimale

All’incrocio fra una riga (ad es. 0,3) e una colonna (0,05) troviamo l’area corrispondente (ad es. 0,35)

Es. l’area fra z=0,35 e 0 è pari a 13,68

(28)

Variabili standardizzate

Esempi d’uso dei punti z

Qual è la % di soggetti con un punteggio inferiore o uguale a 120 (M=100, s=20)?

calcolo il punto z [(120-100)/20=1]

tavole della normale; cerco la riga corrispondente a z=1.0, avanzo fino alla colonna 0 e leggo l’area corrispondente [34,13]

questa è l’area fra la z=0 e z=|1|;

mi interessa anche la metà inferiore, sommo 50,00 [50,00 + 34.13 = 84.13%]

(29)

Variabili standardizzate

Esempi d’uso dei punti z

Qual è la % di soggetti con un punteggio inferiore a 80 (M=100, s=20)?

calcolo il punto z [(80-100)/20=-1]

negativo perché sotto la media tavole della normale; cerco la riga corrispondente a z 1.0, avanzo fino alla colonna 0 e leggo l’area corrispondente [34,13]

poiché questa è l’area fra la z=0 e z=|1| e mi interessa l’area inferiore, faccio il complemento [50,00 - 34,13 = 15.87%]

oppure Howitt; cerco -1.00, trovo 84.13%, ma è quella superiore, quindi 100-84.13=15.87%

(30)

Variabili standardizzate

Esempi d’uso dei punti z

Qual è la % di soggetti con punteggio compreso fra 80 e 120?

calcolo i punti z [-1 e +1]

tavole della normale; cerco la riga corrispondete al punto z 1.0, avanzo fino alla colonna 0 e leggo l’area corrispondente [34,13]

poiché questa è l’area fra la z=0 e z=|1| ed entrambe sono uguali, sommo l’area 2 volte [34,13 + 34,13 = 68.26%]

oppure Howitt; cerco 1.00, trovo

(31)

Variabili standardizzate

Esempi d’uso dei punti z

A quale punto z corrisponde l’area con il 10% di punteggi superiori?

poiché le tavole indicano l’area fra z=0 e z=x, devo trovare il resto di 10,00 [50,00-10,00=40,00]

cerco dentro le tavole una proporzione che si avvicini a 40,00. . . corrisponde a z=1.28 i punteggi il cui z è >= di 1.28, rientrano nel 10% superiore oppure Howitt; cerco un’area vicina al 10% sul lato positivo;

trovo 9.68% -> z=1.30

Riferimenti

Documenti correlati

È la somma delle frequenze che precedono una determinata categoria La frequenza cumulata della prima categoria è uguale a se stessa la frequenza cumulata delle categorie intermedie,

(stampa le misure di variabilità come parte delle diverse statistiche per capire l’andamento e la distribuzione di una variabile).. Misure

curtosi (o kurtosis): quanto la curva dei nostri dati è più piatta o più acuta di quella della

In questa categoria ricadono i grafici che utilizzano una variabile quantitativa e una variabile qualitativa, nonché tabelle che incrociano una qualitativa e una

Per ora vedremo la correlazione lineare prodotto-momento di Bravais-Pearson più conosciuta come correlazione di Pearson e a cui ci si riferisce per antonomasia quando si parla

Un modo generalmente usato per avere la rappresentatività è quella della selezione casuale dei casi statistica dalla popolazione Questi campioni sono chiamati campioni casuali

Se la correlazione trovata nel nostro campione di partenza è compresa nel 95% attorno alla media di 0, allora la nostra correlazione sarà non significativa ovvero casualmente

In pratica, ogni volta abbiamo 1) ipotizzato di conoscere una popolazione 2) estratto K campioni di ampiezza N 3) calcolato la statistica e 4) la deviazione standard delle