• Non ci sono risultati.

Elementi di Psicometria (con laboratorio software 1) 08-Il test t per campioni indipendenti (v. 1.2, 7 aprile 2021) Germano Rossi

N/A
N/A
Protected

Academic year: 2021

Condividi "Elementi di Psicometria (con laboratorio software 1) 08-Il test t per campioni indipendenti (v. 1.2, 7 aprile 2021) Germano Rossi"

Copied!
34
0
0

Testo completo

(1)

Elementi di Psicometria (con laboratorio software 1)

08-Il test t per campioni indipendenti (v. 1.2, 7 aprile 2021)

Germano Rossi1 germano.rossi@unimib.it

1Dipartimento di Psicologia, Università di Milano-Bicocca

a.a. 2020-21

(2)

Sommario

1 Differenza di due medie

2 Test per campioni indipendenti

3 In SPSS

(3)

Differenza di due medie 1

Con lo stesso ragionamento fatto per la distribuzione campionaria delle medie, si può fare la distribuzione campionaria della differenza di due medie.

Se 2 campioni vengono estratti dalla stessa popolazione, la loro media dovrebbe tendere alla media della popolazione, qualunque essa sia.

Se facciamo la differenza fra le due medie (ed entrambe tendono alla media della popolazione), la loro differenza dovrebbe tendere ad essere uguale a 0 (𝜇1− 𝜇2 = 0). Dovrebbe, ma non sempre è così.

Tuttavia se estraiamo molte coppie di medie, la distribuzione della differenza di queste medie graviterà attorno allo 0.

La stessa cosa dovrebbe capitare se i due campioni vengono da due popolazioni diverse che hanno, però, la stessa media (𝜇1 = 𝜇2)

(4)

Differenza di due medie 2

●●

●●

●●

●●●●

●●

●●●●●

●●

●●●

●●

●●●

●●

●●

●●

●●●

●●

●●●

●●●

●●

0 20 40 60 80 100

−1.00.01.0

Media= 0.03

100 differenze di medie campionarie

Distribuzione delle differenze delle medie

−1.0 −0.5 0.0 0.5 1.0

0.01.02.0

(5)

Differenza di due medie: un esempio

Consideriamo il campione di TdG del Cap. 7 (file dati DatiTdG.sav) È composto da 23 maschi e 12 femmine

Nella slide 6 del Cap. 7 abbiamo visto che i 35 TdG hanno un punteggio di Fondamentalismo più alto della popolazione italiana.

Adesso possiamo chiederci se, all’interno del campione dei TdG, i maschi sono più o meno fondamentalisti delle femmine

In pratica stiamo confrontado due gruppi indipendenti (perché sono individui diversi, non appaiati)

Perciò la media del gruppo maschile (𝜇1) sarà confrontata con la media del gruppo femminile (𝜇2)

(6)

Differenza di due medie 3

Anche in questo caso abbiamo che (per N ≥ 30) la distribuzione campionaria della differenza delle medie tenderà a distribuirsi normalmente

e anche in questo caso potremo calcolare un errore standard della differenza delle medie

e anche in questo caso, un valore piccolo dell’errore standard indica una piccola oscillazione delle differenze campionarie attorno allo 0 e un valore grande indica una grossa oscillazione attorno allo 0 Anche in questo caso, se potessimo estrarre un numero infinito di coppie di campioni, potremmo calcolare l’errore standard esatto Non potendo farlo, lo stimiamo a partire dalle deviazioni standard dei due campioni

(7)

Test per campioni indipendenti 1

Il test che useremo per il confronto è il Test t per campioni indipendenti

Si pongono adesso due possibilità:

la varianza nelle due popolazioni è uguale la varianza nelle due popolazioni è diversa

se la varianza è uguale potremmo semplicemente sommare le singole varianze (in particolare se le N dei due campioni fossero uguali) più spesso non possiamo ipotizzare che le varianze siano uguali ancora più spesso, i due campioni non hanno la stessa numerosità Partiamo dall’ipotesi che i campioni siano stati estratti dalla stessa popolazione (o che siano estratti da due popolazioni che hanno la stessa media).

(8)

Test per campioni indipendenti 2

Usiamo quindi una varianza combinata, considerando che

s2 =

∑︀(Xi − M)2 (N − 1)

e la stima dell’errore standard diventa

scomb2 = (N1− 1)s12 + (N2− 1)s22 N1+ N2− 2

sM1−M2 =

√︃scomb2 N1

+scomb2 N2

Mettendo assieme le due formule abbiamo sM1−M2 =

√︃(N1− 1)s12+ (N2− 1)s22 N1+ N2− 2

(︂ 1 N1

+ 1 N2

)︂

(9)

Test per campioni indipendenti: test

Il test sulla differenza delle medie si baserà sulla formula di z, ma produrrà una statistica t

t = (M1− M2) − (𝜇1− 𝜇2) sM1−M2

Anche se è teoricamente possibile ipotizzare che la differenza di due medie corrisponda ad un certo valore (ad es. 5), la maggior parte delle volte si ipotizzerà che la differenza delle medie sia nulla; in questo caso 𝜇1− 𝜇2 = 0 e la formula si riduce alla sola differenze delle medie dei campioni

In ogni caso, la statistica t calcolata avrà gradi di libertà pari a (N1− 1) + (N2− 1) = N1+ N2− 2

(10)

Test della differenza delle medie

Conosciamo: M1, M2, s1 e s2 allora poniamo:

H0: 𝜇1 = 𝜇2

H1: 𝜇1 ̸= 𝜇2 (oppure > oppure <) scegliamo 𝛼 e troviamo il t critico applichiamo la formula

tM1−M2 = M1− M2

√︂(N1−1)s12+(N2−1)s22 N1+N2−2

(︁ 1 N1 + N1

2

)︁

con gdl = N1+ N2− 2

se tM1−M2< tc (in valore assoluto) accetto H0

se maggiore (in valore assoluto), rifiuto H0 (e accetto quindi H1)

(11)

Test della differenza delle medie

Le ipotesi per la verifica si basano sul parametro della popolazione perché

la distribuzione campionaria ci dice che la media della popolazione è stimabile dalla media della distribuzione campionaria

L’ipotesiH0 : 𝜇1= 𝜇2 viene letta come: “La media della popolazione da cui ho estratto il primo campione è uguale alla media della popolazione da cui ho estratto il secondo campione”

L’ipotesiH1 : 𝜇1̸= 𝜇2 (oppure > oppure <) viene letta come: “La media della popolazione da cui ho estratto il primo campione è diversa (maggiore / minore) della media della popolazione da cui ho estratto il secondo campione”

(12)

Test della differenza delle medie: esempio

Abbiamo misurato l’Ortodossia in un campione di Testimoni di Geova e ci chiediamo se vi è differenza fra maschi (N=23) e femmine (N=12)

Mm = 41.173, Mf = 42.5, sm = 2.269 e sf = 2.316 allora:

facciamo le ipotesi nulla e alternativa H1 : 𝜇m̸= 𝜇f

con 𝛼 = .05 bidirezionale il t critico con gdl = 23 + 12 − 2 = 33 è tc = ±2.034

applichiamo la formula

tM1−M2 = 41.173 − 42.5

√︂(︁2.272(23−1)+2.322(12−1) 23+12−2

)︁ (︁1

23+121 )︁

= −1.32609

0.8137104 = −1.63

siccome tM1−M2 < tc accetto H0

(13)

Test della differenza delle medie: esempio

t = −1.63 (rosso) 𝛼 =5% (bi) tc = |2.04| (nero) Accetto H0 perché

|t| < |tc|

|t| cade nell’area di accettazione di H0 (verde)

(14)

Due approcci all’inferenza puntuale

Il secondo approccio è quello basato su p e 𝛼 Se svolgo i calcoli in SPSS ottengo:

Siccome p = .113 (o Sig.) è superiore al valore di 𝛼 = .05, dobbiamo accettare l’ipotesi nulla

(15)

Due approcci all’inferenza puntuale, Excel N

Per trovare un valore critico Con Excel,

zc=INV.NORM.ST(1-alfa/2) (bi-direzionale) oppure

zc=INV.NORM.ST(1-alfa) (mono direzionale) usando la normale

tc=INV.T(alfa;gl) usando il t

Calcolo diretto della probabilità Con Excel, P(z)=

1-DISTRIB.NORM.ST(z) per la normale

tc=DISTRIB.T(t;gl;2) (bi-direzionale)

tc=DISTRIB.T(t;gl;1) (mono-direzionale) zc= z critico; tc=t critico; alfa = valore di 𝛼; gl= gradi di libertà z=punti z; t= statistica t

(16)

Stima intervallare

Anche per la differenza delle medie, possiamo calcolare un’intervallo di confidenza, sempre usando il valore critico di t al 5% o all’1% per avere intervalli di fiducia pari al 95% o al 99%

(M1− M2) ±tcsM1−M2] Applicandolo all’esempio dei Testimoni di Geova:

(M1− M2) = −1.326 t95% = 2.035 sM1−M2 = 0.814

−1.326 + 2.035 * .814 e − 1.326 − 2.035 * .814 ovvero l’intervallo di confidenza oscilla fra -2.982 e 3.330 Poiché l’intervallo include anche il valore 0 (H0 : 𝜇1− 𝜇2= 0) corrispondente alla nostra ipotesi nulla, dobbiamo accettarla come vera.

(17)

Dimensione dell’effetto

Anche per il T-test per campioni indipendenti ci sono diverse formule Il punto di partenza è la d di Cohen: d = (𝜇1− 𝜇2)/𝜎

Una implementazione (proposta da Hodge) è: d = (M1− M2)/scomb cioè:

d = M1− M2

√︂

s12(N1−1)+s22(N2−1) N1+N2−2

questo calcolo è un po’ complesso

però se confrontiamo il denominatore di scomb con il denominatore di t

(N1− 1)s12+ (N2− 1)s22 N1+ N2− 2

(︃ 1 N1

+ 1 N2

)︃

vediamo delle grosse somiglianze

(18)

Ampiezza dell’effetto (formule veloci)

Dal momento che sia d sia t usano la varianza combinata, conoscendo le numerosità e il valore di t, si può calcolare d anche come:

d = t

√︃ N1N2 N1+ N2

= t

√︃N1+ N2 N1N2

confrontiamo le due formule d = 41.173 − 42.5

√︁2.272(23−1)+2.322(12−1) 23+12−2

= −0.5803401

d = −1.63

√︃23 + 12

23 × 12 = −0.580453

(19)

Analisi della potenza N

Per l’analisi della potenza vi propongo 2 possibilità (su un video a parte) tramite Jamovi

tramite G*Power

Troverete tutto nel video 1920Elem - Cap. 8 (Potenza)

(20)

Assunti del t-test

1 Le misure della variabile dipendente di ciascun gruppo

a) siano indipendenti l’uno dall’altro

b) siano indipendenti al proprio interno

2 La variabile dipendente si distribuiscano normalmente

3 Le varianze dei due gruppi siano uguali (omoschedasticità) La condizione 2 può essere ignorata, perché il test t non è molto sensibile alle violazioni di normalità

La condizione 3 può essere ignorata se i due campioni hanno

numerosità abbastanza simile e non troppo asimmetriche; il test t, in questo caso, non distorce troppo e si può usare la distribuzione di t senza problemi

(21)

Assunti del t-test

Se i due campioni non hanno uguale numerosità (pragmaticamente accettabile fino a un rapporto di 1.5 circa), si pongono diverse condizioni:

1 una soluzione è quella di ridurre il campione più numeroso ed

equiparare le numerosità (basta fare una selezione casuale del campione più grande)

2 se il problema è l’eccessiva asimmetria, provare a sottoporre la variabile a trasformazioni che mantengono la linearità, ma cambiano la

distribuzione (v. nel Trattamento dei dati)

3 Un’alternativa è usare la stima robusta della varianza separata (conosciuta come t di Welch), ovvero il test t diventa

t = M1− M2

√︁s2

1

N1 +Ns22

2

(22)

Inferenza con programmi statistici

Nell’uso normale, sono i computer a fare i conti per il confronto di medie: t di Student (o T-Test)

stessa variabile su due campioni indipendenti. Le formule usate sono quelle indicate e prevedono:

1 una formula che ipotizza che i campioni abbiano varianza uguale (usando la varianza combinata)

2 un’altra formula che ipotizza che abbiano varianza diversa (usando le varianze separate)

Alcuni software le applicano entrambe e applicano un test per la verifica dell’omogeneità delle varianze (test di Levene)

Altri software lasciano che scelga l’utente

(23)

Inferenza con programmi statistici

In SPSS viene applicato un test per l’omogeneità delle varianze (il test di Levene) e in base ai risultati l’utente sceglie il test appropriato

Il test di Levene è basato sul rapporto di due varianze (la statistica si chiama F) Assieme ad F, SPSS stampa anche la probabilità di F (ma non i gradi di libertà, che esistono)

se le due varianze sono simili, F tenderà a 1

Notate che i gl nell’area verde hanno i decimali (è il t di Welch)

(24)

SPSS: 2 campioni indipendenti

Analizza |

Confronta medie | Test T: campioni indipendenti Trascinare una o più variabile dipendente (quantitativa) in Variabili oggetto del test

Trascinare una variabile qualitativa (con 2 valori possibili) in Variabile di raggruppamento

Premere Definisci gruppi

e inserire i due valori della qualitativa da usare. Quindi

Continua

Selezionare “Stima dimensioni effetto”

Infine OK

(25)

In SPSS risultati descrittive

I risultati compariranno in tabelle successive: la prima contiene le Medie e le deviazioni standard suddivise per genere

Dalle medie possiamo vedere (“a naso”) che non ci sono grosse differenze fra i sessi nelle prime due variabili.

Forse, nell’ultima c’è una differenza.

(26)

In SPSS: risultati test 1

La seconda tabella contiene molte informazioni e la vediamo in due parti.

Il test di Levene ci dice se i due gruppi hanno la stessa varianza (F piccola, con Sign. cioè p > 𝛼) oppure no (F grande, con p ≤ 𝛼).

A questo punto possiamo leggere e interpretare l’esatto t e confrontare la probabilità associata (Sign.) a quel t, con quei gradi di libertà (gl) direttamente con l’𝛼 scelto.

Ricordate però che la Sign. di Levene non è la Sign. del t

(27)

In SPSS: risultati test 2

Gli intervalli di confidenza ci dicono da quali popolazioni può essere estratto un campione come il nostro sotto la condizione dell’ipotesi nulla.

Se gli intervalli includono lo 0 allora accettiamo l’ipotesi nulla (H0= 0), altrimenti accettiamo quella alternativa.

La logica del risultato della stima puntuale e della stima intervallare devono coincidere.

(28)

Ampiezza dell’effetto (manuale)

Ipotizziamo di non avere un software che calcoli l’ampiezza dell’effetto. La formula più veloce è:

d = t

√︃N1+ N2

N1N2

Se le applichiamo ai risultati delle 3 slide precedenti abbiamo:

Instrins Estr_soc Estr_pers

−.694

√︃158 + 184

158 × 184 = −.807

√︃158 + 184

158 × 184 = −3.94

√︃158 + 184 158 × 184 =

= −.075 = −.088 = −.427

(29)

In SPSS: ampiezza dell’effetto

dalla vers. 27 di SPSS, una terza tabella contiene i risultati dell’ampiezza degli effetti (usandoDatiTdG.sav))

Nel caso del T-test indipendente, ci sono 3 formule diverse (nella letteratura viene usata solitamente la prima)

Sono tutte misure non standardizzate (d-family)

Notate come l’intervallo di confidenza viene applicato anche all’effect size e come il limite superiore superi 1

Delta di Grass si usa con i campioni di controllo (femmine)

(30)

Riportare i risultati

RiprendendoDatiTdG.sav Esempio

Nel campione dei Testimoni di Geova (N=35), l’Ortodossia non risulta statisticamente significativa per Sesso biologico, t(33)=-1.63, p=.113, d=-0.580 pur mostrando una media del sottocampione femminile (M=42.5 SD=2.316) superiore a quello maschile (M=41.17 SD=2.27).

Si riportano sempre: l’indicazione che il test sia significativo o no; il simbolo t (in corsivo), i gradi di libertà tra parentesi tonde, l’uguale e il valore di t seguito dalla probabilità associata a t e dall’eventuale ampiezza dell’effetto.

Si riportano anche i dati necessari percapire il risultato ottenuto.

(31)

Riportare i risultati

Usando i risultati delle slide25-27

Esempio

Per quanto riguarda l’orientamento religioso, per la religiosità intrinseca e l’estrinseca sociale non sembrano esserci effetti del genere, rispettivamente t(337)=-.694, p=.488 e t(337)=-.807, p=.420, in quanto il confronto delle medie non è significativo. Al contrario, per quanto riguarda la religiosità estrinseca personale, il gruppo femminile mostra una media (M=10.86, SD=2.98) più alta del gruppo maschile (M=9.45, SD=5.68), t(308.19)=-3.94, p<.001.

Nel riportare i risultati non si citano mai le ipotesi della “Verifica d’ipotesi” (ovvero H0

e/o H1) perché sono sottintese e non si riporta il (ne si accenna al) test di Levene. Se i gradi di libertà del t sono interi, Levene non era significativo; se i gradi di libertà del t hanno dei decimali (come nell’esempio qui sopra), Levene era significativo. In pratica si riportano i valori di t ma non quelli di Levene. Attenzione poi a non confondere la probabilità associata a Levene con quella associata a t.

(32)

Applicabilità

Per confrontare la media di una variabile fra due gruppi Cosa si usa

1 variabile qualitativa (indipendente) che viene usata per suddividere il campione in 2 gruppi

1 variabile quantitativa (dipendente) su cui vengono calcolate le medie (una per ciascun gruppo

con i software è possibile usare più variabili quantitative (dipendente) per fare più analisi (una per ogni variabile)

(33)

Più confronti di medie 1

I T-test per campioni indipendenti e per campioni dipendenti lavorano con 2 gruppi o con 2 variabili ripetute

Se devo confrontare 3 medie?

Faccio 3 confronti: M1 con M2, poi M1 con M3 e quindi M2 con M3

Equivale a una combinazione di 3 elementi presi 2 a 2 senza ripetizione.

Con 4 medie?

Faccio 6 confronti!

Con 5 medie?

Faccio 10 confronti Ma...

(34)

Più confronti di medie 2

Se per ogni confronto, ho una possibilità di sbagliare pari al livello 𝛼 che scelgo, per 10 confronti avrò una possibilità pari a 10 volte 𝛼 Ovvero, se 𝛼 = .05, 10 × 0.05 = 0.50

Ciò significherebbe che su 10 confronti almeno la metà potrebbero essere inaffidabili

È chiaro che non posso correre un rischio così elevato.

Ho due possibili soluzioni

Usare l’Analisi della varianza (preferibile e che studierete al II anno) Usare il Criterio di Bonferroni: consiste nel dividere il valore di 𝛼 per il numero di confronti e usare il risultato come nuovo 𝛼 (es. 𝛼 = .05 con 10 confronti, 𝛼/10 ⇒ .05/10 = .005, 5 per mille)

Un cenno di Analisi della varianza lo affronteremo dopo il Cap. 13

Riferimenti

Documenti correlati

Se l’ampiezza del campione è uguale o superiore a 30, anche la distribuzione campionaria avrà forma normale o comunque sempre più vicina alla curva normale (all’aumentare di N)

“dal momento che la ricerca viene effettuata su un certo campione (di ampiezza N conosciuta) e usando un certo

1 Ho misurato una variabile su un campione e lo voglio confrontare con i risultati di una ricerca precedente per vedere se le popolazioni statistiche sono uguali o meno (T-Test

Abbiamo costruito una distribuzione campionaria della correlazione E abbiamo confrontato la correlazione calcolata con la distribuzione delle correlazioni. Se la probabilità

Modello teorico: una variabile qualitativa viene confrontata con un modello teorico per vedere se le categorie si distribuiscono in base a dei valori attesi indicati dalla

L’analisi della varianza ad un fattore (una via) lavora con 1 variabile quantitativa e con una variabile qualitativa che abbia più di 2 categorie (o più di 2 medie). L’analisi

2 Valori mancanti casuali (MAR): quando i mancanti non dipendono dalla variabile, ma dipendono da una o più delle altre variabili. 3 Non mancanti a caso (NMAR) ovvero valori

Chi non segue le esercitazioni (ma anche chi le segue) può usare una sorta di checklist per controllare cosa deve saper fare alla fine delle esercitazioni. Tutto quello che è