• Non ci sono risultati.

Inferenza per la differenza di medie di popolazioni normali

Nel documento baccelli verdi 428 baccelli gialli (pagine 49-56)

7.8 Confronto di popolazioni

7.8.1 Inferenza per la differenza di medie di popolazioni normali

Il problema del confronto tra le medie di due popolazioni normali può essere formulato come segue: consideriamo due variabili aleatorie Y1 e Y2 che si distribuiscono normalmente, con medie µ1, µ2 e varianze σ21 e σ22, rispettiva-mente. Si osservano due campioni indipendenti, sulla base due quali vogliamo verificare una ipotesi relativa alla differenza tra le medie µ1 − µ2.

Un esempio tipico in questo contesto è quello della verifica dell’efficacia di un farmaco. Si considerano n pazienti che soffrono di una certa patologia e si dividono casualmente in due gruppi. Ad uno di questi si somministra il farmaco, all’altro un placebo. Se si suppone, ad esempio, che il farmaco agisca sui livelli di colesterolo, allora si misurerà l’efficacia del trattamento sulla base del confronto tra il livelli medi nei due gruppi (si veda l’esempio illustrato nel paragrafo 1.4.6). Si possono allora considerare due popolazioni, quella di chi assume il placebo, che si supporrà distribuita secondo la legge Y1 ∼ N (µ1, σ21) e quella di chi assume il farmaco Y2 ∼ N (µ2, σ22), e da queste vengono estratti due campioni di dimensione n1 e n2, rispettivamente. L’inferenza riguarda quindi una coppia di variabili aleatorie indipendenti.

Osservando due campioni, si otterranno le medie campionarie ¯y1 e ¯y2, dove si ricordi che le variabili Y1 e Y2 hanno distribuzione Y1 ∼ N (µ1, σ12/n1) e Y2 ∼ N (µ2, σ22/n2), in virtù dell’assunzione di gaussianità delle popolazioni.

L’oggetto di interesse è ora la differenza tra le medie µ1− µ2, e in particolare interessa verificare l’ipotesi che il farmaco sia inefficace, cioè

µ1− µ2 = 0.

Se infatti fosse µ1 − µ2 = 0, allora ciò implicherebbe che la media nei due gruppi è la stessa e quindi il farmaco non ha sortito l’effetto desiderato. La differenza µ1 − µ2 si può ragionevolmente stimare con Y1− Y2, dove si noti che, supponendo siano indipendenti i due campioni,

Y1− Y2 ∼ N



µ1− µ212 n1

22 n2



In analogia a quanto fatto nel caso della verifica sulla media di una popo-lazione normale, per verificare l’ipotesi µD = µ1 − µ2 = 0 si userà il fatto che

D = Y1− Y2− (µ1− µ2) qσ21

n1 + σn22

2

ha distribuzione normale per ricavare test di significatività e regioni di rifiuto per µ1− µ2.

Si è mostrato nel paragrafo 5.5 come, partendo da

P

per un α fissato, si ricava

P

dove le varianze delle popolazioni σ12 e σ22 si erano supposte note. Di con-seguenza l’ipotesi nulla µ1 = µ2 (o µD = 0) può essere verificata determinan-do se l’intervallo di confidenza include o meno lo 0. Dunque fissato α (ad esempio, α = 0.05), se gli estremi dell’intervallo che si ottiene dall’ultima espressione contengono lo zero, allora si potrà concludere che il valore reale di µD non è significativamente diverso da zero.

In alternativa, per condurre il test bilaterale per la differenza tra le medie si consideri che sotto l’ipotesi nulla

H0 : µ1− µ2 = 0

che è tanto più grande in valore assoluto quanto più il campione si discosta dall’ipotesi formulata. Il valore-p è quindi dato da

P (|D0| > |d0|) = P

Volendo considerare il problema della verifica di

H0 : µ1− µ2 = 0; H1 : µ1− µ2 6= 0 (7.33)

Per il test unilaterale (destro) per la verifica dell’ipotesi nulla sulla differenza tra le medie

H0 : µ1− µ2 ≤ 0

che equivale a H0 : µ1 ≤ µ2, ci si riferisce sempre alla quantità D0 ma lo scostamento è indicato da valori grandi (positivi), quindi il valore-p del test è

dove si è indicato con d0 il valore osservato di D0. La regione di rifiuto di livello α per la verifica del sistema d’ipotesi

H0 : µ1− µ2 ≤ 0; H1 : µ1− µ2 > 0 (7.35)

cioè si deciderà di rifiutare l’ipotesi nulla se nel campione si è osservato

¯

y1− ¯y2 > z1−α21/n1+ σ22/n2.

Infine se l’ipotesi nulla è (test unilaterale sinistro) H0 : µ1− µ2 ≥ 0

allora si guarderà alla probabilità di ottenere un valore più piccolo di quello osservato d0, che fornisce il livello di significatività osservato per la verifica di H0:

Per l’individuazione della regione di rifiuto di livello α nella formulazione H0 : µ1− µ2 ≥ 0; H1 : µ1− µ2 < 0

si procede in modo analogo a quanto visto prima, pervenendo alla regione R = {D0 < −z1−α} =

( Y1− Y2

12/n1+ σ22/n2 < −z1−α )

. Le regioni di rifiuto sono sintetizzate in tabella 7.6.

Si è assunto finora di conoscere le varianze. Se ciò non si verifica, come tipicamente avviene, occorre estendere quanto visto sopra al caso in cui la varianza debba essere stimata. Più precisamente, si procede in maniera ana-loga a quanto fatto nel caso di un campione, salvo un’ipotesi aggiuntiva che riguarda l’eguaglianza delle varianze nei due gruppi.

H0 H1 R

µ1 − µ2 ≤ 0 µ1− µ2 > 0 y¯1− ¯y2 > z1−α21/n1+ σ22/n2 µ1 − µ2 ≥ 0 µ1− µ2 < 0 y¯1− ¯y2 < −z1−α21/n1+ σ22/n2

µ1− µ2 = 0 µ1− µ2 6= 0 |¯y1− ¯y2| > z1−α

212/n1+ σ22/n2 Tabella 7.6: Regioni di rifiuto per la verifica delle ipotesi sulla differenza tra le medie di due popolazioni normali con varianze note.

Caso delle varianze non note

Rispetto alla situazione precedente, occorre supporre che la varianza sia la medesima nelle due popolazioni, cioè σ12 = σ22, analogamente a quanto fatto in sezione 5.5 per la costruzione di intervalli di confidenza. Per stimare la varianza comune σ2 si ricorre a

Sp2 = 1

n1+ n2− 2((n1− 1)S12+ (n2− 1)S22) Poiché, come visto,

D = Y1− Y2− (µ1− µ2) Spq

1 n1 +n1

2

∼ tn1+n2−2

possiamo scrivere

P (−tn1+n2−2,1−α/2 ≤ D ≤ tn1+n2−2,1−α/2) = 1 − α,

da cui si ricava un intervallo di confidenza di livello 1 − α per µ1 − µ2

Y1− Y2± tn1+n2−2,1−α

2Spr 1 n1 + 1

n2

In analogia al caso precedente, si può dire che si accetta l’ipotesi µD = µ1−µ2 = 0 se l’intervallo di confidenza per µ1−µ2 include il valore ipotizzato per la differenza, ovvero lo zero.

Equivalentemente, fissato α, si può determinare la soglia critica k della Quindi, se si indica con d0 il valore osservato di

D0 = Y1− Y2

la regione di rifiuto di livello α è scritta equivalentemente come

|d0| > tn1+n2−2,1−α/2,

essendo la distribuzione di D0 sotto l’ipotesi nulla una t di Student con n1+ n2− 2 gradi di libertà.

D’altra parte, per giudicare se la differenza osservata (¯y1 − ¯y2) devia for-temente da 0 nell’ipotesi H0 : µD = µ1 − µ2 = 0, si calcola la probabilità

dove si è indicato con Ftn1+n2−2 la funzione di ripartizione della t di Student con n1+ n2− 2 gradi di libertà.

Si procede analogamente per ricavare le regioni di rifiuto al livello α per le altre due formulazioni dell’ipotesi nulla H0 : µ1− µ2 ≤ 0 e H0 : µ1− µ2 ≥ 0 (tabella 7.7).

Se l’ipotesi nulla è

H0 : µ1− µ2 ≤ 0 allora il valore-p si ottiene calcolando

P (D0 > d0) = 1 − Ftn1+n2−2(d0)

dove d0 = (¯y1− ¯y2)/(spp(1/n1) + (1/n2)).

Infine se si vuole verificare

H0 : µ1− µ2 ≥ 0 allora si valuterà la probabilità

P (D0 < d0) = Ftn1+n2−2(d0)

che fornisce evidenza contro l’ipotesi nulla quando è molto piccola.

Esempio 7.21. Un produttore di lampadine afferma di aver realizzato un nuovo sistema che prolunga la durata delle lampadine. Per testare la vali-dità delle sue affermazioni, si formula l’ipotesi che il nuovo dispositivo non abbia effetto sulla durata della lampadina, cioè che la durata media, µ1, delle lampadine dotate del nuovo sistema sia minore o uguale alla durata media, µ2, delle lampadine del vecchio tipo). Allora si ha l’ipotesi nulla H0 : µ1 ≤ µ2, e l’alternativa è che il nuovo sistema sia migliore di quello già in uso, H1 : µ1 > µ2. Si osservano due campioni da ciascun tipo di lampadina, entrambi di numerosità n1 = n2 = 31. Dal campione delle lampadine dotate del nuovo sistema si ottiene ¯y1 = 1195.16 e s21 = 118.13, mentre il campione di lampadine del vecchio tipo ha fornito ¯y2 = 1180.05 e s22 = 124.34.

Per entrambe le popolazioni si assuma la normalità della variabile durata di vita. Inoltre, nell’ipotesi che le varianze delle due popolazioni siano uguali, la varianza comune è stimata mediante la media ponderata delle varianze campionarie corrette

s2p = 30(118.13) + 30(124.34)

60 = 121.23.

Fissato un livello di significatività, ad esempio, pari ad α = 0.01, si rifiuta l’ipotesi nulla se

¯

y1− ¯y2 > tn1+n2−2,1−α

s s2p 1

n1 + 1 n2



Equivalentemente, si confronta il valore osservato della statistica test t = y¯1− ¯y2

r s2p

1 n1 +n1

2



= 1195.16 − 1180.05

121.23(1/31 + 1/31) = 5.40

H0 H1 R

µ1− µ2 ≤ 0 µ1− µ2 > 0 y¯1 − ¯y2 > tn1+n2−2,1−α

r s2p

1 n1 + n1

2



µ1− µ2 ≥ 0 µ1− µ2 < 0 y¯1 − ¯y2 < −tn1+n2−2,1−α

r s2p

1 n1 + n1

2



µ1− µ2 = 0 µ1− µ2 6= 0 |¯y1 − ¯y2| > tn1+n2−2,1−α/2

r s2p

1 n1 +n1

2



Tabella 7.7: Regioni di rifiuto per la verifica delle ipotesi sulla differenza tra le medie di due popolazioni normali con varianze incognite uguali.

con il quantile di ordine 1 − α = 0.99 della t con 60 gradi di libertà, t60,0.99 = 2.39. Essendo 5.40 > 2.39 si decide rifiutare l’ipotesi nulla al li-vello dell’1%, cioè si riconosce al nuovo tipo di lampadina migliori qualità rispetto al vecchio.

Ricordando che il livello di significatività osservato è la probabilità di osser-vare valori della funzione test meno favorevoli ad H0 del valore effettivamente ottenuto, si ottiene un valore-p dato da

P (T > 5.40) < 0.0005

poiché dalle tavole risulta P (T > 3.4602) = 0.0005, per T ∼ t60. Pos-siamo dunque concludere che sembra sussistere una aumento significativo della durata nelle lampadine con il nuovo sistema, a sostegno dell’ipotesi alternativa.

N

Nel documento baccelli verdi 428 baccelli gialli (pagine 49-56)

Documenti correlati