• Non ci sono risultati.

14. TEORIA DEI TEST STATISTICI

N/A
N/A
Protected

Academic year: 2021

Condividi "14. TEORIA DEI TEST STATISTICI"

Copied!
24
0
0

Testo completo

(1)

14. TEORIA DEI TEST STATISTICI

14.1 Generalità sui test di significatività

I dati campionari possono essere utilizzati, oltre che per costruire l’intervallo di confidenza di un parametro ignoto , anche per verificare se una certa congettura su una caratteristica della popolazione può essere ritenuta verosimile o meno, alla luce dei risultati ottenuti sul campione casuale estratto.

Con il termine ipotesi statistica si indica una supposizione su una qualche caratteristica ignota di una popolazione: per esempio, si può voler verificare se un macchinario produce una proporzione adeguata di pezzi che rispettano caratteristiche prestabilite, se un dado o una moneta sono equilibrati, se un farmaco è efficace nella cura di una determinata malattia, se esiste o meno una qualche dipendenza fra due variabili o se la distribuzione di una certa variabile può essere approssimata da un determinato modello teorico.

Le ipotesi sono sottoposte a verifica sulla base del campione estratto e la procedura utilizzata per la verifica di queste ipotesi costituisce il cosiddetto test statistico.

Per esempio, per verificare se una moneta è equilibrata si potrebbe lanciare più volte la moneta e registrare il numero di teste e di croci. Si riterrà plausibile l’ipotesi che la moneta sia equilibrata se il numero di teste e di croci ottenute in un numero sufficientemente elevato di lanci non risultano molto diversi fra loro, ma non si può stabilire con certezza se un'ipotesi è vera o falsa, dato che uno stesso risultato può derivare da monete diverse. Se si lanciasse una moneta equilibrata 100 volte, il numero di teste ottenute potrebbe comunque variare da un risultato minimo pari a 0 fino ad un massimo pari a 100, anche se ovviamente i risultati più probabili sono quelli in cui il numero di teste e di croci non sono troppo diversi fra di loro. È però possibile ottenere un numero di teste pari a 0 o pari a 100, anche se la probabilità di questi risultati è piccolissima (in entrambi i casi è 0.5100).

Un qualsiasi criterio di decisione circa l’accettazione o il rifiuto di un’ipotesi comporta il rischio di commettere due diversi tipi di errore che consistono:

- nel rifiutare l’ipotesi quando è vera - nell’accettarla quando è falsa.

Nel caso della moneta, il risultato campionario potrebbe indicare che la moneta è equilibrata anche se non lo è realmente, oppure potrebbe indicare che la faccia “testa” ha una probabilità molto maggiore di “croce”

anche se la moneta fosse equilibrata o, addirittura, se la faccia “croce” avesse in realtà una probabilità maggiore della faccia “testa”.

Per semplicità nelle pagine successiva si prenderà in considerazione solo il primo tipo di errore, ossia la probabilità di rifiutare un'ipotesi quando è vera, per cui i test che verranno descritti in seguito vengono più correttamente chiamati test di significatività.

(2)

In generale, l’ipotesi che si vuole verificare è detta ipotesi nulla ed è indicata con la notazione

H0:

seguita dal suo enunciato formale, dove H è l’iniziale del termine inglese Hypothesis.

Nel caso della moneta, se  indica la probabilità associata alla faccia testa, l’ipotesi che la moneta sia bilanciata corrisponde a

H0 :  =0.5.

In generale l’ipotesi che un parametro  assuma uno specifico valore 0 viene indicata mediante la notazione

H0:  = 0. 14.1.1

Un’ipotesi H0 su  è ovviamente considerata tanto più verosimile quanto più la stima campionaria risulta probabile sotto H0, per cui la regola di decisione consiste nell’accettare H0 se la stima campionaria rientra nell’insieme dei risultati più probabili sotto H0 e nel rifiutarla in caso contrario.

Nell’esempio relativo alla moneta si sarà portati a ritenere che la moneta sia equilibrata se, lanciandola un adeguato numero di volte, si ottiene un numero di teste pressoché uguale al numero di croci, ossia se la frequenza relativa delle teste si avvicina a 0.5 mentre, al crescere della differenza fra il risultato campionario ottenuto e 0.5, si sarà sempre più portati a ritenere che la moneta è sbilanciata.

In generale, un’ipotesi sul valore del parametro  è considerata tanto più verosimile quanto più il valore t0

assunto dallo stimatore T di  sul campione estratto risulta probabile se si assume come vera l’ipotesi H0.

In altri termini, la regola di decisione su cui si basano i test di significatività consiste nell’accettare l’ipotesi H0 se il valore t0 della stima campionaria di rientra nell’insieme dei risultati più probabili sotto H0 e nel rifiutarla in caso contrario.

In generale, per verificare un’ipotesi 14.1.1, si sceglie uno stimatore T di  e si fa riferimento alla sua distribuzione di probabilità determinata come se 0 fosse il vero valore di . Questa è la cosiddetta distribuzione dello stimatore sotto ipotesi nulla.

L’insieme dei possibili risultati campionari viene quindi suddiviso nella regione di accettazione di H0 (che comprende i risultati più probabili sotto H0) e in una regione di rifiuto o regione critica (che comprende i risultati che sono invece poco probabili sotto la stessa ipotesi).

Una volta scelto il livello di probabilità , gli estremi dell’intervallo di accettazione dell’ipotesi nulla, detti

(3)

valori critici (o valori soglia), spesso corrispondono ai due quantili che in questa distribuzione isolano il primo sulla sua sinistra ed il secondo sulla sua destra una probabilità pari ad /2.

Come abbiamo visto, la regola di decisione consiste nel rifiutare l’ipotesi nulla quando il risultato campionario t di T risulta compreso nella regione critica. In questo caso si dice che il valore della statistica è significativo.

Nell’esempio della moneta, ipotizzando l’indipendenza dei lanci e supponendo che n sia abbastanza elevato da poter utilizzare il teorema limite centrale, la distribuzione dello stimatore "proporzione di teste ottenute nei lanci" può essere approssimata da una normale di valore atteso 0.5 e varianza

   

n n

5 . 0 1 5 . 0 1

 

, per cui i risultati più probabili di sotto H0 sono compresi in un intervallo centrato

su 0.5.

La regola di decisione consiste nel ritenere verosimile l’ipotesi nulla se la stima campionaria pˆ è compresa nell’intervallo dei risultati più probabili e nel rifiutarla se cade all’esterno, anche se esiste una probabilità non nulla di rifiutare H0 quando è vera, perché si può ottenere un risultato campionario che rientra fra quelli poco probabili sotto tale ipotesi.

La probabilità dell’errore che consiste nel rifiutare l’ipotesi nulla quando è vera viene indicata con  e viene detta errore di prima specie o livello di significatività. Il valore  corrisponde quindi alla probabilità di ottenere, quando è vera H0, un risultato compreso nella regione di rifiuto dell’ipotesi.

Questo significa che la regola di decisione utilizzata porterà necessariamente al rifiuto di un’ipotesi vera con una probabilità pari ad , per cui il valore di  viene fissato in modo da essere “quasi sicuri” di non respingere H0 quando è vera. Nelle situazioni reali si tengono presenti le conseguenze che derivano dall’eventuale rifiuto di un'ipotesi vera per cui, se si ha interesse a tutelarsi contro questo rischio, è necessario ridurre questa probabilità.

D’altra parte è evidente che al diminuire di  aumenta di conseguenza l’ampiezza dell’intervallo di accettazione per cui, fissando un valore estremamente basso, si finisce per non respingere H0 anche in presenza di risultati che sono molto improbabili sotto quell’ipotesi e per i quali, quindi, l’ipotesi stessa risulta poco verosimile. I valori di  più comunemente utilizzati sono 0.10, 0.05 e 0.01.

Nel caso della verifica di ipotesi sulla moneta, se il numero n di lanci è abbastanza elevato da poter utilizzare il teorema limite centrale, la regione di accettazione dell’ipotesi nulla =0.5 sarà interna ai due quantili di ordine /2 e 1/2 che isolano, rispettivamente, un’area pari ad /2 sulla sinistra e sulla destra della distribuzione dello stimatore sotto H0. Le due regioni di rifiuto saranno invece posizionate lungo le code di questa distribuzione.

Va infine notato che quando la stima campionaria t0 assunta dallo stimatore T sul campione estratto è compresa nell’intervallo di accettazione dell’ipotesi nulla, questo non implica che H0 sia effettivamente vera.

Se, per esempio, si fosse ottenuto un numero di teste pari a 501 su 1000 lanci non si rifiuterebbe l’ipotesi che

(4)

la moneta sia equilibrata, ma non si rifiuterebbe neppure l’ipotesi che il parametro ignoto  sia uguale a 0.501 oppure a 0.502.

Per questo motivo, quando la stima campionaria è compresa nell’intervallo di accettazione dell’ipotesi nulla, si conclude l’analisi affermando che “non si ha motivo di rifiutare H0 al livello  prefissato”. Ogni stima t di T rientra infatti anche nell’insieme dei risultati più probabili sotto altre ipotesi, diverse da H0, ed è quindi compreso nell’intervallo di accettazione associato a tutte queste ipotesi.

(5)

14.2 Verifica di ipotesi su

Quando l’ipotesi nulla riguarda il parametro  di una variabile Z l’ipotesi 14.1.1 assume la forma seguente

H0: 0 14.2.1

e la sua verifica viene effettuata in modo diverso a seconda del grado di conoscenza sulla distribuzione della variabile Z nella popolazione

- Primo caso

Se è noto che la variabile Z ha una distribuzione normale di varianza nota

, noto

Z~N μ σ2

assumendo come vera l’ipotesi nulla 14.2.1, la distribuzione della media campionaria risulta





n μ σ N

~ X

2 0, .

L’intervallo di accettazione di H0 sarà quindi centrato su 0 e, una volta scelto il livello di significatività , risulterà delimitato dai due quantili che isolano rispettivamente a sinistra e a destra della distribuzione un’area pari ad /2.

Considerata infatti la distribuzione dello stimatore “media campionaria” sotto l’ipotesi nulla 14.2.1, ossia assumendo vera l’ipotesi 0, e scelto il livello di probabilità , gli estremi dell’intervallo di accettazione corrispondono ai due quantili che in questa distribuzione isolano il primo sulla sua sinistra ed il secondo sulla sua destra una probabilità pari ad /2. Questi due valori critici delimitano al loro interno la regione di accettazione dell’ipotesi nulla, data dall’insieme dei risultati campionari più probabili sotto l’ipotesi H0: se la media campionaria cade nella regione di accettazione si conclude l’analisi affermando che non si ha motivo di rifiutare H0 o che l’ipotesi è compatibile con il risultato campionario. Gli intervalli a sinistra del valore critico inferiore e a destra del valore critico superiore costituiscono invece la regione di rifiuto dell'ipotesi.

Pertanto, se la media campionaria cade nella regione critica, il valore della statistica è significativo e l’ipotesi va rifiutata al livello di significatività 

La verifica dell'ipotesi nulla può essere effettuata in modo più semplice, facendo riferimento alla normale standardizzata. Si considera quindi la statistica test

σ n μ

X0 ~N

 

0,1 14.2.2

(6)

e la regione di accettazione dell’ipotesi è in questo caso costituita dai valori compresi fra i quantili di ordine

/2 e 1/2 della N(0, 1), perché sono questi i valori della statistica 14.2.2 che risultano più probabili sotto ipotesi nulla.

Data la simmetria della distribuzione rispetto allo zero è però sufficiente confrontare il risultato della statistica test 14.2.2 presa in valore assoluto

σ n μ X0

14.2.3

con il quantile positivo z1/2 della normale standardizzata.

Se risulta

σ n μ X0

> z1-/2

il valore della statistica test è significativo e l'ipotesi nulla viene rifiutata al livello di significatività ; in caso contrario l'ipotesi è compatibile con i risultati campionari e non c’è motivo di rifiutarla.

Un test di significatività può essere effettuato in modo più accurato mediante il calcolo del p-valore (in inglese p-value) associato al valore assunto dalla statistica test 14.2.3. Questo p-valore rappresenta la probabilità che la statistica test assuma un valore più estremo di quello osservato, sempre assumendo l’ipotesi che H0 sia vera, per cui quanto più il p-valore è piccolo, tanto meno verosimile appare l’ipotesi nulla.

In generale, considerato il valore |t| assunto dalla statistica test T che si distribuisce come una N(0, 1), il p-valore corrispondente è pari alla somma dell’area isolata alla destra di |t| più l’area alla sinistra dello stesso valore preso con segno negativo -|t|.

Posto per semplicità t > 0, il p-valore corrispondente è pari a

   

t t  

 

t  

 

t



 

t

 1 1 21

1

Esempio 14.2.1

Su un campione di 10 elementi estratto da una popolazione normale di varianza nota pari a 160 si è ottenuta una media campionaria pari a 20. Si vuole verificare l’ipotesi che la media nella popolazione sia 25 al livello =0.1.

L’ipotesi nulla assume la forma H0: = 25

per cui la statistica test 14.2.3 risulta uguale a

(7)

25 . 10 1 / 160

25

0  20 

σ n

μ X

Il risultato ottenuto va confrontato con il quantile z0.95=1.645, per cui 1.25 cade nella regione di accettazione e non si ha quindi motivo di rifiutare l’ipotesi al livello di significatività del 10%.

Esempio 14.2.2

Sulla base dei dati dell’esempio precedente, si calcoli il p-valore associato alla statistica test.

Il p-valore associato a 1.25 è uguale all’area isolata alla destra di tale valore più l’area alla sinistra dello stesso valore preso con segno negativo, ossia

1

 

1.25

2

1 0.8944

0.2112

2     

Si può quindi concludere che il risultato della statistica test non porta al rifiuto dell’ipotesi nulla per nessun livello di significatività minore di 0.2112 e, quindi, per nessuno dei valori di più comunemente usati.

- Secondo Caso

Se è noto che la Z si distribuisce in modo normale ma la sua varianza è ignota e il campione è piccolo, con una numerosità fino a 30 elementi, per la verifica dell’ipotesi 14.2.1 si utilizza la seguente statistica test

n S

μ X

c

0

1

tn

~ 14.2.4

che si distribuisce come una t di Student con n1 gradi di libertà.

I risultati più probabili sotto ipotesi nulla sono quindi concentrati intorno allo zero e i due valori critici corrispondono ai due quantili che nella distribuzione tn1 isolano rispettivamente a sinistra e a destra un’area di probabilità pari ad /2.

La regione di accettazione dell’ipotesi è quindi costituita dall’intervallo

tn1,1α/2; tn1,1α/2

per cui, data la simmetria della distribuzione rispetto allo 0, la verifica dell’ipotesi può essere effettuata confrontando

n S

μ X

c

0

14.2.5

con il quantile tn1,1α/2. Se risulta

2 1 , 1

0 n α/

c

n t S

μ

X  

l’ipotesi nulla viene rifiutata al livello , mentre in caso contrario risulta compatibile con il risultato

(8)

campionario.

Esempio 14.2.3

Su un campione casuale di 8 elementi estratto da una popolazione normale sono stati rilevati i seguenti valori della variabile oggetto di studio

1.1 3.1 4.2 4.6 5.0 5.2 5.3 6.5

Verificare l’ipotesi che la media della popolazione sia pari a 5 al livello di significatività=0.01.

Dai dati campionari risulta

   

26964

7 359375 8

. 2 5

21 375

4. EX2 . S2 S2 S2 .

X

E    c   

Per la verifica dell’ipotesi H0: = 5

si utilizza la statistica 14.2.5 che nel caso in esame assume il valore 499

. 3 0770

. 8 1 / 6964 . 2

5 375 . 4

995 . 0 ,

7

 

t

per cui non si ha motivo di rifiutare l’ipotesi nulla al livello di significatività prefissato.

- Terzo Caso

Se la Z si distribuisce in modo normale con varianza ignota e il campione è grande, con una numerosità superiore a 30 elementi, la verifica di ipotesi 14.2.1 si basa sempre sulla statistica test 14.2.4 la cui distribuzione però, per il teorema limite centrale, tende a una distribuzione normale.

Pertanto il procedimento approssimato consiste nel calcolare la statistica test 14.2.5 e di confrontare il risultato ottenuto con il quantile della distribuzione N(0,1) che isola alla sua destra un’area pari ad /2.

Pertanto, se risulta

2 / 1 0

z

n S

μ X

c

14.2.6

l’ipotesi nulla viene rifiutata al livello , mentre in caso contrario è da ritenersi compatibile con il risultato campionario.

Esempio 14.2.4

Su un campione casuale di 65 uova è stato rilevato lo "spessore del guscio” (in millimetri) ottenendo x0.32 e 08

0.

Sc. In base a queste informazioni e sapendo che la variabile ha una distribuzione normale, si vuole verificare l'ipotesi che lo spessore medio del guscio sia pari a 0.3 millimetri al livello di significatività = 0.05.

La verifica dell’ipotesi 3 . 0 : H0 

va effettuata controllando se è verificata la disuguaglianza 14.2.6. Dato che si ottiene 96

1 02

65 2 08 0

30 0 32 0

975

0 .

z , .

, ,

.

 

,

l'ipotesi viene rifiutata al livello di significatività = 0.05.

(9)

Esempio 14.2.5

Sulla base dei dati dell’esempio precedente si verifichi l’ipotesi 3

. 0 :

H0 

mediante il calcolo del p-valore.

Il p-valore risulta uguale a

1

 

2.02

2

1 0.9783

0.0434

2     

per cui l’ipotesi nulla deve essere rifiutata per un livello = 0.05, ma sarebbe compatibile con il risultato campionario ottenuto se si decidesse di lavorare ad un livello = 0.01.

- Quarto caso

Se non si ha nessuna informazione circa la distribuzione della variabile Z nella popolazione ma il campione è grande, con una numerosità superiore a 50 elementi (anche se spesso viene considerata sufficiente una numerosità campionaria superiore a 30), la verifica di ipotesi 14.2.1 si basa sempre sulla statistica test 14.2.5 e il valore ottenuto va confrontato con il quantile di ordine 1/2 della normale standard.

Pertanto il procedimento risulta il medesimo descritto nel caso precedente e l’ipotesi nulla viene rifiutata se è verificata la disuguaglianza 14.2.6.

(10)

14.3 Verifica di ipotesi su

Data una popolazione in cui la variabile Z ha una distribuzione Zero-Uno caratterizzata dal parametro , la verifica di ipotesi sul valore del parametro assume la forma

H0 :  = 0. 14.3.1

Se il campione è sufficientemente numeroso, lo stimatore proporzione campionaria ha una distribuzione asintoticamente normale, in base al teorema limite centrale.

Assumendo come vera l’ipotesi nulla, la distribuzione di ha valore atteso 0 e varianza

 

n π π01 0

, per cui la statistica test

n P

) (1 ˆ

0 0

0

tende a distribuirsi come una N(0, 1).

Di conseguenza, tenendo presente quanto descritto a proposito della verifica di ipotesi su  e seguendo il medesimo procedimento, l’ipotesi nulla 14.3.1 verrà rifiutata se risulta

2 / 1 0 0

0

) (1 ˆ

z

n

P 14.3.2

mentre sarà ritenuta compatibile con il risultato campionario in caso contrario.

Esempio 14.3.1

Si vuole verificare al livello di significatività dell’1% l’ipotesi che il tasso di disoccupazione dei laureati con una votazione finale superiore o uguale a 100 sia pari al 5% sapendo che dalla popolazione è stato estratto un campione casuale di 5000 studenti sui quali 300 sono risultati disoccupati.

H0 : = 0.05

La proporzione di studenti disoccupati nel campione estratto è pari al 6% per cui la statistica test assume il valore seguente

576 2 24

3 5000

95 0 05 0

05 0 06 0

995

0 .

z . .

. . .

.

 

e l’ipotesi viene quindi rifiutata al livello = 0.01.

(11)

Esempio 14.3.2

Sulla base dei dati dell’esempio precedente calcolare il p-valore associato alla statistica test.

Si ottiene

1

 

3.24

2

1 0.9994

0.0012

2     

(12)

14.4 Verifica dell’uguaglianza fra due valori medi

In molte situazioni reali lo scopo di un’indagine statistica consiste nel confronto fra due o più popolazioni considerate in tempi o in situazioni diverse anche se di seguito, per semplicità, verrà considerato solo il caso in cui le popolazioni esaminate sono solo due. In questi casi si ha generalmente interesse a confrontare i valori medi di una determinata variabile nelle due popolazioni oppure le proporzioni di unità che presentano una determinata caratteristica nelle due popolazioni.

In entrambi i casi si estrae un campione da ciascuna popolazione e sui due insiemi di dati si calcola la media campionaria o la proporzione campionaria per verificare se la differenza fra le stime ottenute è così piccola da poter essere imputata solo all’effetto di fattori casuali o se invece è così elevata da portare al rifiuto dell’ipotesi nulla di uguaglianza dei valori dei parametri che caratterizzano le due popolazioni.

I campioni considerati sono ovviamente indipendenti fra di loro, in quanto estratti da due popolazioni diverse.

In questo paragrafo è considerata la verifica dell’ipotesi di uguaglianza dei valori attesi di Z nella prima e nella seconda popolazione

H0 : 1 = 2 14.4.1

così come accade, per esempio, quando si vuole confrontare l’effetto di due diversi fertilizzanti sul rendimento per ettaro di una coltura o l’effetto di due medicinali nella cura di una malattia: se la differenza fra le due medie campionarie è così grande da non poter essere imputata ai soli fattori casuali, si è portati a concludere che un fertilizzante è migliore rispetto all’altro o che il tempo di guarigione con un medicinale è sensibilmente minore rispetto all’altro.

Altri esempi comuni del confronto fra i valori medi di una variabile esaminata in due popolazioni distinte si hanno quando si esamina il rendimento di due diversi titoli, i risultati ottenuti all’esame da studenti che hanno utilizzato due testi differenti, la durata di funzionamento di prodotti ottenuti con due macchinari diversi.

La verifica di una ipotesi 14.4.1 viene effettuata in modi diversi a seconda del grado di conoscenza sulla distribuzione della Z nelle due popolazioni e a seconda della numerosità n1 e n2 dei campioni casuali estratti.

Indicata con X1 la v.c. “valore di Z sull’unità estratta dalla prima popolazione” e con X2 la v.c. “valore di Z sull’unità estratta dalla seconda popolazione”, la verifica dell’ipotesi 14.4.1 viene effettuata sulla base del valore assunto dalla differenza delle due medie campionarie X1 e X2. Tanto più questa differenza è piccola in valore assoluto, tanto più l’ipotesi nulla sembra verosimile, mentre diventa via via più improbabile al crescere del suo valore.

Se la numerosità dei due campioni è sufficientemente elevata da poter utilizzare il teorema limite centrale, la distribuzione di probabilità delle due medie campionarie può essere approssimata da





1 12 1

1 ,

n μ σ N

~ X

(13)





2 2 2 2

2 ,

n μ σ N

~ X

dove σ12 e σ22 sono le varianze della Z nelle due popolazioni.

Dato che i due campioni provengono da due differenti popolazioni, le v.c. X1 e X2 risultano indipendenti fra loro, per cui la distribuzione approssimata della loro differenza risulta





  

2 2 2 1 2 2 1 1 2

1 ,

n σ n μ σ μ N

~ X X

ed effettuando la standardizzazione, si ha quindi

   

0,1

2 22

1 12

2 1 2

1 ~N

n σ n σ

μ μ X X

 . 14.4.2

Di solito le varianze delle popolazioni non sono note, ma possono essere stimate in modo corretto e coerente mediante le varianze campionarie corrette per cui, al posto della 14.4.2, si utilizza la seguente statistica test

   

0,1

2 22

1 12

2 1 2

1 ~N

n S n S

μ μ X X

c c

che, sotto l’ipotesi nulla 14.4.1 assume la forma

 

0,1

2 2 2 1 2 1

2

1 ~N

n S n S

X X

c c

 . 14.4.3

Per effettuare la verifica dell’ipotesi 14.4.1 al livello di significatività  si può quindi confrontare il valore assoluto della statistica test 14.4.3 con il quantile z1/2 della normale standardizzata.

Se risulta

(14)

2 2 2 1 2 1

2 1

n S n S

X X

c c

> z1-/2 14.4.4

il valore della statistica è significativo e l'ipotesi nulla viene rifiutata al livello di significatività , mentre in caso contrario l'ipotesi è compatibile con il risultato campionario e non vi sono motivi per rifiutarla.

Esempio 14.4.1

Due diversi metodi di coltura sono stati utilizzati su due campioni di piante di numerosità n1=40 e n2=60 ottenendo i seguenti risultati:

162 0

. 94

52 6

. 97

22 2

12 1

c c

s x

s x

Si vuole verificare l’ipotesi che i due diversi metodi di coltura non diano risultati significativamente diversi fra loro al livello di significatività =0.05.

La statistica test 14.4.4 assume il valore

96 . 1 8

. 1 60 162 40 52

94 6 . 97

975 .

0

z

per cui non si ha motivo di rifiutare l’ipotesi.

Esempio 14.4.2

Sulla base dei dati dell’esercizio precedente, si calcoli il p-valore associato alla statistica test.

Risulta

1

 

1.8

2

1 0.9641

0.0718

2     

per cui l’ipotesi di uguaglianza fra valori attesi va rifiutata per qualsiasi valore di superiore a 0.0718.

Nel caso in cui si possa assumere la cosiddetta ipotesi di omoschedasticità, ossia l’ipotesi che le varianze delle due popolazioni siano uguali fra loro e uguali a 2, la statistica 14.4.2 assume la forma seguente

       

0,1

2 1

2 1

2 1 2 1

2 1

2 1 2

2 1 2 1

2 2

1 2

2 1 2

1 ~N

n n

n σ n

μ μ X X n

n n σ n

μ μ X X

n σ n σ

μ μ X X

 

 

 14.4.5

Anche in questo caso, in genere, il valore del parametro 2 è ignoto, ma può essere stimato in modo corretto mediante la cosiddetta varianza campionaria pooled che assume la forma seguente

   

2 1 1

2 1

2 2 1 2 1 2 1

 

n n

S n S

Sp n c c

(15)

e corrisponde quindi alla media delle due varianze campionarie corrette ponderate con le rispettive numerosità campionarie diminuite di 1.

Al posto della 14.4.5, si utilizza quindi la seguente statistica test

 

2

2 1

2 1

2 1 2 1

2 1

n n p

t

~ n

n n S n

μ μ X X

che si distribuisce come una t con n1+n22 gradi di libertà.

Sotto l’ipotesi nulla 14.4.1 questa statistica assume la forma

2

2 1

2 1

2 1

2 1

n n p

t

~ n n

n S n

X

X . 14.4.6

Per cui, per effettuare la verifica dell’ipotesi 14.4.1 al livello di significatività , si confronta il valore assoluto della statistica test 14.4.6 con il quantile tn1n22,1/2.

Se risulta

2 / 1 , 2

2 1

2 1

2 1

2 1

 

n n p

t n n

n S n

X

X 14.4.7

il valore della statistica è significativo e l'ipotesi nulla si rifiuta al livello di significatività , mentre in caso contrario non va rifiutata.

Esempio 14.4.3

È stato effettuato un esperimento per confrontare gli effetti di due diverse miscele (A e B) aggiunte al mangime dei polli che dovrebbero favorire l’accrescimento degli animali. Sapendo che dopo un periodo di 2 settimane sono stati rilevati gli incrementi di peso (espressi in grammi) riportati nella tabella successiva, verificare se le due miscele hanno un effetto significativamente diverso al livello di significatività 0.05 ipotizzando che l’accrescimento di peso si distribuisca in modo normale e che sia valida l’ipotesi di omoschedasticità.

A 639 646 650 641 641 637 659 650 640 635 B 650 633 631 637 642 638 640 634 626 636 640

I due campioni, di numerosità n1=10 e n2=11, hanno media e varianza corretta rispettivamente pari a 8

.

1643

x , s12c 54.4

(16)

2637

x , s22c39.6 La varianza pooled è pari a

6105 . 19 46

6 . 39 10 4 . 54

2 9   

sp

e la statistica test per la verifica dell’ipotesi nulla è pari a

2796 . 2 110

11 610510 . 46

637 8 .

643 

Dato che il quantile di riferimento è t19,0.9752.093si rifiuta H0 al livello di significatività 0.05.

Va ricordato che se il numero dei gradi di libertà della t è superiore a 30, il valore dei suoi quantili può essere approssimato dal valore dei quantili dello stesso ordine della normale standard.

(17)

14.5 Verifica dell’uguaglianza fra due proporzioni

Quando si ipotizza che la variabile di interesse Z ha una distribuzione Zero-Uno e si vuole effettuare il confronto fra il valore del parametro  che la caratterizza in due diverse popolazioni, l’ipotesi nulla assume la forma

H0 : 1 = 2 = 0 14.5.1

dove 0 indica il valore ignoto della proporzione comune. Dato che la distribuzione di Z è caratterizzata da un solo parametro, la 14.5.1 equivale in realtà a verificare l’uguaglianza della distribuzione di Z nelle due popolazioni.

Se le numerosità campionarie n1 e n2 sono sufficientemente elevate, le due proporzioni campionarie ˆP1 e ˆP2 hanno una distribuzione che può essere approssimata da due distribuzioni normali, rispettivamente di parametri

 



 

1 1 1 1

1

, 1 ˆ

N n

~

P

  

 



 

2 2 2 2

2

, 1 ˆ

N n

~

P

  

Anche in questo caso le due v.c. sono indipendenti fra loro, per cui la differenza Pˆ P1 ˆ2 ha la seguente distribuzione asintotica

   



    

2 2 2 1

1 2 1

1 2

1

1 , 1

ˆ ˆ

n N n

~ P

P

     

.

Effettuando la standardizzazione, risulta quindi

 

     

0,1

1 1

ˆ ˆ

2 2 2 1

1 1

2 1 2

1 ~N

n n

P P

 

 14.5.2

Sotto l’ipotesi 14.5.1 la 14.5.2 assume la forma seguente

       

0,1

1 1 1

ˆ ˆ 1

1

ˆ ˆ

2 1 0 0

2 1

2 0 1

0 0

2

1 ~N

n n P P n

n

P P





 

 

 

14.5.3

(18)

in cui compare il parametro ignoto 0 che deve essere stimato in qualche modo. Dato che si dispone di due diverse stime ˆp1 e ˆp2 di 0 si utilizza la media aritmetica delle due proporzioni campionarie ponderata con le numerosità n1 e n2, per cui lo stimatore di 0 assume la forma seguente

2 1

2 2 1 0 1 0

ˆ ˆ ˆ

ˆ n n

P n P P n

 

 .

Questo stimatore corrisponde a quello che si ottiene considerando un unico campione costituito dagli n1

elementi appartenenti al primo campione e dagli n2 elementi appartenenti al secondo campione.

La statistica test per la verifica dell’ipotesi 14.5.1 corrisponde quindi a

 

1 ˆ 1 1

 

0,1

ˆ

ˆ ˆ

2 1 0 0

2

1 ~N

n P n

P

P P



 

per cui, scelto il livello di significatività , si confrontar il valore assoluto della statistica test precedente con il quantile z1/2 della normale standardizzata.

Se risulta

 

 

2 1 0 0

2 1

1 ˆ 1

ˆ 1

ˆ ˆ

n P n

P

P

P > z1-/2 14.5.4

il valore della statistica è significativo e l'ipotesi nulla viene rifiutata al livello di significatività , mentre in caso contrario l'ipotesi è compatibile con il risultato campionario e non vi sono motivi per rifiutarla.

Esempio 14.5.1

Anni fa venne condotto uno studio per analizzare gli effetti positivi dell’uso di aspirina sulla prevenzione degli attacchi cardiaci. Su un insieme di 22071 individui vennero formati due gruppi: il gruppo di trattamento e quello di controllo.

Gli individui del gruppo di trattamento ricevettero una dose quotidiana di aspirina mentre quelli di controllo un farmaco placebo. Lo studio venne condotto per un periodo di 5 anni osservando il numero di decessi per infarto. Si ottennero i seguenti risultati

Farmaco\Esito Infartuati Non infartuati

Placebo 239 10795 11034

Aspirina 139 10898 11037

378 21693 22071

(19)

La proporzione dei colpiti da infarto nel gruppo di controllo è 0.021654 11034

ˆ1 239 

p , mentre la stessa proporzione nel

gruppo sottoposto a trattamento è 0.012597 11037

ˆ2 139 

p . Pertanto risulta 0.017127

22071 139 ˆ0239  p

E la statistica test 14.5.4 è pari a

 

5.185

11037 1 11034 017127 1 . 0 1 017127 . 0

012597 . 0 021654 .

0 



 

 

.

Dato che il p-valore associato a tale risultato è praticamente nullo, l’ipotesi di uguaglianza fra le due proporzioni va rifiutata per qualunque livello di significatività.

(20)

14.6 Test di indipendenza

Nella prima parte di queste dispense si è studiato l’indice chi-quadrato per misurare il grado di dipendenza assoluta (o dipendenza in distribuzione) fra due variabili rilevate contemporaneamente su n unità statistiche.

Quando l’insieme di unità statistiche considerate è l’insieme delle unità che costituiscono un campione casuale il risultato ottenuto con la 6.3.1 o con la 6.3.2 viene utilizzato per verificare se è verosimile l’ipotesi che le variabili siano indipendenti nella popolazione da cui il campione è stato estratto.

Indicato rispettivamente con k e h il numero di determinazioni assunte dalle due variabili di interesse, Z e W, le njl che compaiono nella 6.3.1 o le fjl che compaiono nella 6.3.2 rappresentano le frequenze congiunte campionarie relative alle variabili casuali X “valore di Z sull’unità estratta” e di Y “valore di W sull’unità estratta” mentre le

n n

n'jlnj. .l per j = 1, 2, …, k; l = 1, 2, …, h

o le

.l . j '

jl f f

fper j = 1, 2, …, k; l = 1, 2, …, h

sono le corrispondenti frequenze teoriche, calcolate sotto ipotesi di indipendenza assoluta fra le due variabili.

Assumendo come vera l’ipotesi nulla di indipendenza, le statistiche 6.3.1 e 6.3.2 tendono a distribuirsi come una variabile chi-quadrato con un numero di gradi di libertà pari a (k1)(h1), purché siano soddisfatte due condizioni:

- la numerosità campionaria n deve essere sufficientemente elevata

- le n'jlnf'jl devono essere almeno pari a 5 per ogni j = 1, 2, …, k, l = 1, 2, …, h.

Se è vera l’ipotesi di indipendenza fra le due variabili nella popolazione, la statistica test 6.3.1 (o la 6.3.2) tende ad assumere valori prossimi a zero. L’ipotesi nulla di indipendenza sembra quindi tanto più verosimile quanto più il valore della statistica test è prossima a zero, per cui la regione di rifiuto dell’ipotesi nulla è posizionata lungo la coda destra della distribuzione della χ  2k1 h1 .

Scelto quindi un livello di significatività , la regione di rifiuto dell’ipotesi di indipendenza fra Z e W è costituita da tutti quei valori maggiori del quantile χ  2k1 h1,1α.

(21)

Esempio 14.6.1

Si verifichi l’ipotesi di indipendenza fra due variabili Z e W al livello di significatività =0.05 sapendo che su un campione casuale si sono ottenuti i seguenti risultati relativi alle variabili casuali X “valore di Z sull’individuo estratto”

e di Y “valore di W sull’individuo estratto”

X\Y A B a 30 32 62 b 6 22 28 36 54 90

Si controlla facilmente che le frequenze teoriche calcolate sotto ipotesi di indipendenza sono tutte maggiori di 5, come risulta dai valori riportati nella tabella successiva

X\Y A B

a 24.8 37.2 62 b 11.2 16.8 28

36 54 90

Utilizzando la formula di calcolo semplificata 6.3.3 la statistica test risulta pari a

   90 363062 543262 366 28 542228 1 5.8410

2 2

2 2 2

1 2 1

2 



 

 

 

 

 

e l’ipotesi di indipendenza va quindi rifiutata perché la statistica risulta maggiore del quantile 3.841 che nella chi- quadrato con 1 grado di libertà isola alla sua destra un’area pari a 0.05.

Esempio 14.6.2

Si verifichi l’ipotesi di indipendenza fra due variabili Z e W al livello di significatività =0.01 sapendo che su un campione di 100 elementi si sono ottenuti i seguenti risultati relativi alle variabili casuali X “valore di Z sull’individuo estratto” e di Y “valore di W sull’individuo estratto”

X\Y A B

a 0.02 0.18 0.20 b 0.25 0.25 0.50 c 0.25 0.05 0.30 0.52 0.48 1.00

Le frequenze relative teoriche calcolate sotto ipotesi di indipendenza assumono i valori riportati nella tabella successiva

X\Y A B

a 0.104 0.096 0.20 b 0.260 0.240 0.50 c 0.156 0.144 0.30 0.52 0.48 1.00

per cui ogni n'jl100f'jl è superiore a 5.

Utilizzando la formula di calcolo semplificata 6.3.4 la statistica test risulta pari a

   100 0.052.020.2 0.048.180.2 0.052.250.5 ... 1 26.0150

2 2

2 2 1 2 1

3 



  

 

 

 

e l’ipotesi di indipendenza va quindi rifiutata perché la statistica risulta maggiore del quantile 9.210 che nella chi- quadrato con 2 gradi di libertà isola alla sua destra un’area pari a 0.01.

(22)

14.7 Test sulla bontà di adattamento

Un ulteriore comune utilizzo dei dati campionari è la verifica di ipotesi funzionali, ossia la verifica di ipotesi circa la distribuzione della variabile di interesse. Anche se generalmente non si è in grado di stabilire con certezza la distribuzione di Z, è tuttavia possibile che le informazioni parziali in possesso del ricercatore, o altre considerazioni di varia natura, consentano di formulare un’ipotesi distributiva.

In analogia con le situazioni esaminate in precedenza, lo scopo dell’indagine campionaria consiste nel verificare se l’ipotesi nulla circa la forma funzionale della distribuzione della variabile nella popolazione possa essere ritenuta compatibile o meno con i dati campionari raccolti.

Le ipotesi di questo genere vengono verificate attraverso i cosiddetti test funzionali che possono essere utilizzati anche in situazioni diverse come, per esempio, quando si ha interesse a confrontare la distribuzione di una variabile rilevata su due diverse popolazioni oppure su una stessa popolazione in tempi diversi, al fine di valutare se si rilevano differenze significative.

Data una certa variabile Z con distribuzione f(z), l’ipotesi da sottoporre a verifica assume la forma

 

z f

 

z

f 0

0:

H  14.7.1

dove la distribuzione teorica f0(z) può essere completamente o solo parzialmente specificata, nel senso che l’ipotesi può riguardare o meno anche il valore dei parametri che compaiono nel modello. Nel caso in cui l’ipotesi venga completamente specificata, si formulano delle ipotesi anche sui valori dei parametri che caratterizzano la funzione, mentre in altri casi l’ipotesi riguarda solo la forma funzionale della f0(z).

Il criterio generale per la verifica di un’ipotesi 14.7.1 si basa sul confronto fra la distribuzione teorica, sotto ipotesi nulla, e la distribuzione della variabile nella popolazione, che a sua volta viene stimata sulla base dei dati campionari raccolti, ossia attraverso la distribuzione della v.c. X “valore di Z sull’unità estratta”. Occorre quindi calcolare una qualche statistica test in grado di misurare la differenza fra le due distribuzioni e determinare la distribuzione di probabilità di tale differenza, in modo da individuare la regione critica e la regione di accettazione dell’ipotesi nulla.

Uno dei test utilizzati frequentemente, soprattutto quando la variabile considerata è di tipo qualitativo o quantitativo discreto, è la statistica chi-quadrato analizzata in precedenza. In questo caso, però, la statistica si basa sulla differenza fra i valori assunti dalle probabilità teoriche, calcolate sotto H0, rispetto ai valori delle stime campionarie corrispondenti, date dalle frequenze relative calcolate sul campione osservato.

Considerata una variabile qualitativa o quantitativa discreta Z che assume k determinazioni diverse, sia

P(Z=zj) = j per j = 1, 2, …, k 14.7.2

la probabilità che Z assuma la generica determinazione zj. L’ipotesi da verificare può essere espressa nel modo seguente

(23)

j

j 0

0:

H

per j = 1, 2, …, k 14.7.3

e il generico valore di probabilità teorica

0j, calcolata sulla base del modello distributivo ipotizzato sotto H0, va confrontato con la sua stima campionaria, che corrisponde alla frequenza relativa osservata

n

fjnj 14.7.4

pari al rapporto fra il numero dei casi in cui si è rilevata la j-esima determinazione della variabile in esame rispetto alla numerosità campionaria complessiva.

È evidente che quanto più i valori fj e 0j risultano simili fra loro, tanto più sembra verosimile l’ipotesi nulla 14.7.3, mentre al crescere della loro differenza si sarà portati a rifiutare H0.

Il test chi-quadrato che consente di valutare complessivamente l’entità delle differenze fra le k coppie di valori fj e 0j assume la forma seguente

 

k

j j

j j

k π

π n f

χ

1 0

2 2 0

1 . 14.7.5

La statistica test 14.7.5 risulta pari a zero se e solo se le frequenze relative campionarie sono tutte uguali alle corrispondenti probabilità sotto ipotesi nulla, mentre assume valori via via crescenti al crescere delle differenze fra i valori di queste coppie.

Sotto ipotesi nulla e per una numerosità campionaria n sufficientemente elevata, la distribuzione della statistica test 14.7.5 tende ad una distribuzione chi-quadrato con un numero di gradi di libertà pari a k1 e cioè al numero di determinazioni della v.c. X diminuito di 1.

Anche in questo caso l’ipotesi nulla viene rifiutata per valori alti della statistica test per cui, fissato il livello di significatività , la regione di rifiuto è posizionata alla destra del quantile

k21,1.

La distribuzione asintotica chi-quadrato è valida purché siano verificate condizioni analoghe a quelle descritte nel precedente paragrafo. In particolare:

- la numerosità campionaria n deve essere sufficientemente elevata - i prodotti n

0j devono essere almeno pari a 5 per ogni j = 1, 2, …, k.

Esempio 14.7.1

Si vuole verificare l’ipotesi che un dado sia bilanciato al livello di significatività del 5% sapendo che in 1800 lanci sono stati ottenuti i risultati riportati nella tabella successiva

(24)

Distribuzione dei risultati ottenuti lanciando un dado X Frequenze assolute Frequenze relative

1 324 0.18

2 342 0.19

3 306 0.17

4 270 0.15

5 270 0.15

6 288 0.16

1800 1.00

L’ipotesi nulla assume la forma

6 ,..., 2 , 6 1

: 1

H0jj

e quindi i prodotti 300

6 1800

0j  

n sono tutti maggiori di 5.

La statistica 14.7.5 assume il valore

     

14.4

1/6 1/6 - ... 0.16 1/6

1/6 - 0.19 1/6

1/6 - 1800 0.18

2 2

2 2

5





   

 

mentre il quantile di ordine 0.95 della chi-quadrato con 5 gradi di libertà risulta pari a 11.07, per cui l’ipotesi nulla va rifiutata.

Se si fosse scelto un livello di significatività =0.01, il quantile della chi-quadrato sarebbe stato uguale a 15.09 e l’ipotesi nulla sarebbe risultata compatibile con il risultato campionario osservato.

La statistica 14.7.5 può essere utilizzata anche per variabili casuali continue. In questo caso, però, è necessaria la creazione di un certo numero di classi di valori e il calcolo delle probabilità teoriche e delle frequenze campionarie corrispondenti per ciascuna di queste classi.

Se l’ipotesi nulla si riferisce alla forma della distribuzione della variabile (discreta o continua) specificando anche il valore dei parametri che la caratterizzano, il test viene effettuato sostituendo al valore di questi parametri le corrispondenti stime ottenute sul campione osservato. In questa situazione il numero dei gradi di libertà della distribuzione chi-quadrato risente del numero di parametri stimati. Indicato con q il numero di questi parametri stimati, i g.d.l. della chi-quadrato diventano kq1.

Riferimenti

Documenti correlati

All’interno di ciascuna famiglia (test parametrici e non parametrici) la scelta del test più idoneo dovrà essere guidata dal tipo di quesito e dalla necessità di esplorare il

E’ un teorema di convergenza della binomiale alla gaussiana, che si a¢ anca al teorema degli eventi rari.. Qui, per vedere la convergenza, bisogna standardizzare la binomiale S n (Z n

In questo caso il metodo non è in grado di prendere una decisione e si può ad esempio dire (anche se in un senso lieve- mente improprio) che il metodo ha commesso un errore, per

L’osservabile ‘t’ indica, in questo caso, la distanza della misura x 0 dal valor medio in unità di deviazione standard.. Ovviamente il valore dell’osservabile ‘t’

Si suppone, nel modello di Laplace che gli errori casuali di misura possano essere schematizzati come il concorso contemporaneo di un numero n molto grande di disturbi, molto

Si osservi che la deviazione standard delle medie è 1/N volte più piccolo della deviazione standard delle singole misure; questo implica che le medie

Si osservi che la deviazione standard delle medie è 1/N volte più piccolo della deviazione standard delle singole misure; questo implica che le medie campionarie si

Con un campione di n = 100 la forma della distribuzione delle medie è praticamente normale con un valore medio di 0.7502. La cosa importante è che, per campioni