• Non ci sono risultati.

La verifica di ipotesi

4.1. Il test statistico

4.1.1. La definizione di test statistico. Sulla base del campione osservato ÐB ß á ß B Ñ" 8 si è

interessati a stabilire se il vero valore del parametro appartiene ad un certo sottoinsieme dello spazio parametrico. Dato un modello statistico Y), se gli insiemi @! e @" costituiscono una partizione di , la verifica statistica di ipotesi consiste in un procedimento decisionale di scelta@ fra l'ipotesi di base L À! )−@! e l'ipotesi alternativa L À" ) −@". L'insieme delle ipotesi ammissibili e la sua partizione in L! e L" è detto sistema di ipotesi. Se @! (alternativamente @") contiene un solo punto l'ipotesi L! (alternativamente L") è detta semplice. In caso contrario l'ipotesi è detta composta.

Lo strumento statistico che sulla base del campione consente di concludere in favore dell'una o dell'altra ipotesi è il test statistico. Dato un modello statistico Y) e il sistema di ipotesi L À! ) −@! contro L À" )−@", si dice test una funzione

HÀV8Ä ÖL ß L ×! " .

Il test è in effetti una regola decisionale che suddivide V8 negli insiemi complementari V! e V", in modo tale che si accetta L! se ÐB ß á ß B Ñ −" 8 V!, mentre si accetta L" se ÐB ß á ß B Ñ −" 8 V". L'insieme V" è anche detto regione critica del test.

Usualmente il procedimento decisionale è basato sulla determinazione di una statistica piuttosto che sul campione osservato. Dunque, se X œ X Ð\ ß á ß \ Ñ" 8 è una statistica con supporto , si dice test basato su la funzioneg X

HÀg Ä ÖL ß L ×! " ,

mentre è detta statistica test. Il test basato su è una regola decisionale che suddivide negliX X g insiemi complementari g! e g", in modo tale che si accetta L! se per la realizzazione > œ X ÐB ß á ß B Ñ" 8 di si ha X > −g!, mentre si accetta L" se > −g". L'insieme g" è detto regione critica del test basato su . L'insieme X V" è indotto dall'insieme g", essendo

V" œ ÖÐB ß á ß B ÑÀ > œ X ÐB ß á ß B Ñ −" 8 " 8 g"× .

Esempio 4.1.1. Dato un campione casuale da \ µ R Ð ß "Ñ. , si consideri il sistema di ipotesi

L À! .œ.! contro L À" .Á .!, dove .! è una quantità nota. L'ipotesi L! è semplice, mentre l'ipotesi L" è composta. Se si suppone che la statistica test sia , risulta \ g œ‘. Una possibile scelta per g! potrebbe essere data da

g! œ ÖBÀ ± B  .! ±  +× ,

con costante. Di conseguenza, la regione critica del test basato su risulta+ \ g" œ ÖBÀ ± B  .! ±   +× .

Questa scelta di g" appare logica, in quanto più la realizzazione della media campionaria differisce dal valore ipotizzato .! per la media, più si è propensi ad accettare l'ipotesi alternativa. Resta aperto il problema della scelta della costante . Il problema che verrà+

68 La verifica d'ipotesi

analizzato nelle sezioni successive è quello di determinare la statistica test che permette la partizione dello spazio campionario “ottima” secondo alcuni criteri. …

4.1.2. La funzione potenza. Uno strumento per misurare la capacità discriminatoria del test

basato su una statistica è dato dalla cosiddetta funzione potenza. Dato un modello statistico Y) e il sistema di ipotesi L À! )− @! contro L À" )− @", la funzione potenza del test basato su èX data da

T Ð Ñ œX ) Pr)ÐX −g ,"Ñ

dove Pr) è da intendersi nel senso che la probabilità è indotta dalla distribuzione specificata dal modello con il valore del parametro pari a . Per ogni ) )−@! la funzione potenza T Ð ÑX )

fornisce la probabilità di respingere L! quando questa è vera, ovvero la probabilità di commettere il cosiddetto errore di I specie. Analogamente, per ogni ) − @" la quantità "  T Ð ÑX ) fornisce la probabilità di accettare L! quando è vera L", ovvero la probabilità di commettere il cosiddetto errore di II specie. Per ogni ) −@", la funzione potenza T Ð ÑX )

fornisce la probabilità di accettare L" quando questa è vera. Si dice che il test basato su è al livello di significatività seX α

sup

)−@! X

T Ð Ñ œ) α .

Il livello di significatività rappresenta la massima probabilità di commettere un errore di Iα specie.

Esempio 4.1.2. Dato un campione casuale da \ µ R Ð ß "Ñ. , si consideri il sistema di ipotesi

L À! .Ÿ ! contro L À" . !. Entrambe le ipotesi sono composte. Se si suppone che la statistica test sia , dato che \ g œ‘, si può scegliere

g! œ  ∞ßD" 8 Èα e g" œ D" ß ∞ 8 – Èα .

Questa selezione di g" appare logica, in quanto più la realizzazione della media campionaria è elevata, più si è propensi ad accettare l'ipotesi alternativa. Dal momento che risulta \ µ R Ð ß "Î8Ñ . per ogni .−‘, allora la funzione potenza è data da

T Ð Ñ œ \   D œ Ò 8Ð\  Ñ   D  8 Ó 8 œ "  ÐD  8 Ñ œ Ð 8  D Ñ − \ " " " " . . . F . F . . ‘ Pr. α Pr. α α α È È È È È – – , .

Il grafico della precedente funzione potenza per 8 œ "! e α œ ! !&. è riportato in Figura 4.1.1. Dal momento che T Ð Ñ\ . è crescente e che

sup

.Ÿ! \ \ "α "α

T Ð Ñ œ T Ð!Ñ œ . FÐ  D Ñ œ "  ÐDF Ñ œ α ,

Capitolo 4 69 −0.25 0 0.25 0.5 0.75 1 1.25 1.5 0 0.2 0.4 0.6 0.8 1

Figura 4.1.1. Funzione potenza T Ð Ñ\ . per 8 œ "! e αœ ! !&. .

4.1.3. Le proprietà del test statistico. Dalla discussione fatta nella precedente sezione risulta

evidente che esiste la possibilità di commettere due tipi di errore decisionale, ovvero può accadere che la realizzazione della statistica test sia in g" quando il vero valore del parametro è in @! (errore di I specie) e che la realizzazione della statistica test sia in g! quando il vero valore del parametro è in @" (errore di II specie). Dal momento che non si può sperare di rendere contemporaneamente pari a zero questi tipi di errore, si deve stabilire un insieme di proprietà desiderabili per un test.

Una prima proprietà opportuna per un test è quella della correttezza. Dato un modello statistico Y) e il sistema di ipotesi L À! ) −@! contro L À" )−@", un test basato su al livelloX di significatività con funzione potenza α T Ð ÑX ) è detto corretto al livello di significatività seα

T Ð Ñ  X ) α , a −) @" .

La proprietà della correttezza permette di controllare l'errore di I specie e al tempo stesso assicura che la probabilità di accettare L" quando è vera risulta maggiore dell'errore di I specie.

Una seconda proprietà riguarda il comportamento per grandi campioni del test. Se Y8ß) è un modello statistico per ogni , dato il sistema di ipotesi 8 L À! )−@! contro L À" )−@", si consideri il test al livello di significatività basato sulla successione di statistiche α ÖX ×8 . Il test è detto coerente se

lim

8Ä∞T Ð Ñ œ " a −X8 ) , ) @".

La proprietà della coerenza assicura che la probabilità di commettere un errore di II specie tende a quando si dispone di grandi campioni.!

Esempio 4.1.3. Dato un campione casuale da \ µ R Ð ß "Ñ. , si consideri il sistema di ipotesi

L À! .Ÿ ! contro L À" . ! (vedi Esempio 4.1.2). Il test basato su è corretto in quanto si ha\ T Ð Ñ Ÿ\ . α per ogni .Ÿ ! e T Ð Ñ \ . α per ogni . !. Dal momento che la successione di funzioni Ö ÐF È8  D. "αÑ× converge uniformemente ad una funzione costante pari ad per" .  !, allora

lim

8Ä∞T Ð Ñ œ " a  !X8 . , . ,

ovvero il test basato sulla successione di statistiche Ö\ ×8 risulta coerente. …

4.1.4. Il test di livello assegnato. Idealmente, si vorrebbe che T Ð ÑX ) fosse più alta possibile

quando )−@" e la più piccola possibile quando ) −@!. Come già evidenziato nella sezione precedente, questi requisiti sono conflittuali tra loro. Un possibile modo di procedere è quello di fissare il livello di significatività e scegliere quel test che ha più alta potenza per ogni α ) −@".

70 La verifica d'ipotesi

Dato un modello statistico Y) e il sistema di ipotesi L À! )−@! contro L À" )−@", un test basato su al livello di significatività con funzione potenza X α T Ð ÑX ) è detto uniformemente più potente al livello di significatività seα

T Ð Ñ   T Ð Ñ a −X ) X ) , ) @" ,

per ogni altro test basato su una qualsiasi statistica X al livello di significatività .α

Sfortunatamente i test uniformente più potenti esistono solo in varie situazioni speciali. Per campioni finiti, è possibile costruire test uniformente più potenti quando entrambe le ipotesi sono semplici o quando la statistica test ha una particolare struttura. Sotto certe condizioni, in generale si può costruire test uniformente più potenti quando si dispone di grandi campioni. Questi argomenti saranno trattati in dettaglio nelle prossime sezioni.

Con la precedente impostazione del problema l'ipotesi di base e l'ipotesi alternativa vengono trattate in modo non simmetrico. Questo è giustificato dal fatto che usualmente L! costituisce una affermazione in qualche modo privilegiata e quindi si preferisce controllare il livello di significatività del test (ovvero l'errore di I specie) che comporta l'erroneo rifiuto di questa ipotesi privilegiata. Anche se per sviluppare la teoria è necessario fissare il livello di significatività , èα bene sottolineare che quando si lavora operativamente non esiste nessuna regola ragionevole per stabilirne la scelta. Questa considerazione porta al concetto di livello di significatività osservato o valore-P.

Dato un modello statistico Y) e il sistema di ipotesi L À! )−@! contro L À" )−@", se la regione critica del test basato su è data da X g" œ Ö>À >   -×, per un determinato valore campionario > œ X ÐB ß á ß B Ñ" 8 si dice livello di significatività osservato la quantità

α9==

œ sup Pr ÐX   >Ñ

) @! )

,

mentre, se la regione critica è data da g" œ Ö>À > Ÿ -×, allora si dice livello di significatività osservato la quantità α9== œ sup Pr ÐX Ÿ >Ñ ) @! ) .

Quando invece la statistica test ha una distribuzione simmetrica, se la regione critica del testX basato su è data da X g" œ Ö>À > Ÿ - ß >   - ×" # , si dice livello di significatività osservato la quantità

α9==

œ #min )sup Pr)ÐX Ÿ >Ñß)sup Pr)ÐX   >ÑŸ

@! @!

.

Il livello di significatività osservato rappresenta la probabilità di ottenere, quando L! è vera, un valore campionario di estremo (nella appropriata direzione) almeno quanto quello> X osservato. Dunque, il livello di significatività osservato fornisce una misura su quanto l'ipotesi di base risulta compatibile con i dati campionari. Un livello di significatività osservato basso porta a ritenere poco compatibile con i dati campionari l'ipotesi di base, mentre con un livello di significatività osservato elevato è vera l'affermazione contraria.

In una verifica di ipotesi si può semplicemente riportare il livello di significatività osservato, oppure si può arrivare ad una decisione sull'accettazione di L! fissando un livello di significatività . Se il livello di significatività osservato è minore o uguale ad , allora siα α respinge L!, altrimenti si accetta L!. Il livello di significatività osservato diventa in questo caso il più elevato livello di significatività per cui si accetta L!. In questo caso il livello di significatività osservato diventa non solo uno strumento per la decisione nella verifica di ipotesi, ma anche una misura quantitativa di questa decisione.

Capitolo 4 71

Documenti correlati