internazionali - a.a. 2013-2014
La verifica delle ipotesi
Ipotesi statistica: supposizione riguardante:
· un parametro della popolazione
· la forma della distribuzione della popolazione
Un ’ ipotesi è un ’ affermazione che viene considerata vera a meno che
l ’ evidenza empirica porti ad avere seri dubbi sulla sua validità e
suggerisca che essa è falsa
In molte circostanze il ricercatore si trova a dover decidere quale, tra
le diverse situazioni possibili riferibili alla popolazione, è quella
meglio sostenuta dalle evidenze empiriche.
La verifica delle ipotesi
Verifica delle ipotesi : processo utilizzato per stabilire, sulla base delle osservazioni campionarie, se l ’ ipotesi
formulata si può considerare esatta o meno
Test statistico: regola che consente di discriminare tra i risultati
campionari che portano ad accettare l ’ ipotesi e
quelli che portano a rifiutarla
Le ipotesi
( )
X ∼ f x ;θ
θ θ =
** *
*
θ θ o θ θ θ θ
⎧ > <
⎪ ⎨
⎪⎩ ≠
Popolazione:
Ipotesi statistica semplice:
si riferisce ad un valore specifico del parametro r Per esempio
Ipotesi statistica composta:
si riferisce ad un insieme di possibili valori che il parametro della popolazione può assumere
Per esempio
Le ipotesi
Ipotesi nulla (H 0 ): ipotesi sottoposta a verifica
E ’ l ’ ipotesi preesistente rispetto all ’ esperimento campionario, quella che viene considerata valida fino a prova contraria, e comprende il sottoinsieme dei valori dello spazio parametrico Q che si vuole sottoporre a test. Tipicamente, l ’ ipotesi nulla è un ’ ipotesi di tipo semplice:
Ipotesi alternativa (H 1 ): affermazione fatta in antitesi all ’ ipotesi nulla
E ’ costituita da un singolo valore o da un insieme di valori possibili per q e considerati alternativi a q
0:
H
0: q = q
0H
1: q = q
1; H
1: q < q
0; H
1: q > q
0; H
1: q ≠ q
0Le ipotesi
Ipotesi nulla (H 0 ): ipotesi sottoposta a verifica
Ipotesi alternativa (H 1 ): affermazione fatta in antitesi all ’ ipotesi nulla
E ’ bene sottolineare che l’ipotesi nulla e l’ipotesi alternativa non sono equivalenti ai fini della decisione, nel senso che il test non è mai conclusivo circa H
1, ma concerne solo la possibilità che dal campione si possa pervenire al rifiuto o al non rifiuto di H
0.
Le ipotesi H
0e H
1sono esaustive e disgiunte: o vale l ’ una o vale l ’ altra.
Test e regola di decisione
Una volta formulate le ipotesi, occorre decidere se, sulla base dell ’ evidenza empirica campionaria, l ’ ipotesi nulla H
0debba essere rifiutata o meno. E ’ perciò necessario mettere a punto una regola che permetta di discriminare tra i risultati campionari che portano ad accettare l ’ ipotesi nulla e quelli che portano a rifiutarla. Questa regola costituisce il
Il test è dunque una regola che permette di stabilire se le o s s e r v a z i o n i c a m p i o n a r i e debbano ritenersi coerenti con l ’ ipotesi nulla oppure no.
Da un punto di vista operativo, un test è una statistica che fa
corrispondere ad ogni campione casuale
(X
1, …, X
n)un valore numerico che può essere classificato secondo due diverse possibilità:
Poiché il valore campionario di un test
statistico varia da campione a campione, il test statistico costituisce una variabile casuale che può assumere valori compresi in un insieme che costituisce lo spazio campionario del test secondo una particolare distribuzione di
probabilità che è la distribuzione campionaria
del test
Test e regola di decisione
Un test statistico da quindi luogo alla ripartizione dello spazio campionario in due sottoinsiemi complementari: un insieme A costituito dai valori del test che sono compatibili con l ’ ipotesi nulla H
0, e un insieme C che raggruppa i valori del test considerati incompatibili con H
0.
Quest ’ ultimo insieme è costituito dai valori del test che portano al rifiuto di H
0e viene definito la regione critica del test
Quando il valore campionario di t cade nella regione critica, l ’ evidenza empirica del fenomeno studiato porta a ritenere che l ’ ipotesi H
0non possa essere considerata valida, e quindi che non possa essere accettata come vera.
Regione di
accettazione di H0 Regione di rifiuto di H0
Regione di
accettazione di H0 Regione di rifiuto di H0 Regione di
rifiuto di H0
Regione critica per un test statistico con ipotesi
alternativa unidirezionale:
H
0: q = q
0Regione critica per un test statistico con ipotesi
alternativa bidirezionale:
H
0: q = q
0H
1: q > q
0H
1: q ! q
0t
t
La regola di decisione e gli errori
A-priori sono possibili quattro eventi incompatibili legati all ’ ipotesi vera sulla popolazione ed alla decisione che si prende, a ciascuno di essi è associata una probabilità a-priori di verificarsi
Situazione vera H
0H
1Decisio ne H
0H
1Rifiuto H
0vera Errore I tipo
Accetto H
0falsa Errore II tipo
Ipotizzando vera H
0, la regione critica associata (cioè la probabilità di
rifiutare H
0) viene definita livello di significatività del test e indicata con a .
Accettare o rifiutare H
0non può e non deve essere inteso come una
dimostrazione della verità o meno di H
0(altre ipotesi, diverse da H
0,
avrebbero potuto essere accettate o rifiutate sulla base dello stesso
campione) ma solo come una
conclusione che l ’ evidenza empirica è
favorevole o meno all ’ ipotesi nulla.
La regola di decisione e gli errori
Decisione giusta
1- α
Decisione giusta
1- β
Errore II tipo
β
Errore I tipo
α Conclusione
Ipotesi vera
H
0H
0H
1H
1• α = P rifiutare H | H è vera (
0 0) = P ( t x ( ) ∈ R | ω
0)
• β = P accettare H | H è falsa (
0 0) = P ( t x ( ) ∈ A | ω
1)
• 1 − = β P rifiutare H | H è falsa (
0 0) = P ( t x ( ) ∈ R | ω
1)
La verifica delle ipotesi sulla media
þ Le ipotesi:
0 01 0
H : H :
µ µ µ µ
⎧ =
⎨ ≠
⎩
þ Il livello di significatività: α
þ La statistica test: la v.c. media campionaria X
þ Il criterio di decisione: rifiutare il valore µ
0come media della popolazione se la media campionaria
x è molto “distante” dal valore µ
0ipotizzato sotto H
0La verifica delle ipotesi sulla media
þ I valori critici:
(
I) (
S)
P x < x + P x > x α =
oppure standardizzando
0 0
2 2
x- x-
P < -z + P > z
n n
α α
σ µ
α µ
σ
⎛ ⎞ ⎛ ⎞
⎜ ⎟ ⎜ ⎟
= ⎜ ⎜ ⎝ ⎟ ⎟ ⎠ ⎜ ⎜ ⎝ ⎟ ⎟ ⎠ sotto H
0þ Il confronto
• x con x I e x S oppure x-
0n
z µ
= σ con -z
α2e +z
α2þ La decisione
a/2 a/2
1.
µ x S x I
a/2 a/2
2.
0 z α 2 α 2
− z
La verifica delle ipotesi sulla media þ I valori critici:
(
I) (
S)
P x < x + P x > x α =
oppure standardizzando
0 0
2 2
x- x-
P < -z + P > z
n n
α α
σ µ
α µ
σ
⎛ ⎞ ⎛ ⎞
⎜ ⎟ ⎜ ⎟
= ⎜ ⎜ ⎝ ⎟ ⎟ ⎠ ⎜ ⎜ ⎝ ⎟ ⎟ ⎠ sotto H
0þ Il confronto
• x con x I e x S oppure x-
0n
z µ
= σ con -z
α2e +z
α2þ La decisione
a/2 a/2
1.
µ x S x I
a/2 a/2
2.
0 z α 2 α 2
− z
Un esempio
La durata delle lampadine prodotte da una certa azienda ha media pari a 2000 ore e deviazione standard pari a 250 ore.
La produzione dell’ultima settimana è stata effettuata impiegando un nuovo tipo di
materiale sulla cui qualità il responsabile della produzione avanza seri dubbi.
Prima di mettere in vendita le lampadine prodotte si desidera, dunque, indagare sulla qualità del materiale impiegato e, in particolare, verificare se possa avere influito sulla durata delle lampadine.
Si esamina allora un campione casuale di 100 lampadine prese dalla produzione settimanale e se ne misura la durata media, che risulta pari a 1955 ore. E’
possibile affermare, con significatività a=0,05, che tale riduzione sia imputabile alla scarsa qualità del materiale utilizzato?
• Le ipotesi (Nulla, H
0, e Alternativa, H
1)
• Il livello di significatività ( a )
• La regola di decisione
• La statistica di riferimento
Un esempio
La produzione dell ’ ultima settimana è stata effettuata impiegando un nuovo tipo di materiale sulla cui qualità il responsabile della produzione avanza seri dubbi. Prima di mettere in vendita le lampadine prodotte si desidera, dunque, indagare sulla qualità del materiale impiegato e, in particolare, verificare se possa avere influito sulla durata delle lampadine.
Si esamina allora un campione casuale di 100 lampadine prese dalla produzione settimanale e se ne misura la durata media, che risulta pari a 1955 ore. E ’ possibile affermare, con significatività a=0,05, che tale riduzione sia imputabile alla scarsa qualità del materiale utilizzato?
H
0: m = 2000
H
1: m < 2000 a = 0,05 X N ~
Rifiuto H0 se:x
0z n
σ − µ < −
αs =250
m =2000 n =100 x = 1955 a =0,05
2000
0
X
Z X
n
σ−µ
= n
σ
1 1955 1975
Zc
z
a= -1,645
1955 2000 1,8 250 100− = −
-1,8 < -1,645 è Rifiuto H
0;
Valore critico
non standardizzato:
1.
2.
0 1,645 n
µ
− ×σ
=1958,91955 < 1958,9 è Rifiuto H
05%
-1 Zc
Un esempio
2,5% 2,5%
La durata delle lampadine prodotte da una certa azienda ha media pari a 2000 ore e deviazione standard pari a 250 ore.
La produzione dell’ultima settimana è stata effettuata impiegando un nuovo tipo di materiale di cui si ignorano le performance. Prima di mettere in vendita le lampadine prodotte si desidera, dunque, indagare sulla qualità del materiale impiegato e, in particolare, verificare se possa influire sulla durata delle lampadine.
Si esamina allora un campione casuale di 100 lampadine prese dalla produzione settimanale e se ne misura la durata media, che risulta pari a 2010 ore. E’ possibile affermare, con significatività a=0,05, che tale variazione sia imputabile al nuovo materiale utilizzato?
H
0: m = 2000 H
1: m !
2000
a = 0,05 X N ~
Rifiuto H0 se: 0
2
x z
n σ − µ >
αs =250
m =2000 n =100 x = 2010 a =0,05
2000
0
X
Z X
n
σ−µ
=
2010 2000 0, 4 250 100
− =
|0,4| < 1,96 è Non rifiuto H
0;
Valori critici
non standardizzati:
1.
2.
0 1,96
n
µ
m ×σ
= 1951,0è Non rifiuto H
02,5%
2
1,96
z
α=
2049,0 2010
1951 ≤ ≤2049
2,5%
zα2
− zα2
1951 2049
La verifica delle ipotesi sulla media
L'azienda Package utilizza un procedimento tecnologico per l'inscatolamento di uno dei suoi prodotti tarato per ottenere scatole con peso medio di 10Kg e uno s.q.m. pari a 0,3Kg. Durante il controllo periodico del funzionamento del meccanismo di inscatolamento risulta che il peso medio del prodotto inscatolato in un campione di 10 scatole estratte a caso dalla catena di montaggio è pari a 10,19 Kg.
a) Sulla base dei risultati campionari, il responsabile della produzione
sospetta che il meccanismo sia guasto e produca scatole con peso medio
diverso da quello previsto. Supponendo che il peso del prodotto
inscatolato dall'azienda si distribuisca normalmente, sulla base dei
risultati campionari, si può ritenere che ci sia effettivamente un guasto nel
sistema di inscatolamento? Effettuare il test sia ad un livello di
significatività del 5% che dell'1%.
La verifica delle ipotesi sulla media
b) Sulla base dei risultati campionari, il responsabile della produzione sospetta che il meccanismo sia guasto e produca scatole con peso medio maggiore di quello previsto. Supponendo che il peso del prodotto inscatolato dall'azienda si distribuisca normalmente, sulla base dei risultati campionari si può ritenere che ci sia effettivamente un guasto nel sistema di inscatolamento? Effettuare il test sia ad un livello di significatività del 5% che dell'1%.
c) Risolvere i punti a) e b) nel caso in cui lo s.q.m. del peso delle scatole
prodotte dall ’ azienda non sia noto ma si conosca lo s.q.m. del peso delle
scatole presenti nel campione di 10 scatole estratte (s=0.35Kg).
>30? n X ! N?
s noto?
NO NO
NO SI SI
SI
?
1
X-
t
ns n µ
∼
−X N ;
σ n
⎛ µ ⎞
∼ ⎜ ⎝ ⎟ ⎠
Riepilogo sulla v.c. media campionaria
Le fasi della verifica delle ipotesi
1 Definire l ’ ipotesi H
02 Definire l ’ ipotesi H
13 Specificare il livello di significatività a
4 Determinare la dimensione n del campione
5 Determinare la statistica test
6 Fissare il valore (test unidirezionale) o i valori critici (test
bidirezionale) che dividono le regioni di rifiuto e di accettazione
7 Calcolare il valore campionario della statistica
8 Confrontare il valore campionario della statistica con il/i valori critici
9 Prendere una decisione
La verifica delle ipotesi su una proporzione
10%
zα
H
0: p = 0,5
H
1: p > 0,5 a = 0,10 p ~ N
Rifiuto H0 se:(
0)
0
1
0p z
n
α
π
π π
− >
⋅ − p =0,54
n=100
In una scommessa con un amico, lanciando 100 volte una moneta si sono ottenute 54 teste. Abbiamo il sospetto che l ’ amico ci abbia ingannati utilizzando una moneta truccata. Si verifichi questa
ipotesi ad un livello di significatività a =0,1.
1,28 z
α=
0,50 p
0 (1 )
p n
π
π π
−
⋅ − 10%
pc
Non rifiuto H
0(
0) ( )
0 0