Dipartimento di Scienze politiche, della comunicazione e delle relazioni internazionali - a.a. 2013-2014

(1)

internazionali - a.a. 2013-2014

(2)

La verifica delle ipotesi

Ipotesi statistica: supposizione riguardante:

·   un parametro della popolazione

·   la forma della distribuzione della popolazione

Un ’ ipotesi è un ’ affermazione che viene considerata vera a meno che

l ’ evidenza empirica porti ad avere seri dubbi sulla sua validità e

suggerisca che essa è falsa

In molte circostanze il ricercatore si trova a dover decidere quale, tra

le diverse situazioni possibili riferibili alla popolazione, è quella

meglio sostenuta dalle evidenze empiriche.

(3)

La verifica delle ipotesi

Verifica delle ipotesi : processo utilizzato per stabilire, sulla base delle osservazioni campionarie, se l ’ ipotesi

formulata si può considerare esatta o meno

Test statistico: regola che consente di discriminare tra i risultati

campionari che portano ad accettare l ’ ipotesi e

quelli che portano a rifiutarla

(4)

Le ipotesi

( )

X ∼ f x ;θ

θ θ =

*

* *

*

θ θ o θ θ θ θ

⎧ > <

⎪ ⎨

⎪⎩ ≠

Popolazione:

Ipotesi statistica semplice:

si riferisce ad un valore specifico del parametro r  Per esempio

Ipotesi statistica composta:

si riferisce ad un insieme di possibili valori che il parametro della popolazione può assumere

Per esempio

(5)

Le ipotesi

Ipotesi nulla (H ₀ ): ipotesi sottoposta a verifica

E ’ l ’ ipotesi preesistente rispetto all ’ esperimento campionario, quella che viene considerata valida fino a prova contraria, e comprende il sottoinsieme dei valori dello spazio parametrico Q che si vuole sottoporre a test. Tipicamente, l ’ ipotesi nulla è un ’ ipotesi di tipo semplice:

Ipotesi alternativa (H ₁ ): affermazione fatta in antitesi all ’ ipotesi nulla

E ’ costituita da un singolo valore o da un insieme di valori possibili per q e considerati alternativi a q

₀

:

H

₀

: q ₌ q

₀

H

₁

: q = q

₁

; H

₁

: q < q

₀

; H

₁

: q > q

₀

; H

₁

: q ≠ q

₀

(6)

Le ipotesi

Ipotesi nulla (H ₀ ): ipotesi sottoposta a verifica

Ipotesi alternativa (H ₁ ): affermazione fatta in antitesi all ’ ipotesi nulla

E ’ bene sottolineare che l’ipotesi nulla e l’ipotesi alternativa non sono equivalenti ai fini della decisione, nel senso che il test non è mai conclusivo circa H

₁

, ma concerne solo la possibilità che dal campione si possa pervenire al rifiuto o al non rifiuto di H

₀

.

Le ipotesi H

₀

e H

₁

sono esaustive e disgiunte: o vale l ’ una o vale l ’ altra.

(7)

Test e regola di decisione

Una volta formulate le ipotesi, occorre decidere se, sulla base dell ’ evidenza empirica campionaria, l ’ ipotesi nulla H

₀

debba essere rifiutata o meno. E ’ perciò necessario mettere a punto una regola che permetta di discriminare tra i risultati campionari che portano ad accettare l ’ ipotesi nulla e quelli che portano a rifiutarla. Questa regola costituisce il

Il test è dunque una regola che permette di stabilire se le o s s e r v a z i o n i c a m p i o n a r i e debbano ritenersi coerenti con l ’ ipotesi nulla oppure no.

Da un punto di vista operativo, un test è una statistica che fa

corrispondere ad ogni campione casuale

(X

₁

, …, X

_n

)un valore numerico che può essere classificato secondo due diverse possibilità:

Poiché il valore campionario di un test

statistico varia da campione a campione, il test statistico costituisce una variabile casuale che può assumere valori compresi in un insieme che costituisce lo spazio campionario del test secondo una particolare distribuzione di

probabilità che è la distribuzione campionaria

del test

(8)

Test e regola di decisione

Un test statistico da quindi luogo alla ripartizione dello spazio campionario in due sottoinsiemi complementari: un insieme A costituito dai valori del test che sono compatibili con l ’ ipotesi nulla H

₀

, e un insieme C che raggruppa i valori del test considerati incompatibili con H

₀

.

Quest ’ ultimo insieme è costituito dai valori del test che portano al rifiuto di H

₀

e viene definito la regione critica del test

Quando il valore campionario di t cade nella regione critica, l ’ evidenza empirica del fenomeno studiato porta a ritenere che l ’ ipotesi H

₀

non possa essere considerata valida, e quindi che non possa essere accettata come vera.

Regione di

accettazione di H₀ Regione di rifiuto di H₀

Regione di

accettazione di H₀ Regione di rifiuto di H₀ Regione di

rifiuto di H₀

Regione critica per un test statistico con ipotesi

alternativa unidirezionale:

H

₀

: q = q

₀

Regione critica per un test statistico con ipotesi

alternativa bidirezionale:

H

₀

: q = q

₀

H

₁

: q > q

₀

H

₁

: q ! q

₀

t

(9)

La regola di decisione e gli errori

A-priori sono possibili quattro eventi incompatibili legati all ’ ipotesi vera sulla popolazione ed alla decisione che si prende, a ciascuno di essi è associata una probabilità a-priori di verificarsi

Situazione vera H

₀

H

₁

Decisio ne H

₀

H

₁

Rifiuto H

₀

vera Errore I tipo

Accetto H

₀

falsa Errore II tipo

Ipotizzando vera H

₀

, la regione critica associata (cioè la probabilità di

rifiutare H

₀

) viene definita livello di significatività del test e indicata con a .

Accettare o rifiutare H

₀

non può e non deve essere inteso come una

dimostrazione della verità o meno di H

₀

(altre ipotesi, diverse da H

₀

,

avrebbero potuto essere accettate o rifiutate sulla base dello stesso

campione) ma solo come una

conclusione che l ’ evidenza empirica è

favorevole o meno all ’ ipotesi nulla.

(10)

La regola di decisione e gli errori

Decisione giusta

1- α

Decisione giusta

1- β

Errore II tipo

β

Errore I tipo

α Conclusione

Ipotesi vera

H

₀

H

₀

H

₁

H

₁

• α = P rifiutare H | H è vera (

⁰ ⁰

) = P ( t x ( ) ∈ R | ω

⁰

)

• β = P accettare H | H è falsa (

⁰ ⁰

) = P ( t x ( ) ∈ A | ω

¹

)

• ¹ − = β P rifiutare H | H è falsa (

⁰ ⁰

) = P ( t x ( ) ∈ R | ω

¹

)

(11)

La verifica delle ipotesi sulla media

þ Le ipotesi:

⁰ ⁰

1 0

H : H :

µ µ µ µ

⎧ =

⎨ ≠

⎩

þ Il livello di significatività: α

þ La statistica test: la v.c. media campionaria X

þ Il criterio di decisione: rifiutare il valore µ

⁰

come media della popolazione se la media campionaria

x è molto “distante” dal valore µ

⁰

ipotizzato sotto H

0

(12)

La verifica delle ipotesi sulla media

þ I valori critici:

(

^I

) (

^S

)

P x < x + P x > x α =

oppure standardizzando

0 0

2 2

x- x-

P < -z + P > z

n n

α α

σ µ

α µ

σ

⎛ ⎞ ⎛ ⎞

⎜ ⎟ ⎜ ⎟

= ⎜ ⎜ ⎝ ⎟ ⎟ ⎠ ⎜ ⎜ ⎝ ⎟ ⎟ ⎠ ^{sotto H}

⁰

þ Il confronto

• ^x ^con ^x Î ê ^x ^S ôppure ^x-

⁰

n

z µ

= σ con -z

_α₂

_e +z

_α2

þ La decisione

a/2 a/2

1. µ x _S x I

a/2 a/2

2. 0 z α 2 α 2

− z

(13)

La verifica delle ipotesi sulla media þ I valori critici:

(

^I

) (

^S

)

P x < x + P x > x α =

oppure standardizzando

0 0

2 2

x- x-

P < -z + P > z

n n

α α

σ µ

α µ

σ

⎛ ⎞ ⎛ ⎞

⎜ ⎟ ⎜ ⎟

= ⎜ ⎜ ⎝ ⎟ ⎟ ⎠ ⎜ ⎜ ⎝ ⎟ ⎟ ⎠ ^{sotto H}

⁰

þ Il confronto

• ^x ^con ^x Î ê ^x ^S ôppure ^x-

⁰

n

z µ

= σ con -z

_α₂

_e +z

_α2

þ La decisione

a/2 a/2

1. µ x _S x I

a/2 a/2

2. 0 z α 2 α 2

− z

(14)

Un esempio

La durata delle lampadine prodotte da una certa azienda ha media pari a 2000 ore e deviazione standard pari a 250 ore.

La produzione dell’ultima settimana è stata effettuata impiegando un nuovo tipo di

materiale sulla cui qualità il responsabile della produzione avanza seri dubbi.

Prima di mettere in vendita le lampadine prodotte si desidera, dunque, indagare sulla qualità del materiale impiegato e, in particolare, verificare se possa avere influito sulla durata delle lampadine.

Si esamina allora un campione casuale di 100 lampadine prese dalla produzione settimanale e se ne misura la durata media, che risulta pari a 1955 ore. E’

possibile affermare, con significatività a=0,05, che tale riduzione sia imputabile alla scarsa qualità del materiale utilizzato?

•  Le ipotesi (Nulla, H

₀

, e Alternativa, H

₁

)

•  Il livello di significatività ( a )

•  La regola di decisione

•  La statistica di riferimento

(15)

Un esempio

La produzione dell ’ ultima settimana è stata effettuata impiegando un nuovo tipo di materiale sulla cui qualità il responsabile della produzione avanza seri dubbi. Prima di mettere in vendita le lampadine prodotte si desidera, dunque, indagare sulla qualità del materiale impiegato e, in particolare, verificare se possa avere influito sulla durata delle lampadine.

Si esamina allora un campione casuale di 100 lampadine prese dalla produzione settimanale e se ne misura la durata media, che risulta pari a 1955 ore. E ’ possibile affermare, con significatività a=0,05, che tale riduzione sia imputabile alla scarsa qualità del materiale utilizzato?

H

₀

: m = 2000

H

₁

: m < 2000 a = 0,05 X N ~

^{Rifiuto H}⁰^se:

^x

⁰

z n

σ − µ < −

α

s =250

m =2000 n =100 x = 1955 ^a ^=0,05

2000

0

X

Z X

n

σ⁻µ

= n

σ

1 1955 ¹⁹⁷⁵

Z_c

z

_a

= -1,645

^{1955 2000} 1,8 250 100

− = −

-1,8 < -1,645 è ^{Rifiuto H}

0

;

Valore critico

non standardizzato:

1.

2.

0 1,645 n

µ

⁻ ^×

σ

⁼^1958,9

1955 < 1958,9 è Rifiuto H

₀

5%

-1 Z_c

(16)

Un esempio

2,5% 2,5%

La durata delle lampadine prodotte da una certa azienda ha media pari a 2000 ore e deviazione standard pari a 250 ore.

La produzione dell’ultima settimana è stata effettuata impiegando un nuovo tipo di materiale di cui si ignorano le performance. Prima di mettere in vendita le lampadine prodotte si desidera, dunque, indagare sulla qualità del materiale impiegato e, in particolare, verificare se possa influire sulla durata delle lampadine.

Si esamina allora un campione casuale di 100 lampadine prese dalla produzione settimanale e se ne misura la durata media, che risulta pari a 2010 ore. E’ possibile affermare, con significatività a=0,05, che tale variazione sia imputabile al nuovo materiale utilizzato?

H

₀

: m = 2000 H

₁

: m !

2000

a = 0,05 X N ~

_{Rifiuto H}

0 se: ⁰

2

x z

n σ − µ >

α

s =250

m =2000 n =100 x = 2010 a =0,05

2000

0

X

Z X

n

σ⁻µ

=

2010 2000 0, 4 250 100

− =

|0,4| < 1,96 è Non rifiuto H

₀

;

Valori critici

non standardizzati:

1.

2.

0 1,96

n

µ

m ×

σ

= ^1951,0

è Non rifiuto H

₀

2,5%

2

1,96

z

_α

=

2049,0 2010

1951 ≤ ≤2049

2,5%

z_α2

− z_α2

1951 2049

(17)

La verifica delle ipotesi sulla media

L'azienda Package utilizza un procedimento tecnologico per l'inscatolamento di uno dei suoi prodotti tarato per ottenere scatole con peso medio di 10Kg e uno s.q.m. pari a 0,3Kg. Durante il controllo periodico del funzionamento del meccanismo di inscatolamento risulta che il peso medio del prodotto inscatolato in un campione di 10 scatole estratte a caso dalla catena di montaggio è pari a 10,19 Kg.

a) Sulla base dei risultati campionari, il responsabile della produzione

sospetta che il meccanismo sia guasto e produca scatole con peso medio

diverso da quello previsto. Supponendo che il peso del prodotto

inscatolato dall'azienda si distribuisca normalmente, sulla base dei

risultati campionari, si può ritenere che ci sia effettivamente un guasto nel

sistema di inscatolamento? Effettuare il test sia ad un livello di

significatività del 5% che dell'1%.

(18)

La verifica delle ipotesi sulla media

b) Sulla base dei risultati campionari, il responsabile della produzione sospetta che il meccanismo sia guasto e produca scatole con peso medio maggiore di quello previsto. Supponendo che il peso del prodotto inscatolato dall'azienda si distribuisca normalmente, sulla base dei risultati campionari si può ritenere che ci sia effettivamente un guasto nel sistema di inscatolamento? Effettuare il test sia ad un livello di significatività del 5% che dell'1%.

c) Risolvere i punti a) e b) nel caso in cui lo s.q.m. del peso delle scatole

prodotte dall ’ azienda non sia noto ma si conosca lo s.q.m. del peso delle

scatole presenti nel campione di 10 scatole estratte (s=0.35Kg).

(19)

>30? n X ! N?

s noto?

NO NO

NO SI SI

SI

?

1

X-

t

n

s n µ

∼

−

X N ;

σ n

⎛ µ ⎞

∼ ⎜ ⎝ ⎟ ⎠

Riepilogo sulla v.c. media campionaria

(20)

Le fasi della verifica delle ipotesi

1  Definire l ’ ipotesi H

₀

2  Definire l ’ ipotesi H

₁

3  Specificare il livello di significatività a

4  Determinare la dimensione n del campione

5  Determinare la statistica test

6  Fissare il valore (test unidirezionale) o i valori critici (test

bidirezionale) che dividono le regioni di rifiuto e di accettazione

7  Calcolare il valore campionario della statistica

8  Confrontare il valore campionario della statistica con il/i valori critici

9  Prendere una decisione

(21)

La verifica delle ipotesi su una proporzione

10%

z_α

H

₀

: p = 0,5

H

₁

: p > 0,5 a = 0,10 p ~ N

^{Rifiuto H}0 se:

(

⁰

)

0

1

0

p z

n

α

π

π π

− >

⋅ − p =0,54

n=100

In una scommessa con un amico, lanciando 100 volte una moneta si sono ottenute 54 teste. Abbiamo il sospetto che l ’ amico ci abbia ingannati utilizzando una moneta truccata. Si verifichi questa

ipotesi ad un livello di significatività a =0,1.

1,28 z

_α

=

0,50 p

0 (¹ )

p n

π

π π

−

⋅ − 10%

pc

Non rifiuto H

₀

(

⁰

) ( )

0 0

0,54 0,50

1 0,50 1 0,50

100 p

n π

π π

− = −

⋅ − ⋅ − = 0,80

0,80 < 1,28

(22)

Dove e come studiare

File “esercizi verifica delle ipotesi.pdf”

•  S. Borra, A. Di Ciaccio (2004) – Statistica – Metodologie per le scienze economiche e sociali – McGraw-HillCap. 13 (escluso paragrafi 13.7, 13.8), Cap. 14 (escluso paragrafi 14.4, 14.5, 14.6).

Dipartimento di Scienze politiche, della comunicazione e delle relazioni internazionali - a.a. 2013-2014

internazionali - a.a. 2013-2014

La verifica delle ipotesi

Ipotesi statistica: supposizione riguardante:

· un parametro della popolazione

· la forma della distribuzione della popolazione

Un ’ ipotesi è un ’ affermazione che viene considerata vera a meno che

l ’ evidenza empirica porti ad avere seri dubbi sulla sua validità e

suggerisca che essa è falsa

In molte circostanze il ricercatore si trova a dover decidere quale, tra

le diverse situazioni possibili riferibili alla popolazione, è quella

meglio sostenuta dalle evidenze empiriche.

La verifica delle ipotesi

Verifica delle ipotesi : processo utilizzato per stabilire, sulla base delle osservazioni campionarie, se l ’ ipotesi

formulata si può considerare esatta o meno

Test statistico: regola che consente di discriminare tra i risultati

campionari che portano ad accettare l ’ ipotesi e

quelli che portano a rifiutarla

Le ipotesi

( )

X ∼ f x ;θ

θ θ =

* *

*

θ θ o θ θ θ θ

⎧ > <

⎪ ⎨

⎪⎩ ≠

Popolazione:

Ipotesi statistica semplice:

si riferisce ad un valore specifico del parametro r Per esempio

Ipotesi statistica composta:

si riferisce ad un insieme di possibili valori che il parametro della popolazione può assumere

Per esempio

Le ipotesi

Ipotesi nulla (H 0 ): ipotesi sottoposta a verifica

Ipotesi alternativa (H 1 ): affermazione fatta in antitesi all ’ ipotesi nulla

E ’ costituita da un singolo valore o da un insieme di valori possibili per q e considerati alternativi a q

:

H

: q = q

H

: q = q

; H

: q < q

; H

: q > q

; H

: q ≠ q

Le ipotesi

Ipotesi nulla (H 0 ): ipotesi sottoposta a verifica

Ipotesi alternativa (H 1 ): affermazione fatta in antitesi all ’ ipotesi nulla

E ’ bene sottolineare che l’ipotesi nulla e l’ipotesi alternativa non sono equivalenti ai fini della decisione, nel senso che il test non è mai conclusivo circa H

, ma concerne solo la possibilità che dal campione si possa pervenire al rifiuto o al non rifiuto di H

.

Le ipotesi H

e H

sono esaustive e disgiunte: o vale l ’ una o vale l ’ altra.

Test e regola di decisione

Una volta formulate le ipotesi, occorre decidere se, sulla base dell ’ evidenza empirica campionaria, l ’ ipotesi nulla H

debba essere rifiutata o meno. E ’ perciò necessario mettere a punto una regola che permetta di discriminare tra i risultati campionari che portano ad accettare l ’ ipotesi nulla e quelli che portano a rifiutarla. Questa regola costituisce il

Il test è dunque una regola che permette di stabilire se le o s s e r v a z i o n i c a m p i o n a r i e debbano ritenersi coerenti con l ’ ipotesi nulla oppure no.

Da un punto di vista operativo, un test è una statistica che fa

corrispondere ad ogni campione casuale

(X

, …, X

)un valore numerico che può essere classificato secondo due diverse possibilità:

Poiché il valore campionario di un test

statistico varia da campione a campione, il test statistico costituisce una variabile casuale che può assumere valori compresi in un insieme che costituisce lo spazio campionario del test secondo una particolare distribuzione di

probabilità che è la distribuzione campionaria

del test

Test e regola di decisione

Un test statistico da quindi luogo alla ripartizione dello spazio campionario in due sottoinsiemi complementari: un insieme A costituito dai valori del test che sono compatibili con l ’ ipotesi nulla H

, e un insieme C che raggruppa i valori del test considerati incompatibili con H

.

Quest ’ ultimo insieme è costituito dai valori del test che portano al rifiuto di H

e viene definito la regione critica del test

Quando il valore campionario di t cade nella regione critica, l ’ evidenza empirica del fenomeno studiato porta a ritenere che l ’ ipotesi H

non possa essere considerata valida, e quindi che non possa essere accettata come vera.

Regione critica per un test statistico con ipotesi

·   un parametro della popolazione

·   la forma della distribuzione della popolazione

si riferisce ad un valore specifico del parametro r  Per esempio

Ipotesi nulla (H ₀ ): ipotesi sottoposta a verifica

Ipotesi alternativa (H ₁ ): affermazione fatta in antitesi all ’ ipotesi nulla

: q ₌ q

Ipotesi nulla (H ₀ ): ipotesi sottoposta a verifica

Ipotesi alternativa (H ₁ ): affermazione fatta in antitesi all ’ ipotesi nulla

• ¹ − = β P rifiutare H | H è falsa (