• Non ci sono risultati.

Dipartimento di Scienze politiche, della comunicazione e delle relazioni internazionali - a.a. 2013-2014

N/A
N/A
Protected

Academic year: 2022

Condividi "Dipartimento di Scienze politiche, della comunicazione e delle relazioni internazionali - a.a. 2013-2014"

Copied!
35
0
0

Testo completo

(1)

comunicazione e delle relazioni

internazionali - a.a. 2013-2014

(2)

Popolazione Parametri Valori fissi, spesso non noti

Campione Statistiche Stimatori o

Variabili casuali, le cui determinazioni

dipendono dalle particolari osservazioni scelte

Parametri e statistiche

(3)

Ø Parametri: valori caratteristici della popolazione Ø Statistiche o v.c. campionarie o stimatori o

statistiche test: funzioni delle osservazioni campionarie Ø Statistica calcolata o stima: numero ottenuto

applicando la statistica al campione osservato

Ø Distribuzione campionaria: valori che la statistica

assume al variare del campione nell ’ universo campionario

Parametri e statistiche

(4)

Distribuzioni campionarie

Le conclusioni inferenziali, basate sull ’ unico campione osservato, devono essere giudicate sulla base della distribuzione di probabilità dei possibili campioni che potevano essere generati e dei quali quello osservato

costituisce una realizzazione particolare.

(5)

La stima

Si suppone che la popolazione, seppur incognita, si distribuisca secondo una legge di probabilità completamente caratterizzata da un parametro o da un insieme di parametri.

Sulla base di un campione casuale X

1

, X

2

, …, X

n

si vuole trovare un

valore o un insieme di valori per il parametro che siano la migliore

approssimazione possibile del valore incognito della popolazione.

(6)

La stima

La stima puntuale

Per stimare uno stesso parametro si possono usare più statistiche (più stimatori) ognuno delle quali fornisce valori potenziali per il parametro.

La stima per intervalli

Si cerca un intervallo che ha una particolare confidenza o probabilità di includere il parametro della popolazione

( 1 2 ) 1

P t < < θ t = − α

Livello di confidenza

(7)

La stima puntuale

Occorre definire delle regole in base alle quali si possa discriminare tra stimatori alternativi:

1. Proporre stimatori “ naturali ”

2. Determinare la probabilità con cui uno stimatore tende a produrre stime diverse da θ

Proprietà degli stimatori

(8)

La stima puntuale: la correttezza

Uno stimatore t è uno stimatore corretto del parametro q se:

( )

E t = θ

( ) X = µ

E X

( ) n n

E 1

ˆ

2

= σ

2

σ σ ˆ

2

è uno stimatore corretto di m

è uno stimatore distorto di s

2

S

2

=

X

i

− X

( )

2

i=1

n

n −1 è uno stimatore corretto di s

2

(9)

La stima puntuale

•  Anche se lo stimatore presenta proprietà ottimali, una volta ottenuto il campione le stime difficilmente coincideranno con il parametro incognito

•  A parità di stimatore, campioni diversi conducono a stime diverse

•  Il valore numerico della singola stima non fornisce

informazioni sul probabile campo di variazione delle stime del parametro

Stima per intervalli

(10)

Lintervallo di confidenza per la media della popolazione

( )

~ 0,1 X

n

N σ n µ

m

~ ,

2

X N

n µ σ

⎛ ⎞

⎜ ⎟

⎝ ⎠

• Popolazione X N ( µ σ ;

2

)

P t (

1

< < µ t

2

) = − 1 α

• Stimatore di µ à media campionaria

α 2

α 2

t

1

t

2

0

α 2

α 2

-Z

a/2

Z

a/2

(11)

• Popolazione X N ( µ σ ;

2

)

P t (

1

< < µ t

2

) = − 1 α

• Stimatore di µ à media campionaria

P t (

1

< < µ t

2

) = − = 1 α P ( z

α2

< < Z z

α2

)

Z X

n σ µ

=

2 2

P z X z

n

α

µ

α

σ

⎛ ⎞

⎜ − < − < ⎟

⎜ ⎟

⎜ ⎟

⎝ ⎠ = − 1 α

Lintervallo di confidenza per la media della popolazione

2 n 2 1

P z X z

n n

α

σ

α

σ α

µ µ

⎛ − ⋅ ≤ ≤ ⋅ ⎞ = −

⎜ ⎟

+

2 2 1

P z z

n n

X

α

σ µ X

α

σ α

⎛ − ⋅ ≤ ≤ ⋅ ⎞ = −

⎜ ⎟

+

(12)

2 2

P z X z

n

α

µ

α

σ

⎛ ⎞

⎜ − < − < ⎟

⎜ ⎟

⎜ ⎟

⎝ ⎠ = − 1 α

Lintervallo di confidenza per la media della popolazione

2 n 2 1

P z X z

n n

α

σ

α

σ α

µ µ

⎛ − ⋅ ≤ ≤ ⋅ ⎞ = −

⎜ ⎟

+

2 2 1

P z z

n n

X

α

σ µ X

α

σ α

⎛ − ⋅ ≤ ≤ ⋅ ⎞ = −

⎜ ⎟

+

Una macchina produce bulloni il cui peso ha distribuzione Normale con media m=63 grammi e varianza s2=0,8.

Scegliendo a caso 8 bulloni, qual è l’intervallo che con probabilità 0,95 comprenderà la loro media?

Una macchina produce bulloni il cui peso ha distribuzione Normale con media m=incognita e varianza s2=0,8.

Scelti a caso 8 bulloni, il loro peso medio è risultato pari a 62,6 grammi. Qual è l’intervallo che, con probabilità 0,95, contiene il parametri incognito m?

0,89 0,89

62,6 1,96 62,6 1,96 0,95

8 8

P

µ

+ =

⎝ ⎠

0,89 0,89

63 1,96 63 1,96 0,95

8 Xn 8

P ⎛⎜ − ⋅ ≤ ≤ + ⋅ ⎞⎟ =

⎝ ⎠

(

63 0,62 n 63 0,62

)

0,95

P − ≤ X ≤ + =

(

62,38 Xn 63,62

)

0,95

P ≤ ≤ =

(

62,6 0,62 62,6 0,62

)

0,95

P

µ

+ =

(

61,98 63,22

)

0,95

P

µ

=

(13)

2 2

1

P X z X z

n n

α

σ µ

α

σ α

⎛ − < < + ⎞ = −

⎜ ⎟

⎝ ⎠

• Dopo aver estratto il campione ( x

1

, x

2

, … x

n

) :

2 2

1

P x z x z

n n

α σ µ α σ α

⎛ − < < + ⎞ = −

⎜ ⎟

⎝ ⎠

Per 1-a= 68%

2 1,00

z α =

Per 1-a = 95%

2 1,96

z α =

Per 1-a= 99%

2 2,58

z α =

Lintervallo di confidenza per la media

della popolazione

(14)

Quando il parametro m della popolazione è incognito, il miglior modo per stimarlo è utilizzare la media campionaria.

Quando la numerosità campionaria n è sufficientemente elevata si ha:

E’ quindi possibile dire che, con probabilità 1-a, l’intervallo:

contiene il parametro incognito m.

µ σ

⎛ ⎞

∼ ⎜ ⎟

⎝ ⎠

;

2

X N

n

x ± z

α

2

⋅ σ

n

Lintervallo di confidenza per la media

della popolazione

(15)

Si supponga di aver estratto 10 campioni di 36 unità da una popolazione normale con media µ=10 e varianza pari a 36. Per ognuno di questi campioni si è calcolata la media campionaria e l’intervallo di confidenza al 95%.

Estremi dell’intervallo:

a X = − 1,96 σ n

b X 1,96

n

= + σ

Campione

X

Estremo

inferiore a

Estremo superiore b

1 8.75 6.79 10.71

2 11.75 9.79 13.71

3 8.45 6.49 10.41

4 9.70 7.74 11.66

5 10.50 8.54 12.46

6 9.00 7.04 10.96

7 11.15 9.19 13.11

8 10.50 8.54 12.46

9 7.75 5.79 9.71

10 10.10 8.14 12.06

Lintervallo di confidenza per la media

della popolazione

(16)

0 2 4 6 8 10 12 14 16

1 2 3 4 5 6 7 8 9 10

Numero del campione

a, b, media campionaria

NO

µ

Lintervallo di confidenza per la media

della popolazione

(17)

L ’ altezza delle matricole universitarie di sesso maschile può essere considerata una variabile con distribuzione Normale, con media incognita e varianza pari a 10,66.

Per stimare l ’ altezza media si estrae un campione casuale di 58 matricole e si misura l’altezza media, che risulta pari a 175,4 cm. Si definisca l ’ intervallo che, ad un livello di fiducia del 90, del 95 e del 99 per cento contenga il parametro incognito della popolazione.

( )

~ ; 10,66

X N µ n = 58 x = 175, 4 cm

0,90

1 0,95

0,99 α

⎧⎪

− = ⎨

⎪⎩

3,265 3,265

175, 4 1,96 175, 4 1,96 0,95

58 58

P

µ

+ =

⎝ ⎠

3,265 3,265

175, 4 2,58 175, 4 2,58 0,99

58 58

P

µ

+ =

⎝ ⎠

3,265 3,265

175, 4 1,64 175, 4 1,64 0,90

58 58

P

µ

+ =

⎝ ⎠ P

(

175,4 0,705

µ

175,4 0,705+

)

= 0,90

(

175,4 0,840 175,4 0,840

)

0,95

P

µ

+ =

(

175, 4 1,106 175, 4 1,106

)

0,99

P

µ

+ =

Esercizio

(18)

L ’ altezza delle matricole universitarie di sesso maschile può essere considerata una variabile con distribuzione Normale, con media incognita e varianza pari a 10,66.

Per stimare l ’ altezza media si estrae un campione casuale di 58 matricole e si misura l’altezza media, che risulta pari a 175,4 cm. Si definisca l ’ intervallo che, ad un livello di fiducia del 90, del 95 e del 99 per cento contenga il parametro incognito della popolazione.

Esercizio

( )

~ ; 10,66

X N µ n = 58 x = 175, 4 cm

0,90

1 0,95

0,99 α

⎧⎪

− = ⎨

⎪⎩

( 174,6 176,2 ) 0,95

P µ =

( 174,3 176,5 ) 0,99

P µ =

( 174,7 176,1 ) 0,90

P µ = x  0,705

x  0,840

x  1,106

(19)

n >

30?

?

s noto?

NO NO

NO SI SI

SI

xz

α

2

⋅ σ n

xt

α

2

⋅ σ n

La stima per intervalli

X  N ?

(20)

La stima per intervalli

(

2

)

~ ; X N µ σ

X

n

− µ

σ n

X

n

− µ

s n

s = 1

n − 1

i=1n

( x

i

− x )

2

~ t

n1

La stima della media

con distribuzione nota e varianza incognita X  k ⋅ σ n

P X − tα

2; n−1

( )

sn

µ

≤ X + tα

2; n−1

( )

sn

⎝⎜ ⎞

⎠⎟ = 0,95 P X − zα

2

⋅ σn

µ

≤ X + zα

2

⋅ σn

⎝⎜ ⎞

⎠⎟ = 0,95

•  La funzione di densità della v.c. di Student è sempre simmetrica, con valore medio pari a 0, ed assume una forma molto simile a quello della Normale standardizzata alla quale tende assai velocemente al crescere dei gradi di libertà.

•  Per valori di n piccoli o moderati, la v.c. di Student si caratterizza per una curtosi leggermente più elevata e per code più “pesanti” della v.c. Normale.

µ X

f(x)

X f(x)

( ) 0 ; ( )

2 E X Var X n

= = n

La distribuzione t di Student

(21)

La stima per intervalli

Esempio

L’altezza delle matricole universitarie di sesso maschile può essere considerata una variabile con distribuzione Normale, con media e varianza incognite.

Per stimare l’altezza media si estrae un campione casuale di 18 matricole e si misura l’altezza media, che risulta pari a 175,4 cm, con sqm campionario corretto pari a 4,4 cm. Si definisca l’intervallo che, ad un livello di fiducia del 95% contenga il parametro incognito della popolazione.

(

2

)

~ ;

X N µ σ

n = 18 x = 175, 4cm 1−

α

= 0,95

(

2

)

~ ; X N µ σ

X

n

− µ

σ n

X

n

− µ

s n

s = 1

n − 1

i=1n

( x

i

− x )

2

~ t

n1

La stima della media

con distribuzione nota e varianza incognita

s = 4,4cm

X  k ⋅ σ n

X  k ⋅ s n

0,025;17 2,110

t =

175,4  2,11⋅ 4,4

18 175,4  2,19

173,2 177,6

P X − tα

2; n−1

( )

sn

µ

≤ X + tα

2; n−1

( )

sn

⎝⎜ ⎞

⎠⎟ = 0,95

( 173,2 177,6 ) 0,95

P µ =

(22)

Un'azienda che imbottiglia una bibita gassata vuole indagare sulla forza della pressione interna della bibita presente in una lattina. Supponendo che la forza della pressione sia una v.c.

con s.q.m. 28psi, si consideri un campione casuale di 20 lattine con pressione media pari a 235psi. Si determini un intervallo di confidenza al 95% per la pressione media delle lattine prodotte dall'azienda nel caso in cui il valore della pressione possa

essere considerato distribuito normalmente.

Esercizio

(23)

X~ N(?; 28) s=28

n=20 1-a=0,95 1 , 96

2 = z α

= 235 x

20 96 28

, 1 235 

[ 222 , 73 ; 245 , 27 ]

z=1,96 z=2,33 ldf=90% z=1,64 ldf=95%

ldf=99%

Esercizio

(24)

•  Si cerca un intervallo che ha una particolare confidenza o probabilità di includere il parametro della popolazione

( 1 2 ) 1

P t < < θ t = − α

Livello di confidenza

La stima per intervalli

(25)

( )

( )

X B ∼ n π ; n π 1 − π

( 1 )

X B ;

n n

π π

⎛ π − ⎞

⎜ ⎟

∼ ⎜ ⎝ ⎟ ⎠

•  : numero di successi in n prove

•  : proporzione di successi in n prove

p à proporzione di successi nella popolazione

p à proporzione di successi in un campione di ampiezza n P: v.c proporzione campionaria

( 1 )

P ;

n N

n

π π

→∞ π

⎛ − ⎞

⎜ ⎟

∼ ⎜ ⎝ ⎟ ⎠ Z= P - ( ) ( ) 0;1

1 N

n π

π − π

V.C. Proporzione campionaria

(26)

La proporzione di successi nella popolazione

• Popolazione :

( 1 )

X B ;

n n

π π

⎛ π − ⎞

⎜ ⎟

∼ ⎜ ⎝ ⎟ ⎠

P t (

1

< < π t

2

) = − 1 α

• Stimatore di π à proporzione campionaria P

( 1 )

P ;

n

N

n

π π

→∞

π

⎛ − ⎞

⎜ ⎟

∼ ⎜ ⎝ ⎟ ⎠ Z= P - ( ) ( ) 0;1

1 N

n π

π − π

La stima per intervalli

(27)

La proporzione di successi nella popolazione

( 1 2 ) 1 ( 2 2 )

P t < < π t = − = α P zα < < Z z α

( 1 )

Z P

n π

π π

= −

( ) ( )

2 2

1 1

1

P P z P z

n n

α α

π π π π

π α

⎛ − − ⎞

⎜ − < < + ⎟ = −

⎜ ⎟

⎝ ⎠

• Dopo aver estratto il campione ( x

1

, x

2

, … x

n

) e sostituendo al parametro ignoto della popolazione il suo stimatore p:

( ) ( )

2 2

1 1

p p p p 1

P p z p z

n n

α π α α

⎛ − − ⎞

⎜ − < < + ⎟ = −

⎜ ⎟

⎝ ⎠

La stima per intervalli

(28)

Quando il parametro p della popolazione è incognito, il miglior modo per stimarlo è utilizzare la proporzione campionaria.

Quando la numerosità campionaria n è sufficientemente elevata si ha:

E’ quindi possibile dire che, con probabilità 1- α, l’intervallo:

contiene il parametro incognito p.

( 1 )

P ;

n

N

n

π π

→∞

π

⎛ − ⎞

⎜ ⎟

∼ ⎜ ⎝ ⎟ ⎠

( ) ( )

2 2

1 1

p p p p 1

P p z p z

n n

α π α α

⎛ − − ⎞

⎜ − < < + ⎟ = −

⎜ ⎟

⎝ ⎠

La stima per intervalli

La proporzione di successi nella popolazione

(29)

Esercizio

La stima di una proporzione

Da un’indagine condotta su un campione casuale di 280 matricole universitarie è risultato che il 36% si dichiara insoddisfatto della nuova Riforma.

Qual è l’intervallo che, ad un livello di fiducia del 95%,

comprende il parametro incognito della popolazione?

(30)

Esercizio

La stima di una proporzione

Da un’indagine condotta su un campione casuale di 280 matricole universitarie è risultato che il 36% si dichiara insoddisfatto della nuova Riforma.

Qual è l’intervallo che, ad un livello di fiducia del 95%, comprende il parametro incognito della popolazione?

Parametro: p (Proporzione nella popolazione) Stimatore:

p

(Proporzione campionaria)

( ) = π

E p Var p ( ) = π ( 1 π )

n

Per campioni grandi

( )

π π

π

⋅ − ⎞

⎜ ⎟

⎜ ⎟

⎝ ⎠

~ ; 1 p N

n

n=280 p=0,36 1- α = 0,95

( )

α α

π

π π

α

⎛ ⎞

⎜ ⎟

⎜− ≤ − ≤ ⎟ = −

⎜ ⋅ − ⎟

⎜ ⎟

⎜ ⎟

⎝ ⎠

2 2 1

1

P z p z

n

( ) ( )

α α

π π

π

π π

α

⎛ ⋅ − ⋅ − ⎞

⎜ ⎟

⇒ − ⋅ ≤ ≤ + ⋅ = −

⎜ ⎟

2 2

1 1

1

P p z p z

n n

α

=

2

1,96

z

( ) π ( )

⎛ ⋅ − ⋅ − ⎞

⎜ ⎟

⇒ − ⋅ ≤ ≤ + ⋅ =

⎜ ⎟

⎝ ⎠

0,36 1 0,36 0,36 1 0,36

0,36 1,96 0,36 1,96 0,95

280 280

P

;

( π )

P 0,36 0,056 − ≤ ≤ 0,36 0,056 + = 0,95 0,303 P ( π 0,416 ) = 0,95

(31)

Un rivenditore di automobili vorrebbe stimare la proporzione di clienti che posseggono ancora l'automobile acquistata

cinque anni prima.

Dai registri del rivenditore si seleziona un campione casuale di 200 clienti, di cui 82 posseggono ancora l'automobile

acquistata cinque anni prima. Si definisca una stima per

intervalli per la proporzione nella popolazione ad un livello di confidenza del 95%.

Esercizio

(32)

n=200 1-a=0,95 1 , 96

2 = z α

41 , 200 82 = 0

= p

( )

200

41 , 0 1

* 41 , 96 0

, 1 41

,

0 −

[ 0 , 3418 ; 0 , 4781 ]

Esercizio

(33)

Campione

casuale E’ un campione estratto da una popolazione in cui tutte le unità hanno probabilità non nulla di essere estratte.

Un campione è

rappresentativo… …quando è estratto in modo casuale (e non quando è grande!).

Un campione

grande… …è associato ad un minore errore delle stime.

Quindi… …la cosa migliore è avere un campione grande scelto in modo casuale ;

ma… …è molto meglio avere un campione piccolo estratto in modo casuale che un campione grande estratto

“ a casaccio”.

Una riflessione

(34)

Dove e come studiare

File esercizi intervalli di confidenza.pdf

•  S. Borra, A. Di Ciaccio (2004) – Statistica – Metodologie per le scienze economiche e sociali – McGraw-Hill. Cap. 11 (escluso paragrafi 11.4, 11.5, 11.9), Cap. 12 (escluso paragrafo 12.6).

•  D. Piccolo (2004) – Statistica per le decisioni – Il Mulino. Cap. 13 (escluso paragrafi 13.3, 13.4,13.5, 13.6, 13.7, 13.8), Cap. 15 (escluso paragrafi 15.4, 15.5, 15.6).

•  F. Parpinel, C. Provasi (2004) – Elementi di probabilità e statistica per

le Scienze Economiche – Giappichelli editore. Cap. 6 (escluso paragrafi

6.1.1, 6.1.2, 6.2.4).

(35)

Popolazione e campione

ü  La stima

ü  La stima puntuale

ü  Le proprietà degli stimatori

ü  Intervallo di confidenza per la media

ü  Intervallo di confidenza per la proporzione

Riepilogo

Riferimenti

Documenti correlati

Il corso di laurea magistrale in Scienze delle amministrazioni e delle organizzazioni complesse si propone di fare acquisire agli studenti, poi laureati nella classe,

Giuseppe Liotta (Università degli Studi di Palermo) La responsabilità per danni nello sport.

La produzione dell ’ ultima settimana è stata effettuata impiegando un nuovo tipo di materiale sulla cui qualità il responsabile della produzione avanza seri dubbi.

La casualità interviene nella selezione delle unità e si ottiene attribuendo ad ogni unità della popolazione una probabilità nota e diversa da zero di essere

Un sistema informativo aziendale deve raccogliere, processare, immagazzinare e distribuire informazione al fine di facilitare i processi di pianificazione, decisione

Il 5% dei pneumatici prodotti dal turno di giorno erano difettosi, mentre la percentuale di prodotti difettosi era pari al 10% di quelli prodotti dal turno di sera e al 20% di

Nello studio delle relazioni tra due (o più) variabili, oltre a misurare l’entità (o forza) del legame esistente, spesso si è anche interessati ad accertare come varia una di esse

ü  Analisi della interdipendenza tra due caratteri quantitativi ü  Codevianza.