comunicazione e delle relazioni
internazionali - a.a. 2013-2014
Popolazione Parametri Valori fissi, spesso non noti
Campione Statistiche Stimatori o
Variabili casuali, le cui determinazioni
dipendono dalle particolari osservazioni scelte
Parametri e statistiche
Ø Parametri: valori caratteristici della popolazione Ø Statistiche o v.c. campionarie o stimatori o
statistiche test: funzioni delle osservazioni campionarie Ø Statistica calcolata o stima: numero ottenuto
applicando la statistica al campione osservato
Ø Distribuzione campionaria: valori che la statistica
assume al variare del campione nell ’ universo campionario
Parametri e statistiche
Distribuzioni campionarie
Le conclusioni inferenziali, basate sull ’ unico campione osservato, devono essere giudicate sulla base della distribuzione di probabilità dei possibili campioni che potevano essere generati e dei quali quello osservato
costituisce una realizzazione particolare.
La stima
Si suppone che la popolazione, seppur incognita, si distribuisca secondo una legge di probabilità completamente caratterizzata da un parametro o da un insieme di parametri.
Sulla base di un campione casuale X
1, X
2, …, X
nsi vuole trovare un
valore o un insieme di valori per il parametro che siano la migliore
approssimazione possibile del valore incognito della popolazione.
La stima
La stima puntuale
Per stimare uno stesso parametro si possono usare più statistiche (più stimatori) ognuno delle quali fornisce valori potenziali per il parametro.
La stima per intervalli
Si cerca un intervallo che ha una particolare confidenza o probabilità di includere il parametro della popolazione
( 1 2 ) 1
P t < < θ t = − α
Livello di confidenza
La stima puntuale
Occorre definire delle regole in base alle quali si possa discriminare tra stimatori alternativi:
1. Proporre stimatori “ naturali ”
2. Determinare la probabilità con cui uno stimatore tende a produrre stime diverse da θ
Proprietà degli stimatori
La stima puntuale: la correttezza
Uno stimatore t è uno stimatore corretto del parametro q se:
( )
E t = θ
( ) X = µ
E X
( ) n n
E 1
ˆ
2= σ
2−
σ σ ˆ
2è uno stimatore corretto di m
è uno stimatore distorto di s
2S
2=
X
i− X
( )
2i=1
∑
nn −1 è uno stimatore corretto di s
2La stima puntuale
• Anche se lo stimatore presenta proprietà ottimali, una volta ottenuto il campione le stime difficilmente coincideranno con il parametro incognito
• A parità di stimatore, campioni diversi conducono a stime diverse
• Il valore numerico della singola stima non fornisce
informazioni sul probabile campo di variazione delle stime del parametro
Stima per intervalli
L ’ intervallo di confidenza per la media della popolazione
( )
~ 0,1 X
nN σ − n µ
m
~ ,
2X N
n µ σ
⎛ ⎞
⎜ ⎟
⎝ ⎠
• Popolazione X ∼ N ( µ σ ;
2)
• P t (
1< < µ t
2) = − 1 α
• Stimatore di µ à media campionaria
α 2
α 2
t
1t
20
α 2
α 2
-Z
a/2Z
a/2• Popolazione X ∼ N ( µ σ ;
2)
• P t (
1< < µ t
2) = − 1 α
• Stimatore di µ à media campionaria
• P t (
1< < µ t
2) = − = 1 α P ( − z
α2< < Z z
α2)
Z X
n σ − µ
=
2 2
P z X z
n
α
µ
ασ
⎛ ⎞
⎜ − < − < ⎟
⎜ ⎟
⎜ ⎟
⎝ ⎠ = − 1 α
L ’ intervallo di confidenza per la media della popolazione
2 n 2 1
P z X z
n n
α
σ
ασ α
µ µ
⎛ − ⋅ ≤ ≤ ⋅ ⎞ = −
⎜ ⎟
⎝
+
⎠2 2 1
P z z
n n
X
ασ µ X
ασ α
⎛ − ⋅ ≤ ≤ ⋅ ⎞ = −
⎜ ⎟
⎝
+
⎠2 2
P z X z
n
α
µ
ασ
⎛ ⎞
⎜ − < − < ⎟
⎜ ⎟
⎜ ⎟
⎝ ⎠ = − 1 α
L ’ intervallo di confidenza per la media della popolazione
2 n 2 1
P z X z
n n
α
σ
ασ α
µ µ
⎛ − ⋅ ≤ ≤ ⋅ ⎞ = −
⎜ ⎟
⎝
+
⎠2 2 1
P z z
n n
X
ασ µ X
ασ α
⎛ − ⋅ ≤ ≤ ⋅ ⎞ = −
⎜ ⎟
⎝
+
⎠Una macchina produce bulloni il cui peso ha distribuzione Normale con media m=63 grammi e varianza s2=0,8.
Scegliendo a caso 8 bulloni, qual è l’intervallo che con probabilità 0,95 comprenderà la loro media?
Una macchina produce bulloni il cui peso ha distribuzione Normale con media m=incognita e varianza s2=0,8.
Scelti a caso 8 bulloni, il loro peso medio è risultato pari a 62,6 grammi. Qual è l’intervallo che, con probabilità 0,95, contiene il parametri incognito m?
0,89 0,89
62,6 1,96 62,6 1,96 0,95
8 8
P⎛⎜ − ⋅ ≤
µ
≤ + ⋅ ⎞⎟ =⎝ ⎠
0,89 0,89
63 1,96 63 1,96 0,95
8 Xn 8
P ⎛⎜ − ⋅ ≤ ≤ + ⋅ ⎞⎟ =
⎝ ⎠
(
63 0,62 n 63 0,62)
0,95P − ≤ X ≤ + =
(
62,38 Xn 63,62)
0,95P ≤ ≤ =
(
62,6 0,62 62,6 0,62)
0,95P − ≤
µ
≤ + =(
61,98 63,22)
0,95P ≤
µ
≤ =2 2
1
P X z X z
n n
α
σ µ
ασ α
⎛ − < < + ⎞ = −
⎜ ⎟
⎝ ⎠
• Dopo aver estratto il campione ( x
1, x
2, … x
n) :
2 2
1
P x z x z
n n
α σ µ α σ α
⎛ − < < + ⎞ = −
⎜ ⎟
⎝ ⎠
Per 1-a= 68%
2 1,00
z α =
Per 1-a = 95%
2 1,96
z α =
Per 1-a= 99%
2 2,58
z α =
L ’ intervallo di confidenza per la media
della popolazione
Quando il parametro m della popolazione è incognito, il miglior modo per stimarlo è utilizzare la media campionaria.
Quando la numerosità campionaria n è sufficientemente elevata si ha:
E’ quindi possibile dire che, con probabilità 1-a, l’intervallo:
contiene il parametro incognito m.
µ σ
⎛ ⎞
∼ ⎜ ⎟
⎝ ⎠
;
2X N
n
x ± z
α2
⋅ σ
n
L ’ intervallo di confidenza per la media
della popolazione
Si supponga di aver estratto 10 campioni di 36 unità da una popolazione normale con media µ=10 e varianza pari a 36. Per ognuno di questi campioni si è calcolata la media campionaria e l’intervallo di confidenza al 95%.
Estremi dell’intervallo:
• a X = − 1,96 σ n
b X 1,96
n
= + σ
CampioneX
Estremoinferiore a
Estremo superiore b
1 8.75 6.79 10.71
2 11.75 9.79 13.71
3 8.45 6.49 10.41
4 9.70 7.74 11.66
5 10.50 8.54 12.46
6 9.00 7.04 10.96
7 11.15 9.19 13.11
8 10.50 8.54 12.46
9 7.75 5.79 9.71
10 10.10 8.14 12.06
L ’ intervallo di confidenza per la media
della popolazione
0 2 4 6 8 10 12 14 16
1 2 3 4 5 6 7 8 9 10
Numero del campione
a, b, media campionaria
NO
µ
L ’ intervallo di confidenza per la media
della popolazione
L ’ altezza delle matricole universitarie di sesso maschile può essere considerata una variabile con distribuzione Normale, con media incognita e varianza pari a 10,66.
Per stimare l ’ altezza media si estrae un campione casuale di 58 matricole e si misura l’altezza media, che risulta pari a 175,4 cm. Si definisca l ’ intervallo che, ad un livello di fiducia del 90, del 95 e del 99 per cento contenga il parametro incognito della popolazione.
( )
~ ; 10,66
X N µ n = 58 x = 175, 4 cm
0,90
1 0,95
0,99 α
⎧⎪
− = ⎨
⎪⎩
3,265 3,265
175, 4 1,96 175, 4 1,96 0,95
58 58
P⎛⎜ − ⋅ ≤
µ
≤ + ⋅ ⎞⎟ =⎝ ⎠
3,265 3,265
175, 4 2,58 175, 4 2,58 0,99
58 58
P⎛⎜ − ⋅ ≤
µ
≤ + ⋅ ⎞⎟ =⎝ ⎠
3,265 3,265
175, 4 1,64 175, 4 1,64 0,90
58 58
P⎛⎜ − ⋅ ≤
µ
≤ + ⋅ ⎞⎟ =⎝ ⎠ P
(
175,4 0,705− ≤µ
≤175,4 0,705+)
= 0,90(
175,4 0,840 175,4 0,840)
0,95P − ≤
µ
≤ + =(
175, 4 1,106 175, 4 1,106)
0,99P − ≤
µ
≤ + =Esercizio
L ’ altezza delle matricole universitarie di sesso maschile può essere considerata una variabile con distribuzione Normale, con media incognita e varianza pari a 10,66.
Per stimare l ’ altezza media si estrae un campione casuale di 58 matricole e si misura l’altezza media, che risulta pari a 175,4 cm. Si definisca l ’ intervallo che, ad un livello di fiducia del 90, del 95 e del 99 per cento contenga il parametro incognito della popolazione.
Esercizio
( )
~ ; 10,66
X N µ n = 58 x = 175, 4 cm
0,90
1 0,95
0,99 α
⎧⎪
− = ⎨
⎪⎩
( 174,6 176,2 ) 0,95
P ≤ µ ≤ =
( 174,3 176,5 ) 0,99
P ≤ µ ≤ =
( 174,7 176,1 ) 0,90
P ≤ µ ≤ = x 0,705
x 0,840
x 1,106
n >
30?
?
s noto?
NO NO
NO SI SI
SI
x z
α2
⋅ σ n
x t
α2
⋅ σ n
La stima per intervalli
X N ?
La stima per intervalli
(
2)
~ ; X N µ σ
X
n− µ
σ n
X
n− µ
s n
s = 1
n − 1 ∑
i=1n( x
i− x )
2~ t
n−1La stima della media
con distribuzione nota e varianza incognita X k ⋅ σ n
P X − tα
2; n−1
( )
⋅ sn ≤µ
≤ X + tα2; n−1
( )
⋅ sn⎛
⎝⎜ ⎞
⎠⎟ = 0,95 P X − zα
2
⋅ σn ≤
µ
≤ X + zα2
⋅ σn
⎛
⎝⎜ ⎞
⎠⎟ = 0,95
• La funzione di densità della v.c. di Student è sempre simmetrica, con valore medio pari a 0, ed assume una forma molto simile a quello della Normale standardizzata alla quale tende assai velocemente al crescere dei gradi di libertà.
• Per valori di n piccoli o moderati, la v.c. di Student si caratterizza per una curtosi leggermente più elevata e per code più “pesanti” della v.c. Normale.
µ X
f(x)
X f(x)
( ) 0 ; ( )
2 E X Var X n
= = n
−
La distribuzione t di Student
La stima per intervalli
Esempio
L’altezza delle matricole universitarie di sesso maschile può essere considerata una variabile con distribuzione Normale, con media e varianza incognite.
Per stimare l’altezza media si estrae un campione casuale di 18 matricole e si misura l’altezza media, che risulta pari a 175,4 cm, con sqm campionario corretto pari a 4,4 cm. Si definisca l’intervallo che, ad un livello di fiducia del 95% contenga il parametro incognito della popolazione.
(
2)
~ ;
X N µ σ
n = 18 x = 175, 4cm 1−α
= 0,95(
2)
~ ; X N µ σ
X
n− µ
σ n
X
n− µ
s n
s = 1
n − 1 ∑
i=1n( x
i− x )
2~ t
n−1La stima della media
con distribuzione nota e varianza incognita
s = 4,4cm
X k ⋅ σ n
X k ⋅ s n
0,025;17 2,110
t =
175,4 2,11⋅ 4,4
18 175,4 2,19
173,2 177,6P X − tα
2; n−1
( )
⋅ sn ≤µ
≤ X + tα2; n−1
( )
⋅ sn⎛
⎝⎜ ⎞
⎠⎟ = 0,95
( 173,2 177,6 ) 0,95
P ≤ µ ≤ =
Un'azienda che imbottiglia una bibita gassata vuole indagare sulla forza della pressione interna della bibita presente in una lattina. Supponendo che la forza della pressione sia una v.c.
con s.q.m. 28psi, si consideri un campione casuale di 20 lattine con pressione media pari a 235psi. Si determini un intervallo di confidenza al 95% per la pressione media delle lattine prodotte dall'azienda nel caso in cui il valore della pressione possa
essere considerato distribuito normalmente.
Esercizio
X~ N(?; 28) s=28
n=20 1-a=0,95 1 , 96
2 = z α
= 235 x
20 96 28
, 1 235
[ 222 , 73 ; 245 , 27 ]
z=1,96 z=2,33 ldf=90% z=1,64 ldf=95%
ldf=99%
Esercizio
• Si cerca un intervallo che ha una particolare confidenza o probabilità di includere il parametro della popolazione
( 1 2 ) 1
P t < < θ t = − α
Livello di confidenza
La stima per intervalli
( )
( )
X B ∼ n π ; n π 1 − π
( 1 )
X B ;
n n
π π
⎛ π − ⎞
⎜ ⎟
∼ ⎜ ⎝ ⎟ ⎠
• : numero di successi in n prove
• : proporzione di successi in n prove
p à proporzione di successi nella popolazione
p à proporzione di successi in un campione di ampiezza n P: v.c proporzione campionaria
( 1 )
P ;
n N
n
π π
→∞ π
⎛ − ⎞
⎜ ⎟
∼ ⎜ ⎝ ⎟ ⎠ Z= P - ( ) ( ) 0;1
1 N
n π
π − π ∼
V.C. Proporzione campionaria
La proporzione di successi nella popolazione
• Popolazione :
( 1 )
X B ;
n n
π π
⎛ π − ⎞
⎜ ⎟
∼ ⎜ ⎝ ⎟ ⎠
• P t (
1< < π t
2) = − 1 α
• Stimatore di π à proporzione campionaria P
( 1 )
P ;
n
N
n
π π
→∞
π
⎛ − ⎞
⎜ ⎟
∼ ⎜ ⎝ ⎟ ⎠ Z= P - ( ) ( ) 0;1
1 N
n π
π − π ∼
La stima per intervalli
La proporzione di successi nella popolazione
( 1 2 ) 1 ( 2 2 )
P t < < π t = − = α P z − α < < Z z α
( 1 )
Z P
n π
π π
= −
−
( ) ( )
2 2
1 1
1
P P z P z
n n
α α
π π π π
π α
⎛ − − ⎞
⎜ − < < + ⎟ = −
⎜ ⎟
⎝ ⎠
• Dopo aver estratto il campione ( x
1, x
2, … x
n) e sostituendo al parametro ignoto della popolazione il suo stimatore p:
( ) ( )
2 2
1 1
p p p p 1
P p z p z
n n
α π α α
⎛ − − ⎞
⎜ − < < + ⎟ = −
⎜ ⎟
⎝ ⎠
La stima per intervalli
Quando il parametro p della popolazione è incognito, il miglior modo per stimarlo è utilizzare la proporzione campionaria.
Quando la numerosità campionaria n è sufficientemente elevata si ha:
E’ quindi possibile dire che, con probabilità 1- α, l’intervallo:
contiene il parametro incognito p.
( 1 )
P ;
n
N
n
π π
→∞
π
⎛ − ⎞
⎜ ⎟
∼ ⎜ ⎝ ⎟ ⎠
( ) ( )
2 2
1 1
p p p p 1
P p z p z
n n
α π α α
⎛ − − ⎞
⎜ − < < + ⎟ = −
⎜ ⎟
⎝ ⎠
La stima per intervalli
La proporzione di successi nella popolazione
Esercizio
La stima di una proporzione
Da un’indagine condotta su un campione casuale di 280 matricole universitarie è risultato che il 36% si dichiara insoddisfatto della nuova Riforma.
Qual è l’intervallo che, ad un livello di fiducia del 95%,
comprende il parametro incognito della popolazione?
Esercizio
La stima di una proporzione
Da un’indagine condotta su un campione casuale di 280 matricole universitarie è risultato che il 36% si dichiara insoddisfatto della nuova Riforma.
Qual è l’intervallo che, ad un livello di fiducia del 95%, comprende il parametro incognito della popolazione?
Parametro: p (Proporzione nella popolazione) Stimatore:
p
(Proporzione campionaria)( ) = π
E p Var p ( ) = π ⋅ ( 1 − π )
n
Per campioni grandi
( )
π π
⎛
π
⋅ − ⎞⎜ ⎟
⎜ ⎟
⎝ ⎠
~ ; 1 p N
n
n=280 p=0,36 1- α = 0,95
( )
α α
π
π π
α
⎛ ⎞
⎜ ⎟
⎜− ≤ − ≤ ⎟ = −
⎜ ⋅ − ⎟
⎜ ⎟
⎜ ⎟
⎝ ⎠
2 2 1
1
P z p z
n
( ) ( )
α α
π π
π
π πα
⎛ ⋅ − ⋅ − ⎞
⎜ ⎟
⇒ − ⋅ ≤ ≤ + ⋅ = −
⎜ ⎟
⎝ 2 2 ⎠
1 1
1
P p z p z
n n
α
=
2
1,96
z
( ) π ( )
⎛ ⋅ − ⋅ − ⎞
⎜ ⎟
⇒ − ⋅ ≤ ≤ + ⋅ =
⎜ ⎟
⎝ ⎠
0,36 1 0,36 0,36 1 0,36
0,36 1,96 0,36 1,96 0,95
280 280
P