Lezione 21
PROPRIETΓ DEGLI STIMATORI
Considerato un certo parametro ο±, esistono diverse funzioni dei dati campionari che possono essere considerate come possibili stimatori del parametro, ma Γ¨ evidente che la scelta di una determinata funzione oppure di una funzione diversa porta a stime che sono generalmente diverse fra di loro.
Se Γ¨ noto che Z ha una distribuzione normale, per esempio, il suo parametro ο potrebbe essere stimato dalla media, dalla moda o dalla mediana del campione.
Nei casi reali il parametro in questione Γ¨ ovviamente ignoto, per cui non cβΓ¨ nessuna possibilitΓ di quantificare l'errore commesso utilizzando una particolare stima.
Per determinare la bontΓ di una funzione dei dati campionari rispetto ad altre funzioni diverse ci si basa sulle proprietΓ degli stimatori. Si sceglierΓ quindi lo stimatore con le proprietΓ migliori, anche se in una particolare occasione di campionamento non si potrΓ mai sapere se la stima fornita dallo stimatore scelto Γ¨ effettivamente prossima al valore vero del parametro ignoto.
Nel caso della stima del parametro ο, per esempio, si giungerΓ alla conclusione che lo stimatore migliore Γ¨ la media campionaria, ma in una determinata occasione di campionamento non si potrΓ mai essere sicuri che il calcolo della mediana campionaria o della moda campionaria non avrebbe fornito un risultato che sarebbe stato piΓΉ vicino a ο.
Semplificando al massimo il problema, si consideri una variabile Z che ha una distribuzione di frequenza f(z,ο±) di forma nota in cui compare un unico parametro ignoto: ο±. In maniera analoga, se la distribuzione di Z fosse invece ben approssimata da un qualche modello teorico, si consideri un modello f(z,ο±) caratterizzato dal valore del parametro ignoto ο±.
Partendo da questo presupposto, si studieranno 3 importanti proprietΓ degli stimatori:
1) CORRETTEZZA
La funzione T=g(X) dei dati campionari Γ¨ uno stimatore corretto del parametro
ο± se il valore atteso dello stimatore Γ¨ uguale al parametro da stimare, ossia se
E(T) = ο±
per ogni possibile valore del parametro ο±.
Questa proprietΓ fornisce garanzie contro il verificarsi di errori di stima sistematici, ossia di sistematiche sovrastime o sottostime del parametro. Se uno stimatore non Γ¨ corretto, si parla infatti di stime βdistorte in mediaβ.
Se uno stimatore non Γ¨ corretto, si dice distorto, e la sua distorsione Γ¨ data dalla differenza
B(T) = E(T) β ο±
dove la lettera B Γ© lβiniziale del termine inglese βbiasβ (che si legge bΙΙͺΒ·Ιs).
Considerando gli stimatori analizzati nel corso di queste lezioni, risulta che la media campionaria e la proporzione campionaria sono stimatori corretti. Si Γ¨ infatti dimostrato in precedenza che
πΈ(πΜ ) = π πΈ(πΜ) = π
Non Γ¨ invece corretta la varianza campionaria, in quanto πΈ(π2) = π β 1
π π2
Va perΓ² notato che al crescere della numerositΓ campionaria π il valore atteso della varianza campionaria tende a π2, per cui questo stimatore si dice asintoticamente corretto. La sua distorsione tende quindi a zero per π che tende a +β.
In generale, considerata una variabile Z che nella popolazione ha una distribuzione caratterizzata da un parametro ignoto ο±, uno stimatore T=g(X) di ο± Γ¨ asintoticamente corretto se, per ogni possibile valore del parametro ο±, risulta
πββππππΈ(π) = π ovvero
πββππππ΅(π) = 0
e cioè se il suo valore atteso dello stimatore tende al parametro da stimare al crescere della numerosità del campione.
Se uno stimatore Γ¨ distorto Γ¨ talvolta possibile correggere la sua distorsione, come accade nel caso della varianza campionaria. Se infatti si moltiplica la varianza campionaria per la costante π
πβ1, si ottiene lo stimatore varianza campionaria corretta, spesso indicata mediante la notazione ππ2.
In genere, quindi, la varianza π2 della popolazione viene stimata utilizzando lo stimatore
ππ2 = π π β 1π2
che sarΓ quello che verrΓ utilizzato nelle lezioni successive.
Per ottenere il valore di questa funzione dei dati campionari conviene comunque calcolare la varianza campionaria nel modo usuale e poi moltiplicarla per la costante π
πβ1
La dimostrazione che ππ2 Γ¨ uno stimatore corretto della varianza della popolazione Γ¨ estremamente semplice, in quanto
πΈ(ππ2) = πΈ ( π
π β 1π2) = π
π β 1πΈ(π2) = π π β 1
π β 1
π π2 = π2
Anche se la correttezza Γ¨ una proprietΓ desiderabile per uno stimatore, va detto che, in alcuni casi, uno stimatore distorto puΓ² essere preferibile a uno stimatore corretto. Questo accade se lo stimatore corretto fornisce elevate sottostime e sovrastime che si compensano fra loro, per cui lo stimatore presenta una
variabilità così elevata da poter fornire stime molto distanti dal valore vero del parametro.
2) EFFICIENZA
Una misura della variabilitΓ delle stime fornite da uno stimatore Γ¨ fornita dal suo errore quadratico medio (o momento secondo dellβerrore di stima) che corrisponde a
πππΈ(π) = πΈ(π β π)2
dove lβacronimo MSE indica le iniziali del termine inglese βmean square errorβ.
Questo indice fornisce una misura della precisione dello stimatore, in quanto calcola la media dei quadrati delle differenze fra i possibili valori dello stimatore e il parametro da stimare.
Al crescere della precisione delle stime cresce anche lβefficienza dello stimatore, nel senso che diminuisce il grado di incertezza sulle stime ottenute mediante unβindagine campionaria.
Uno stimatore, anche se corretto, risulta quindi poco efficiente se presenta unβelevata variabilitΓ delle stime del parametro ignoto.
In genere lβerrore quadratico medio viene calcolato per confrontare lβefficienza di due diversi stimatori del parametro. Considerati, per esempio, gli stimatori T1 e T2 di ο±, se risulta
MSE (T1) < MSE(T2)
per ogni possibile valore del parametro ο±, si conclude dicendo cheT1 Γ¨ piΓΉ efficiente di T2.
Nel caso del parametro ο, per esempio, risulta che la media campionaria Γ¨ uno stimatore piΓΉ efficiente della mediana campionaria o della moda campionaria, quale che sia il valore di ο.
ProprietΓ dellβerrore quadratico medio
Lβerrore quadratico medio corrisponde alla somma della varianza dello stimatore piΓΉ la sua distorsione al quadrato
Questa dimostrazione si effettua sommando e sottraendo il valore atteso πΈ(π) dello stimatore allβinterno della formula dellβerrore quadratico medio, creando un binomio e sviluppandone il quadrato
Dimostrazione
πππΈ(π) = πΈ(π β π)2 = πΈ[π β πΈ(π) + πΈ(π) β π]2 = = πΈ{[π β πΈ(π)] + [πΈ(π) β π]}2 =
= πΈ{[π β πΈ(π)]2 + [πΈ(π) β π]2 + 2[π β πΈ(π)][πΈ(π) β π]} = = πΈ[π β πΈ(π)]2+ πΈ[πΈ(π) β π]2+ 2[πΈ(π) β π] Γ πΈ[π β πΈ(π)]
Il rettangolo dai bordi gialli contiene unβespressione che corrisponde alla varianza dello stimatore
Il rettangolo dai bordi rossi corrisponde alla media della differenza al quadrato fra valore atteso dello stimatore e parametro, per cui corrisponde alla media della distorsione al quadrato, che Γ¨ una costante rispetto allβoperatore βvalore medioβ
Il rettangolo dai bordi azzurri corrisponde alla media di una variabile scarto, in quanto considera la media della differenza fra lo stimatore T e il suo valore atteso. Quindi la quantitΓ racchiusa nel rettangolo azzurro Γ¨ pari a zero.
Lβerrore quadratico medio corrisponde quindi a
πππΈ(π) = π(π) + [π΅(π)]2
Da questa dimostrazione risulta che se uno stimatore T Γ¨ corretto il suo errore quadratico medio corrisponde alla sua varianza
MSE(T) = V(T)
Spesso, dati due diversi stimatori T1 e T2 di uno stesso parametro ο±, si calcola lβefficienza relativa di T1 rispetto a T2 mediante il rapporto
π(π1, π1) = πππΈ(π1) πππΈ(π2)
che, se entrambi gli stimatori risultano corretti, assume la forma
π(π1, π1) = π(π1) π(π2)
Infine, considerata una variabile Z con distribuzione f(z, ο±) e uno stimatore corretto T di ο± se sono soddisfatte alcune condizioni abbastanza generali, si
dimostra mediante la disuguaglianza di Rao-CramΓ©r che la varianza di T non puΓ² mai essere inferiore a una quantitΓ Vmin, che dipende da f(z, ο±) e da n. Si ottiene quindi una misura dellβefficienza assoluta di T calcolando il rapporto
e(T) = ( )
T V Vmin
Se risulta
e(T) = 1,
per tutti i possibili valori del parametro ο±, si conclude che T Γ¨ uno stimatore che ha varianza minima e si dice quindi che ha massima efficienza.
3) COERENZA (o CONSISTENZA)
Unβaltra importante proprietΓ di uno stimatore esamina il suo comportamento per un campione la cui numerositΓ tende ad infinito.
Uno stimatore si dice coerente (o consistente) se, considerato un qualsiasi valore ο₯ οΎ 0, risulta
πββππππ(|π β π| β₯ π) = 0
per ogni possibile valore del parametro ο±.
Uno stimatore si dice quindi coerente se, al crescere di n, tende a zero la probabilitΓ che la differenza in valore assoluto tra stimatore e parametro risulti maggiore di un ο₯ comunque piccolo.
In altri termini, questo significa che lo stimatore T converge in probabilitΓ a ο±.
La coerenza, quindi comporta necessariamente che lo stimatore T sia corretto o, almeno, asintoticamente corretto e che la sua varianza V(T) tenda a zero per n che tende a infinito.
La statistica π Γ¨ uno stimatore coerente di ο o di ο° (a seconda della distribuzione della Z e, di conseguenza, delle Xi). Anche gli stimatori della varianza, S2 e ππ2, sono entrambi stimatori coerenti di ο³2.
ESERCIZI
1. Data una popolazione di valore atteso ο e varianza unitaria, si estragga un campione casuale di 4 elementi estratti con ripetizione e si considerino i seguenti stimatori di ο
π1 = π1+ π4 2
π2 =π1+ π2 + π3+ π4 4
π3 =π1+ 2π2+ 2π3+ π4
Si verifichi che sono tutti stimatori corretti e si individui quello piΓΉ efficiente. 6
La distribuzione di probabilitΓ delle variabili ππcorrisponde alla distribuzione di frequenza della Z, per cui ciascuna ππ ha un valore atteso pari a ο e varianza unitaria
I valori attesi dei tre stimatori, combinazioni lineari delle ππ, risultano quindi πΈ(π1) = πΈ(π1) + πΈ(π4)
2 =π + π
2 = π πΈ(π2) = πΈ(π1) + πΈ(π2) + πΈ(π3) + πΈ(π4)
4 = 4π
4 = π πΈ(π3) = πΈ(π1) + 2πΈ(π2) + 2πΈ(π3) + πΈ(π4)
= 6π
= π
mentre le loro varianze sono π(π1) = π(π1) + π(π4)
4 = 1 + 1
4 =1
2 = 0.5 π(π2) =π(π1) + π(π2) + π(π3) + π(π4)
16 = 1 + 1 + 1 + 1
16 = 1
4= 0.25 π(π3) =π(π1) + 4π(π2) + 4π(π3) + π(π4)
36 =10
36 = 0.27Μ
Si conclude quindi che lo stimatore piΓΉ efficiente Γ¨ T2
2. Data una popolazione di valore atteso ο e varianza unitaria, si estragga un campione casuale di 4 elementi estratti con ripetizione e si considerino gli stimatori di ο
π1 = 1
2π1+1
8π2 +1
4π3+1 8π4 π2 =1
2πΜ
Si verifichi se sono stimatori corretti e si calcoli la loro varianza e il valore dellβerrore quadratico medio per ο=1
I valori attesi dei due stimatori risultano πΈ(π1) = 1
2πΈ(π1) +1
8πΈ(π2) +1
4πΈ(π3) +1
8πΈ(π4) = 4 + 1 + 2 + 1
8 π = π
πΈ(π2) = 1
2πΈ(πΜ) = 1 2π
Lo stimatore π1Γ¨ quindi corretto, mentre π2Γ¨ distorto Le varianze dei due stimatori sono
π(π1) = 1
4π(π1) + 1
64π(π2) + 1
16π(π3) + 1
64π(π4) = 16 + 1 + 4 + 1
64 π2 =
= 22
64π2 = 11 32 π(π2) =1
4π(πΜ) =1 4
π2 4 = 1
16
Di conseguenza i due errori quadratici medi sono
πππΈ(π1) = π(π1) = 11 32
πππΈ(π2) = π(π2) + [π΅(π2)]2 = 1
16+ (1
2π β π)
2
= 1 16+1
4π2
Ponendo π = 1 risulta πππΈ(π2) = 1
16+1 4= 5
16 =10
32 < πππΈ(π1)
3. Data una popolazione di media ο e varianza ο³2, si estragga un campione bernoulliano di 2 elementi e si considerino i seguenti stimatori di ο
π1 = 1
3π1+2 3π2 π2 =3
4π1 +1 4π2
Si individui quello piΓΉ efficiente
I due valori attesi sono πΈ(π1) = 1
3πΈ(π1) +2
3πΈ(π2) = (1 3+2
3) π = π πΈ(π2) = 3
4πΈ(π1) +1
4πΈ(π2) = (3 4+1
4) π = π
pertanto entrambi gli stimatori sono corretti. Per valutarne lβefficienza basta quindi confrontare le loro varianze, che risultano pari a
π(π1) = 1
9π(π1) +4
9π(π2) = (1 9+4
9) π2 = 5
9π2 = 0. 5Μπ2 π(π2) = 9
16π(π1) + 1
16π(π2) = ( 9 16+ 1
16) π2 = 10
16π2 = 0.625π2 Si puΓ² quindi concludere che lo stimatore T1 Γ¨ piΓΉ efficiente di T2
4. Considerata la seguente funzione dei dati campionari
π =βπβ3π=1 ππ π β 3 +2
πππ
si verifichi se si tratta di uno stimatore consistente del parametro ο
Il valore atteso Γ¨ dato da πΈ(π) = βπβ3π=1 πΈ(ππ)
π β 3 +2
ππΈ(ππ) = (π β 3)π π β 3 +2
ππ = (π + 2 π ) π per cui lo stimatore Γ¨ asintoticamente corretto.
La varianza di T Γ¨
π(π) =βπβ3π=1 π(ππ) (π β 3)2 + 4
π2π(ππ) = (π β 3)π2 (π β 3)2 + 4
π2π2 = π2
π β 3+4π2 π2 Dato che risulta
πββππππΈ(π) = π
πββππππ(π) = 0 si conclude cheT Γ¨ uno stimatore consistente di ο