• Non ci sono risultati.

STIMA DELLA VARIANZA CAMPIONARIA Abbiamo visto che una stima puntuale corretta per il valore atteso µ delle variabili aleatorie X

N/A
N/A
Protected

Academic year: 2021

Condividi "STIMA DELLA VARIANZA CAMPIONARIA Abbiamo visto che una stima puntuale corretta per il valore atteso µ delle variabili aleatorie X"

Copied!
16
0
0

Testo completo

(1)

STIMA DELLA VARIANZA CAMPIONARIA

Abbiamo visto che una stima puntuale corretta per il valore atteso µ delle variabili aleatorie X

i

` e ¯ x

n

= (x

1

+ .. + x

n

)/n.

Una stima puntuale della varianza σ

2

delle variabili aleatorie X

i

` e la varianza campionaria s

n2

s

2n

= (x

1

− ¯ x)

2

+ (x

2

− ¯ x)

2

+ ...(x

n

− ¯ x)

2

n − 1

Mostriamo che anche questa stima puntuale ` e corretta ossia che il valore medio dello stimatore

S

2n

= (X

1

− ¯ X)

2

+ (X

2

− ¯ X)

2

+ ...(X

n

− ¯ X)

2

n − 1

` e uguale alla varianza σ

2

delle variabili aleatorie X

i

.

(2)

Si consideri un campione di numerosit` a n da una popolazione: n variabili aleatorie X

1

, .., X

n

, con stessa distribuzione di cui non si conosce la varianza σ

2

. Otteniamo n numeri x

1

, ..x

n

(x

i

` e il valore osservato della variabile aleatoria X

i

).

Sembra naturale prendere come stima di σ

2

il numero a

n

= (x

1

− µ)

2

+ (x

2

− µ)

2

+ ...(x

n

− µ)

2

n

In effetti a

n

` e una stima corretta se il valore atteso µ delle variabili X

i

` e noto. Sia a

n

una realizzazione della variabile aleatoria A

n

(lo stimatore: stessa definizione di a

n

ma con le realizzazioni x

i

sostituite dalle corrispondenti variabili aleatorie X

i

).

Vericare che E(A

n

) = σ

2

` e semplice, infatti dalla equazione qui sopra, tenendo presente che le variabili X

i

sono identicamente distribuite, si ha che

E(A

n

) = E[(X

1

− µ)

2

] = σ

2

(3)

Tuttavia molto spesso anche il valore atteso ` e ignoto e quindi sembra ragionevole sostituire µ con la sua stima che ` e la media campionaria ¯ x

n

.

b

n

= (x

1

− ¯ x

n

)

2

+ (x

2

− ¯ x

n

)

2

+ ...(x

n

− ¯ x

n

)

2

n

In effetti b

n

NON ` e una stima corretta. Vericare che

E(B

n

) 6= σ

2

` e semplice, infatti dalla equazione qui sopra, tenendo presente che le variabili X

i

sono identicamente distribuite, si ha

E(B

n

) = E[(X

1

− ¯ X

n

)

2

] = E

"



X

1

− X

1

+ X

2

+ ...X

n

n



2

#

(4)

Tenendo presente che X

i

e X

j

sono indipendenti se i 6= j si ha E(X

i

X

j

) = E(X

i

)E(X

j

) = µ

2

per i 6= j (si noti che la prima uguaglianza, che non dimostriamo, ` e una diretta conseguenza dell’indipendenza). Si ha inoltre E[X

i2

] = µ

2

+ σ

2

per ogni i , usando questi risultati si ottiene

E(B

n

) = n − 1 n σ

2

e quindi B

n

non ` e uno stimatore corretto. Se invece di dividere per n si divide per n − 1 si ottiene uno stimatore ` e corretto. In definitiva uno stimatore puntuale corretto della varianza σ

2

` e

S

2n

= (X

1

− ¯ X)

2

+ (X

2

− ¯ X)

2

+ ...(X

n

− ¯ X)

2

n − 1

ossia ` e la varianza campionaria perch` e E(S

2n

) =

n−1n

E(B

n

) = σ

2

.

(5)

DISTRIBUZIONE DELLA VARIANZA CAMPIONARIA Abbiamo visto S

n2

` e uno stimatore corretto di σ

2

. Si pu` o inoltre dimostrare (sostanzialmente un applicazione della legge dei grandi numeri) che per ogni a positivo, P(|S

n2

− σ

2

| > a) → 0 quando n → ∞. Questo significa che S

n2

→ σ

2

per grandi n.

Se la distribuzione della popolazione ` e normale (se le X

i

sono gaussiane) si pu` o dimostrare un risultato pi` u preciso col seguente teorema

Teorema La variabile aleatoria (n − 1) S

2n

σ

2

= 1 σ

2

n

X

i=1

(x

i

− ¯ x)

2

ha una distribuzione del chi-quadrato a n − 1 gradi di libert` a .

Non descriveremo qui questa distribuzione (in realt` a una famiglia

di distribuzioni di parametro n − 1).

(6)

RIASSUMENDO

Per un campione di numerosit` a n estratto da una popolazione con distribuzione di media µ e varianza σ si ha che

I

E(S

n2

) = σ

2

per ogni n,

I

S

n2

→ σ

2

quando n → ∞ (non realizzabile in pratica),

I

(n − 1)

Sσn22

ha una distribuzione del chi-quadrato a n − 1 gradi di libert` a se le X

i

sono gaussiane.

I

(n − 1)

Sσn22

ha approssimativamente una distribuzione del chi-quadrato a n − 1 gradi di libert` a se le X

i

non sono gaussiane.

Si noti che la varianza campionaria ` e una stima della varianza σ

2

.

Dato che S

n

→ σ

2

per n → ∞, la sua precisione (efficienza)

aumenta al crescere di n.

(7)

DISTRIBUZIONE DELLE MEDIA CAMPIONARIA (VARIANZA INCOGNITA) .

I risultati finora ottenuti ci permettono quindi di dire quindi che ¯ X

n

ha media µ e varianza σ/ √

n. Inoltre per n sufficientemente grandi, la variabile Z

n

= ( ¯ X

n

− µ)/(σ/ √

n) ` e approssimativamnte una normale standard. Abbiamo infine visto che per n grandi la variabile aleatoria S

n

coincide colla varianza σ.

Se non si conosce la varianza σ ha quindi senso rimpiazzarla con S

n

e definire la variabile aleatoria

T

n

= X ¯

n

− µ S

n

/ √

n

Teorema. Se le X

i

sono normali, T

n

` e una variabile aleatoria

avente la distribuzione t di Student con grado di libert` a n-1.

(8)

Non descriveremo qui la distribuzione t di Student, Tuttavia notiamo che al crescere di n la variabile aleatoria S

n2

coincide sempre pi` u con la varianza σ

2

e quindi la variabile T

n

coincide con Z

n

(le due variabili sono legate dalla relazione T

n

= Z

n

· σ/S

n

).

Per questo motivo la t di Student ` e sempre meglio approssimata da una normale standard al crescere di n.

Normale standard comparata a una t di Student con n − 1 = 4.

(9)

RIASSUMENDO

Se le variabili X

i

non sono gaussiane, la variabile T

n

` e solo approssimativamente distribuita come una t di Studente di

parametro n − 1. Quindi per un campione di numerosit` a n estratto da una popolazione con distribuzione di media µ e varianza σ si ha che

I

T

n

ha una distribuzione t di Student a n − 1 gradi di libert` a se le X

i

sono gaussiane,

I

T

n

ha approssimativamente una distribuzione t di Student a n − 1 gradi di libert` a se le X

i

non sono gaussiane,

I

T

n

ha approssimativamente una distribuzione normale

standard se n ` e grande (anche per X

i

non gaussiane).

(10)

Abbiamo visto che la media campionaria ` e uno stimatore corretto del valore atteso µ e la varianza campionaria ` e uno stimatore corretto della varianza σ

2

. Lo stimatore di un parametro non ` e unico: per decidere quale tra 2 stimatori corretti sia il migliore si usa il criterio di scegliere quello pi` u efficiente ossia quello per cui la varianza ` e minore.

Esercizio 1. Si consideri un campione x

1

, ...,x

n

di variabili aleatorie discrete X

i

che assumono i tre valori 0, -1, 1 con probabilit` a

p(−1) = a

2 , p(0) = 1 − a, p(1) = a 2

(1) Per quali a la funzione p ` e una distribuzione di probabilit` a ?

Risposta: deve essere 0 ≤ p(i ) ≤ 1 per ogni i = 0, −1, 1 quindi a

deve essere a ∈ [0, 1]. Inoltre deve essere p(−1) +p(0)+p(1) = 1,

cosa vera per ogni a.

(11)

(2) Calcolare valore atteso e varianza.

Risposta:

E(X

1

) = (−1) · a

2 + 0 · (1 − a) + 1 · a 2 = 0.

var(X

1

) = E(X

12

) = (−1)

2

· a

2 + 0

2

· (1 − a) + 1

2

· a 2 = a (3). Si considerino i seguenti 2 stimatori di a:

Γ = 1 n

n

X

i =1

|X

i

|, Λ = |X

n

|

I due stimatori sono corretti?

Risposta: E(Λ) = E(|X

n

|) = | − 1| · p(−1) + 0 · p(0) + |1|p(1) = a

(12)

Poich` e le X

i

. hanno stessa distribuzione:

E(Γ) = 1 n

n

X

i =1

E(|X

i

|) = 1 n

n

X

i =1

a = a

Quindi sia Γ che Λ sono stimatori corretti.

(4) Si calcoli la varianza dei due stimatori.

Risposta: la varianza di Λ ` e var(Λ) = E



(|X

n

| − a)

2



= E |X

n

|

2

 − a

2

E |X

n

|

2

 = (−1)

2

p(−1) + 0

2

p(0) + 1

2

p(1) = a 2 + a

2 = a

quindi var(Λ) = a − a

2

= a(1 − a).

(13)

Poich` e le variabili aleatorie sono indipendenti e con stessa distribuzione:

var(Γ) = var( 1 n

n

X

i =1

|X

i

|) = 1 n

2

n

X

i =1

var(|X

i

|)

= 1 n

2

n

X

i =1

var(|X

n

|) = 1 n

2

n

X

i =1

a(1 − a) = 1

n a(1 − a) (5) Quale ` e lo stimatore pi` u efficiente?

Risposta: si ha var(Γ) var(Λ) = 1

n < 1, per ogni n > 1

Quindi Γ ` e pi` u efficiente di Λ.

(14)

Esercizio 2. Si consideri un campione x

1

, ...,x

n

di variabili aleatorie discrete X

i

che assumono i due valori 0 e 1 con probabilit` a 1 − p e p rispettivamente.

(1) Si calcolino µ = E(X

i

) e σ = var(X

i

) in funzione di p.

Risposta: Si deve avere µ = 0 · (1 − p) + 1 · p = µ per cui µ = p, che implica µ ∈ [0, 1].

Inoltre σ

2

= E(X

i2

) − µ

2

= 0

2

· (1 − p) + 1

2

· p − p

2

= p(i − p).

(2) Lo stimatore di p Γ = 1

12 X

1

+ 3(X

2

+ X

3

)

` e corretto? Risposta: Poich` e le X

i

hanno stessa distribuzione:

E(Γ) = 1

12 E(X

1

)+3E(X

2

)+3E(X

3

) = E(X

1

)[ 1

12 +6] = µ 73

12 = p 73

12

quindi Γ ` e distorto (il suo valore atteso non coincide con p).

(15)

(3) Si determini una costante c tale che posto Λ = cΓ, Λ ` e uno stimatore corretto di p.

Risposta: siccome E(Γ) = 73p/12), per c =

1273

si ha che E(Λ) = 12

73 E(Γ) = p quindi

Λ = 1

73 X

1

+ 36

73 (X

2

+ X

3

)

` e uno stimatore corretto di p.

(4) Si compari lo stimatore corretto di µ (e quindi di p = µ)

X ¯

3

= (X

1

+ X

2

+ X

3

)/3 con Λ e si dica quale ` e quello pi´ u efficiente

(16)

Risposta: per le propriet` a della varianza var(Λ) =  1

73



2

var(X

1

) +  36 73



2

· var(X

2

) +  36 73



2

· var(X

3

) inoltre tenendo presente che le variabili X

i

sono identicamente distribuite con varianza σ

2

var(Λ) = σ

2

"

 1 73



2

+ 2 ·  36 73



2

#

= 0.49 · σ

2

Si ha invece var( ¯ X

3

) = σ

2

/3 = 0, 33 · σ

2

e quindi var( ¯ X

3

)

var(Λ) = 0, 33

0, 49 < 1

Quindi ¯ X

3

` e pi` u efficiente di Λ.

Riferimenti

Documenti correlati

Un metodo usato per fornire una stima approssimata degli standard error si basa sulla teoria sviluppata da Binder (1991) e da Binder e Patak (1994) conosciuta come “Theory

b) Nel caso vengano realizzati interventi non autorizzati a danno delle chiome di soggetti arborei (potature, sbrancature, taglio rami, ecc.) sia nel corso dei

Calcolare valore atteso, varianza e legge di Z, indicando dove si usa

[r]

• si ha un fading alla Rice in presenza di un termine dominante (in genere cammino LOS, o cammino LOS + cammino riflesso sul terreno) e numerosi cammini che &#34;perturbano&#34;

Sia X una variabile aleatoria con legge dipendente da un parametro θ (detto anche parametro naturale) su cui si vuol fare inferenza.. Una quantit` a pivotale ` e una variabile

“numero di palline bianche estratte” se ne determini la distribuzione di probabilità, il valore atteso, il coefficiente di variazione e