Elementi di Probabilit` a e Statistica - 052AA - A.A. 2014-2015
Prova di verifica - 19 giugno 2015
Esercizio 1. Il signor Macchi ogni mattino guarda il cielo sopra Pisa e valuta se sia il caso di portare con s´ e un ombrello. La sua previsione per` o non ` e accurata, e poniamo α ∈ [0, 1] la probabilit` a che oggi piova, condizionata al fatto che Macchi aveva previsto che non piovesse, β ∈ [0, 1] la probabilit` a che oggi non piova, condizionata al fatto che Macchi aveva previsto pioggia (Macchi prevede pioggia o meno con probabilit` a non nulle). Poniamo pari a 1/5 la probabilit` a dell’“evento” oggi piove (a Pisa piove in media anche pi` u di un giorno ogni 5).
1) Qual’` e il rapporto tra la probabilit` a dell’“evento” oggi piove e Macchi ha previsto pioggia, e l’“evento” oggi non piove e Macchi ha previsto pioggia?
2) Mostrare che, per α = 1/6, β = 1/3 la probabilit` a dell’“evento” Macchi ha previsto pioggia
` e unicamente determinata, e calcolarla.
3) Con i valori di α e β (e le conseguenti probabilit` a) fissati al punto sopra, qual’` e la probabilit` a che il signor Macchi abbia previsto pioggia, condizionata all’“evento” oggi piove?
Soluzione 1. Anche se non ` e esplicitamente richiesto, il problema si potrebbe modellizzare in uno spazio di probabilit` a in cui vi sono 2 eventi
P ↔ oggi piove M ↔ Macchi ha previsto pioggia,
e bisognerebbe affrontare la questione se vi sia una misura di probabilit` a P consistente con le probabilit` a specifiche assegnate (ma questo ` e proprio l’oggetto del secondo punto).
1) Possiamo scrivere i rapporti di probabilit` a in termini di probabilit` a condizionate:
P(P c ∩ M )
P(P ∩ M ) = P(P c |M )P(M )
P(P |M )P(M ) = P(P c |M )
P(P |M ) = 1 − β
β ∈ [0, ∞]
2) Siamo interessati alla probabilit` a p = P (M ). Qualunque essa sia, poich´ e stiamo assumendo che sia diversa da 0, possiamo scrivere
P(P ) = P(M ∩ P ) + P(M c ∩ P )
= P(P |M )P(M ) + P(P |M c )P(M c )
= (1 − β)p + α(1 − p) Da cui necessariamente (se β + α 6= 1)
p = 1/5 − α 1 − β − α . Nel caso specifico otteniamo p = 1/15.
3) Usiamo la formula di Bayes
P(M |P ) = P(P |M )P(M )/P(P ) = 2 3 · 1
15 · 5 = 2 9 .
Esercizio 2. Dato n ≥ 1, siano X 1 , . . . , X n variabili aleatorie i.i.d., con momento secondo finito e poniamo X := 1 n P n
i=1 X i . Per n ≥ 2, sia S n 2 := n−1 1 P n
i=1 (X i − X) 2 lo stimatore corretto della varianza σ 2 := Var(X i ), e sia T n 2 := n 1 P n
i=1 (X i − X) 2 “quello non corretto”. Definiamo
R(U, σ 2 ) := E[|U − σ 2 | 2 ] il rischio (quadratico) associato ad uno stimatore U di σ 2 .
1) Assumiamo che le X i siano centrate, E[X i ] = 0, e ammettano momento quarto finito µ 4 :=
E[X i 4 ] < ∞. Per n = 2, scrivere R(S 2 2 , σ 2 ) e R(T 2 2 , σ 2 ) come funzioni di σ 2 e µ 4 . Quale stimatore ha rischio maggiore?
2) Assumiamo che X i sia N (m, σ 2 ), per m ∈ R, σ 2 > 0. Per ogni n ≥ 2, calcolare R(S n 2 , σ 2 ) e R(T n 2 , σ 2 ). Quale stimatore ha rischio maggiore?
3) Assumendo ancora che X i sia N (m, σ 2 ), per m ∈ R e σ 2 > 0, determinare il valore α ∗ che minimizza la funzione R 3 α 7→ R(αS n 2 , σ 2 ), e calcolare il rischio R(α ∗ S n 2 , σ 2 ).
Soluzione 2. 1) Nel caso n = 2, possiamo scrivere S 2 2 =
X 1 − X 1 + X 2
2
2
+
X 2 − X 1 + X 2
2
2
= 1
2 (X 1 − X 2 ) 2 . Poich´ e S 2 2 ` e corretto, otteniamo
E[(S 2 2 − σ 2 ) 2 ] = Var(S 2 2 ) = E[S 2 4 ] − E[S 2 2 ] 2
= 1
4 E[(X 1 − X 2 ) 4 ] − σ 4
= 1
4 E[X 1 4 − 4X 1 3 X 2 + 6X 1 2 X 2 2 − 4X 1 X 2 3 + X 2 4 ] − σ 4
= 1
4 2µ 4 + 6σ 4 − σ 4 = µ 4 + σ 4 2
dove abbiamo anche usato il fatto che E[X 1 3 X 2 ] = E[X 1 3 ]E[X 2 ] = 0, perch´ e X 1 e X 2 sono indipedenti (dotate di momento quarto, quindi anche terzo) e centrate. Abbiamo anche usato il fatto che σ 2 = E[X i 2 ]. Per quanto riguarda T 2 2 = S 2 2 /2, otteniamo
E[(T 2 2 − σ 2 ) 2 ] = E[T 2 4 ] − 2σ 2 E[T 2 2 ] + σ 4
= 1
16 E[(X 1 − X 2 ) 4 ] − σ 2 E[S 2 2 ] + σ 4
= 1
16 E[X 1 4 − 4X 1 3 X 2 + 6X 1 2 X 2 2 − 4X 1 X 2 3 + X 2 4 ]
= 1
16 2µ 4 + 6σ 4 = µ 4 + 3σ 4 8
Ne segue che il rischio associato allo stimatore T 2 2 ` e sempre strettamente inferiore a quello associato a S 2 2 .
2) Nel caso in cui le X i siano indipendenti e N (m, σ 2 ), sappiamo dalla teoria che Y = σ 12
P n
i=1 (X i − X) 2 ha legge χ 2 (n − 1) = Γ((n − 1)/2, 1/2). Le dispense forniscono la formula E[Y 2 ] = n 2 − 1 e quindi
E[(S n 2 − σ 2 ) 2 ] = Var(S n 2 ) = E[S n 4 ] − E[S n 2 ] 2
= σ 4
(n − 1) 2 E[Y 2 ] − σ 4
= σ 4 (n + 1)(n − 1) (n − 1) 2 − 1
= 2σ 4 n − 1 . Per lo stimatore T n 2 = σ 2 Y /n ragioniamo in modo simile:
E[(T n 2 − σ 2 ) 2 ] = E[T n 4 ] − 2σ 2 E[T n 2 ] + σ 4
= σ 4
E[Y 2 ]
n 2 − 2 E[Y ] n + 1
= σ 4 n 2 − 1
n 2 − 2 n − 1 n + 1
= σ 4 n 2 − 1 − 2n(n − 1) + n 2
n 2 = σ 4 2n − 1
n 2 .
Poich´ e vale 2n−1 n2 < n−1 2 per n ≥ 2, il rischio di T n 2 ` e sempre minore di quello di S 2 n .
3) Svolgiamo un’altra volta il calcolo, stavolta considerando uno stimatore U = βσ 2 Y (poi poniamo α = β(n − 1)). Si ottiene
E[(U − σ 2 ) 2 ] = E[U 2 ] − 2σ 2 E[U ] + σ 4
= σ 4 β 2 E[Y 2 ] − 2βE[Y ] + 1
= σ 4 β 2 (n 2 − 1) − 2β(n − 1) + 1 .
Perci` o, per minimizzare, basta porre 2β(n 2 − 1) − 2(n − 1) = 0, ossia β = n+1 1 (in termini di α, vale α = n−1 n+1 ). Troviamo in corrispondenza il rischio
R(αS n 2 , σ 2 ) = 2σ 4 n + 1
Esercizio 3. Consideriamo, per un’opportuna costante C θ > 0, la densit` a di probabilit` a f (θ, x) parametrizzata da θ ∈ (0, ∞) definita da
f (θ, x) =
C θ per −θ ≤ x ≤ θ, 0 altrimenti.
Siano X 1 , ..., X n delle v.a. indipendenti con densit` a f (θ, x).
1) Scrivere le funzioni di ripartizione di |X 1 | e di M := max i=1,...,n |X i |.
2) Scrivere il modello statistico standard relativo a f (θ, x) e trovare lo stimatore di massima verosimiglianza b θ.
3) Valutare se b θ ` e corretto e se ` e consistente.
4) Vogliamo considerare
l’ipotesi nulla H 0 ) θ ≤ 2, contro l’alternativa H 1 ) θ > 2.
Supponiamo di volere determinare una regione critica della forma {M ≤ c} oppure {M ≥ c}, per qualche c ∈ R. Intuitivamente, quale delle due `e nella direzione giusta? Dimostrare (senza usare il teorema sul rapporto di verosimiglianza, qui un po’ critico) che la scelta fatta definisce una regione di rifiuto di livello α = 0.05 per un’opportuna scelta di c.
Soluzione 3. 1) Si ha C θ = 2θ 1 ,
F |X1| (θ, t) =
0 per t ≤ 0
t
θ per 0 ≤ t ≤ θ 1 per t > θ
F M (θ, t) = P (M ≤ t) = P (|X i | ≤ t) n =
0 per t ≤ 0
t θ
n
per 0 ≤ t ≤ θ 1 per t > θ.
2) Poniamo Ω = R n , F = B (R n ), P θ con densit` a L (θ, x 1 , ..., x n ) data da (essendo f (θ, x) =
1 2θ 1 |x|≤θ )
L (θ, x 1 , ..., x n ) = 1
(2θ) n 1 max|xi|≤θ
Fissati x 1 , ..., x n , come funzione di θ accade che 1 max|xi|≤θ vale 0 per θ ∈ [0, max |x i |), 1 per θ ≥ max |x i |, quindi L (θ, x 1 , ..., x n ) nulla per θ ∈ [0, max |x i |) (quindi il massimo va cercato per θ ≥ max |x i |); e per θ ≥ max |x i | la funzione L vale (2θ) 1
n quindi ` e decrescente in θ.
Pertanto il punto di massimo assume il valore max |x i |. Lo stimatore di MV `e pertanto M : θ = max |X b i | .
3) Calcoliamo il valore atteso di ˆ θ:
E θ [M ] = Z
tf M (θ, t) dt = n θ
Z θ 0
t t θ
n−1
dt = n θ n
Z θ 0
t n dt = n θ n
θ n+1
n + 1 = n n + 1 θ quindi ˆ θ non ` e corretto. Poi, per tale che θ − ≥ 0 (il caso θ = 0 va esaminato a parte, ma P 0 (|M n − 0| > ) = 0)
P θ (|M n − θ| > ) = 1 − P θ (θ − ≤ M n ≤ θ + )
= 1 − Z θ
θ−
n
θ n t n−1 dt = 1 − n θ n
t n n
θ θ−
= 1 − 1
θ n (θ n − (θ − ) n ) = θ − θ
n
→ 0, quindi ` e consistente.
4) (Nota: il rapporto di MV conterrebbe il termine 1 1max|
xi|
≤θ2
max