• Non ci sono risultati.

Elementi di Probabilit` a e Statistica - 052AA - A.A. 2014-2015

N/A
N/A
Protected

Academic year: 2021

Condividi "Elementi di Probabilit` a e Statistica - 052AA - A.A. 2014-2015"

Copied!
4
0
0

Testo completo

(1)

Elementi di Probabilit` a e Statistica - 052AA - A.A. 2014-2015

Prova di verifica - 19 giugno 2015

Esercizio 1. Il signor Macchi ogni mattino guarda il cielo sopra Pisa e valuta se sia il caso di portare con s´ e un ombrello. La sua previsione per` o non ` e accurata, e poniamo α ∈ [0, 1] la probabilit` a che oggi piova, condizionata al fatto che Macchi aveva previsto che non piovesse, β ∈ [0, 1] la probabilit` a che oggi non piova, condizionata al fatto che Macchi aveva previsto pioggia (Macchi prevede pioggia o meno con probabilit` a non nulle). Poniamo pari a 1/5 la probabilit` a dell’“evento” oggi piove (a Pisa piove in media anche pi` u di un giorno ogni 5).

1) Qual’` e il rapporto tra la probabilit` a dell’“evento” oggi piove e Macchi ha previsto pioggia, e l’“evento” oggi non piove e Macchi ha previsto pioggia?

2) Mostrare che, per α = 1/6, β = 1/3 la probabilit` a dell’“evento” Macchi ha previsto pioggia

` e unicamente determinata, e calcolarla.

3) Con i valori di α e β (e le conseguenti probabilit` a) fissati al punto sopra, qual’` e la probabilit` a che il signor Macchi abbia previsto pioggia, condizionata all’“evento” oggi piove?

Soluzione 1. Anche se non ` e esplicitamente richiesto, il problema si potrebbe modellizzare in uno spazio di probabilit` a in cui vi sono 2 eventi

P ↔ oggi piove M ↔ Macchi ha previsto pioggia,

e bisognerebbe affrontare la questione se vi sia una misura di probabilit` a P consistente con le probabilit` a specifiche assegnate (ma questo ` e proprio l’oggetto del secondo punto).

1) Possiamo scrivere i rapporti di probabilit` a in termini di probabilit` a condizionate:

P(P c ∩ M )

P(P ∩ M ) = P(P c |M )P(M )

P(P |M )P(M ) = P(P c |M )

P(P |M ) = 1 − β

β ∈ [0, ∞]

2) Siamo interessati alla probabilit` a p = P (M ). Qualunque essa sia, poich´ e stiamo assumendo che sia diversa da 0, possiamo scrivere

P(P ) = P(M ∩ P ) + P(M c ∩ P )

= P(P |M )P(M ) + P(P |M c )P(M c )

= (1 − β)p + α(1 − p) Da cui necessariamente (se β + α 6= 1)

p = 1/5 − α 1 − β − α . Nel caso specifico otteniamo p = 1/15.

3) Usiamo la formula di Bayes

P(M |P ) = P(P |M )P(M )/P(P ) = 2 3 · 1

15 · 5 = 2 9 .

Esercizio 2. Dato n ≥ 1, siano X 1 , . . . , X n variabili aleatorie i.i.d., con momento secondo finito e poniamo X := 1 n P n

i=1 X i . Per n ≥ 2, sia S n 2 := n−1 1 P n

i=1 (X i − X) 2 lo stimatore corretto della varianza σ 2 := Var(X i ), e sia T n 2 := n 1 P n

i=1 (X i − X) 2 “quello non corretto”. Definiamo

R(U, σ 2 ) := E[|U − σ 2 | 2 ] il rischio (quadratico) associato ad uno stimatore U di σ 2 .

(2)

1) Assumiamo che le X i siano centrate, E[X i ] = 0, e ammettano momento quarto finito µ 4 :=

E[X i 4 ] < ∞. Per n = 2, scrivere R(S 2 2 , σ 2 ) e R(T 2 2 , σ 2 ) come funzioni di σ 2 e µ 4 . Quale stimatore ha rischio maggiore?

2) Assumiamo che X i sia N (m, σ 2 ), per m ∈ R, σ 2 > 0. Per ogni n ≥ 2, calcolare R(S n 2 , σ 2 ) e R(T n 2 , σ 2 ). Quale stimatore ha rischio maggiore?

3) Assumendo ancora che X i sia N (m, σ 2 ), per m ∈ R e σ 2 > 0, determinare il valore α che minimizza la funzione R 3 α 7→ R(αS n 2 , σ 2 ), e calcolare il rischio R(α S n 2 , σ 2 ).

Soluzione 2. 1) Nel caso n = 2, possiamo scrivere S 2 2 =



X 1 − X 1 + X 2

2

 2

+



X 2 − X 1 + X 2

2

 2

= 1

2 (X 1 − X 2 ) 2 . Poich´ e S 2 2 ` e corretto, otteniamo

E[(S 2 2 − σ 2 ) 2 ] = Var(S 2 2 ) = E[S 2 4 ] − E[S 2 2 ] 2

= 1

4 E[(X 1 − X 2 ) 4 ] − σ 4

= 1

4 E[X 1 4 − 4X 1 3 X 2 + 6X 1 2 X 2 2 − 4X 1 X 2 3 + X 2 4 ] − σ 4

= 1

4 2µ 4 + 6σ 4  − σ 4 = µ 4 + σ 4 2

dove abbiamo anche usato il fatto che E[X 1 3 X 2 ] = E[X 1 3 ]E[X 2 ] = 0, perch´ e X 1 e X 2 sono indipedenti (dotate di momento quarto, quindi anche terzo) e centrate. Abbiamo anche usato il fatto che σ 2 = E[X i 2 ]. Per quanto riguarda T 2 2 = S 2 2 /2, otteniamo

E[(T 2 2 − σ 2 ) 2 ] = E[T 2 4 ] − 2σ 2 E[T 2 2 ] + σ 4

= 1

16 E[(X 1 − X 2 ) 4 ] − σ 2 E[S 2 2 ] + σ 4

= 1

16 E[X 1 4 − 4X 1 3 X 2 + 6X 1 2 X 2 2 − 4X 1 X 2 3 + X 2 4 ]

= 1

16 2µ 4 + 6σ 4  = µ 4 + 3σ 4 8

Ne segue che il rischio associato allo stimatore T 2 2 ` e sempre strettamente inferiore a quello associato a S 2 2 .

2) Nel caso in cui le X i siano indipendenti e N (m, σ 2 ), sappiamo dalla teoria che Y = σ 1

2

P n

i=1 (X i − X) 2 ha legge χ 2 (n − 1) = Γ((n − 1)/2, 1/2). Le dispense forniscono la formula E[Y 2 ] = n 2 − 1 e quindi

E[(S n 2 − σ 2 ) 2 ] = Var(S n 2 ) = E[S n 4 ] − E[S n 2 ] 2

= σ 4

(n − 1) 2 E[Y 2 ] − σ 4

= σ 4  (n + 1)(n − 1) (n − 1) 2 − 1



= 2σ 4 n − 1 . Per lo stimatore T n 2 = σ 2 Y /n ragioniamo in modo simile:

E[(T n 2 − σ 2 ) 2 ] = E[T n 4 ] − 2σ 2 E[T n 2 ] + σ 4

= σ 4

 E[Y 2 ]

n 2 − 2 E[Y ] n + 1



= σ 4  n 2 − 1

n 2 − 2 n − 1 n + 1



= σ 4 n 2 − 1 − 2n(n − 1) + n 2

n 2 = σ 4 2n − 1

n 2 .

(3)

Poich´ e vale 2n−1 n

2

< n−1 2 per n ≥ 2, il rischio di T n 2 ` e sempre minore di quello di S 2 n .

3) Svolgiamo un’altra volta il calcolo, stavolta considerando uno stimatore U = βσ 2 Y (poi poniamo α = β(n − 1)). Si ottiene

E[(U − σ 2 ) 2 ] = E[U 2 ] − 2σ 2 E[U ] + σ 4

= σ 42 E[Y 2 ] − 2βE[Y ] + 1 

= σ 42 (n 2 − 1) − 2β(n − 1) + 1 .

Perci` o, per minimizzare, basta porre 2β(n 2 − 1) − 2(n − 1) = 0, ossia β = n+1 1 (in termini di α, vale α = n−1 n+1 ). Troviamo in corrispondenza il rischio

R(αS n 2 , σ 2 ) = 2σ 4 n + 1

Esercizio 3. Consideriamo, per un’opportuna costante C θ > 0, la densit` a di probabilit` a f (θ, x) parametrizzata da θ ∈ (0, ∞) definita da

f (θ, x) =

 C θ per −θ ≤ x ≤ θ, 0 altrimenti.

Siano X 1 , ..., X n delle v.a. indipendenti con densit` a f (θ, x).

1) Scrivere le funzioni di ripartizione di |X 1 | e di M := max i=1,...,n |X i |.

2) Scrivere il modello statistico standard relativo a f (θ, x) e trovare lo stimatore di massima verosimiglianza b θ.

3) Valutare se b θ ` e corretto e se ` e consistente.

4) Vogliamo considerare

l’ipotesi nulla H 0 ) θ ≤ 2, contro l’alternativa H 1 ) θ > 2.

Supponiamo di volere determinare una regione critica della forma {M ≤ c} oppure {M ≥ c}, per qualche c ∈ R. Intuitivamente, quale delle due `e nella direzione giusta? Dimostrare (senza usare il teorema sul rapporto di verosimiglianza, qui un po’ critico) che la scelta fatta definisce una regione di rifiuto di livello α = 0.05 per un’opportuna scelta di c.

Soluzione 3. 1) Si ha C θ = 1 ,

F |X

1

| (θ, t) =

0 per t ≤ 0

t

θ per 0 ≤ t ≤ θ 1 per t > θ

F M (θ, t) = P (M ≤ t) = P (|X i | ≤ t) n =

0 per t ≤ 0

t θ

 n

per 0 ≤ t ≤ θ 1 per t > θ.

2) Poniamo Ω = R n , F = B (R n ), P θ con densit` a L (θ, x 1 , ..., x n ) data da (essendo f (θ, x) =

1 2θ 1 |x|≤θ )

L (θ, x 1 , ..., x n ) = 1

(2θ) n 1 max|x

i

|≤θ

(4)

Fissati x 1 , ..., x n , come funzione di θ accade che 1 max|x

i

|≤θ vale 0 per θ ∈ [0, max |x i |), 1 per θ ≥ max |x i |, quindi L (θ, x 1 , ..., x n ) nulla per θ ∈ [0, max |x i |) (quindi il massimo va cercato per θ ≥ max |x i |); e per θ ≥ max |x i | la funzione L vale (2θ) 1

n

quindi ` e decrescente in θ.

Pertanto il punto di massimo assume il valore max |x i |. Lo stimatore di MV `e pertanto M : θ = max |X b i | .

3) Calcoliamo il valore atteso di ˆ θ:

E θ [M ] = Z

tf M (θ, t) dt = n θ

Z θ 0

t  t θ

 n−1

dt = n θ n

Z θ 0

t n dt = n θ n

θ n+1

n + 1 = n n + 1 θ quindi ˆ θ non ` e corretto. Poi, per  tale che θ −  ≥ 0 (il caso θ = 0 va esaminato a parte, ma P 0 (|M n − 0| > ) = 0)

P θ (|M n − θ| > ) = 1 − P θ (θ −  ≤ M n ≤ θ + )

= 1 − Z θ

θ−

n

θ n t n−1 dt = 1 − n θ n

 t n n

 θ θ−

= 1 − 1

θ nn − (θ − ) n ) =  θ −  θ

 n

→ 0, quindi ` e consistente.

4) (Nota: il rapporto di MV conterrebbe il termine 1 1

max

|

xi

|

≤θ2

max

|

xi

|

≤θ1

la cui interpretazione ` e un po’

critica). La regione intuitivamente plausibile ` e {M ≥ c}: se il massimo di un campione sperimentale supera c vuol dire che θ supera c, e questo ` e nella direzione giusta per rifiutare θ ≤ 2 (il ragionamento opposto con {M ≤ c} non ` e plausibile).

Supponiamo di trovare c tale che

P θ=2 (M ≥ c) ≤ α.

Allora, per θ ≤ 2,

P θ (M ≥ c) = 1 − F M (θ, c) ≤ 1 − F M (2, c) ≤ α

dove abbiamo usato il fatto che F M (2, c) ≤ F M (θ, c) (si vede con facili ragionamenti).

A questo punto cerchiamo c tale che

P θ=2 (M ≥ c) ≤ α.

Dobbiamo risolvere

1 − F M (2, c) ≤ α F M (2, c) ≥ 1 − α

quindi (anche se pu` o sembrare un po’ paradossale rispetto agli esempi soliti) si prende c < 2, positivo, e precisamente tale che c 2  n

= α, ovvero c = 2 √

n

α.

Riferimenti

Documenti correlati

Dopo aver rimesso dentro le tre palline estratte, si lancia una moneta onesta e si aggiunge una pallina con il numero 11 se esce testa, una pallina con il numero 12 se esce croce,

Gianni non si `e preparato per il concorso e decide di svolgere i tre test scegliendo per ogni quesito la risposta completamente a caso tra

Un giocatore per verificare che sia onesta definisce una variabile casuale X che assume il valore 1 se esce un numero pari, il valore −1 se esce un numero dispari ed il valore 0 se

Si assuma che le persone decidano indipendentemente se annullare o meno il viaggio e che il cliente che ha scelto l’hotel a 5 stelle annulla il viaggio con probabilit`a 1/10, quello

La probabilit`a che un iscritto passi il test pratico per la patente `e, ad ogni tentativo, pari

Si ritiene che la probabilit`a che un individuo sia allergico ad un certo farmaco sia pari

Un suo reparto produce un numero di pezzi giornalieri che varia casualmente di giorno in giorno; con un certo grado di estrapolazione, si supponga che questo numero X aleatorio

Questa definizione si applica anche al caso in cui gli eventi elementari (casi possibili) non sono equiprobabili e al caso in cui l’esperimento non ` e ripetibile (quale ` e