Elementi di Probabilit`a e Statistica - 052AA - A.A. 2014-2015 Prima prova di veriﬁca intermedia - 9 aprile 2015 Problema 1.

(1)

Elementi di Probabilit` a e Statistica - 052AA - A.A. 2014-2015

Prima prova di verifica intermedia - 9 aprile 2015

Problema 1. Dati due eventi A, B, su uno spazio probabilizzato (Ω, F , P), diciamo che A `e in favore di B se vale P(A) > 0 e P(B|A) ≥ P(B). Discutere la validit`a delle seguenti affermazioni, per eventi A, B, C.

1. Se A `e in favore di B e P(B) > 0, allora B `e in favore di A.

2. Se A `e in favore di B e P(B) < 1, allora B^c `e in favore di A^c.

3. (Facoltativo) Se A è in favore di B e B è in favore di C, allora A è in favore di C.

Supponete ora di avere davanti a voi due scatole dall’esterno indistinguibili, non vuote, di cui però sapete che una contiene solo N₁ palline, tutte bianche, e l’altra contiene N₂ palline, di cui alcune bianche e altre nere. Scegliete una scatola da cui estraete una pallina (senza guardare il contenuto della scatola). Usando il linguaggio introdotto sopra, si può affermare che l’evento la pallina estratta è bianca è in favore dell’evento la scatola scelta contiene solo palline bianche? (Per giustificare la risposta non è strettamente necessario esibire esplicitamente uno spazio di probabilità relativo alla situazione).

Soluzione 1. Diamo qui una soluzione che usa la formula di Bayes. L’esercizio si può anche risolvere notando che A è in favore di B se e solo se P(A) > 0 e P(A∩B) ≥ P(A)P(B), e ricondurre tutti i calcoli a probabilità non condizionate (Questa riformulazione mostra anche che A è in favore di B se P(A) > 0 e le v.a. 1_A, 1_B sono positivamente correlate).

1. Affermazione vera in generale. Per la formula di Bayes, se A `e in favore di B e P(B) > 0 allora

P(A|B) = P(A)P(B|A)

P(B) ≥ P(A).

2. Affermazione vera in generale. Ancora per la formula di Bayes, se A `e in favore di B e P(B^c) = 1 − P(B) > 0, allora

P(A^c|B^c) = 1 − P(A|B^c) = 1 − P(A)P(B^c|A)

P(B^c) = 1 − P(A)1 − P(B|A)

1 − P(B) ≥ 1 − P(A), dove abbiamo usato (1 − P(B|A))/(1 − P(B)) ≤ 1 perch´e P(B|A) ≥ P(B).

3. Affermazione falsa in generale. Basta notare che se A ⊆ B, allora A `e in favore di B (e quindi anche B `e in favore di A) e considerare A, C ⊆ B disgiunti e non trascurabili, cos`ı P(C|A) = 0 < P(C).

L’evento A, la pallina estratta è bianca, è in favore dell’evento B, la scatola scelta contiene solo palline bianche. Infatti, considerando un qualunque spazio di probabilità che è un modello ragionevole per la situazione descritta, l’evento B sarà non trascurabile e P(A|B) = 1. Da questo segue che l’evento A è non trascurabile (perché P(A) ≥ P(A|B)P(B)) e B è in favore di A, quindi anche A è in favore di B.

Problema 2. Per N ∈ N, N ≥ 1, indichiamo con X^N una variabile aleatoria avente legge uniforme su {0, . . . , N − 1} (definita su un opportuno spazio (Ω_N, F_N, P_N)).

(2)

1. Calcolare la funzione generatrice delle probabilit`a G_X_N.

2. Calcolare valore atteso e varianza di X_N. (Ricorda che un possibile approccio consiste nel derivare la funzione generatrice G_X_N e determinarne il valore in t = 1).

3. Mostrare che il polinomio G_X₆ si fattorizza in (almeno) due modi diversi come prodotto di polinomi G_X₆(t) = a₁(t)a₂(t) = a₃(t)a₄(t) con a_i polinomio a coefficienti non-negativi e a_i(1) = 1 (per i ∈ {1, . . . , 4}). Dare un’interpretazione probabilistica di questo fatto.

4. (Facoltativo) Per ogni k ∈ N, k ≥ 1, mostrare che limN →∞N^−kEN[X_N^k] esiste e determinarlo.

Soluzione 2. 1. La funzione generatrice G_X_N `e un polinomio di grado N − 1:

G_X_N(t) = 1 N

N −1

X

`=1

t^k = 1 N

t^N − 1

t − 1 , per t 6= 1, dove la seconda forma `e utile per i calcoli che seguono.

2. Qui ci sono diversi modi di procedere. Procediamo come suggerito, cio`e differenziando la funzione generatrice, per t < 1,

d

dtGX_N(t) = 1 N

N t^{N −1}(t − 1) − (t^N − 1) (t − 1)² = 1

N

(N − 1)t^N − N t^{N −1}+ 1 (t − 1)²

e valutandone il limite per t = 1 (usando e.g. il teorema di de l’Hˆopital ), da cui

EN[X_N] = lim

t→1

d

dtG_X_N(t) = 1 N

(N − 1)N (N − 1) − N (N − 1)(N − 2)

2 = N − 1

2 . Differenziando un’altra volta la funzione generatrice, per t < 1, abbiamo

d dt

2

G_X_N(t) = 1 N

(N − 1)(N − 2)t^N − 2N (N − 2)t^{N −1}+ N (N − 1)t^{N −2}− 2 (t − 1)³

e valutandone il limite per t = 1 (usando ancora il teorema di de l’Hˆopital ), otteniamo

EN[X_N(X_N − 1)] = lim

t→1

d dt

2

G_X_N(t)

= (N − 1)(N − 2) [(N − 1)(N − 2) − 2(N − 2)(N − 3) + (N − 3)(N − 4)]

6

= (N − 1)(N − 2)

3 .

A questo punto, per la varianza si ottiene

Var(X_N) = EN[X_N(X_N − 1)] + EN[X_N] − EN[X_N]² = N²− 1 12 .

(3)

3. Possiamo scrivere G_X₆(t) = 1

6 t⁶− 1

t − 1 = (t³− 1)(t³+ 1)

6(t − 1) = (t³+ 1) 2

(t²+ t + 1)

3 = a₁(t)a₂(t), oppure

G_X₆(t) = 1 6

t⁶− 1

t − 1 = (t²− 1)(t⁴+ t²+ 1)

6(t − 1) = (t + 1) 2

(t⁴+ t²+ 1)

3 = a₃(t)a₄(t).

Per l’interpretazione probabilistica, notiamo che a₁ corrisponde alla funzione generatrice di una v.a. Y₁ che assume valori in {0, 3} con probabilit`a uniforme, a₂ corrisponde alla funzione generatrice di una v.a. Y₂ che assume valori in {0, 1, 2}

con probabilit`a uniforme, e quindi la legge di X₆ corrisponde alla legge di Y₁ + Y₂ (se Y₁ e Y₂ sono indipendenti). Similmente a₃ corrisponde ad una legge uniforme su {0, 1} mentre a₄ corrisponde ad una legge uniforme su {0, 2, 4}.

4. Per definizione di valore atteso, possiamo scrivere

EN

"

X_N N

k#

=

N −1

X

`=0

` N

k

1 N =

N −1

X

`=0

f ` N

1 N,

dove f (x) = x^k. L’ultima espressione si pu`o interpretare come somma di Riemann, da cui deduciamo il limite

N →∞lim E^N

"

X_N N

k#

= Z 1

0

x^kdx = 1 k + 1.

Per una dimostrazione senza integrali (in cui sostanzialmente prima integriamo per parti e poi passiamo al limite), notiamo ad esempio che, per ` ∈ {0, . . . , N − 1}, possiamo scrivere, via espansione binomiale di Newton,

`^k = (` + 1)^k+1− (`)^k+1

k + 1 + R_k(`), dove R_k(`) = O_k(`^k−1), infatti

0 ≤ R_k(`) = 1 k + 1

k+1

X

i=2

k + 1 i

`^k+1−i ≤ 2^k+1 k + 1`^k−1. Perci`o,

1 N^k+1

N −1

X

`=0

`^k = 1 N^k+1

N −1

X

`=0

(` + 1)^k+1− `^k+1

k + 1 + 1

N^k+1

N −1

X

`=0

O_k(`^k)

= 1

k + 1 + O_k(N⁻¹).

Problema 3. Il valore di un titolo quotato in borsa, da un giorno all’altro cala o cresce di un’unità oppure rimane costante (rispetto ad una certa unità di misura e ammettendo un certo grado di approssimazione). Detto S_i il valore al termine del giorno i-esimo, vale S_i = S_i−1+ X_i dove X_i è la variazione avvenuta durante il giorno i-esimo (i ≥ 1).

(4)

Come descritto sopra, supponiamo quindi che ciascuna variazione X_i assuma solamente valori in {−1, 0, +1}. In un periodo di n ≥ 1 giorni, in cui la borsa è abbastanza stabile, supponiamo che le variabili X₁, . . . , X_n siano indipendenti, ugualmente distribuite, con uguale probabilità di valere +1 o −1. Indichiamo con θ ∈ [0, 1/2] la probabilità di valere +1 (o, il che è lo stesso, di valere −1). Un agente di borsa vuole stimare θ.

1. Scrivere un (adeguato) modello statistico parametrico e la relativa verosimiglianza.

2. Trovare, se c’`e, lo stimatore di massima verosimiglianza, esaminando se sia corretto e se sia consistente per n → ∞.

3. Trovare una regione di fiducia di livello 1 − α, con α ∈ (0, 1) assegnato. Si cerchi di trovarne una esatta, pur più grande del necessario; ed una migliore, cioè più piccola, anche se approssimata.

Soluzione 3. 1. Consideriamo il modello statistico parametrico Ω = {−1, 0, 1}ⁿ, A = P(Ω), P^θ con verosimiglianza

L(θ, k₁, . . . , k_n) =

n

Y

i=1

θ^|kⁱ^|(1 − 2θ)^1−|kⁱ^|, θ ∈ Θ =

0,1

2

, (k₁, . . . , k_n) ∈ Ω.

In altre parole, consideriamo il modello canonico relativo ad un campione di taglia n (X₁, . . . , X_n), con legge m^θ(k) = θ^|k|(1 − 2θ)^1−|k|, k ∈ {−1, 0, 1} (per includere anche i casi θ ∈ {0, 1/2}, usiamo la convenzione 0⁰ = 1). Poniamo inoltre s = s(k1, . . . , kn) :=Pn

i=1|ki|, cos`ı

L(θ, k₁, . . . , k_n) = θ^s(1 − 2θ)^n−s = exp {log(θ)s + log(1 − 2θ)(n − s)} , (dove l’ultima identit`a ha senso anche per θ ∈ {0, 1/2}, ponendo log(0) = −∞).

2. Lo stimatore di massima verosimiglianza si ottiene dall’equazione 0 = ∂

∂θL(θ, k₁, . . . , k_n) = s

θ − 2(n − s) 1 − 2θ

L(θ, k₁, . . . , k_n)

che implica ˆθ = _2n^s . In realtà, per concludere che ˆθ è davvero il massimo, control- liamo esplicitamente i valori di bordo θ ∈ {0, 1/2}. Se s /∈ {0, n}, è chiaro che ˆθ

è un massimo, perché in quel caso la verosimiglianza è nulla al bordo. Se s = 0, vale ˆθ = 0, e allora la verosimiglianza vale 1; similmente se s = n, vale ˆθ = 1/2 e allora la verosimiglianza vale 1. Più esplicitamente, abbiamo trovato lo stimatore di massima verosimiglianza

θ =ˆ 1 2n

n

X

i=1

|X_i| .

Notiamo che le variabili aleatorie |X_i| sono indipendenti (Proposizione 2.5.11 delle dispense, estesa a n-variabili) ciascuna con legge Bernoulli di parametro 2θ (perch´e {|X_i| = 1} = {X_i = 1} ∪ {X_i = −1} unione disgiunta di eventi ciascuno con probabilit`a θ). Pertanto le |X_i| sono un campione di taglia n di v.a. Bernoulli di parametro 2θ.

Grazie a questa osservazione, notiamo che ˆθ `e corretto e consistente per n → ∞, grazie alla disuguaglianza

P^θ(|ˆθ − θ| ≥ d) ≤ Var(|X1| /2)

nd² = 2θ(1 − 2θ)

4nd² ≤ 1

16nd².

(5)

3. La disuguaglianza scritta sopra si pu`o usare per ottenere una regione di fiducia (esatta) della forma C = (ˆθ − d, ˆθ + d). Dato α ∈ (0, 1), ponendo α = _16nd¹ 2, otteniamo d = ₄^√¹_nα.

Possiamo anche studiare regioni di fiducia ottenute via TLC, con l’approssimazione (valida in una situazione in cui n sia grande)

P^θ(|ˆθ−θ| ≥ d) = P^θ

√n _n¹

Pn

i=1|Xi| − 2θ p2θ(1 − 2θ) ≥

√n2d p2θ(1 − 2θ)

!

≈ 1−

Z d⁰

−d⁰

e^−x²^/2

√2π dx,

dove abbiamo indicato d⁰ = ^2d

√n

√

2θ(1−2θ). Imponendo d⁰ = q_1−α/2 (q_t indica il quantile gaussiano) e rimuovendo la dipendenza da θ ∈ [0, 1/2], otteniamo d = ^q^1−α/2₂^√_n .