Elementi di Probabilit` a e Statistica - 052AA - A.A. 2014-2015
Seconda prova di verifica intermedia - 28 maggio 2015
Problema 1. Alberto si riduce sempre a fare la spesa verso l’orario di chiusura del supermercato locale, e siccome non ` e l’unico a fare cos`ı, trova spesso lunghe code alle casse. Questa volta ha fatto davvero tardi ed ` e l’ultimo dei clienti ad inserirsi in coda (nessun altro pu` o entrare al supermercato). Inoltre, egli nota che, per i ∈ {1, . . . 4}, la cassa i ` e aperta e ci sono in coda N i ≥ 1, persone. Alberto, che si sta appassionando allo studio della probabilt` a, suppone che i tempi di attesa relativi alle diverse casse siano indipendenti e ritiene che la coda i-esima impieghi per esaurirsi un tempo con legge esponenziale di parametro ν i := 1/N i .
1. Esibire uno spazio di probabilit` a che rappresenti la situazione descritta. Qual’` e il valore atteso del tempo che Alberto dovrebbe passare in coda alla cassa 1?
2. Calcolare la probabilit` a che la coda alla cassa 2 si esaurisca prima di quella alla cassa 1. Quanto vale nel caso in cui N i = 9 per i ∈ {1, . . . 4}?
3. Supponendo che Alberto scelga di mettersi in coda alla cassa 1, qual’` e la probabilit` a che almeno una tra le code alle altre casse si esaurisca prima che arrivi il turno di Alberto? Quanto vale tale probabilit` a nel caso in cui N i = 9 per i ∈ {1, . . . 4}?
Soluzione 1. 1. La situazione descritta si formalizza ragionando ad esempio su uno spazio di probabilit` a (Ω, A, P) su cui siano definite variabili aleatorie reali T i , in- dipendenti e di legge Exp(ν i ), per i ∈ {1, . . . , 4}. Si pu` o mostrare che un tale spazio esiste ponendo ad esempio Ω = R 4 e P avente densit` a (rispetto alla misura di Lebesgue)
f (x 1 , . . . x 4 ) =
4
Y
i=1
ν i e −ν
ix
iI [0,∞) (x i ).
Il valore atteso ` e E [T 1 ] = R ∞
0 x 1 ν 1 e −ν
1x
1dx 1 = N 1 .
2. Per calcolare la probabilit` a richiesta, studiamo prima il caso generale di due espo- nenziali indipendenti (S, T ) con rispettivi parametri λ e ν . Per il teorema di Fubini:
P(S ≤ T ) = Z
I {0≤s≤t} λνe −λs λe −νt dsdt
= Z ∞
0
λe −λs Z ∞
s
νe −νt dtds
= Z ∞
0
λe −λs P(s ≤ T )ds
= Z ∞
0
λe −(λ+ν)s ds
= λ
λ + ν ,
da cui la probabilit` a richiesta, specializzando S = T 2 , T = T 1 ` e ν ν
21
+ν
2, e quindi 1/2
nel caso in cui ν 1 = ν 2 .
3. La probabilt` a richiesta ` e P (min {T 2 , T 3 , T 4 } ≤ T 1 ). Per calcolarla, osserviamo intan- to che S := min {T 2 , T 3 , T 4 } `e indipendente da T 1 e ha legge anch’essa esponenziale, ad esempio notando che vale
P(min {T 2 , T 3 , T 4 } ≥ s) =
4
Y
i=2
P(T i ≥ s) = e −s P
4i=2ν
i, per ogni s ∈ [0, ∞)
e per unicit` a della funzione di ripartizione, deduciamo che la legge ` e esponenziale di parametro P 4
i=2 ν i . Per il calcolo generale fatto sopra, ponendo λ = P 4 i=2 ν i e λ + ν = P 4
i=1 ν i , otteniamo
P(min {T 2 , T 3 , T 4 } ≤ T 1 ) = P 4
i=2 ν i P 4
i=1 ν i .
Nel caso in cui gli N i siano tutti uguali (in particolare se N i = 9), otteniamo che la probabilit` a vale 3/4.
Problema 2. Siano X e Y due variabili aleatorie indipendenti, X avente legge N (m, σ 2 ) (m ∈ R, σ 2 > 0) e Y a valori in {−1, 1} e poniamo p = P (Y = 1) ∈ [0, 1]. Definiamo la variabile aleatoria U := XY .
1. Esprimere, in funzione dei parametri m, σ 2 e p, media e varianza di U . 2. Per quali valori di m, σ 2 e p le variabili U ed X hanno la stessa legge?
3. Per quali valori di m, σ 2 e p le variabili aleatorie U ed X sono incorrelate? (Facol- tativo) per quali valori U ed X sono indipendenti?
Soluzione 2. 1. In questo esercizio, usiamo diverse volte il Teorema 4.3.7 delle di- spense: se F , G, sono v.a. reali indipendenti con F , G con momento primo, allora F G ` e ha momento primo e vale E [F G] = E [F ] E [G]. Siccome X `e gaussiana e Y
` e limitata, le condizioni di integrabilit` a saranno sempre soddisfatte. Calcoliamo la media
E [U ] = E [XY ] = E [X] E [Y ] = m(p − (1 − p)) = m(2p − 1) e il momento secondo:
E U 2 = E X 2 Y 2 = E X 2
E Y 2 = E (X − m + m) 2 = σ 2 + m 2 . La varianza si pu` o ottenere per differenza:
V ar(U ) = E U 2 − (E [U]) 2 = σ 2 + m 2 − m 2 (2p − 1) 2 = σ 2 + 4p(1 − p)m 2 . 2. Notiamo che, se X ed U hanno la stessa legge, necessariamente devono avere stessa
media e stessa varianza, per cui dal primo punto deduciamo le condizioni necessarie m(2p − 1) = m, σ 2 + 4p(1 − p)m 2 = σ 2
e quindi m = 0 oppure p = 1. Il caso p = 1 implica Y = 1 e quindi ` e anche
sufficiente. Anche la condizione m = 0 ` e sufficiente, e segue dal fatto che possiamo
scrivere
E [ϕ(XY )] = E ϕ(X)I {Y =1} + ϕ(−X)I {Y =−1}
= E [ϕ(X)] E I {Y =1} + E [ϕ(−X)] E I {Y =−1}
= E [ϕ(X)] p + E [ϕ(−X)] (1 − p)
= E [ϕ(X)] p + E [ϕ(X)] (1 − p)
= E [ϕ(X)]
dove abbiamo usato che la legge di −X coincide con quella di X (sono entrambe N (0, σ 2 )).
3. Le variabili X ed U sono scorrelate se e solo se p = 1/2: infatti calcoliamo E [U X] = E X 2 Y = E X 2
E [Y ] , E [U ] E [X] = E [X] 2 E [Y ] , quindi
Cov(U, X) = E X 2
E [Y ] − E [X] 2 E [Y ] = E X 2 − E [X] 2
E [Y ] = σ 2 (2p − 1).
Invece, le variabili X ed U non sono mai indipendenti; se lo fossero, anche |X|
sarebbe indipendente da |U | = |XY | = |X|, ma allora |X| dovrebbe essere degenere, ad esempio dovrebbe valere P (|X| ≤ t) = P (|X| ≤ t) 2 ∈ {0, 1} per ogni t ∈ R il che ` e assurdo (X ha legge normale).
Problema 3. Un’agenzia di controllo dei trasporti ferroviari monitora regolarmente il numero di persone sul Pisa-Firenze delle 7:39 relativamente ai giorni feriali. Da numerose misurazioni passate si sa che il numero medio di presenze ` e 184,5 ed il numero di posti a sedere sembra sufficiente, di solito.
Di recente per` o le lamentele per il treno troppo pieno sono aumentate e quindi l’agenzia effettua 15 misurazioni, ottenendo certi valori x 1 , . . . , x 15 aventi x = 15 1 P 15
i=1 x i = 199,4, s =
q 1 14
P 15
i=1 (x i − x) 2 = 14,8. Nel seguito la v.a. N = “numero di passeggeri” verr` a descritta da una gaussiana, anche se a stretto rigore ` e una v.a. discreta e non negativa.
1. Si supponga inizialmente per semplicit` a che la deviazione standard di N sia nota, pari a 15. Scrivere una regione di rifiuto di livello 0,05 per un test per la media di N , relativamente all’ipotesi nulla m ≤ 184,5 (la risoluzione si considera completa solo se si parte dalla propriet` a del rapporto di verosimiglianza dimostrata a lezione - dandola per buona - senza l’uso di formulette finali prefatte) e vedere se il test rifiuta l’ipotesi.
2. Rimuoviamo l’ipotesi di conoscenza della deviazione standard. Scrivere una regione di rifiuto di livello 0,05 (pur senza svolgere le dimostrazioni, si rammenti perch´ e quella che si propone ` e una regione di rifiuto), sempre relativamente all’ipotesi nulla m ≤ 184,5 e vedere se il test rifiuta l’ipotesi.
3. Calcolare un intervallo in cui cade la soglia di accettazione del test del punto 2 e
fare l’esempio di due livelli che avrebbero dato esiti opposti.
4. Supponiamo, per svolgere un calcolo potenziale, che i parametri veri di N siano i valori 200 e 15. Il treno ha 220 posti. Con che probabilit` a c’` e almeno una persona senza posto a sedere?
Soluzione 3. 1. H 0 ) m ≤ m 0 := 184,5 (con gaussianit` a e σ 0 = 15 ipotizzate), H 1 ) m > m 0 . Sappiamo dalla teoria che il rapporto di verosimiglianza ` e crescente rispetto a X = N
1+...+N n
n, quindi (per il noto corollario del teorema di Neyman- Pearson) la regione ottimale di livello α = 0,05 ` e della forma X ≥ d con
P m
0,σ
0X ≥ d = 0,05 ovvero, essendo X ∼ N
m 0 , σ 15
20sotto l’ipotesi N ∼ N (m 0 , σ 2 0 ), deve valere
P
Z ≥ d − m 0 σ 0
√ 15
= 0,05
dove Z ∼ N (0, 1), quindi P
Z ≤ d−m σ
00