Elementi di Analisi Numerica, Probabilità e Statistica,
modulo 2: Elementi di Probabilità e Statistica (3 cfu) Probabilità e Statistica (6 cfu) Scritto del 26 aprile 2017. Appello Straordinario Id: A
Nome e Cognome: Esame da 3 6 cfu (barrare la casella interessata)
Si ricorda che nella correzione dell'elaborato si valuteranno anche i procedimenti che portano ai risultati nali. Tali procedimenti devono essere descritti o giusticati in modo sintetico, ma chiaro. Riportare solo il risultato nale, anche se corretto, verrà considerato errore.
Problema 1 (tutti)
Due v.a. X e Y sono indipendenti ed identicamente distribuite con densità N (µ = 0, σ2 = 2). Si considerino le variabili aleatorie R, Θ cosi denite X = R cos Θ e Y = R sin Θ con Θ ∈ [−π, π).
1. 4/30 Trovare la densità congiunta di R, Θ vericando che sono indipendenti. 2. 4/30 Calcolare media e varianza di R e Θ.
3. 2/30 Dimostrare che la P (R < E[R]) ≈ 0.544
Problema 2 (tutti)
Un'urna contiene 4 biglie rosse e 6 nere. Si estraggono a caso dall'urna due biglie, senza mettere la prima biglia estratta nell'urna. Determinare la probabilità che
1. 1/30 la prima biglia estratta sia nera e la seconda rossa; 2. 2/30 le due biglie estratte siano entrambe rosse;
3. 2/30 almeno una delle due biglie estratte sia nera; 4. 2/30 le due biglie estratte abbiano colori dierenti. 5. 3/30 le due biglie estratte abbiano lo stesso colore;
Problema 4 (solo esame 6 cfu)
Il seguente campione 23.56, 26.36, 25.20, 28.32, 27.55, 27.09, 26.40, 23.32, 21.86, 23.75, 28.39, 27.47, 26.22, 24.31, 24.89, 25.46, 24.19, 25.01, è estratto da una popolazione gaussiana di parametri µ e σ sconosciuti. Testare le seguenti ipotesi ad un livello di condenza del 1%
1. 2/30 H0(µ = 24) 2. 2/30 H0(σ2= 3),
Problema 3 (solo esame 6 cfu)
Si vuole stabilire, tramite un test ANOVA, se ci sia dierenza tra quattro diversi metodi di produzione di una merce. I da-ti raccolda-ti in tabella rappresentano, per ogni metodo, il numero di minuti necessari per la preparazione. Dopo aver specicato l'ipotesi nulla, determinare
M1 22 22 21 19 24 21 18
M2 22 20 22 19 20 24 19
M3 16 24 17 20 19 14 17
M4 19 19 15 21 20 18 19
1. 1/30 le medie di gruppo e la media totale;
2. 3/30 SSW e SSB e il loro numero di gradi di libertà, specicando sotto quali condizioni sono stimatori corretti;
Soluzione
Problema 1 (tutti)
1. Si tratta del ben noto passaggio alle coordinate polari. Con le condizioni specicate c'è corrispondenza biunivoca: ad ogni valore della coppia (X, Y ) ne corrisponde solo uno di (R, Θ) e viceversa. Basta quindi scrivere pR,Θ(r, θ) d r d θ = pX,Y(x, y) d x d y = 1 2πσ2e −(x2+y2)/2σ2 r d r d θ = 1 2πσ2e −r2/2σ2 r d r d θ da cui pR,Θ(r, θ) = 1 2π r σ2e −r2/2σ2
Si vede che la densità congiunta è il prodotto delle marginali che sono
pΘ(θ) = 1 2π θ ∈ [−π, π) pR(r) = r σ2e −r2/2σ2 r ≥ 0
che risultano normalizzate. Se ne conclude che le v.a. R, Θ sono indipendenti.
2. Per la Θ che è distribuita uniformemente si trova subito E[Θ] = 0 e Var[Θ] = π2/3. Per la R ci si può ricondurre ad integrali noti. Infatti
E[R] = Z +∞ 0 r r σ2e −r2/2σ2 d r = 1 2 Z +∞ −∞ r2 σ2e −r2/2σ2 d r = ... =r π 2σ
dove si è usato l'integrale che denisce il secondo momento della gaussiana. Per la varianza occorre un integrale che, ad esempio, può essere integrato per parti 2 volte
E[R2] = Z +∞ 0 r2 r σ2e −r2/2σ2 d r = Z +∞ 0 r2 d d r − e−r2/2σ2d r = ... = 2σ2 da cui Var[R] = (2 − π/2)σ2.
3. La distribuzione cumulativa della R vale FR(r) = Z r 0 s σ2e −s2/2σ2 d s = 1 − e−r2/2σ2 Risulta quindi P (R <pπ/2 σ) = F (pπ/2 σ) = 1 − e−π/4≈ 0.544
Problema 2 (tutti)
1. Siano n le biglie nere ed r quelle rosse. Indichiamo con Ri l'evento i-esima estratta è rossa e Ni l'evento i-esima estratta è nera. Indichiamo inoltre i seguenti eventi E1 = N1∩ N2, E2= N1∩ R2, E3= R1∩ N2e E4= R1∩ R2che risultano indipendenti.
La prob. cercata è P (E2) = P (N1)P (R2) = n n + r r n + r − 1 2. Con riferimento al punto precedente si ha
P (E4) = P (R1)P (R2) = r n + r r − 1 n + r − 1 3. Risulta
P (almeno una nera) = P (E1∪ E2∪ E3) = P (E1) + P (E2) + P (E3) = ... =
n(n − 1 + 2r) (n + r)(n + r − 1) 4. P (E2∪ E3) = 2nr (n + r)(n + r − 1) 5. P (E1∪ E4) = n(n − 1) + r(r − 1) (n + r)(n + r − 1)
Problema 4 (solo esame 6 cfu)
1. La statistica da usare è U = ¯ X − µ q S2 N −1 N dove ¯X è la media campionaria e S2
N −1 la varianza campionaria. Il valore di µ viene ssato da H0. Dalla teoria è noto che U è una v.a. t di Student con N −1 = 17 gradi di libertà. Si trova ¯x = 25.51944 e S2
17= 3.39066. In dettaglio si ottiene
H0(µ = 24) u = +3.5009 P (|U | > 3.5009) = 0.002739
Dal p-dei-dati si deduce che l'ipotesi si può rigettare all'1%. Analisi confermata dallo studio della zona di rigetto P (|U | > |uα|) = α = 2 Z +∞ |uα| pT17(x) d x = 2(1 − FT17(|uα|)) da cui uα= FT−117(1 − α/2) = 2.898
2. In questo caso la statistica da usare è
U = N − 1 σ2 S
2 N −1
che è distribuita come una v.a. di tipo χ2
N −1dove il valore di σ
2 è recuperato dall'ipotesi H 0. Si trova
Dal p-dei-dati si deduce che tutte l'ipotesi non si rigetta all'1%. Analisi confermata dallo studio della zona di rigetto P (U > uα) = α = Z +∞ uα pχ2 17(x) d x = (1 − Fχ2 17(uα)) da cui uα= Fχ−12 17 (1 − α/2) ≈ 35
Problema 3 (solo esame 6 cfu)
1. L'ipotesi nulla è H0(Xi,j∼ N (µ, σ2)).
Risulta Xi,∗= 21.0000, 20.8571, 18.1429, 18.7143, X∗∗ = 19.67857
2. SSW = 129.1429 con 24 gdl, sempre corretto. SSB = 44.964con 3 gdl, corretto solo sotto H0. 3. La statistica da usare è una F di Fisher F3,24 = 2.7854. Risulta P (F3,24 > 2.7854) ≈ 0.062che è il
p-dei-dati. Ne segue che H0 si può rigettare ad un livello di signicatività maggiore del 6%. All'1% pertanto non si rigetta.
Analisi confermata dallo studio delle zone di rigetto P (F3,24> fα) = α. Infatti f1%= 4.71, f5%= 3.01 e f10%= 2.32.