13 luglio 2010 Matricola:
Tema C 1. Parte A
1.1. Indichiamo con Q1 e Q3 il primo e terzo quartile, con m la mediana e con x la media di un campione di dati x1, . . . , xn. Si pu`o certamente affermare che
se Q1= Q3, allora m = Q1.
se Q1= Q3, allora m = x.
se i dati x1, . . . , xn non sono tutti uguali tra loro, allora Q1 ≤ x ≤ Q3.
Q1< m oppure m < Q3.
1.2. Lancio un dado regolare a sei facce e, indipendentemente, due monete equilibrate. Qual `e la probabilit`a che il risultato del dado sia 3 e che entrambe le monete diano croce?
121
125
241
18
1.3. Sia Φ(x) = P (Z ≤ x) la funzione di ripartizione e zα il percentile della distribuzione normale standard. Se X ∼ N (2, 9), la probabilit`a P (X ≤ 3) vale
Φ(19)
z1
3
Φ(13)
z1
9
1.4. Sono dati due eventi A e B di uno spazio di probabilit`a tali che P (A) = P (B) = 34. Quale dei seguenti valori certamente non pu`o essere assunto da P (A ∩ B)?
14
12
34
169
1.5. In un test per la media incognita µ di un campione normale a varianza nota ottengo una media campionaria x = 2.5. Allora si pu`o essere certi che
l’ipotesi H0: µ ≤ 2.3 non `e rifiutata a qualunque livello di significativit`a.
l’ipotesi H0: µ ≥ 2.3 `e rifiutata a qualunque livello di significativit`a.
l’ipotesi H0: µ ≤ 2.3 `e rifiutata a qualunque livello di significativit`a.
l’ipotesi H0: µ ≥ 2.3 non `e rifiutata a qualunque livello di significativit`a.
1.6. Sia Y ∼ P o(4n) e sia Z := Y −anb√n . Per quali valori delle costanti a, b la variabile Z ha una distribuzione approssimativamente normale standard per n grande?
a = 4, b = 4
a = 2, b = 4
a = 4, b = 2
a = 2, b = 2
1
1.7. Si vuole testare l’indipendenza del sesso di una persona dal fatto di essere o non essere fumatore. Esaminando un campione di individui, il valore della statistica del test `e T = 4.18.
Sapendo che χ20.05,1 = 3.84 e χ20.05,1 = 6.53, si pu`o concludere che
il valore-p del test `e compreso tra 1% e 5%.
il valore-p del test `e maggiore di 5%.
il valore-p del test `e minore di 1%.
nessuna delle precedenti (per rispondere `e necessario conoscere l’ampiezza del campione di individui esaminato).
2. Parte B
2.1. noto che una determinata forma influenzale colpisce l’1.9% della popolazione. Un gruppo di 863 pazienti `e in trattamento con un nuovo medicinale per il colesterolo, e di essi 19 contrag- gono l’influenza. Ci sono ragioni sufficienti per concludere, con significativit`a del 5%, che tale medicinale aumenti in modo significativo la probabilit`a di contrarre l’influenza?
Soluzione. Usiamo un test su una proporzione, per l’ipotesi nulla H0 : p ≤ 0.019. Posto ˆ
p = 86319, la statistica test `e
st p − 0.019ˆ p0.019(1 − 0.019)/√
863 ' 0.649.
Essendo z0.05= 1.645 > st, H0 non viene rifiutata: non ci sono ragioni sufficienti per concludere, con significativit`a del 5%, che tale medicinale aumenti in modo significativo la probabilit`a di contrarre l’influenza.
2.2. Nell’arco di un triennio, sono stati registrati 1603 incidenti stradali capitati ai 708 guida- tori di una societ`a di trasporto pubblico. La seguente tabella riporta come tali incidenti sono distribuiti tra i vari autisti:
n. di autisti n. di incidenti
117 0
157 1
158 2
115 3
78 4
44 5
21 6
7 7
6 8
3 9
0 10 o pi`u
Questi dati sono compatibili con l’ipotesi che il numero di incidenti per autista abbia distribu- zione di Poisson?
Soluzione. Il primo passo nel test di buon adattamento consiste nello stimare il parametro della distribuzione di Poisson. Dalla tabella di frequenza si ottiene ˆλ = x = 2.27. Otteniamo la seguente tabella, in cui le frequenze attese sono calcolate con la formula
e−2.272.27k k! 706 per k ≤ 9.
n. di incidenti frequenza frequenza attesa
0 117 73.21
1 157 165.91
2 158 188
3 115 142.02
4 78 80.47
5 44 36.47
6 21 13.78
7 7 4.46
8 6 1.26
9 3 0.32
10 o pi`u 0 0.09
Poich´e vi sono troppe frequenze attese minori di 5, la tabella va ridotta come segue:
n. di incidenti frequenza frequenza attesa
0 117 73.21
1 157 165.91
2 158 188
3 115 142.02
4 78 80.47
5 44 36.47
6 21 13.78
7 o pi`u 16 6.13
Da questa si calcola la statistica test:
st = 117 − 73.21)6
73.21 + · · · +(16 − 6.13)2
6.13 ' 57.9.
Poich´e st > χ20.05,6 = 12.592, l’ipotesi H0 di adattamento alla distribuzione di Poisson viene rifiutata: i dati non sono compatibili con l’ipotesi che il numero di incidenti per autista abbia distribuzione di Poisson.
2.3. Sulla base delle osservazioni sul passato, si pu`o ritenere che la probabilit`a che in un anno in Italia avvenga un terremoto di grande intensit`a (almeno 6.0 gradi nella scala Richter) sia pari a 0.13. Supponiamo che gli eventi che avvengano terremoti in anni diversi siano indipendenti.
Trascuriamo inoltre la possibilit`a che in un singolo anno avvenga pi`u di un terremoto. Sia X il numero di terremoti di grande intensit`a che avverranno in Italia nei prossimi 20 anni e sia A l’evento che nei prossimi 20 anni si verifichi pi`u di 1 terremoto di grande intensit`a.
a) Si determini la distribuzione della variabile X e si calcoli la probabilit`a dell’evento A.
b) Si calcoli la probabilit`a dell’evento A usando l’approssimazione di Poisson.
c) Si calcoli la probabilit`a dell’evento A usando l’approssimazione normale. `E lecito farlo?
Soluzione.
a) Per lo schema delle prove ripetute e indipendenti, X ∼ B(20, 0.13). Di conseguenza P (A) = P (X > 1) = 1 − P (X = 0) − P (X = 1) = 1 −20
0
0.1300.8720−20 1
0.1310.8719
= 1 − 0.8720− 20 · 0.13 · 0.8719= 1 − 0.062 − 0.184 ' 0.754 .
b) Per l’approssimazione di Poisson X ≈ Y := P o(20 · 0.13) = P o(2.6), quindi P (A) ' P (Y > 1) = 1 − P (Y = 0) − P (Y = 1) = 1 − e−2.6− e−2.6· 2.6 = 0.732 .
c) Secondo le regole viste a lezione non sarebbe lecito usare l’approssimazione normale, perch´e np = 20 · 0.13 = 2.6 < 5. Tuttavia il risultato `e comunque molto buono: usando l’approssimazione di continuit`a, dato che E(X) = 20 · 0.13 = 2.6 e V ar(X) = 20 · 0.13 · (1 − 0.13) = 2.262, si ottiene
P (X > 1) = P (X > 1.5) = P X − 2.6
√2.262 > 1.5 − 2.6
√2.262
= P (Z > −0.73) = Φ(0.73) = 0.767.