Francesco Caravenna
Foglio 1. (12–16 aprile 2010) Esercitazione del 14 aprile 2010
Esercizio 1. Si considerino i seguenti dati relativi agli incidenti aerei per voli com- merciali avvenuti negli USA nel periodo 1991-95:
Anno x = numero di incidenti y = numero di vittime
91 4 62
92 4 33
93 1 1
94 4 239
95 2 166
a) Per il campione x si determinino media, mediana, quartili, varianza, deviazione standard, differenza interquartile e si disegni il box plot.
b) Si determini il coefficiente di correlazione tra i campioni x e y.
c) Si scriva la tabella delle frequenze relativa al campione x e si ricalcoli la media usando la tabella.
Esercizio 2. Si considerino il seguente campione di dati: 1, 3, 3, 8, z (il valore di z
`
e incognito).
a) Si esprimano media e mediana del campione in funzione di z ∈ R.
b) Si esprima la mediana del campione 1, 3, 4, 8, z in funzione di z ∈ R.
Esercizio 3. Un campione di dati x1, . . . , xn `e tale che x = 0. Quali delle seguenti affermazioni sono sicuramente vere?
a) Esiste almeno un dato xi tale che xi > 0.
b) Esiste almeno un dato xi tale che xi ≥ 0.
c) Q2 = 0.
d) Q1 ≤ 0.
Esercizio 4. In una classe di 18 individui viene misurata la temperatura corpo- rea con un termometro di precisione (fondoscala 0.01◦C). Le temperature rilevate, organizzate in ordine crescente, risultano:
36.24 36.27 36.40 36.62 36.72 36.77 36.78 36.81 36.91 36.94 37.14 37.17 37.18 37.20 37.23 37.33 37.35 37.68 .
Si suddividano i dati in opportune classi e si disegni l’istogramma delle frequenze.
1
Esercitazione del 16 aprile 2010
Esercizio 5. Si determinini il coefficiente di correlazione per il seguente campione:
x y
0 2
1 1.5 5 -0.5 6 -1
Esercizio 6. Si disegni il box plot per il campione 1, 7, 0, 7, 9, 5.
Esercizio 7. Un campione di dati x1, . . . , xn `e tale che s2x = 0. Quali delle seguenti affermazioni sono sicuramente vere?
a) x = 0.
b) Q1 = Q2.
Esercizio 8. Un campione di dati x1, . . . , xn `e tale che Q1 = Q3 = 2.5. Quali delle seguenti affermazioni sono sicuramente vere?
a) Q2 = 2.5.
b) x = 2.5.
c) Tutti i dati sono uguali a 2.5.
Esercizio 9. Una coppia ha due figli(e). Assumiamo che il sesso dei due figli possa essere descritto dallo spazio campionario S = {(M M ), (M F ), (F M ), (F F )} (dove (ab) indica che il primogenito `e di sesso a e il secondogenito di sesso b) munito della probabilit`a uniforme, cio`e P (M M ) = P (M F ) = P (F M ) = P (F F ) = 14.
a) Qual `e la probabilit`a che il primogenito sia maschio?
b) Qual `e la probabilit`a che entrambi i figli siano maschi?
c) Se sappiamo che il primogenito `e maschio, qual `e la probabilit`a che entrambi i figli siano maschi?
d) Se sappiamo che il secondogenito `e maschio, qual `e la probabilit`a che entrambi i figli siano maschi?
e) Se sappiamo che almeno un figlio `e maschio, qual `e la probabilit`a che entrambi i figli siano maschi?
Esercizio 10 (Paradosso di Monty Hall). Vi propongo di scegliere tra tre buste chiuse, una delle quali contiene un premio mentre le altre due sono vuote. Una volta effettuata la scelta, io guardo di nascosto il contenuto delle due buste rimaste e ve ne mostro una vuota (tra le mie due buste ce n’`e almeno una vuota, dunque lo posso sempre fare). A questo punto vi propongo di cambiare la busta che avete scelto con quella che mi `e rimasta in mano. Vi conviene cambiare?
Soluzione 1. a) Per la variabile x si ha:
• x = 4+4+1+4+25 = 155 = 3.
• Q1 = 2, Q2 = 4, Q3 = 4.
• s2x =
Pn
i=1(xi−x)2
n−1 = 12+12+(−2)42+12+(−1)2 = 2.
• sx =ps2x =√
2 ' 1.41
• Q3− Q1 = 2
Il relativo box-plot `e mostrato in figura.
1.0 1.5 2.0 2.5 3.0 3.5 4.0
b) Per la variabile y si ha:
• y = 62+33+1+239+166
5 = 5015 = 100.2.
• s2y =
Pn
i=1(yi−y)2
n−1 = (−38.2)2+(−67.2)2+(−99.2)4 2+(138.8)2+(65.8)2 = 9852.7.
• sy =√
9852.7 ' 99.26
Quindi il coefficiente di correlazione vale r =
1 n−1
Pn
i=1(xi− x)(yi− y) sx· sy
=
1
4(−38.2 − 67.2 + 2 · 99.2 + 138.8 − 65.8)
1.41 · 99.26 ' 0.30.
Dunque x e y non manifestano una correlazione significativa.
c) La tabella delle frequenze per il campione x `e data da Valori di x Frequenza assoluta
1 1
2 1
4 3
La media `e data dunque da x = y1f1f+y2f2+y3f3
1+f2+f3 = 1·1+2·1+4·3
1+1+3 = 155 = 3.
Soluzione 2. a) Indipendentemente dal valore di z, il terzo dato in ordine crescente
`
e sempre 3, per cui Q2 = 3.
b) In questo caso si ha che
Q2 =
3 se z ≤ 3 x se 3 < z < 4 4 se z ≥ 4
.
Soluzione 3. a) F b) V c) F d) F.
Soluzione 4. Scegliendo le classi di ampiezza 0.25◦C, a partire da 36◦C, si ottiene la tabella seguente:
Classe Frequenza assoluta
[36, 36.25) 1
[36.25, 36.5) 2 [36.5, 36.75) 2
[36.75, 37) 5
[37, 37.25) 5
[37.25, 37.5) 2 [37.5, 37.75) 1 Il relativo istogramma `e mostrato in figura.
36.0 36.5 37.0 37.5 38.0
012345
Soluzione 5. Una risposta veloce si ha notando che i dati giacciono lungo la retta y = −x/2 + 2, per cui si ha r = −1 (il coefficiente angolare della retta `e negativo).
Altrimenti si pu`o procedere col calcolo diretto:
• x = 0+1+5+64 = 124 = 3
• y = 2+1.5−0.5−1
4 = 24 = 0.5
• s2x = (
Pn
i=1x2i)−n x2
n−1 = 02+12+523+62−4·32 = 263
• s2y = (
Pn
i=1yi2)−n y2
n−1 = 22+1.52+(−0.5)32+(−1)2−4·0.52 = 2612 da cui
r = (Pn
i=1xi, yi) − n x y
(n − 1) sxsy = 0 · 2 + 1 · 1.5 + 5 · (−5) + 6 · (−1) − 4 · 3 · 0.5 3 ·
q26 3
q26 12
= −1 .
Soluzione 6. Mettendo i dati in ordine crescente: 0, 1, 5, 7, 7, 9 si ricava facilmente che Q1 = 1, Q2 = 5+72 = 6, Q3 = 7. Il relativo boxplot `e illustrato in figura.
0 2 4 6 8
Soluzione 7. a) F b) V.
Soluzione 8. a) V b) F c) F.
Soluzione 9. a) 12 b) 14 c) 12 d) 12 e) 13.
Soluzione 10. S`ı, la probabilit`a di vincere il premio passa da 13 a 23.