Esercizi di Metodi Statistici per la Biologia Francesco Caravenna
Foglio 1. (7–11 maggio 2007)
Esercizio 1. Si considerino i seguenti dati relativi agli incidenti aerei per voli com- merciali avvenuti negli USA nel periodo 1991-95:
Anno x = numero di incidenti y = numero di vittime
91 4 62
92 4 33
93 1 1
94 4 239
95 2 166
Per il campione x si determinino media, mediana, quartili, varianza, deviazione standard e differenza interquartile. Infine si determini il coefficiente di correlazione tra i campioni x e y.
Esercizio 2. Si determinino i quartili e si disegni il box plot per i seguenti dati:
1, 7, 0, 7, 9, 5.
Esercizio 3. Si determinini il coefficiente di correlazione per il seguente campione di dati:
x y
0 2
1 1.5 5 -0.5 6 -1
Esercizio 4. Si considerino i seguenti dati: 1, 3, 3, 8, z (il valore di z `e incognito).
a) Al variare di z ∈ R, quali valori pu`o assumere la mediana Q2?
b) Se invece i dati fossero 1, 3, 4, 8, z, quali valori potrebbe assumere Q2? Esercizio 5. Un campione di dati x1, . . . , xn `e tale che x = 0. Le seguenti affer- mazioni sono vere o false?
a) Esiste almeno un dato xi tale che xi > 0.
b) Esiste almeno un dato xi tale che xi ≥ 0.
c) Q2 = 0.
d) Q1 ≤ 0.
1
2
Esercizio 6. Un campione di dati x1, . . . , xn `e tale che s2x = 0. Le seguenti affer- mazioni sono vere o false?
a) x = 0.
b) Q1 = Q2.
Esercizio 7. Un campione di dati x1, . . . , xn `e tale che Q1 = Q3 = 2.5. Le seguenti affermazioni sono vere o false?
a) Q2 = 2.5.
b) x = 2.5.
c) Tutti i dati sono uguali a 2.5.
d) I dati che valgono 2.5 sono pi`u del 40%.
3
Soluzione 1. Per la variabile x si ha:
• x = 4+4+1+4+25 = 155 = 3.
• Q1 = 2, Q2 = 4, Q3 = 4.
• s2x = 12+12+(−2)42+12+(−1)2 = 2.
• sx =ps2x =√
2 ' 1.41
• Q3− Q1 = 2 Per la variabile y:
• y = 62+33+1+239+166
5 = 5015 = 100.2.
• s2y = (−38.2)2+(−67.2)2+(−99.2)4 2+(138.8)2+(65.8)2 = 9852.7.
• sy =√
9852.7 ' 99.26
Quindi il coefficiente di correlazione vale r =
1 n−1
Pn
i=1(xi− x)(yi− y)
sx· sy =
1
4(−38.2 − 67.2 + 2 · 99.2 + 138.8 − 65.8)
1.41 · 99.26 ' 0.30.
Dunque x e y manifestano una debole correlazione positiva.
Soluzione 2. Mettendo i dati in ordine crescente: 0, 1, 5, 7, 7, 9 si ricava facilmente che Q1 = 1, Q2 = 5+72 = 6, Q3 = 7.
Soluzione 3. Una risposta veloce si ha notando che i dati giacciono lungo la retta y = −x/2 + 2, per cui si ha r = −1 (il coefficiente angolare della retta `e negativo).
Altrimenti si pu`o procedere col calcolo diretto:
• x = 0+1+5+64 = 124 = 3
• y = 2+1.5−0.5−1
4 = 24 = 0.5
• s2x = (−3)2+(−2)3 2+22+32 = 263
• s2y = (1.5)2+12+(−1)3 2+(−1.5)2 = 2612 da cui
r = −3 · 1.5 + (−2) + 2 · (−1) + 3 · (−1.5) 3 ·
q26 3
q26 12
= −1 .
Soluzione 4. a) Indipendentemente dal valore di z, il terzo dato in ordine crescente
`
e sempre 3, per cui Q2 = 3.
b) In questo caso si ha che
Q2 =
3 se z ≤ 3 x se 3 < z < 4 4 se z ≥ 4
.
Soluzione 5. a) F b) V c) F d) F.
4
Soluzione 6. a) F b) V.
Soluzione 7. a) V b) F c) F d) V.