Esercizi di Metodi Statistici per la Biologia Francesco Caravenna
Foglio 1. (14–18 gennaio 2008)
Esercizio 1. Si considerino i seguenti dati relativi agli incidenti aerei per voli com- merciali avvenuti negli USA nel periodo 1991-95:
Anno x = numero di incidenti y = numero di vittime
91 4 62
92 4 33
93 1 1
94 4 239
95 2 166
Per il campione x si determinino media, mediana, quartili, varianza, deviazione stan- dard, differenza interquartile e si disegni il box plot. Infine si determini il coefficiente di correlazione tra i campioni x e y.
Esercizio 2. Si determinini il coefficiente di correlazione per il seguente campione di dati:
x y
0 2
1 1.5 5 -0.5 6 -1
Esercizio 3. Si considerino i seguenti dati: 1, 3, 3, 8, z (il valore di z `e incognito).
a) Al variare di z ∈ R, quali valori pu`o assumere la mediana Q2?
b) Se invece i dati fossero 1, 3, 4, 8, z, quali valori potrebbe assumere Q2?
Esercizio 4. Un campione di dati x1, . . . , xn `e tale che x = 0. Quali delle seguenti affermazioni sono sicuramente vere?
a) Esiste almeno un dato xi tale che xi > 0.
b) Esiste almeno un dato xi tale che xi ≥ 0.
c) Q2 = 0.
d) Q1 ≤ 0.
Esercizio 5. Un campione di dati x1, . . . , xn `e tale che s2x = 0. Quali delle seguenti affermazioni sono sicuramente vere?
1
2
a) x = 0.
b) Q1 = Q2.
Esercizio 6. Un campione di dati x1, . . . , xn `e tale che Q1 = Q3 = 2.5. Quali delle seguenti affermazioni sono sicuramente vere?
a) Q2 = 2.5.
b) x = 2.5.
c) Tutti i dati sono uguali a 2.5.
d) I dati che valgono 2.5 sono pi`u del 40%.
Esercizio 7. In una classe di 18 individui viene misurata la temperatura corporea con un termometro di precisione (fondoscala 0.01◦C). Le temperature rilevate, orga- nizzate in ordine crescente, risultano:
36.24 36.27 36.40 36.62 36.72 36.77 36.78 36.81 36.91 36.94 37.14 37.17 37.18 37.20 37.23 37.33 37.35 37.68 .
Si suddividano i dati in opportune classi e si disegni l’istogramma delle frequenze.
Soluzione 1. Per la variabile x si ha:
• x = 4+4+1+4+25 = 155 = 3.
• Q1 = 2, Q2 = 4, Q3 = 4.
• s2x = 12+12+(−2)42+12+(−1)2 = 2.
• sx =ps2x =√
2 ' 1.41
• Q3− Q1 = 2 Il relativo box-plot `e:
1.01.52.02.53.03.54.0
Per la variabile y si ha:
• y = 62+33+1+239+166
5 = 5015 = 100.2.
3
• s2y = (−38.2)2+(−67.2)2+(−99.2)4 2+(138.8)2+(65.8)2 = 9852.7.
• sy =√
9852.7 ' 99.26
Quindi il coefficiente di correlazione vale r =
1 n−1
Pn
i=1(xi− x)(yi− y)
sx· sy =
1
4(−38.2 − 67.2 + 2 · 99.2 + 138.8 − 65.8)
1.41 · 99.26 ' 0.30.
Dunque x e y non manifestano una correlazione significativa.
Soluzione 2. Una risposta veloce si ha notando che i dati giacciono lungo la retta y = −x/2 + 2, per cui si ha r = −1 (il coefficiente angolare della retta `e negativo).
Altrimenti si pu`o procedere col calcolo diretto:
• x = 0+1+5+64 = 124 = 3
• y = 2+1.5−0.5−1
4 = 24 = 0.5
• s2x = (−3)2+(−2)3 2+22+32 = 263
• s2y = (1.5)2+12+(−1)3 2+(−1.5)2 = 2612 da cui
r = −3 · 1.5 + (−2) + 2 · (−1) + 3 · (−1.5) 3 ·
q26 3
q26 12
= −1 .
Soluzione 3. a) Indipendentemente dal valore di z, il terzo dato in ordine crescente
`
e sempre 3, per cui Q2 = 3.
b) In questo caso si ha che
Q2 =
3 se z ≤ 3 x se 3 < z < 4 4 se z ≥ 4
.
Soluzione 4. a) F b) V c) F d) F.
Soluzione 5. a) F b) V.
Soluzione 6. a) V b) F c) F d) V.
Soluzione 7. Scegliendo le classi di ampiezza 0.25◦C, a partire da 36◦C, si ottiene la tabella seguente:
4
Classe Frequenza assoluta
[36, 36.25) 1
[36.25, 36.5) 2 [36.5, 36.75) 2
[36.75, 37) 5
[37, 37.25) 5
[37.25, 37.5) 2 [37.5, 37.75) 1 Il relativo istogramma `e:
36.0 36.5 37.0 37.5 38.0
012345