Esercizi di Metodi Statistici per la Biologia Francesco Caravenna
Foglio 6. (4–8 giugno 2007)
Esercizio 1. a) Lancio una moneta 100 volte, ottenendo 41 teste. Posso conclud- ere, all’1% di significativit`a, che la moneta `e truccata? Si calcoli il p-value. [Il p-value vale 2(1 − Φ
(0.41 − 0.5) · 2 ·√ 100
= 2(1 − Φ(1.8)) ≈ 0.07, quindi H0 : p = 0.5 `e rifiutata all’1%.]
b) Lancio una moneta 1000 volte, ottenendo 545 teste. Posso concludere, all’1%
di significativit`a, che la moneta `e truccata? Si calcoli il p-value. [Il p-value vale 2(1 − Φ
(0.545 − 0.5) · 2 ·√ 1000
= 2(1 − Φ(2.846)) ≈ 0.004, quindi H0 : p = 0.5 `e rifiutata all’1%.]
c) Si determini l’intervallo di confidenza bilatero per p di livello 99%, e si confronti il risultato ottenuto con la risposta data al punto precedente.
Esercizio 2. Si misura la quantit`a di N O2 presente nell’aria di Padova, facendo 8 rilevazioni in diverse zone della citt`a e ottenendo un valore medio campionario pari a x = 115µg/m3 e una deviazione standard campionaria pari a sx = 17µg/m3. Si misura la stessa sostanza a Milano, facendo 13 rilevazioni e ottenendo un val- ore medio campionario pari a x = 101µg/m3 e una deviazione standard campi- onaria pari a sy = 14µg/m3. Al 5% di significativit`a, si pu`o concludere che il val- ore medio di N O2 presente a Padova sia maggiore di quello presente a Milano?
[Dato che ss2x2
y ∈ (0.5, 2) posso applicare il test nell’ipotesi di varianze uguali. Si ha s2p = 7·(17)2+12·(14)19 2 = 230.2632 per cui t = √ 115−101
230.2632·√
1/8+1/13 = 6.8214 ≈ 2.05. Dato che t19,0.05= 1.73, H0 : µx ≤ µy `e rifiutata al 5%.]
Esercizio 3. Si teme che la somministrazione di un farmaco abbia come effetto indesiderato l’aumento della pressione sanguigna sistolica. Si prendono in consider- azione 6 individui e si misura su ciascuno il valore della pressione sanguigna prima e dopo l’assunzione del farmaco, ottenendo i seguenti valori:
Paziente Prima Dopo
1 134 140
2 132 135
3 130 126
4 118 124
5 127 126
6 142 144
1
2
Si pu`o concludere, al 5% di significativit`a, che il farmaco abbia davvero l’effetto collaterale temuto?
[Le differenze tra i valori della pressione dopo e prima della somministrazione valgono:
6 3 − 4 6 − 1 2 .
Media e varianza di questi dati valgono x = 2 e s2 = 15.6. L’ipotesi nulla H0 : µ ≤ 0 viene rifiutata al 5% se t > t5,0.05. Dato che t = s/x√6 ≈ 1.24 mentre t5,0.05 = 2.015, H0 `e accettata al 5%.]
Esercizio 4. I seguenti dati indicano la risposta di uno strumento a un segnale in ingresso:
Ingresso x Uscita y
6 9.3
10 15.4
12 18.1
18 24.1
20 25.3
a) Si stimino i coefficienti a, b, σ2 del modello di regressione lineare y = a + bx + e con e ∼ N (0, σ2) e si disegni la retta di interpolazione. [x = 13.2, y = 18.44, Sxy =P
ixiyi− 5xy = 149.76, Sxx =P
ix2i− 5x2 = 132.8, Syy =P
iy2i− 5y2 = 171.992, da cui b = Sxy/Sxx ≈ 1.13, a = y − bx ≈ 3.55, SSR = (SxxSyy − Sxy2 )/Sxx ≈ 3.1, SSR/3 ≈ 1.03].
b) Si determini l’intervallo di confidenza per b al 95% e al 99%. [Al 95%: 1.13 ± p1.03/132.8 · 3.18 = 1.13 ± 0.28 → [0.85, 1.41]; all’1%: 1.13 ± p1.03/132.8 · 5.84 = 1.13 ± 0.52 → [0.61, 1.65]]
c) I dati permettono di concludere, al 5% di significativit`a, che vi sia dipendenza tra y e x? E all’1%? [S`ı in entrambi i casi, vedi b)]
d) Ritenete che il modello di regressione lineare si adatti bene ai dati? (Si deter- mini il valore di R2) [R2 = 1 − 3.1/171.992 ≈ 0.98]