Esercizi di Metodi Statistici per la Biologia Francesco Caravenna
Foglio 7. (25–29 febbraio 2008)
Esercizio 1. Si misura la concentrazione nell’aria di una certa sostanza in 50 punti diversi di una citt`a, ottenendo un valore medio x = 6.35 (espresso in opportune unit`a di misura). Si assuma che la concentrazione di questa sostanza segua una distribuzione Normale di media incognita µ e varianza nota σ2 = 3.
b) Si effettui un test all’1% sull’ipotesi H0 : µ ≥ 6.9 e si determini il p-value.
[Rifiuto H0 se z = σ/x−µ√n0 < −z0.01. Dato che z = 1.73/7.076.35−6.9 = −2.25 e −z0.01=
−2.326, H0 `e accettata. p-value: α = Φ(−2.25) ≈ 0.012]
Esercizio 2. Un laboratorio farmaceutico sta elaborando un farmaco che dovrebbe ridurre la frequenza cardiaca a riposo di almeno 4 battiti al minuto. Per testarne l’effetto, viene somministrato il farmaco a un gruppo di 25 volontari. Per ciascun volontario, si misura la diminuzione di frequenza cardiaca: la media e la deviazione standard empirica di tali dati (espressi in battiti al minuto) sono x = 5.3 e s = 4.8.
a) Da questi dati si pu`o inferire che il farmaco abbia avuto l’effetto previsto?
(Effettuare un test al 5%) [H0 : µ ≤ 4; Rifiuto H0 se t = x−µs/√n0 > t0.05,24; dato che t = 1.354 e t0.05,24 = 1.71, H0 `e accettata]
b) Si determini l’intervallo di confidenza unilatero destro al 95% per il valore atteso della diminuzione di frequenza cardiaca. [(x − t0.05√sn, ∞) = (5.3 − 1.714.85 , ∞) = (3.658, ∞)]
Esercizio 3. a) Lancio una moneta 100 volte, ottenendo 41 teste. Posso conclu- dere, all’1% di significativit`a, che la moneta `e truccata? Si calcoli il p-value. [Il p-value vale 2(1 − Φ
(0.41 − 0.5) · 2 ·√ 100
= 2(1 − Φ(1.8)) ≈ 0.07, quindi H0 : p = 0.5 `e accettata all’1%.]
b) Lancio una moneta 1000 volte, ottenendo 545 teste. Posso concludere, all’1%
di significativit`a, che la moneta `e truccata? Si calcoli il p-value. [Il p-value vale 2(1 − Φ
(0.545 − 0.5) · 2 ·√ 1000
= 2(1 − Φ(2.846)) ≈ 0.004, quindi H0 : p = 0.5 `e rifiutata all’1%.]
Esercizio 4. Si misura la quantit`a di N O2 presente nell’aria di Padova, facendo 8 rilevazioni in diverse zone della citt`a e ottenendo un valore medio campionario pari a x = 115µg/m3 e una deviazione standard campionaria pari a sx = 17µg/m3. Si misura la stessa sostanza a Milano, facendo 13 rilevazioni e ottenendo un valore medio campionario pari a x = 101µg/m3 e una deviazione standard campiona- ria pari a sy = 14µg/m3. Al 5% di significativit`a, si pu`o concludere che il valore
1
2
medio di N O2 presente a Padova sia maggiore di quello presente a Milano? [Da- to che ss2x2
y ∈ (0.5, 2) posso applicare il test nell’ipotesi di varianze uguali. Si ha s2p = 7·(17)2+12·(14)19 2 = 230.2632 per cui t = √ 115−101
230.2632·√
1/8+1/13 = 6.8214 ≈ 2.05. Dato che t19,0.05= 1.73, H0 : µx ≤ µy `e rifiutata al 5%.]
Esercizio 5. Si teme che la somministrazione di un farmaco abbia come effetto indesiderato l’aumento della pressione sanguigna sistolica. Si prendono in conside- razione 6 individui e si misura su ciascuno il valore della pressione sanguigna prima e dopo l’assunzione del farmaco, ottenendo i seguenti valori:
Paziente Prima Dopo
1 134 140
2 132 135
3 130 126
4 118 124
5 127 126
6 142 144
Si pu`o concludere, al 5% di significativit`a, che il farmaco abbia davvero l’effetto collaterale temuto?
[Le differenze tra i valori della pressione dopo e prima della somministrazione valgono:
6 3 − 4 6 − 1 2 .
Media e varianza di questi dati valgono x = 2 e s2 = 15.6. L’ipotesi nulla H0 : µ ≤ 0 viene rifiutata al 5% se t > t5,0.05. Dato che t = x
s/√
6 ≈ 1.24 mentre t5,0.05 = 2.015, H0 `e accettata al 5%.]
Esercizio 6. Viene misurato il livello di colesterolo totale in un gruppo di 22 fem- mine che seguono una dieta vegetariana, ottenendo una media campionaria di 188 (mg/100 mL) e una deviazione standard campionaria di 17. `E noto che il livello di colesterolo totale nell’intera popolazione femminile ha media 200 (mg/100 mL).
(a) Questi dato mostrano una differenza significativa nel livello medio di cole- sterolo nel gruppo che segue dieta vegetariana rispetto all’intera popolazione femminile (eseguire un test al 5%)?
[Si esegue un t-test per verificare l’ipotesi H0 : µ = µ0. La statistica vale
|t| = |x−µs/√n0| = |188−20017/√22| = 3.31 > 2.07 = t21,0.025, per cui l’ipotesi H0 `e rifiutata al 5%.]
Vengono quindi esaminati 18 maschi vegetariani, ottenendo una media campionaria di 191 e una deviazione standard campionaria di 19.
(b) Si pu`o concludere che il livello medio di colesterolo dei maschi vegetariani sia maggiore di quello delle femmine vegetariane (eseguire un test al 5%)?
[Si effettua un test per il confronto di medie per campioni indipendenti:
dato che s2f/s2m = 172/192 = 0.8 ∈ (12, 2), si pu`o procedere. La varianza
3
campionaria combinata vale s2p = (nf−1)s
2
f+(nm−1)s2m
nf+nm−2 = 321.21 e la statistica vale t = xf−xm
sp
√1/nf+1/nm
= √ 188−191
321.21√
1/21+1/18 = −0.52 > −1.68 = t38,0.05, quindi l’ipotesi H0 : µf > µm `e accettata al 5%.]
Esercizio 7. In un test per la verifica di una determinata ipotesi H0, i dati del campione portano a rifiutare H0 al 5% di significativit`a. Indicando con α il p-value, si pu`o certamente concludere che
α > 0.05;
α < 0.05;
α = 0.05;
nessuna delle precedenti.
Esercizio 8. L’ampiezza dell’intervallo di confidenza per la media di un campione normale con varianza nota
dipende dal valore dei dati, oltre che dalla taglia n del campione;
dipende dalla taglia n del campione, ma non dal valore dei dati;
ha distribuzione normale;
ha distribuzione t di Student.
Esercizio 9. Sia ∆ l’ampiezza dell’intervallo di confidenza per la media di un cam- pione normale di n dati con varianza nota σ2. Impiegando un campione di 4n dati, tenendo immutati il livello di confidenza e σ2, la nuova ampiezza dell’intervallo di confidenza vale
4∆;
∆4;
∆2;
bisogna conoscere il valore di σ2 per poterlo dire.