Esercizi di Statistica ∼ Laurea in Biologia Molecolare Francesco Caravenna
Foglio 6. (17–21 maggio 2010)
Lezione del 19 maggio 2010
Errata corrige (libro di Ross):
• pag. 279 (§7.4) ultima riga: sostituire “σ/√
n” con “σ√ n”.
• pag. 358 (§9.2) sesta riga: cancellare “Questo è vero se”; la frase comincia dunque con “Chiaramente, un valore così alto . . . ”
• pag. 361 (§9.3) terzultima riga: sostituire “maggiore o uguale ad α” con “minore o uguale ad α”.
Teoria: Verifica delle ipotesi statistiche. Ipotesi statistica, ipotesi nulla, regione critica, livello di significatività. Esempi. [Ross, §9.1, §9.2].
Test per la media di un campione normale con varianza nota: ipotesi nulla bilatera, ipotesi nulla unilatera. Esempi. p-value del test. [Ross, §9.3, §9.3.1]
Esercitazione del 20 maggio 2010
Teoria: Richiami su test e p-value con esempi. Test per la media di un campione normale con varianza ignota [Ross, §9.4]. Test per la media di una proporzione, p-value [Ross, §9.5 + integrazioni].
Esercizio 1. Si misura la concentrazione nell’aria di una certa sostanza in 50 punti diversi di una città, ottenendo un valore medio x = 6.35 (espresso in opportune unità di misura). Si assuma che la concentrazione di questa sostanza segua una distribuzione Normale di media incognita µ e varianza nota σ2 = 3.
a) Si effettui un test al 5% e all’1% sull’ipotesi H0 : µ = 6.9, e di determini il p-value.
[Test al 5%: rifiuto H0 se |z| = |σ/x−µ√n0| > z0.025. Dato che |z| = |1.73/7.076.35−6.9| = 2.25 e z0.025= 1.96, H0 è rifiutata. Test all’1%: dato che z0.005= 2.576, H0 è accettata.
p-value: 1 − α/2 = Φ(2.25) ≈ 0.988 da cui α = 0.024]
b) Si effettui un test all’1% sull’ipotesi H0 : µ ≥ 6.9 e si determini il p-value. [Rifiuto H0 se z = σ/x−µ√n0 < −z0.01. Dato che z = 1.73/7.076.35−6.9 = −2.25 e −z0.01= −2.326, H0 è accettata. p-value: α = Φ(−2.25) ≈ 0.012]
Esercizio 2. Un laboratorio farmaceutico sta elaborando un farmaco che dovrebbe ridurre la frequenza cardiaca a riposo di almeno 4 battiti al minuto. Per testarne l’effetto, viene somministrato il farmaco a un gruppo di 25 volontari. Per ciascun volontario, si misura la diminuzione di frequenza cardiaca: la media e la deviazione standard empirica di tali dati (espressi in battiti al minuto) sono x = 5.3 e s = 4.8.
1
2
a) Da questi dati si può inferire che il farmaco abbia avuto l’effetto previsto?
(Effettuare un test al 5%) [H0 : µ ≤ 4; Rifiuto H0 se t = x−µs/√n0 > t0.05,24; dato che t = 1.354 e t0.05,24 = 1.71, H0 è accettata]
b) (esercizio per casa) Si testi l’ipotesi H0 : µ = 4 al 5% di significatività. [H0 : µ = 4; Rifiuto H0 se |t| = |x−µs/√n0| > |t0.025,24|; dato che t = 1.354 e t0.025,24 = 2.06, H0 è accettata]
c) (esercizio per casa) Si determini l’intervallo di confidenza al 95% per il valore atteso della diminuzione di frequenza cardiaca. [x ± t0.025,24√s
n = 5.3 ± 2.064.85 → (3.32, 7.28); si noti che questo intervallo contiene il valore 4.]
Esercizio 3. Lancio una moneta 100 volte, ottenendo 41 teste. Posso concludere, all’1% di significatività, che la moneta è truccata? Si calcoli il p-value. [Il p-value vale 2(1 − Φ
(0.41 − 0.5) · 2 ·√ 100
= 2(1 − Φ(1.8)) ≈ 0.07, quindi H0 : p = 0.5 è accettata all’1%.]
Lezione del 21 maggio 2010
Esercizio 4. Lancio una moneta 1000 volte, ottenendo 545 teste. Posso concludere che la moneta è truccata? Si calcoli il p-value. [Il p-value vale 2(1 − Φ
(0.545 − 0.5) · 2 ·√
1000
= 2(1 − Φ(2.846)) ≈ 0.004, quindi H0 : p = 0.5 è rifiutata a qualunque livello di significatività superiore a 0.4%. Ciò significa che i dati mostrano un forte contrasto con H0.]
Teoria: Verifica di ipotesi sulla media di due popolazioni normali indipendenti : il caso di varianze note [Ross, §10.2], il caso di varianze ignote con campioni numerosi [Ross, §10.3], il caso di varianze ignote ma uguali con campioni poco numerosi [Ross,
§10.4]. Test sulla media di due campioni accoppiati (dati appaiati) [Ross, §10.5].
Esercizio 5. Un’elevata concentrazione di zinco nell’acqua da bere, oltre ad alterarne il sapore, può provocare problemi di salute. Per migliorare le modalità di raccolta dell’acqua, si vuole stabilire se vi sia una differenza significativa nella concentrazione di zinco tra la superficie ed il fondo di un certo corso d’acqua. In 6 punti distinti viene misurata la concentrazione di zinco (in mg/`) al fondo e alla superficie, ottenendo i seguenti risultati:
fondo superficie 0.430 0.415 0.266 0.238 0.567 0.390 0.531 0.410 0.707 0.605 0.716 0.609
3
Che conclusioni si possono trarre da questi dati?
[Detta µd la differenza media tra la concentrazione al fondo e quella in superficie, testiamo l’ipotesi H0 : µd≤ 0 al 5% di significatività. Indichiamo con di le differenze delle concentrazioni al fondo e alla superficie fornite nel problema: d1 = 0.430−0.415 = 0.015, . . . , d6 = 0.716 − 0.609 = 0.107. Effettuiamo un test per la media di un campione normale con varianza incognita. Si ha d = 0.0917, sd = 0.0607 per cui ν =
√n sdd =
√6
0.06070.0917 ≈ 3.7. Dato che t0.05,5 = 2.015, si ha ν > t0.05,5 e dunque H0 è rifiutata: c’è una forte evidenza che la concentrazione di zinco sul fondo sia maggiore di quella in superficie.]