• Non ci sono risultati.

Esercizi di Metodi Statistici per la Biologia Francesco Caravenna

N/A
N/A
Protected

Academic year: 2021

Condividi "Esercizi di Metodi Statistici per la Biologia Francesco Caravenna"

Copied!
3
0
0

Testo completo

(1)

Esercizi di Metodi Statistici per la Biologia Francesco Caravenna

Foglio 7. (25–29 febbraio 2008)

Esercizio 1. Si misura la concentrazione nell’aria di una certa sostanza in 50 punti diversi di una citt`a, ottenendo un valore medio x = 6.35 (espresso in opportune unit`a di misura). Si assuma che la concentrazione di questa sostanza segua una distribuzione Normale di media incognita µ e varianza nota σ2 = 3.

b) Si effettui un test all’1% sull’ipotesi H0 : µ ≥ 6.9 e si determini il p-value.

[Rifiuto H0 se z = σ/x−µn0 < −z0.01. Dato che z = 1.73/7.076.35−6.9 = −2.25 e −z0.01=

−2.326, H0 `e accettata. p-value: α = Φ(−2.25) ≈ 0.012]

Esercizio 2. Un laboratorio farmaceutico sta elaborando un farmaco che dovrebbe ridurre la frequenza cardiaca a riposo di almeno 4 battiti al minuto. Per testarne l’effetto, viene somministrato il farmaco a un gruppo di 25 volontari. Per ciascun volontario, si misura la diminuzione di frequenza cardiaca: la media e la deviazione standard empirica di tali dati (espressi in battiti al minuto) sono x = 5.3 e s = 4.8.

a) Da questi dati si pu`o inferire che il farmaco abbia avuto l’effetto previsto?

(Effettuare un test al 5%) [H0 : µ ≤ 4; Rifiuto H0 se t = x−µs/n0 > t0.05,24; dato che t = 1.354 e t0.05,24 = 1.71, H0 `e accettata]

b) Si determini l’intervallo di confidenza unilatero destro al 95% per il valore atteso della diminuzione di frequenza cardiaca. [(x − t0.05sn, ∞) = (5.3 − 1.714.85 , ∞) = (3.658, ∞)]

Esercizio 3. a) Lancio una moneta 100 volte, ottenendo 41 teste. Posso conclu- dere, all’1% di significativit`a, che la moneta `e truccata? Si calcoli il p-value. [Il p-value vale 2(1 − Φ

(0.41 − 0.5) · 2 ·√ 100

 = 2(1 − Φ(1.8)) ≈ 0.07, quindi H0 : p = 0.5 `e accettata all’1%.]

b) Lancio una moneta 1000 volte, ottenendo 545 teste. Posso concludere, all’1%

di significativit`a, che la moneta `e truccata? Si calcoli il p-value. [Il p-value vale 2(1 − Φ

(0.545 − 0.5) · 2 ·√ 1000

 = 2(1 − Φ(2.846)) ≈ 0.004, quindi H0 : p = 0.5 `e rifiutata all’1%.]

Esercizio 4. Si misura la quantit`a di N O2 presente nell’aria di Padova, facendo 8 rilevazioni in diverse zone della citt`a e ottenendo un valore medio campionario pari a x = 115µg/m3 e una deviazione standard campionaria pari a sx = 17µg/m3. Si misura la stessa sostanza a Milano, facendo 13 rilevazioni e ottenendo un valore medio campionario pari a x = 101µg/m3 e una deviazione standard campiona- ria pari a sy = 14µg/m3. Al 5% di significativit`a, si pu`o concludere che il valore

1

(2)

2

medio di N O2 presente a Padova sia maggiore di quello presente a Milano? [Da- to che ss2x2

y ∈ (0.5, 2) posso applicare il test nell’ipotesi di varianze uguali. Si ha s2p = 7·(17)2+12·(14)19 2 = 230.2632 per cui t = 115−101

230.2632·

1/8+1/13 = 6.8214 ≈ 2.05. Dato che t19,0.05= 1.73, H0 : µx ≤ µy `e rifiutata al 5%.]

Esercizio 5. Si teme che la somministrazione di un farmaco abbia come effetto indesiderato l’aumento della pressione sanguigna sistolica. Si prendono in conside- razione 6 individui e si misura su ciascuno il valore della pressione sanguigna prima e dopo l’assunzione del farmaco, ottenendo i seguenti valori:

Paziente Prima Dopo

1 134 140

2 132 135

3 130 126

4 118 124

5 127 126

6 142 144

Si pu`o concludere, al 5% di significativit`a, che il farmaco abbia davvero l’effetto collaterale temuto?

[Le differenze tra i valori della pressione dopo e prima della somministrazione valgono:

6 3 − 4 6 − 1 2 .

Media e varianza di questi dati valgono x = 2 e s2 = 15.6. L’ipotesi nulla H0 : µ ≤ 0 viene rifiutata al 5% se t > t5,0.05. Dato che t = x

s/

6 ≈ 1.24 mentre t5,0.05 = 2.015, H0 `e accettata al 5%.]

Esercizio 6. Viene misurato il livello di colesterolo totale in un gruppo di 22 fem- mine che seguono una dieta vegetariana, ottenendo una media campionaria di 188 (mg/100 mL) e una deviazione standard campionaria di 17. `E noto che il livello di colesterolo totale nell’intera popolazione femminile ha media 200 (mg/100 mL).

(a) Questi dato mostrano una differenza significativa nel livello medio di cole- sterolo nel gruppo che segue dieta vegetariana rispetto all’intera popolazione femminile (eseguire un test al 5%)?

[Si esegue un t-test per verificare l’ipotesi H0 : µ = µ0. La statistica vale

|t| = |x−µs/n0| = |188−20017/22| = 3.31 > 2.07 = t21,0.025, per cui l’ipotesi H0 `e rifiutata al 5%.]

Vengono quindi esaminati 18 maschi vegetariani, ottenendo una media campionaria di 191 e una deviazione standard campionaria di 19.

(b) Si pu`o concludere che il livello medio di colesterolo dei maschi vegetariani sia maggiore di quello delle femmine vegetariane (eseguire un test al 5%)?

[Si effettua un test per il confronto di medie per campioni indipendenti:

dato che s2f/s2m = 172/192 = 0.8 ∈ (12, 2), si pu`o procedere. La varianza

(3)

3

campionaria combinata vale s2p = (nf−1)s

2

f+(nm−1)s2m

nf+nm−2 = 321.21 e la statistica vale t = xf−xm

sp

1/nf+1/nm

= 188−191

321.21

1/21+1/18 = −0.52 > −1.68 = t38,0.05, quindi l’ipotesi H0 : µf > µm `e accettata al 5%.]

Esercizio 7. In un test per la verifica di una determinata ipotesi H0, i dati del campione portano a rifiutare H0 al 5% di significativit`a. Indicando con α il p-value, si pu`o certamente concludere che

 α > 0.05;

 α < 0.05;

 α = 0.05;

 nessuna delle precedenti.

Esercizio 8. L’ampiezza dell’intervallo di confidenza per la media di un campione normale con varianza nota

 dipende dal valore dei dati, oltre che dalla taglia n del campione;

 dipende dalla taglia n del campione, ma non dal valore dei dati;

 ha distribuzione normale;

 ha distribuzione t di Student.

Esercizio 9. Sia ∆ l’ampiezza dell’intervallo di confidenza per la media di un cam- pione normale di n dati con varianza nota σ2. Impiegando un campione di 4n dati, tenendo immutati il livello di confidenza e σ2, la nuova ampiezza dell’intervallo di confidenza vale

 4∆;

 4;

 2;

 bisogna conoscere il valore di σ2 per poterlo dire.

Riferimenti

Documenti correlati

L’ampiezza dell’intervallo di confidenza per la media di un campione normale con varianza nota.  dipende dal valore dei dati, oltre che dalla taglia n

con distribuzione Po(λ). Il numero di vittime per incidenti stradali in un giorno in Italia può essere descritto con una variabile di Poisson di media 13.. Si misura un campione di

Calcolo delle probabilità per variabili normali non standard: procedura di standardizzazione..

Si sa che nei libri prodotti da una certa casa editrice ciascuna pagina può contenere refusi con probabilità 20 1 , indipendentemente dalle altre pagine.. Si sa che i libri prodotti

a) Si dimostri che gli eventi A := “il primo dado dà come risultato 2” e B := “la somma dei due dadi vale 7” sono indipendenti.. b) Si dimostri che gli eventi A := “il primo

Un mio amico ha acquistato quel modello di auto, e ha fatto 20000 Km senza che alcuna manutenzione straordinaria sia stata necessaria. Sulla base di questa informazione calcolare

Il numero di telefonate giornaliere effettuate a Padova in cui il numero di telefono viene composto in modo errato si pu` o descrivere con una variabile di Poisson di media 17.5.. `

Si sa che i libri prodotti da una certa casa editrice contengono in media 5 pagine con refusi.. In una fabbrica di circuiti stampati vengono prodotti 10000 pezzi