• Non ci sono risultati.

Esercizi di Metodi Statistici per la Biologia Francesco Caravenna

N/A
N/A
Protected

Academic year: 2021

Condividi "Esercizi di Metodi Statistici per la Biologia Francesco Caravenna"

Copied!
2
0
0

Testo completo

(1)

Esercizi di Metodi Statistici per la Biologia Francesco Caravenna

Foglio 6. (4–8 giugno 2007)

Esercizio 1. a) Lancio una moneta 100 volte, ottenendo 41 teste. Posso conclud- ere, all’1% di significativit`a, che la moneta `e truccata? Si calcoli il p-value. [Il p-value vale 2(1 − Φ

(0.41 − 0.5) · 2 ·√ 100

 = 2(1 − Φ(1.8)) ≈ 0.07, quindi H0 : p = 0.5 `e rifiutata all’1%.]

b) Lancio una moneta 1000 volte, ottenendo 545 teste. Posso concludere, all’1%

di significativit`a, che la moneta `e truccata? Si calcoli il p-value. [Il p-value vale 2(1 − Φ

(0.545 − 0.5) · 2 ·√ 1000

 = 2(1 − Φ(2.846)) ≈ 0.004, quindi H0 : p = 0.5 `e rifiutata all’1%.]

c) Si determini l’intervallo di confidenza bilatero per p di livello 99%, e si confronti il risultato ottenuto con la risposta data al punto precedente.

Esercizio 2. Si misura la quantit`a di N O2 presente nell’aria di Padova, facendo 8 rilevazioni in diverse zone della citt`a e ottenendo un valore medio campionario pari a x = 115µg/m3 e una deviazione standard campionaria pari a sx = 17µg/m3. Si misura la stessa sostanza a Milano, facendo 13 rilevazioni e ottenendo un val- ore medio campionario pari a x = 101µg/m3 e una deviazione standard campi- onaria pari a sy = 14µg/m3. Al 5% di significativit`a, si pu`o concludere che il val- ore medio di N O2 presente a Padova sia maggiore di quello presente a Milano?

[Dato che ss2x2

y ∈ (0.5, 2) posso applicare il test nell’ipotesi di varianze uguali. Si ha s2p = 7·(17)2+12·(14)19 2 = 230.2632 per cui t = 115−101

230.2632·

1/8+1/13 = 6.8214 ≈ 2.05. Dato che t19,0.05= 1.73, H0 : µx ≤ µy `e rifiutata al 5%.]

Esercizio 3. Si teme che la somministrazione di un farmaco abbia come effetto indesiderato l’aumento della pressione sanguigna sistolica. Si prendono in consider- azione 6 individui e si misura su ciascuno il valore della pressione sanguigna prima e dopo l’assunzione del farmaco, ottenendo i seguenti valori:

Paziente Prima Dopo

1 134 140

2 132 135

3 130 126

4 118 124

5 127 126

6 142 144

1

(2)

2

Si pu`o concludere, al 5% di significativit`a, che il farmaco abbia davvero l’effetto collaterale temuto?

[Le differenze tra i valori della pressione dopo e prima della somministrazione valgono:

6 3 − 4 6 − 1 2 .

Media e varianza di questi dati valgono x = 2 e s2 = 15.6. L’ipotesi nulla H0 : µ ≤ 0 viene rifiutata al 5% se t > t5,0.05. Dato che t = s/x6 ≈ 1.24 mentre t5,0.05 = 2.015, H0 `e accettata al 5%.]

Esercizio 4. I seguenti dati indicano la risposta di uno strumento a un segnale in ingresso:

Ingresso x Uscita y

6 9.3

10 15.4

12 18.1

18 24.1

20 25.3

a) Si stimino i coefficienti a, b, σ2 del modello di regressione lineare y = a + bx + e con e ∼ N (0, σ2) e si disegni la retta di interpolazione. [x = 13.2, y = 18.44, Sxy =P

ixiyi− 5xy = 149.76, Sxx =P

ix2i− 5x2 = 132.8, Syy =P

iy2i− 5y2 = 171.992, da cui b = Sxy/Sxx ≈ 1.13, a = y − bx ≈ 3.55, SSR = (SxxSyy − Sxy2 )/Sxx ≈ 3.1, SSR/3 ≈ 1.03].

b) Si determini l’intervallo di confidenza per b al 95% e al 99%. [Al 95%: 1.13 ± p1.03/132.8 · 3.18 = 1.13 ± 0.28 → [0.85, 1.41]; all’1%: 1.13 ± p1.03/132.8 · 5.84 = 1.13 ± 0.52 → [0.61, 1.65]]

c) I dati permettono di concludere, al 5% di significativit`a, che vi sia dipendenza tra y e x? E all’1%? [S`ı in entrambi i casi, vedi b)]

d) Ritenete che il modello di regressione lineare si adatti bene ai dati? (Si deter- mini il valore di R2) [R2 = 1 − 3.1/171.992 ≈ 0.98]

Riferimenti

Documenti correlati

L’ampiezza dell’intervallo di confidenza per la media di un campione normale con varianza nota.  dipende dal valore dei dati, oltre che dalla taglia n

con distribuzione Po(λ). Il numero di vittime per incidenti stradali in un giorno in Italia può essere descritto con una variabile di Poisson di media 13.. Si misura un campione di

Calcolo delle probabilità per variabili normali non standard: procedura di standardizzazione..

Si sa che nei libri prodotti da una certa casa editrice ciascuna pagina può contenere refusi con probabilità 20 1 , indipendentemente dalle altre pagine.. Si sa che i libri prodotti

a) Si dimostri che gli eventi A := “il primo dado dà come risultato 2” e B := “la somma dei due dadi vale 7” sono indipendenti.. b) Si dimostri che gli eventi A := “il primo

Un mio amico ha acquistato quel modello di auto, e ha fatto 20000 Km senza che alcuna manutenzione straordinaria sia stata necessaria. Sulla base di questa informazione calcolare

Si misura la concentrazione nell’aria di una certa sostanza in 50 punti diversi di una citt` a, ottenendo un valore medio x = 6.35 (espresso in opportune unit` a di misura).

Il numero di telefonate giornaliere effettuate a Padova in cui il numero di telefono viene composto in modo errato si pu` o descrivere con una variabile di Poisson di media 17.5.. `