Statistica Cognome:
Lauree Triennali in Biologia e Biologia Molecolare Nome:
2 settembre 2010 Matricola:
1. Parte A
1.1. Se {x1, x2, x3} e {y1, y2, y3} sono due campioni di dati tutti negativi, il loro coefficiente di correlazione
`e sicuramente negativo
`e sicuramente positivo
non pu`o essere nullo
pu`o essere positivo
1.2. Due dadi regolari a sei facce sono cos`ı costruiti: il dado A ha due facce rosse e quattro facce blu, mentre il dado B ha tre facce rosse e tre facce blu. Se lancio i due dadi, qual `e la probabilit`a che le facce risultanti abbiano lo stesso colore?
365
13
12
23
1.3. Sia X ∼ B(1, 1/3) e sia Y := 1 − X. Qual `e la distribuzione di Y ?
B(1,23)
B(1,12)
B(1,13)
P o(13)
1.4. Sia X ∼ N (µ, σ2) con µ = 11 e σ2 incognita. La probabilit`a P (X ≥ 11) vale
12
14
Φ(11σ)
zα con α = 11σ
1.5. L’intervallo di confidenza per la media di un campione normale di varianza incognit`a `e funzione di quattro grandezze: la media campionaria x, la deviazione standard σ, l’ampiezza del campione n e il livello di confidenza 1−α. L’ampiezza dell’intervallo di confidenza diminuisce
se cresce σ (a parit`a delle altre grandezze)
se decresce α (a parit`a delle altre grandezze)
se cresce n (a parit`a delle altre grandezze)
se decresce x (a parit`a delle altre grandezze)
1.6. Se in un test χ2 di indipendenza per due variabili il valore-p `e pari a 0.003, che cosa si pu`o concludere?
Le variabili sono indipendenti
Le variabili non sono indipendenti
C’`e forte evidenza che le variabili siano indipendenti
C’`e forte evidenza che le variabili non siano indipendenti
1
2
1.7. In un test per la verifica di una ipotesi H0, la regione critica `e della forma {|T | > 1.2}, dove T indica la statistica usata. Se i dati osservati x1, . . . , xn sono tali che T (x1, . . . , xn) = −0.95, si pu`o concludere che
H0 non `e rifiutata
H0 `e rifiutata
si commette errore di prima specie
si commette errore di seconda specie
2. Parte B
2.1. Il peso corporeo nella popolazione maschile adulta ha distribuzione normale con media 72 Kg e deviazione standard 13.2 Kg, mentre nella popolazione femminile ha distribuzione normale con media 64 Kg e deviazione standard 10.7 kg.
In un ascensore `e esposta la portata dichiarata di 5 persone e 400 Kg.
a) Se nell’ascensore salgono 5 maschi, qual `e la probabilit`a che il loro peso complessivo superi la portata dell’ascensore?
b) E se salgono 4 maschi e una femmina?
(Si assuma che i pesi dei diversi individui siano indipendenti.) Soluzione.
a) Se X1, X2, . . . , X5 ∼ N (72, 13.22) sono indipendenti, il peso complessivo `e X =
5
X
i=1
Xi ∼ N (5 · 72, 5 · 13.22) = N (360, 871.2).
Dunque
P (X > 400) = P X − 360
√871.2 > 400 − 360
√871.2
= P (Z > 1.355) ' 0.088.
b) In questo caso il peso complessivo `e Y =
4
X
i=1
Xi+ Y5,
dove Y5 ∼ N (64, 10.72) `e indipendente dalle altre variabili. Ne segue che Y ∼ N (4 · 72 + 64, 4 · 13.22+ 10.72) = N (352, 811.45).
Perci`o
P (Y > 400) = P Y − 352
√
811.45 > 400 − 352
√ 811.45
= P (Z > 1.685) ' 0.046.
3
2.2. Un istituto di genetica ha condotto una sperimentazione sul metodo YSORT, disegnato per aumentare la probabilit`a di concepire un maschio. 51 bambini sono nati da genitori che hanno usato il metodo YSORT, e di essi 39 sono maschi.
a) Determinare un intervallo di confidenza per la probabilit`a che una coppia che usa il metodo YSORT ha di generare un maschio.
b) Ci sono ragioni sufficienti per concludere, sulla base dei dati, che tale probabilit`a sia maggiore di 0.5? (Formulare un opportuno test e determinarne il valore-p).
Soluzione.
a) Abbiamo ˆp = 3951 ' 0.7647. L’intervallo di confidenza al 99% `e dato da ˆ
p ±
rp(1 − ˆˆ p)
n z0.005 = 0.7647 ±
r0.7647(1 − 0.7647)
51 2.58 = 0.7647 ± 0.1532.
b) Verifichiamo l’ipotesi nulla H0 : p ≤ 12. La statistica test `e data da ST = p − 0.5ˆ
p0.5(1 − 0.5)/n ' 3.78.
Pertanto
valore − p = P (Z > 4.46) ' 0.
Un valore cos`ı piccolo del valore-p porta a concludere che i dati sono fortemente a favore del fatto che la probabilit`a che una coppia che usa il metodo YSORT ha di generare un maschio sia maggiore di 0.5.
4
2.3. I seguenti dati si riferiscono ad uno studio sugli integratori di calcio e dei loro effetti sulla pressione sanguigna. Sono stati studiati un gruppo placebo e un gruppo trattato con integratori, e ne sono state rilevate le pressioni sanguigne.
Placebo 124.6 104.8 96.5 116.3 106.1 128.8 107.2 123.1 118.1 Calcio 129.1 123.4 102.7 118.1 114.7 120.9 104.4 116.3
Ci sono ragioni per ritenere che l’integratore abbia effetti sulla pressione sanguigna? (Eseguire un test al 5%; assumere la normalit`a delle distribuzioni della pressione sanguigna)
Soluzione. Si noti anzitutto che le numerosit`a dei due gruppi, n1 = 9 e n2 = 8 sono piccole.
Utilizziamo un test di confronto di medie per piccoli campioni, con ipotesi nulla H0 : µ1 = µ2. Dai dati troviamo
x1= 113.94 s1= 10.81 x2 = 116.2 s2 = 9.00.
Essendo ss212 2
= 1.442 ∈ (1/2, 2), `e lecito applicare un test per piccoli campioni. Dopo aver calcolato
Sp2= 8s21+ 7s22
15 = 100.23, otteniamo la statistica test
ST = x1− x2 Sp
q1 9 +18
= −0.4636.
La regione critica `e data da |ST | > t15,0.025= 2.1315. Dunque, la statistica test non cade nella regione critica: al livello di significativit`a assegnato, non ci sono ragioni sufficienti per ritenere che l’integratore abbia effetti sulla pressione sanguigna.