Statistica Cognome:
Lauree Triennali in Biologia e Biologia Molecolare Nome:
22 settembre 2010 Matricola:
1. Parte A
1.1. Siano {x1, . . . , xn} i redditi (lordi annui) di n individui nel 1998 e {y1, . . . , yn} i redditi degli stessi individui nel 2008. Indichiamo con x e y le rispettive medie campionarie. Se y > x, si pu`o certamente affermare che
tutti gli individui hanno aumentato il loro reddito
almeno met`a degli individui ha aumentato il proprio reddito
almeno un individuo ha aumentato il proprio reddito
al pi`u un individuo ha diminuito il proprio reddito
1.2. Una busta contiene 3 carte: due carte hanno entrambe le facce rosse mentre una carta ha una faccia rossa e una faccia nera. Pesco una carta a caso e la depongo sul tavolo su una faccia a caso. Qual `e la probabilit`a che la faccia superiore sia rossa?
23
34
45
56
1.3. Sia X ∼ P o(3) e poniamo Y := −X. Qual `e la distribuzione di Y ?
P o(−3)
B(9, 1/3)
N (3, 3)
nessuna delle precedenti
1.4. Siano X1 ∼ N (5, 16) e X2 ∼ N (5, 9) variabili aleatorie indipendenti. Quale delle seguenti variabili ha una distribuzione normale standard?
(X1− X2)/5
(X1− X2)/√ 7
(X1− X2)/7
(X1− 5)/4 + (X2− 5)/3
1.5. Dato un campione X1, . . . , Xndi variabili aleatorie normali indipendenti con media nota µ, indichiamone con X e S2 rispettivamente media e varianza campionaria. La variabile aleatoria (X − µ)/(S/√
n) ha distribuzione
binomiale
normale
t di Student
χ2
1.6. Il valore-p di un test d’ipotesi
`e la probabilit`a di commettere errore di prima specie
`e la probabilit`a di commettere errore di seconda specie
pu`o essere un numero negativo
dipende dai dati del campione
1
2
1.7. Si effettua un test per la verifica di una ipotesi nulla H0 e i dati del campione non cadono nella regione critica. Allora
si pu`o aver commesso errore di prima specie
si pu`o aver commesso errore di seconda specie
H0 `e vera
H0 `e falsa
2. Parte B
2.1. Allo scopo di verificare l’efficacia di alcune decisioni di politica sanitaria, vengono analizzati i seguenti dati relativi alla mortalit`a infantile in una certa area geografica. Nel 1990 nacquero 8717 bambini, di cui 141 morirono in et`a infantile. I corrispondenti dati per il 1995 sono di 5673 nati, con 74 morti in et`a infantile. Questi dati sono sufficienti a concludere che vi sia stata una diminuzione della mortalit`a infantile? (Calcolare il valore-p di un opportuno test)
Soluzione. Eseguiamo un test di confronto tra due proporzioni. Sia p1 la probabilit`a che un neonato del 1990 aveva di morire in et`a infantile, e sia p2l’analoga probabilit`a per i nati nel 1995.
Le corrispondenti quantit`a stimate sono ˆp1 = 141/8717 ' 0.01618, e ˆp2 = 74/5673 ' 0.013.
Posto
ˆ
p := 141 + 74
8717 + 5673 ' 0.01494, la statistica test assume il valore
st = pˆ1− ˆp2
p ˆp(1 − ˆp) q 1
8717 +56731
' 1.512965
Scegliendo H0: p1≤ p2 come ipotesi nulla, si trova il valore-p α = 1 − P (Z ≤ st) ' 0.065144.
Ne segue che l’ipotesi H0verrebbe non rifiutata al 5%, ma, ad esempio, rifiutata al 7%. Possiamo dire che i dati, pur propendendo per il rifiuto di H0, cio`e per una diminuzione della mortalit`a infantile, non possono essere considerati conclusivi.
3
2.2. Una ricerca intende verificare se una regolare attivit`a fisica riduca in modo significativo la produzione di HBE, un ormone secreto dalla ghiandola pituitaria in condizioni di stress. Ai dieci partecipanti alla ricerca (dieci individui dediti a vita sedentaria) viene misurato il livello di HBE nel mese di gennaio, e poi nel mese di maggio, dopo quattro mesi di attivit`a fisica regolare.
Questi sono i risultati ottenuti (i livelli di HBE sono in pg/mLi):
Partecipante Gennaio Maggio Differenza
1 42 22 20
2 47 29 18
3 37 9 28
4 9 9 0
5 33 26 7
6 70 36 34
7 54 38 16
8 27 32 -5
9 41 33 8
10 18 14 4
E possibile concludere, a livello di significativit`` a del 5%, che l’attivit`a fisica riduce il livello di HBE? (Si assuma la normalit`a delle distribuzioni delle variabili in gioco.)
Soluzione. Trattandosi di dati appaiati, eseguiamo un test-t per le differenze (denotiamo con w la relativa variabile). Se µ `e la media della distribuzione delle differenze, sottoponiamo a verifica l’ipotesi H0: µ ≤ 0. Tale ipotesi viene rifiutata al 5% di significativit`a se
T = w
s/√
10 > t0.05,9,
dove s `e la deviazione standard campionaria relativa alle differenze w. Si trova: w = 13, s = 12.4.
Pertanto
T = 3.3152 > t0.05,9 = 1.833.
H0viene pertanto rifiutata: possiamo concludere che, a livello di significativit`a del 5%, l’attivit`a fisica riduce il livello di HBE.
4
2.3. In un’azienda viene eseguito un sondaggio per conoscere il parere degli impiegati riguardo ad una particolare politica aziendale. Assumiamo di sapere che gli impiegati realmente favorevoli a tale politica si dichiareranno favorevoli nel sondaggio, mentre il 20% di quelli contrari si dichiareranno ugualmente favorevoli, per timore di ritorsioni.
a) In questo primo quesito supponiamo di sapere che il 75% degli impiegati `e favorevole alla politica dell’azienda, mentre il restante 25% `e contrario. Scegliamo a caso un impiegato:
qual `e la probabilit`a che si dichiari favorevole nel sondaggio?
b) In questo secondo quesito, supponiamo di non sapere quale sia la percentuale di impiegati favorevoli, ma di sapere che l’85% degli impiegati si `e dichiarato favorevole al sondaggio.
Scegliamo a caso un impiegato: qual `e la probabilit`a che sia realmente favorevole alla politica dell’azienda? (Sugg.: usare la stessa formula del punto a): `e semplicemente cambiata l’incognita del problema.)
Soluzione. Si considerino gli eventi: A = “l’impiegato scelto `e favorevole alla politica dell’a- zienda”, B = “l’impiegato scelto si dichiara favorevole alla politica dell’azienda”. Abbiamo:
P (B|A) = 1, P (B|Ac) = 0.2.
a) Si assume che P (A) = 0.75. Pertanto
P (B) = P (B|A)P (A) + P (B|Ac)(1 − P (A)) = 0.75 + 0.2 · 0.25 = 0.8.
b) Ora sappiamo che P (B) = 0.85. Quindi, dalla formula
P (B) = P (B|A)P (A) + P (B|Ac)(1 − P (A)) dobbiamo ricavare P (A):
P (A) = P (B) − P (B|Ac)
P (B|A) − P (B|Ac) = 0.85 − 0.2
1 − 0.2 = 0.8125