• Non ci sono risultati.

Esercizi di Statistica ∼ Laurea in Biologia Molecolare Francesco Caravenna

N/A
N/A
Protected

Academic year: 2021

Condividi "Esercizi di Statistica ∼ Laurea in Biologia Molecolare Francesco Caravenna"

Copied!
5
0
0

Testo completo

(1)

Francesco Caravenna

Foglio 1. (12–16 aprile 2010) Esercitazione del 14 aprile 2010

Esercizio 1. Si considerino i seguenti dati relativi agli incidenti aerei per voli com- merciali avvenuti negli USA nel periodo 1991-95:

Anno x = numero di incidenti y = numero di vittime

91 4 62

92 4 33

93 1 1

94 4 239

95 2 166

a) Per il campione x si determinino media, mediana, quartili, varianza, deviazione standard, differenza interquartile e si disegni il box plot.

b) Si determini il coefficiente di correlazione tra i campioni x e y.

c) Si scriva la tabella delle frequenze relativa al campione x e si ricalcoli la media usando la tabella.

Esercizio 2. Si considerino il seguente campione di dati: 1, 3, 3, 8, z (il valore di z

`

e incognito).

a) Si esprimano media e mediana del campione in funzione di z ∈ R.

b) Si esprima la mediana del campione 1, 3, 4, 8, z in funzione di z ∈ R.

Esercizio 3. Un campione di dati x1, . . . , xn `e tale che x = 0. Quali delle seguenti affermazioni sono sicuramente vere?

a) Esiste almeno un dato xi tale che xi > 0.

b) Esiste almeno un dato xi tale che xi ≥ 0.

c) Q2 = 0.

d) Q1 ≤ 0.

Esercizio 4. In una classe di 18 individui viene misurata la temperatura corpo- rea con un termometro di precisione (fondoscala 0.01C). Le temperature rilevate, organizzate in ordine crescente, risultano:

36.24 36.27 36.40 36.62 36.72 36.77 36.78 36.81 36.91 36.94 37.14 37.17 37.18 37.20 37.23 37.33 37.35 37.68 .

Si suddividano i dati in opportune classi e si disegni l’istogramma delle frequenze.

1

(2)

Esercitazione del 16 aprile 2010

Esercizio 5. Si determinini il coefficiente di correlazione per il seguente campione:

x y

0 2

1 1.5 5 -0.5 6 -1

Esercizio 6. Si disegni il box plot per il campione 1, 7, 0, 7, 9, 5.

Esercizio 7. Un campione di dati x1, . . . , xn `e tale che s2x = 0. Quali delle seguenti affermazioni sono sicuramente vere?

a) x = 0.

b) Q1 = Q2.

Esercizio 8. Un campione di dati x1, . . . , xn `e tale che Q1 = Q3 = 2.5. Quali delle seguenti affermazioni sono sicuramente vere?

a) Q2 = 2.5.

b) x = 2.5.

c) Tutti i dati sono uguali a 2.5.

Esercizio 9. Una coppia ha due figli(e). Assumiamo che il sesso dei due figli possa essere descritto dallo spazio campionario S = {(M M ), (M F ), (F M ), (F F )} (dove (ab) indica che il primogenito `e di sesso a e il secondogenito di sesso b) munito della probabilit`a uniforme, cio`e P (M M ) = P (M F ) = P (F M ) = P (F F ) = 14.

a) Qual `e la probabilit`a che il primogenito sia maschio?

b) Qual `e la probabilit`a che entrambi i figli siano maschi?

c) Se sappiamo che il primogenito `e maschio, qual `e la probabilit`a che entrambi i figli siano maschi?

d) Se sappiamo che il secondogenito `e maschio, qual `e la probabilit`a che entrambi i figli siano maschi?

e) Se sappiamo che almeno un figlio `e maschio, qual `e la probabilit`a che entrambi i figli siano maschi?

Esercizio 10 (Paradosso di Monty Hall). Vi propongo di scegliere tra tre buste chiuse, una delle quali contiene un premio mentre le altre due sono vuote. Una volta effettuata la scelta, io guardo di nascosto il contenuto delle due buste rimaste e ve ne mostro una vuota (tra le mie due buste ce n’`e almeno una vuota, dunque lo posso sempre fare). A questo punto vi propongo di cambiare la busta che avete scelto con quella che mi `e rimasta in mano. Vi conviene cambiare?

(3)

Soluzione 1. a) Per la variabile x si ha:

• x = 4+4+1+4+25 = 155 = 3.

• Q1 = 2, Q2 = 4, Q3 = 4.

• s2x =

Pn

i=1(xi−x)2

n−1 = 12+12+(−2)42+12+(−1)2 = 2.

• sx =ps2x =√

2 ' 1.41

• Q3− Q1 = 2

Il relativo box-plot `e mostrato in figura.

1.0 1.5 2.0 2.5 3.0 3.5 4.0

b) Per la variabile y si ha:

• y = 62+33+1+239+166

5 = 5015 = 100.2.

• s2y =

Pn

i=1(yi−y)2

n−1 = (−38.2)2+(−67.2)2+(−99.2)4 2+(138.8)2+(65.8)2 = 9852.7.

• sy =√

9852.7 ' 99.26

Quindi il coefficiente di correlazione vale r =

1 n−1

Pn

i=1(xi− x)(yi− y) sx· sy

=

1

4(−38.2 − 67.2 + 2 · 99.2 + 138.8 − 65.8)

1.41 · 99.26 ' 0.30.

Dunque x e y non manifestano una correlazione significativa.

c) La tabella delle frequenze per il campione x `e data da Valori di x Frequenza assoluta

1 1

2 1

4 3

La media `e data dunque da x = y1f1f+y2f2+y3f3

1+f2+f3 = 1·1+2·1+4·3

1+1+3 = 155 = 3.

(4)

Soluzione 2. a) Indipendentemente dal valore di z, il terzo dato in ordine crescente

`

e sempre 3, per cui Q2 = 3.

b) In questo caso si ha che

Q2 =





3 se z ≤ 3 x se 3 < z < 4 4 se z ≥ 4

.

Soluzione 3. a) F b) V c) F d) F.

Soluzione 4. Scegliendo le classi di ampiezza 0.25C, a partire da 36C, si ottiene la tabella seguente:

Classe Frequenza assoluta

[36, 36.25) 1

[36.25, 36.5) 2 [36.5, 36.75) 2

[36.75, 37) 5

[37, 37.25) 5

[37.25, 37.5) 2 [37.5, 37.75) 1 Il relativo istogramma `e mostrato in figura.

36.0 36.5 37.0 37.5 38.0

012345

(5)

Soluzione 5. Una risposta veloce si ha notando che i dati giacciono lungo la retta y = −x/2 + 2, per cui si ha r = −1 (il coefficiente angolare della retta `e negativo).

Altrimenti si pu`o procedere col calcolo diretto:

• x = 0+1+5+64 = 124 = 3

• y = 2+1.5−0.5−1

4 = 24 = 0.5

• s2x = (

Pn

i=1x2i)−n x2

n−1 = 02+12+523+62−4·32 = 263

• s2y = (

Pn

i=1yi2)−n y2

n−1 = 22+1.52+(−0.5)32+(−1)2−4·0.52 = 2612 da cui

r = (Pn

i=1xi, yi) − n x y

(n − 1) sxsy = 0 · 2 + 1 · 1.5 + 5 · (−5) + 6 · (−1) − 4 · 3 · 0.5 3 ·

q26 3

q26 12

= −1 .

Soluzione 6. Mettendo i dati in ordine crescente: 0, 1, 5, 7, 7, 9 si ricava facilmente che Q1 = 1, Q2 = 5+72 = 6, Q3 = 7. Il relativo boxplot `e illustrato in figura.

0 2 4 6 8

Soluzione 7. a) F b) V.

Soluzione 8. a) V b) F c) F.

Soluzione 9. a) 12 b) 14 c) 12 d) 12 e) 13.

Soluzione 10. S`ı, la probabilit`a di vincere il premio passa da 13 a 23.

Riferimenti

Documenti correlati

L’ampiezza dell’intervallo di confidenza per la media di un campione normale con varianza nota.  dipende dal valore dei dati, oltre che dalla taglia n

con distribuzione Po(λ). Il numero di vittime per incidenti stradali in un giorno in Italia può essere descritto con una variabile di Poisson di media 13.. Si misura un campione di

Calcolo delle probabilità per variabili normali non standard: procedura di standardizzazione..

Si sa che nei libri prodotti da una certa casa editrice ciascuna pagina può contenere refusi con probabilità 20 1 , indipendentemente dalle altre pagine.. Si sa che i libri prodotti

a) Si dimostri che gli eventi A := “il primo dado dà come risultato 2” e B := “la somma dei due dadi vale 7” sono indipendenti.. b) Si dimostri che gli eventi A := “il primo

63 delle dispense). Si consideri la seguente classica strategia per il gioco della roulette. Gioco sempre sul rosso. Alla prima giocata punto un dollaro. Se perdo raddoppio la

Esercizio 3 (es. 35 delle dispense). 42 delle dispense). Il signor A riceve un’informazione che si esprime con un ”s`ı” o con un ”no”, trasmette tale informazione al signor B,

Si misura la concentrazione nell’aria di una certa sostanza in 50 punti diversi di una citt` a, ottenendo un valore medio x = 6.35 (espresso in opportune unit` a di misura).