1
HOMEWORK 3
3.1 Considerato un esperimento che consiste nel lanciare due volte un dado in cui le facce contrassegnate con 1 e 2 punti hanno probabilità doppia rispetto alle altre, si determini la distribuzione di probabilità della v.c. Y che assume valore 0 se si è ottenuta una somma dei punteggi inferiore a 5 e valore 1 in tutti gli altri casi.
Si determini il valore atteso e il coefficiente di variazione di tale variabile.
3.2 Considerata un’urna contenente 1000 palline di cui 400 bianche, 400 nere e 200 rosse, si calcoli in modo approssimato
a) la moda, la mediana, il valore atteso e la varianza della v.c. Y “numero di palline bianche estratte” per un campione di 100 palline estratte con ripetizione;
b) la probabilità che estraendo un campione di 100 palline con ripetizione si ottengano almeno 50 palline bianche;
c) la moda, la mediana, il valore atteso e la varianza della v.c. 𝑃̂ “proporzione di palline bianche estratte” per un campione di 100 palline estratte con ripetizione;
d) la probabilità che estraendo un campione di 100 palline con ripetizione la proporzione di palline bianche sia minore o uguale al 50%.
3.3 Siano X1,… X9 v.c. indipendenti ciascuna con distribuzione normale di valore atteso 4 e varianza 36. Calcolare:
a) 𝑃(𝑋1 < 10)
b) 𝑃[(2𝑋1− 𝑋2) > 54]
3.4 Date le variabili casuali X ~ N(5, 6) e Y ~ N(2, 5) con covarianza Cov(X,Y) = 1, si considerino le due variabili casuali
D = Y−X T = 2X+Y . Calcolare:
a) P[D > 0]
b) il primo decile di D c) P[15 < T ≤ 17]
d) il terzo quartile di T.
2
3.5 Data una variabile casuale X la cui funzione di densità di probabilità è 𝑓(𝑥) = 1
𝜃 per 0 ≤ 𝑥 ≤ 𝜃 si determini
a) la funzione di ripartizione F(x)
b) la probabilità che X assuma un valore inferiore a
4
, c) la probabilità che X assuma un valore superiore a + 2 d) la mediana x0.5
e) E(X) f) V(X)
3.6 Da una popolazione in cui la variabile di interesse ha valore atteso e varianza
2, si estragga un campione casuale di 2 elementi e si considerino i seguenti stimatori di
𝑇1 =1
3𝑋1 +2 3𝑋2 𝑇2 =3
4𝑋1+1 4𝑋2 Si individui quello più efficiente
3.7 Considerata la funzione dei dati campionari
𝑇 = ∑𝑛−3𝑖=1 𝑋𝑖 𝑛 − 3 +2
𝑛𝑋𝑛
si verifichi se si tratta di uno stimatore consistente per il parametro .
3
SOLUZIONI
3.1
La distribuzione di probabilità della variabile casuale X “punteggio su un dado”
risulta X p(x) 1 0.250 2 0.250 3 0.125 4 0.125 5 0.125 6 0.125 1.000
Indicata con S la variabile casuale “somma dei punteggi sui due dadi”, la probabilità P(S ≤ 4) corrisponde alla somma delle seguenti probabilità
P(S=2) = 0.252 = 0.0625
P(S=3) = 2×0.25×0.25 = 0.125
P(S=4) = 2×0.25×0.125 + 0.252 = 0.125
La distribuzione della variabile casuale Y risulta quindi la seguente Y p(y)
0 0.3125 2 0.6875 1.000
e gli indici richiesti risultano E(Y) = 0.6875
V(Y) = 0.6875 - 0.68752 = 0.21484375 CVy ≈ 0.6742
4
3.2
a) La distribuzione asintotica di Y è una normale di valore atteso 𝑛𝜋 = 100 × 0.4 = 40
e varianza
𝑛𝜋(1 − 𝜋) = 100 × 0.4 × 0.6 = 24
Per cui moda, media e mediana coincidono. Gli indici richiesti sono quindi My = y0.5 = E(Y) = 100 × 0.4 = 40
V(Y) = 100 × 0.4 × 0.6 = 24 b)
La probabilità approssimata è
𝑃(𝑌 ≥ 50) = 1 − Φ (50 − 40
√24 ) = 1 − Φ(2.04) = 0.0207 c)
Anche a distribuzione asintotica della v.c. 𝑃̂ “proporzione di palline bianche estratte” può essere approssimata da una normale di valore atteso
𝜋 = 0.4 e varianza
𝜋(1 − 𝜋)
𝑛 = 0.4 × 0.6
100 = 0.0024 per cui risulta
𝑀𝑝̂ = 𝑝̂0.5 = 𝐸(𝑃̂) = 0.4 𝑉(𝑃̂) = 0.4 × 0.6
100 = 0.0024
d) la probabilità richiesta risulta 𝑃(𝑃̂ ≤ 0.5) = Φ (0.5 − 0.4
√0.0024) = Φ(2.04) = 0.9793
5
3.3
a) Sulla base della distribuzione
𝑋1~𝑁(4, 36) risulta
𝑃(𝑋1 < 10) = Φ (10 − 4
6 ) = Φ(1) = 0.8413 b)
Per poter calcolare la probabilità richiesta occorre innanzitutto determinare valore atteso e varianza della variabile casuale 2𝑋1− 𝑋2 che si distribuisce in modo normale, essendo una combinazione lineare di variabili normali.
Si ha
𝐸(2𝑋1 − 𝑋2) = 2𝐸(𝑋1) − 𝐸(𝑋2) = 2 × 4 − 4 = 4 𝑉(2𝑋1− 𝑋2) = 4𝑉(𝑋1) + 𝑉(𝑋2) = 4 × 36 + 36 = 180 per cui
𝑃[(2𝑋1 − 𝑋2) > 54] = 1 − 𝑃[(2𝑋1 − 𝑋2) < 54] = 1 − Φ (54 − 4
√180) =
= 1 − Φ(3.73) = 0.0001
6
3.4 a)
Le variabili casuali D e T hanno entrambe una distribuzione normale, essendo combinazioni lineari di variabili normali.
I parametri che identificano la distribuzione di D sono 𝐸(𝐷) = 2 − 5 = −3
𝑉(𝐷) = 5 + 6 − 2 × 1 = 9 per cui
𝑃(𝐷 > 0) = 1 − Φ (3
3) = 0.1587 b)
Il primo decile d0.1 di D si ottiene dal primo decile della normale standard e risulta d0.1 = −3 + 3×(−1.282) = −6.846
c)
I parametri che identificano la distribuzione di T sono 𝐸(𝑇) = 2 × 5 + 3 × 2 = 16
𝑉(𝑇) = 4 × 6 + 9 × 5 + 2 × 2 × 3 × 1 = 81 per cui
𝑃(15 < 𝑇 ≤ 17) = Φ (17 − 16
9 ) − Φ (15 − 16
9 ) = 2𝛷(0.11) − 1 = 0.0876 d)
Il terzo quartile t0.75 di T si ottiene dal terzo quartile della normale standard e risulta
t0.75 = 16 + 9×(0.674) = 22.066
7
3.5 a)
La funzione di ripartizione si ottiene dal seguente integrale
∫ 1
𝜃𝑑𝑡 = 1
𝜃∫ 𝑑𝑡
𝑥 0
= 1
𝜃[𝑡]0𝑥 = 1
𝜃(𝑥 − 0) = 𝑥 𝜃
𝑥
0
per cui 𝐹(𝑥) =𝑥
𝜃 0 ≤ 𝑥 ≤ 𝜃 b)
Il valore della probabilità richiesta corrisponde alla funzione di ripartizione calcolata in corrispondenza di quel valore, per cui si ha
𝐹 (𝑥 = 𝜃
4) = 𝜃 4𝜃 =1
4 c)
Dato il campo di variazione della variabile, definita fra 0 e 𝜃, risulta 1 − 𝐹(𝑥 = 𝜃 + 2) = 1 − 1 = 0
d)
La mediana è quel valore della variabile in corrispondenza del quale la funzione di ripartizione vale 0.5, per cui
𝐹(𝑥0.5) = 𝑥0.5
𝜃 = 0.5 da cui si ottiene 𝑥0.5 = 0.5𝜃 e)
Il valore atteso della variabile è dato dal seguente integrale 𝐸(𝑋) = ∫ 𝑥1
𝜃𝑑𝑥 = 1 𝜃[𝑥2
2]
0 𝜃
= 1 𝜃(𝜃2
2 − 0) =𝜃 2
𝜃 0
f)
Il secondo momento è pari a 𝐸(𝑋2) = ∫ 𝑥21
𝜃𝑑𝑥 = 1 𝜃[𝑥3
3]
0 𝜃
=1 𝜃(𝜃3
3 − 0) = 𝜃2 3
𝜃 0
per cui la varianza è uguale a 𝑉(𝑋) = 𝜃2
3 −𝜃2 4 = 𝜃2
12
8
3.6
I valori attesi dei due stimatori sono 𝐸(𝑇1) = 1
3𝐸(𝑋1) +2
3𝐸(𝑋2) = (1 3+2
3) 𝜇 = 𝜇 𝐸(𝑇2) = 3
4𝐸(𝑋1) +1
4𝐸(𝑋2) = (3 4+1
4) 𝜇 = 𝜇
per cui entrambi gli stimatori sono corretti e per valutarne l’efficienza basta confrontare le loro varianze che risultano pari a
𝑉(𝑇1) = 1
9𝑉(𝑋1) +4
9𝑉(𝑋2) = (1 9+4
9) 𝜎2 = 5
9𝜎2 = 0. 5̄𝜎2 𝑉(𝑇2) = 9
16𝑉(𝑋1) + 1
16𝑉(𝑋2) = ( 9 16+ 1
16) 𝜎2 = 10
16𝜎2 = 0.625𝜎2
Si conclude quindi che T1 è più efficiente di T2
3.7
Il valore atteso dello stimatore è 𝐸(𝑇) = 𝐸 (∑𝑛−3𝑖=1 𝑋𝑖
𝑛 − 3 +2
𝑛𝑋𝑛) = (𝑛 − 3)𝜇 𝑛 − 3 +2
𝑛𝜇 = 𝜇 +2 𝑛𝜇 Si tratta quindi di uno stimatore distorto, con distorsione
𝐵(𝑇) = 2 𝑛𝜇
per cui si conclude che T è asintoticamente corretto La varianza dello stimatore è data da
𝑉(𝑇) = 𝑉 (∑𝑛−3𝑖=1 𝑋𝑖 𝑛 − 3 +2
𝑛𝑋𝑛) =(𝑛 − 3)𝜎2
(𝑛 − 3)2 +4𝜎2
𝑛2 = 𝜎2
(𝑛 − 3)+4𝜎2 𝑛2 e il suo errore quadratico medio è pari a
𝑀𝑆𝐸(𝑇) = 𝑉(𝑇) + [𝐵(𝑇)]2 = 𝜎2
(𝑛 − 3)+4𝜎2
𝑛2 +4𝜇2 𝑛2 Dato che
𝑛→+∞𝑙𝑖𝑚 𝑀𝑆𝐸(𝑇) = 0
T è uno stimatore asintoticamente corretto e consistente per