(1)

1

HOMEWORK 3

3.1 Considerato un esperimento che consiste nel lanciare due volte un dado in cui le facce contrassegnate con 1 e 2 punti hanno probabilità doppia rispetto alle altre, si determini la distribuzione di probabilità della v.c. Y che assume valore 0 se si è ottenuta una somma dei punteggi inferiore a 5 e valore 1 in tutti gli altri casi.

Si determini il valore atteso e il coefficiente di variazione di tale variabile.

3.2 Considerata un’urna contenente 1000 palline di cui 400 bianche, 400 nere e 200 rosse, si calcoli in modo approssimato

a) la moda, la mediana, il valore atteso e la varianza della v.c. Y “numero di palline bianche estratte” per un campione di 100 palline estratte con ripetizione;

b) la probabilità che estraendo un campione di 100 palline con ripetizione si ottengano almeno 50 palline bianche;

c) la moda, la mediana, il valore atteso e la varianza della v.c. 𝑃̂ “proporzione di palline bianche estratte” per un campione di 100 palline estratte con ripetizione;

d) la probabilità che estraendo un campione di 100 palline con ripetizione la proporzione di palline bianche sia minore o uguale al 50%.

3.3 Siano X1,… X9 v.c. indipendenti ciascuna con distribuzione normale di valore atteso 4 e varianza 36. Calcolare:

a) 𝑃(𝑋₁ < 10)

b) 𝑃[(2𝑋₁− 𝑋₂) > 54]

3.4 Date le variabili casuali X ~ N(5, 6) e Y ~ N(2, 5) con covarianza Cov(X,Y) = 1, si considerino le due variabili casuali

D = Y−X T = 2X+Y . Calcolare:

a) P[D > 0]

b) il primo decile di D c) P[15 < T ≤ 17]

d) il terzo quartile di T.

(2)

2

3.5 Data una variabile casuale X la cui funzione di densità di probabilità è 𝑓(𝑥) = 1

𝜃 per 0 ≤ 𝑥 ≤ 𝜃 si determini

a) la funzione di ripartizione F(x)

b) la probabilità che X assuma un valore inferiore a

4

 , c) la probabilità che X assuma un valore superiore a  + 2 d) la mediana x0.5

e) E(X) f) V(X)

3.6 Da una popolazione in cui la variabile di interesse ha valore atteso  e varianza

², si estragga un campione casuale di 2 elementi e si considerino i seguenti stimatori di 

𝑇₁ =1

3𝑋₁ +2 3𝑋₂ 𝑇₂ =3

4𝑋₁+1 4𝑋₂ Si individui quello più efficiente

3.7 Considerata la funzione dei dati campionari

𝑇 = ∑^𝑛−3_𝑖=1 𝑋_𝑖 𝑛 − 3 +2

𝑛𝑋_𝑛

si verifichi se si tratta di uno stimatore consistente per il parametro .

(3)

3

SOLUZIONI

3.1

La distribuzione di probabilità della variabile casuale X “punteggio su un dado”

risulta X p(x) 1 0.250 2 0.250 3 0.125 4 0.125 5 0.125 6 0.125 1.000

Indicata con S la variabile casuale “somma dei punteggi sui due dadi”, la probabilità P(S ≤ 4) corrisponde alla somma delle seguenti probabilità

P(S=2) = 0.25²= 0.0625

P(S=3) = 2×0.25×0.25 = 0.125

P(S=4) = 2×0.25×0.125 + 0.25² = 0.125

La distribuzione della variabile casuale Y risulta quindi la seguente Y p(y)

0 0.3125 2 0.6875 1.000

e gli indici richiesti risultano E(Y) = 0.6875

V(Y) = 0.6875 - 0.6875² = 0.21484375 CVy ≈ 0.6742

(4)

4

3.2

a) La distribuzione asintotica di Y è una normale di valore atteso 𝑛𝜋 = 100 × 0.4 = 40

e varianza

𝑛𝜋(1 − 𝜋) = 100 × 0.4 × 0.6 = 24

Per cui moda, media e mediana coincidono. Gli indici richiesti sono quindi My = y0.5 = E(Y) = 100 × 0.4 = 40

V(Y) = 100 × 0.4 × 0.6 = 24 b)

La probabilità approssimata è

𝑃(𝑌 ≥ 50) = 1 − Φ (50 − 40

√24 ) = 1 − Φ(2.04) = 0.0207 c)

Anche a distribuzione asintotica della v.c. 𝑃̂ “proporzione di palline bianche estratte” può essere approssimata da una normale di valore atteso

𝜋 = 0.4 e varianza

𝜋(1 − 𝜋)

𝑛 = 0.4 × 0.6

100 = 0.0024 per cui risulta

𝑀_𝑝̂ = 𝑝̂_0.5 = 𝐸(𝑃̂) = 0.4 𝑉(𝑃̂) = 0.4 × 0.6

100 = 0.0024

d) la probabilità richiesta risulta 𝑃(𝑃̂ ≤ 0.5) = Φ (0.5 − 0.4

√0.0024) = Φ(2.04) = 0.9793

(5)

5

3.3

a) Sulla base della distribuzione

𝑋₁~𝑁(4, 36) risulta

𝑃(𝑋₁ < 10) = Φ (10 − 4

6 ) = Φ(1) = 0.8413 b)

Per poter calcolare la probabilità richiesta occorre innanzitutto determinare valore atteso e varianza della variabile casuale 2𝑋₁− 𝑋₂ che si distribuisce in modo normale, essendo una combinazione lineare di variabili normali.

Si ha

𝐸(2𝑋₁ − 𝑋₂) = 2𝐸(𝑋₁) − 𝐸(𝑋₂) = 2 × 4 − 4 = 4 𝑉(2𝑋₁− 𝑋₂) = 4𝑉(𝑋₁) + 𝑉(𝑋₂) = 4 × 36 + 36 = 180 per cui

𝑃[(2𝑋₁ − 𝑋₂) > 54] = 1 − 𝑃[(2𝑋₁ − 𝑋₂) < 54] = 1 − Φ (54 − 4

√180) =

= 1 − Φ(3.73) = 0.0001

(6)

6

3.4 a)

Le variabili casuali D e T hanno entrambe una distribuzione normale, essendo combinazioni lineari di variabili normali.

I parametri che identificano la distribuzione di D sono 𝐸(𝐷) = 2 − 5 = −3

𝑉(𝐷) = 5 + 6 − 2 × 1 = 9 per cui

𝑃(𝐷 > 0) = 1 − Φ (3

3) = 0.1587 b)

Il primo decile d0.1 di D si ottiene dal primo decile della normale standard e risulta d0.1 = −3 + 3×(−1.282) = −6.846

c)

I parametri che identificano la distribuzione di T sono 𝐸(𝑇) = 2 × 5 + 3 × 2 = 16

𝑉(𝑇) = 4 × 6 + 9 × 5 + 2 × 2 × 3 × 1 = 81 per cui

𝑃(15 < 𝑇 ≤ 17) = Φ (17 − 16

9 ) − Φ (15 − 16

9 ) = 2𝛷(0.11) − 1 = 0.0876 d)

Il terzo quartile t0.75 di T si ottiene dal terzo quartile della normale standard e risulta

t0.75 = 16 + 9×(0.674) = 22.066

(7)

7

3.5 a)

La funzione di ripartizione si ottiene dal seguente integrale

∫ 1

𝜃𝑑𝑡 = 1

𝜃∫ 𝑑𝑡

𝑥 0

= 1

𝜃[𝑡]₀^𝑥 = 1

𝜃(𝑥 − 0) = 𝑥 𝜃

𝑥

0

per cui 𝐹(𝑥) =𝑥

𝜃 0 ≤ 𝑥 ≤ 𝜃 b)

Il valore della probabilità richiesta corrisponde alla funzione di ripartizione calcolata in corrispondenza di quel valore, per cui si ha

𝐹 (𝑥 = 𝜃

4) = 𝜃 4𝜃 =1

4 c)

Dato il campo di variazione della variabile, definita fra 0 e 𝜃, risulta 1 − 𝐹(𝑥 = 𝜃 + 2) = 1 − 1 = 0

d)

La mediana è quel valore della variabile in corrispondenza del quale la funzione di ripartizione vale 0.5, per cui

𝐹(𝑥_0.5) = 𝑥_0.5

𝜃 = 0.5 da cui si ottiene 𝑥_0.5 = 0.5𝜃 e)

Il valore atteso della variabile è dato dal seguente integrale 𝐸(𝑋) = ∫ 𝑥1

𝜃𝑑𝑥 = 1 𝜃[𝑥²

2]

0 𝜃

= 1 𝜃(𝜃²

2 − 0) =𝜃 2

𝜃 0

f)

Il secondo momento è pari a 𝐸(𝑋²) = ∫ 𝑥²1

𝜃𝑑𝑥 = 1 𝜃[𝑥³

3]

0 𝜃

=1 𝜃(𝜃³

3 − 0) = 𝜃² 3

𝜃 0

per cui la varianza è uguale a 𝑉(𝑋) = 𝜃²

3 −𝜃² 4 = 𝜃²

12

(8)

8

3.6

I valori attesi dei due stimatori sono 𝐸(𝑇₁) = 1

3𝐸(𝑋₁) +2

3𝐸(𝑋₂) = (1 3+2

3) 𝜇 = 𝜇 𝐸(𝑇₂) = 3

4𝐸(𝑋₁) +1

4𝐸(𝑋₂) = (3 4+1

4) 𝜇 = 𝜇

per cui entrambi gli stimatori sono corretti e per valutarne l’efficienza basta confrontare le loro varianze che risultano pari a

𝑉(𝑇₁) = 1

9𝑉(𝑋₁) +4

9𝑉(𝑋₂) = (1 9+4

9) 𝜎² = 5

9𝜎² = 0. 5̄𝜎² 𝑉(𝑇₂) = 9

16𝑉(𝑋₁) + 1

16𝑉(𝑋₂) = ( 9 16+ 1

16) 𝜎² = 10

16𝜎² = 0.625𝜎²

Si conclude quindi che T1 è più efficiente di T2

3.7

Il valore atteso dello stimatore è 𝐸(𝑇) = 𝐸 (∑^𝑛−3_𝑖=1 𝑋_𝑖

𝑛 − 3 +2

𝑛𝑋_𝑛) = (𝑛 − 3)𝜇 𝑛 − 3 +2

𝑛𝜇 = 𝜇 +2 𝑛𝜇 Si tratta quindi di uno stimatore distorto, con distorsione

𝐵(𝑇) = 2 𝑛𝜇

per cui si conclude che T è asintoticamente corretto La varianza dello stimatore è data da

𝑉(𝑇) = 𝑉 (∑^𝑛−3_𝑖=1 𝑋_𝑖 𝑛 − 3 +2

𝑛𝑋_𝑛) =(𝑛 − 3)𝜎²

(𝑛 − 3)² +4𝜎²

𝑛² = 𝜎²

(𝑛 − 3)+4𝜎² 𝑛² e il suo errore quadratico medio è pari a

𝑀𝑆𝐸(𝑇) = 𝑉(𝑇) + [𝐵(𝑇)]² = 𝜎²

(𝑛 − 3)+4𝜎²

𝑛² +4𝜇² 𝑛² Dato che

𝑛→+∞𝑙𝑖𝑚 𝑀𝑆𝐸(𝑇) = 0

T è uno stimatore asintoticamente corretto e consistente per 