1
ESERCIZI SU DISTRIBUZIONI BIVARIATE
1) Data la seguente tabella a doppia entrata X\Y 0 2 3
0 5 10 15 30
1 5 5 10 20
10 15 25 50 determinare:
a) la mediana della distribuzione di Y condizionata a X=0 e condizionata a X=1 b) le distribuzioni della Y|x
c) le distribuzioni della X|y d) la media di Y
e) la varianza di Y f) la media di X g) la varianza di X
Soluzione
a) Considerata la distribuzione di Y|x=0, la mediana corrisponde all’intensità 2, dato che ⌈𝑛𝑝⌉ = ⌈30 × 0.5⌉ = 15 e l’intensità che occupa il quindicesimo posto è 2 (nella distribuzione condizionata ci sono infatti 5 intensità pari 0, 10 intensità pari 2 e 15 intensità pari 3)
Considerata la distribuzione di Y|x=1, la mediana corrisponde all’intensità 2, dato che ⌈𝑛𝑝⌉ = ⌈20 × 0.5⌉ = 10 e l’intensità che occupa il decimo posto è 2
b)
X\Y 0 2 3
0 5/30 10/30 15/30 1.0 1 5/20 5/20 10/20 1.0 c)
X\Y 0 2 3
0 5/10 10/15 15/25 1 5/10 5/15 10/25
1.0 1.0 1.0
d)
𝑦̅ = 2 × 15 + 3 × 25
50 = 2.1
2
e)
𝑚2𝑦 = 4 × 15 + 9 × 25
50 = 5.7
𝑠𝑦2 = 5.7 − 2.12 = 1.29 f)
𝑥̅ = 0 × 30 + 1 × 20
50 = 0.4
g)
𝑚2𝑥 =0 × 30 + 1 × 20
50 = 0.4
𝑠𝑥2 = 0.4 − 0.42 = 0.24
2) Data la seguente tabella a doppia entrata X\Y 0 1 3
0 2 2 1 5
1 2 0 3 5
4 2 4 10 calcolare:
a) la varianza della distribuzione di X
b) la varianza della trasformazione lineare W=2X−1 c) la covarianza fra X e Y
d) la covarianza fra W e Y
e) l’indice chi-quadrato, indicandone valore minimo e valore massimo f) l’equazione della retta di regressione della Y sulla X
g) il valore stimato di Y per x=1
3
Soluzione a)
𝑥̅ = 0 × 5 + 1 × 5
10 = 0.5
𝑚2𝑥 = 0 × 5 + 1 × 5
10 = 0.5
𝑠𝑥2 = 0.5 − 0.52 = 0.25 b)
𝑠𝑤2 = 4 × 0.25 = 1 c)
𝑦̅ = 1 × 2 + 3 × 4
10 = 1.4
𝑚1,1 =1 × 3 × 3
10 = 0.9 𝑠𝑥𝑦 = 0.9 − 0.5 × 1.4 = 0.2 d)
𝑠𝑤𝑦 = 2𝑠𝑥𝑦 = 2 × 0.2 = 0.4
e)
𝜒2 = 10 × ( 22
4 × 5+ 22
2 × 5+ 12
4 × 5+ 22
4 × 5+ 32
4 × 5− 1) = 3 𝜒𝑚𝑖𝑛2 =0
𝜒𝑚𝑎𝑥2 = 10 × [𝑚𝑖𝑛(2,3) − 1] = 10 f)
𝛽̂ = 𝑠𝑥𝑦
𝑠𝑥2 = 0.2
0.25 = 0.8
𝛼̂ = 𝑦̅ − 𝛽̂𝑥̅ = 1.4 − 0.8 × 0.5 = 1 𝑌̂ = 1 + 0.8𝑋
g)
Posto x=1 si ha
𝑌̂ = 1 + 0.8 = 1.8
4
n1. =5 n2. =4 n3. =6
𝑦̄𝑥1 = 36 𝑦̄𝑥2 = 33 𝑦̄𝑥3 = 78 𝜎𝑦2 = 642.667 Calcolare il valore approssimato del rapporto di correlazione 𝜂𝑌|𝑥2
Soluzione
Per il calcolo di 𝜂𝑌|𝑥2 occorre determinare il valore della varianza spiegata, ossia della varianza delle medie condizionate di Y
La media generale di Y, pari alla media ponderata delle medie condizionate, è 𝑦̅ =36 × 5 + 33 × 4 + 78 × 6
5 + 4 + 6 = 52 per cui la varianza spiegata è
𝑠𝑏2 =(36 − 52)2× 5 + (33 − 52)2× 4 + (78 − 52)2× 6
15 = 452
e quindi
𝜂𝑌|𝑥2 = 452
642.667 ≈ 0.7033
4) Su n=100 coppie di osservazioni delle variabili X e Y, sono stati osservati i seguenti valori
∑ 𝑥𝑖
100
𝑖=1
= 100, ∑ 𝑥𝑖2
100
𝑖=1
= 500, ∑ 𝑥𝑖
100
𝑖=1
𝑦𝑖 = 800, 𝑦̄ = 4, 𝑠𝑦2 = 4
Calcolare il coefficiente di correlazione tra W=1+2X e Z=2-3Y.
5
Soluzione
Sulla base delle informazioni fornite dal testo si ha
𝑥̄ = ∑100𝑖=1𝑥𝑖
𝑛 = 100
100 = 1 𝑚1,1 = ∑100𝑖=1𝑥𝑖𝑦𝑖
𝑛 =800
100 = 8 𝑠𝑥𝑦 = 𝑚1,1 − 𝑥̄𝑦̄ = 8 − 1 × 4 = 4
𝑚2𝑥 = ∑100𝑖=1𝑥𝑖2
𝑛 =500
100 = 5 𝑠𝑥2 = 𝑚2𝑥 − 𝑥̄2 = 5 − 1 = 4 Risulta quindi
𝑟𝑥𝑦 = 𝑠𝑥𝑦
𝑠𝑥 𝑠𝑦 = 4
√4 × 4 = 1 e infine
𝑟𝑤𝑧 = −𝑟𝑥𝑦 = −1
5) Su n=10 coppie di osservazioni relative alle variabili X e Y, si sono ottenuti i seguenti valori
𝑥̄ = 8, 𝑦̄ = 6, 𝜎𝑥2 = 16, ∑ 𝑥𝑖𝑦𝑖
10
𝑖=1
= 640
Facendo riferimento al modello di regressione 𝑦𝑖 = 𝛼 + 𝛽𝑥𝑖 + 𝜀𝑖, calcolare le stime dei minimi quadrati di 𝛼 e 𝛽
6
Sulla base delle informazioni fornite dal testo si ha
𝑚1,1 =∑100𝑖=1𝑥𝑖𝑦𝑖
𝑛 =640
10 = 64 𝑠𝑥𝑦 = 𝑚1,1− 𝑥̄𝑦̄ = 64 − 8 × 6 = 16
Risulta quindi
𝛽̂ = 𝑠𝑥𝑦
𝑠𝑥2 = 16 16 = 1
𝛼̂ = 𝑦̅ − 𝛽̂𝑥̅ = 6 − 1 × 8 = −2