HOMEWORK 2
2.1 Le seguenti coppie di valori sono relative al volume di un gas (Y) in corrispondenza di una temperatura (X) misurata in gradi Celsius
Volume (Y) Temperatura (X)
10.5 10°
10.7 15°
11.1 20°
11.4 30°
11.6 35°
11.9 40°
12.4 50°
12.5 60°
a) disegnare il diagramma di dispersione con la temperatura X in ascissa e il volume Y in ordinata
b) determinare i parametri della retta di regressione della Y sulla X
c) stimare il valore del volume in corrispondenza di una temperatura pari a 45°
d) determinare il coefficiente di correlazione lineare fra X e Y
e) determinare media e varianza della temperatura W espressa in gradi Fahrenheit sapendo che
𝑊 = 9
5𝑋 + 32
f) determinare il valore del coefficiente di correlazione lineare fra la temperatura W e il volume Y
2.2 Le seguenti coppie di determinazioni si riferiscono a una variabile qualitativa sconnessa X e a una variabile quantitativa continua Y
(a, 0.2) (a, 2.0) (a, 3.1) (a, 1.4) (a, 2.1)
(a, 3.9) (a, 2.0) (b, 7.8) (b, 3.5) (a, 6.1)
a) Costruire la distribuzione bivariata considerando le classi 0-2, 2-4 e 4-8 per la Y
b) Su tale distribuzione calcolare il valore del chi-quadrato e indicarne valore minimo e valore massimo
c) Determinare le frequenze interne sotto ipotesi di indipendenza assoluta fra X e Y
d) Sulla distribuzione bivariata ottenuta al punto a) determinare le distribuzioni condizionate della Y|x
e) Calcolare media e varianza di tali distribuzioni e media e varianza della distribuzione marginale di Y
f) Verificare che la media della Y corrisponde alla media ponderata delle medie condizionate
g) Verificare che la varianza della Y corrisponde alla somma della varianza between e della varianza within
h) Calcolare il rapporto di correlazione opportuno
2.3 Data la seguente distribuzione bivariata relativa a due variabili quantitative discrete
X\Y 1 2 3 0 5 5 0 10 1 5 10 5 20 2 0 5 15 20 10 20 20 50
a) determinare l’equazione della retta di regressione della Y sulla X b) stimare il valore teorico della Y per x=0 e per x=2
c) calcolare la bontà del modello lineare mediante il coefficiente di correlazione lineare
d) determinare il valore del coefficiente di correlazione lineare per le variabili X e W= 5 − 8X
e) determinare il valore del coefficiente di correlazione lineare per le variabili W=−2 + 3X
Z= 6 − 0.25Y
SOLUZIONI 2.1
a) Lo scatter assume la forma seguente
b) Per la variabile X si ottiene 𝑥̅ = 32.5
𝑚2𝑥 = 1318.75 𝑠𝑥2 = 262.5
Per la Y si ottiene 𝑦̅ = 11.5125 𝑚2𝑦 = 133.01125 𝑠𝑦2 = 0.47359375
Il momento misto ordinario di ordine 1,1 risulta 𝑚1,1 = 385.1875
per cui la covarianza è pari a 𝑠𝑥𝑦 =11.03125
I parametri della retta di regressione risultano quindi pari a 𝛽̂ = 11.03125
262.5 ≈ 0.04202 𝛼̂ = 11.5125 −11.03125
× 32.5 ≈ 10.14673
c) Posto x=45 dall’equazione della retta di regressione si ottiene 𝑦̂ = 10.14673 + 0.04202 × 45 = 12.03763
d) Il coefficiente di correlazione lineare è pari a 𝑟𝑥𝑦 = 11.03125
√262.5 × 0.47359375 ≈ 0.9894
e) Dalla relazione
𝑊 = 9
5𝑋 + 32 che lega le due variabili risulta
𝑤̅ = 9
5𝑥̅ + 32 =9
5× 32.5 + 32 = 90.5 𝑠𝑤2 = (9
5)
2
× 𝑠𝑥2 = (9 5)
2
× 262.5 = 850.5
f)
𝑟𝑤𝑦 = 𝑠𝑒𝑔𝑛𝑜 (9
5) × 𝑟𝑥𝑦 = 𝑟𝑥𝑦 ≈ 0.9894
2.2
a) La distribuzione bivariata risulta
X\Y 0 − 2 2 − 4 4 − 8
a 4 3 1 8
b 0 1 1 2
4 4 2 10
b)
𝜒2 = 10 ( 42
4 × 8+ 32
4 × 8+ 1
2 × 8+ 1
4 × 2+ 1
2 × 2− 1) = 2.1875 𝜒𝑚𝑖𝑛2 = 0
𝜒𝑚𝑎𝑥2 = 10 × [𝑚𝑖𝑛(2,3) − 1] = 10
c) La tabella sotto ipotesi di indipendenza assoluta fra le variabili è la seguente
X\Y 0 − 2 2 − 4 4 − 8
a 3.2 3.2 1.6 8
b 0.8 0.8 0.4 2
4 4 2 10
d) Le distribuzioni di Y|x risultano
X\Y 0 − 2 2 − 4 4 − 8
a 0.500 0.375 0.125 1.000
b 0.000 0.500 0.500 1.000
f) I valori caratteristici della Y all’interno dei gruppi omogenei in X sono 𝑦̅𝑎 = 2.375
𝑚2𝑦|𝑎 = 8.375 𝑠𝑦|𝑎2 = 2.734375 𝑦̅𝑏 = 4.5
𝑚2𝑦|𝑏 = 22.5 𝑠𝑦|𝑏2 = 2.25
I valori caratteristici della distribuzione marginale di Y risultano 𝑦̅ = 2.8
𝑚2𝑦 = 11.2
f) La media ponderata delle medie condizionate risulta 2.375 × 8 + 4.5 × 2
10 = 2.8 = 𝑦̅
g) La media delle varianze delle distribuzioni condizionate è 𝑠𝑤2 = 2.734375 × 8 + 2.25 × 2
10 = 2.6375
La varianza delle medie condizionate risulta 𝑠𝑏2 = (2.375 − 2.8)2× 8 + (4.5 − 2.8)2× 2
10 = 0.7225
La somma di queste due varianze è 𝑠𝑤2 + 𝑠𝑏2 = 2.6375 + 0.7225 = 3.36 = 𝑠𝑦2
h) L’unico rapporto di correlazione che è possibile calcolare, data la natura della variabile X, è quello della Y sulla X, che risulta pari al rapporto fra varianza between e varianza totale della Y per cui si ha
𝜂𝑦|𝑥2 =𝑠𝑏2
𝑠𝑦2 = 0.7225
3.36 ≈ 0.2150
2.3
a) Per la variabile X si ottiene 𝑥̅ = 1.2
𝑚2𝑥 = 2 𝑠𝑥2 = 0.56
Per la Y si ottiene 𝑦̅ = 2.2
Il momento misto ordinario di ordine 1,1 è pari a 𝑚1,1 = 3
per cui la covarianza risulta 𝑠𝑥𝑦 = 0.36
I parametri della retta di regressione risultano quindi pari a 𝛽̂ = 0.36
0.56 ≈ 0.64286 𝛼̂ = 2.2 −0.36
0.56× 1.2 ≈ 1.42857
L’equazione della retta di regressione assume quindi la forma 𝑌̂ = 1.42857 + 0.64286𝑋
b) Per x=0 il valore stimato della Y risulta 𝑦̂ = 1.42857
Per x=2 il valore stimato della Y risulta 𝑦̂ = 1.42857 + 0.64286 × 2 = 2.71429
c) Per la Y si ottiene 𝑚2𝑦 = 5.4
per cui la sua varianza è 𝑠𝑦2 = 0.56
Il coefficiente di correlazione lineare fra X e Y risulta pari a 𝑟𝑥𝑦 = 0.36
√0.56 × 0.56 ≈ 0.6429
d) Il coefficiente di correlazione lineare per le variabili X e W= 5 − 8X risulta necessariamente pari a −1, dato che si tratta della variabile X e di una sua combinazione lineare in cui il parametro che moltiplica la X ha segno negativo
𝑟𝑥𝑤 = −1
e) Il valore del coefficiente di correlazione lineare per le variabili W=−2 + 3X
Z= 6 − 0.25Y risulta invece
𝑟𝑤𝑧 = 𝑠𝑒𝑔𝑛𝑜[3 × (−0,25)] × 𝑟𝑥𝑦 = −0.6429