• Non ci sono risultati.

d) Il coefficiente di correlazione lineare è pari a

N/A
N/A
Protected

Academic year: 2021

Condividi " d) Il coefficiente di correlazione lineare è pari a "

Copied!
8
0
0

Testo completo

(1)

HOMEWORK 2

2.1 Le seguenti coppie di valori sono relative al volume di un gas (Y) in corrispondenza di una temperatura (X) misurata in gradi Celsius

Volume (Y) Temperatura (X)

10.5 10°

10.7 15°

11.1 20°

11.4 30°

11.6 35°

11.9 40°

12.4 50°

12.5 60°

a) disegnare il diagramma di dispersione con la temperatura X in ascissa e il volume Y in ordinata

b) determinare i parametri della retta di regressione della Y sulla X

c) stimare il valore del volume in corrispondenza di una temperatura pari a 45°

d) determinare il coefficiente di correlazione lineare fra X e Y

e) determinare media e varianza della temperatura W espressa in gradi Fahrenheit sapendo che

𝑊 = 9

5𝑋 + 32

f) determinare il valore del coefficiente di correlazione lineare fra la temperatura W e il volume Y

(2)

2.2 Le seguenti coppie di determinazioni si riferiscono a una variabile qualitativa sconnessa X e a una variabile quantitativa continua Y

(a, 0.2) (a, 2.0) (a, 3.1) (a, 1.4) (a, 2.1)

(a, 3.9) (a, 2.0) (b, 7.8) (b, 3.5) (a, 6.1)

a) Costruire la distribuzione bivariata considerando le classi 0-2, 2-4 e 4-8 per la Y

b) Su tale distribuzione calcolare il valore del chi-quadrato e indicarne valore minimo e valore massimo

c) Determinare le frequenze interne sotto ipotesi di indipendenza assoluta fra X e Y

d) Sulla distribuzione bivariata ottenuta al punto a) determinare le distribuzioni condizionate della Y|x

e) Calcolare media e varianza di tali distribuzioni e media e varianza della distribuzione marginale di Y

f) Verificare che la media della Y corrisponde alla media ponderata delle medie condizionate

g) Verificare che la varianza della Y corrisponde alla somma della varianza between e della varianza within

h) Calcolare il rapporto di correlazione opportuno

2.3 Data la seguente distribuzione bivariata relativa a due variabili quantitative discrete

X\Y 1 2 3 0 5 5 0 10 1 5 10 5 20 2 0 5 15 20 10 20 20 50

a) determinare l’equazione della retta di regressione della Y sulla X b) stimare il valore teorico della Y per x=0 e per x=2

c) calcolare la bontà del modello lineare mediante il coefficiente di correlazione lineare

d) determinare il valore del coefficiente di correlazione lineare per le variabili X e W= 5 − 8X

e) determinare il valore del coefficiente di correlazione lineare per le variabili W=−2 + 3X

Z= 6 − 0.25Y

(3)

SOLUZIONI 2.1

a) Lo scatter assume la forma seguente

b) Per la variabile X si ottiene 𝑥̅ = 32.5

𝑚2𝑥 = 1318.75 𝑠𝑥2 = 262.5

Per la Y si ottiene 𝑦̅ = 11.5125 𝑚2𝑦 = 133.01125 𝑠𝑦2 = 0.47359375

Il momento misto ordinario di ordine 1,1 risulta 𝑚1,1 = 385.1875

per cui la covarianza è pari a 𝑠𝑥𝑦 =11.03125

I parametri della retta di regressione risultano quindi pari a 𝛽̂ = 11.03125

262.5 ≈ 0.04202 𝛼̂ = 11.5125 −11.03125

× 32.5 ≈ 10.14673

(4)

c) Posto x=45 dall’equazione della retta di regressione si ottiene 𝑦̂ = 10.14673 + 0.04202 × 45 = 12.03763

d) Il coefficiente di correlazione lineare è pari a 𝑟𝑥𝑦 = 11.03125

√262.5 × 0.47359375 ≈ 0.9894

e) Dalla relazione

𝑊 = 9

5𝑋 + 32 che lega le due variabili risulta

𝑤̅ = 9

5𝑥̅ + 32 =9

5× 32.5 + 32 = 90.5 𝑠𝑤2 = (9

5)

2

× 𝑠𝑥2 = (9 5)

2

× 262.5 = 850.5

f)

𝑟𝑤𝑦 = 𝑠𝑒𝑔𝑛𝑜 (9

5) × 𝑟𝑥𝑦 = 𝑟𝑥𝑦 ≈ 0.9894

(5)

2.2

a) La distribuzione bivariata risulta

X\Y 0 − 2 2 − 4 4 − 8

a 4 3 1 8

b 0 1 1 2

4 4 2 10

b)

𝜒2 = 10 ( 42

4 × 8+ 32

4 × 8+ 1

2 × 8+ 1

4 × 2+ 1

2 × 2− 1) = 2.1875 𝜒𝑚𝑖𝑛2 = 0

𝜒𝑚𝑎𝑥2 = 10 × [𝑚𝑖𝑛(2,3) − 1] = 10

c) La tabella sotto ipotesi di indipendenza assoluta fra le variabili è la seguente

X\Y 0 − 2 2 − 4 4 − 8

a 3.2 3.2 1.6 8

b 0.8 0.8 0.4 2

4 4 2 10

d) Le distribuzioni di Y|x risultano

X\Y 0 − 2 2 − 4 4 − 8

a 0.500 0.375 0.125 1.000

b 0.000 0.500 0.500 1.000

f) I valori caratteristici della Y all’interno dei gruppi omogenei in X sono 𝑦̅𝑎 = 2.375

𝑚2𝑦|𝑎 = 8.375 𝑠𝑦|𝑎2 = 2.734375 𝑦̅𝑏 = 4.5

𝑚2𝑦|𝑏 = 22.5 𝑠𝑦|𝑏2 = 2.25

I valori caratteristici della distribuzione marginale di Y risultano 𝑦̅ = 2.8

𝑚2𝑦 = 11.2

(6)

f) La media ponderata delle medie condizionate risulta 2.375 × 8 + 4.5 × 2

10 = 2.8 = 𝑦̅

g) La media delle varianze delle distribuzioni condizionate è 𝑠𝑤2 = 2.734375 × 8 + 2.25 × 2

10 = 2.6375

La varianza delle medie condizionate risulta 𝑠𝑏2 = (2.375 − 2.8)2× 8 + (4.5 − 2.8)2× 2

10 = 0.7225

La somma di queste due varianze è 𝑠𝑤2 + 𝑠𝑏2 = 2.6375 + 0.7225 = 3.36 = 𝑠𝑦2

h) L’unico rapporto di correlazione che è possibile calcolare, data la natura della variabile X, è quello della Y sulla X, che risulta pari al rapporto fra varianza between e varianza totale della Y per cui si ha

𝜂𝑦|𝑥2 =𝑠𝑏2

𝑠𝑦2 = 0.7225

3.36 ≈ 0.2150

(7)

2.3

a) Per la variabile X si ottiene 𝑥̅ = 1.2

𝑚2𝑥 = 2 𝑠𝑥2 = 0.56

Per la Y si ottiene 𝑦̅ = 2.2

Il momento misto ordinario di ordine 1,1 è pari a 𝑚1,1 = 3

per cui la covarianza risulta 𝑠𝑥𝑦 = 0.36

I parametri della retta di regressione risultano quindi pari a 𝛽̂ = 0.36

0.56 ≈ 0.64286 𝛼̂ = 2.2 −0.36

0.56× 1.2 ≈ 1.42857

L’equazione della retta di regressione assume quindi la forma 𝑌̂ = 1.42857 + 0.64286𝑋

b) Per x=0 il valore stimato della Y risulta 𝑦̂ = 1.42857

Per x=2 il valore stimato della Y risulta 𝑦̂ = 1.42857 + 0.64286 × 2 = 2.71429

c) Per la Y si ottiene 𝑚2𝑦 = 5.4

per cui la sua varianza è 𝑠𝑦2 = 0.56

Il coefficiente di correlazione lineare fra X e Y risulta pari a 𝑟𝑥𝑦 = 0.36

√0.56 × 0.56 ≈ 0.6429

(8)

d) Il coefficiente di correlazione lineare per le variabili X e W= 5 − 8X risulta necessariamente pari a −1, dato che si tratta della variabile X e di una sua combinazione lineare in cui il parametro che moltiplica la X ha segno negativo

𝑟𝑥𝑤 = −1

e) Il valore del coefficiente di correlazione lineare per le variabili W=−2 + 3X

Z= 6 − 0.25Y risulta invece

𝑟𝑤𝑧 = 𝑠𝑒𝑔𝑛𝑜[3 × (−0,25)] × 𝑟𝑥𝑦 = −0.6429

Riferimenti

Documenti correlati

CORSO DI GEOMETRIA E ALGEBRA.. 22

Si classifichino, al variare di a, le coniche singolari scrivendone la forma canonica affine.. (ii) Sia ponga a

[r]

Esibire due matrici che hanno lo stesso polinomio caratteristico ma non

Corso di Laurea in Ingegneria dell’Informazione Prova scritta di Geometria e Algebra. 16

si calcola il m.c.m e si sviluppano i calcoli si ottiene un’equazione di secondo grado in si risolve l’equazione ottenendo due soluzioni si confrontano le soluzioni con

Si noti che la correlazione ` e positiva se dati sono ordinati in modo approssimativamente crescente nello scatterplot, negativa se sono ordinati in modo approssimativamente

[r]