Esercizio 1
La seguente tabella riporta la distribuzione di un collettivo di 70 studenti per nu- mero di anni impiegati per conseguire la laurea (Y) e titolo di studio (X)
X \Y 3 4 5
Liceo Classico 15 10 0 Liceo Scientifico 5 3 12
Altro 5 15 5
Calcolare:
1. le distribuzioni marginali, ni.e nj.; 2. le frequenze relative congiunte fi j
3. le distribuzioni di frequenza marginali relative, fi.e f. j; 4. le distribuzioni relative condizionate.
Soluzione
1. le distribuzioni marginali di X e Y si ottengono calcolando i totali delle frequenze assolute per riga e per colonna, rispettivamente, , ni.= ∑Kj=1ni j e n. j = ∑Hi=1ni j
X \Y 3 4 5 Totale
Liceo Classico 15 10 0 25 Liceo Scientifico 5 3 12 20
Altro 5 15 5 25
Totale 25 28 17 70
2. Le frequenze relative congiunte si ottengono come fi j= ni j n 3. mentre quelle marginali come fi.= ni.
n e f. j =n. j n
X \Y 3 4 5 Totale Liceo Classico 0.2143 0.1429 0 0.3572 Liceo Scientifico 0.0714 0.0429 0.1714 0.2857 Altro 0.0714 0.2143 0.0714 0.3571 Totale 0.3571 0.4001 0.2428 1
Calcoliamo la distribuzione titolo di studio condizionata alle diverse modalità di Y.
X| Y = 3 ni1/n·1 Liceo Classico 0.6 Liceo Scientifico 0.2
Altro 0.2
Totale 1
X| Y = 4 ni2/n·2 Liceo Classico 0.357 Liceo Scientifico 0.107
Altro 0.536
Totale 1
X| Y = 5 ni3/n·3 Liceo Classico 0 Liceo Scientifico 0.706
Altro 0.294
Calcoliamo la distribuzione degli anni impiegati per conseguire la laurea con- dizionata alle diverse modalità di X.
Y | X = Lic.Classico n1 j/n1·
3 0.6
4 0.4
5 0
Totale 1
Y | X = Lic.Scienti f ico n2 j/n2·
3 0.25
4 0.15
5 0.60
Totale 1
Y | X = Altro n3 j/n3·
3 0.20
4 0.60
5 0.20
Totale 1
Esercizio 2
Con riferimento alla seguente distribuzione di un collettivo di individui secondo il sesso (X) ed il salario (Y).
X \Y 1 2 3
M 0 10 10
F 10 10 0
Calcolare:
1. le distribuzioni marginali di X e Y;
2. le distribuzioni di Y condizionate alle diverse modalità di X;
3. le medie e le varianze di Y condizionate alle diverse modalità di X;
4. la media e la varianza di Y.
Soluzione
Otteniamo le distribuzioni marginali di X e Y sommando rispetto alle colonne e alle righe, rispettivamente.
1 2 3 Totale
M 0 10 10 20
F 10 10 0 20
Totale 10 20 10 40
Otteniamo le distribuzioni condizionate di Y dato X Y| X=M n1 j
1 0
2 10
3 10
Totale 20
Y| X=F n2 j
1 0
2 10
3 10
Totale 20
Calcoliamo le medie e le varianze condizionate di Y | X = xi con i = 1, . . . , H.
Dato che X è un carattere qualitativo sconnesso non possiamo calcolare le medie e le varianze condizionate di X | Y = yj con j = 1, . . . , K.
Y|X=M n1 j yj· n1 j y2j· n1 j
1 0 0 0
2 10 20 40
3 10 30 90
Totale 20 50 130
¯
yX=xi= 1
ni.∑Kj=1yjni j
¯
yX=M=50 20 = 2.5 σY2|X=x
i = 1
ni.∑Kj=1y2jni j− ¯y2X=x
i
σY2|X=M=130
20 − 2.52= 0.25
Y|X=F n2 j yj· n2 j y2j· n2 j
1 10 10 10
2 10 20 40
3 0 0 0
Totale 20 30 50
¯
yX=xi= 1
ni.∑Kj=1yjni j
¯
yX=F =30 20 = 1.5 σY2|X=x
i = 1
ni.∑Kj=1y2jni j− ¯y2X=x
i
σY2|X=F = 50
20− 1.52= 0.25
Per calcolare la media e la varianza di Y dobbiamo considerare la distribuzione marginale di Y
yj nj yj· nj y2j· nj
1 10 10 10
2 20 40 80
3 10 30 90
Totale 40 80 180
¯ y=80
40 = 2 σy2= 180
40 − 22= 4.5 − 4 = 0.5
Esercizio 3
Con riferimento alla distribuzione di un collettivo di famiglie secondo il numero di figli (X) e il reddito (Y), completare la seguente tabella nel caso di indipendenza
X \Y 0a 2 2a 6 6 a 10 Totale
1 20 40
2
3 10
Totale 30 100
Soluzione n13: 30 · 40
100 = 12 n11: 40-(12+20)=8
n·1: 40 · x
100 = 8 ⇒ x = 20 n·2: 100-(30+20)=50 n22: 50-(20+10)=20
n2·: 50 · x
100 = 20 ⇒ x = 40 n3·: 100-(40+40)=20 n33: 20 · 30
100 = 6 n31: 20-(10+6)=4 n21: 20-(8+4)=8 n23: 40-(20+8)=12
X \Y 0a 2 2a 6 6 a 10 Totale
1 8 20 12 40
2 8 20 12 40
3 4 10 6 20
Totale 20 50 30 100
Esercizio 4
Con riferimento alla seguente distribuzione di un collettivo di individui secondo il sesso (Y) ed il comune di residenza (X)
X \Y M F
A 0 5
B 5 0
C 10 10
Calcolare le frequenze sotto l’ipotesi di indipendenza tra i due caratteri.
Soluzione
Prima di tutto occorre ricavarsi le distribuzioni marginali di X e Y.
X \Y M F Totale
A 5
B 5
C 20
Totale 15 15 30
La frequenza d’indipendenza è pari a n?i j = ni.n. j
n . Quindi otteniamo la seguente tabella
X \Y M F Totale
A 2.5 2.5 5
B 2.5 2.5 5
C 10 10 20
Totale 15 15 30
Esercizio 5
Nella tabella seguente si riportano l’ammontare degli investimenti (X) e i volumi di vendita (Y)
X Y
1 11
1 8.6
2 10.5 2.1 12 2.2 12.8 2.9 14.7 3 13.5
3 14
3 12.7 3.1 16.4
Sapendo che ¯x= 2.33 e ¯y= 12.62, calcolare una misura della correlazione lineare tra i due caratteri.
Soluzione
X Y xi· yi (xi− ¯x)2 (yi− ¯y)2
1 11 11 1.769 2.624
1 8.6 8.6 1.769 16.160
2 10.5 21 0.109 4.494
2.1 12 25.2 0.053 0.384
2.2 12.8 28.16 0.017 0.032 2.9 14.7 42.63 0.325 4.326
¯
x= 23.3
10 = 2.33
¯
y= 126.2
10 = 12.62 ρxy= COD(X ,Y )
pdev(X )dev(Y )
COD(X ,Y ) = ∑ixiyi− n ¯x ¯y = 308.03 − 10 · (2.33 · 12.62) = 13.984 ρxy= 13.984
√5.982 · 44.992= 0.852
Esercizio 6
Data la seguente tabella
X\Y -1 1 Totale
-1 30 10 40
1 20 40 60
Totale 50 50 100
Calcolare il coefficiente di correlazione lineare tra i caratteri X e Y.
Soluzione
Per poter calcolare il coefficiente di correlazione lineare, dobbiamo calcolare le seguenti quantità
¯
x= −40 + 60 100 = 20
100 = 0.2
¯
y= −50 + 50 100 = 0 xi yj ni j xiyjni j
-1 -1 30 30
1 -1 20 -20
-1 1 10 -10
1 1 40 40
Totale 100 40
Dalla tabella precedente è immediato verificare che la codevianza sia pari a 40.
Dev(x) = ∑Hi=1(xi− ¯x)2ni.= (−1 − 0.2)240 + (1 − 0.2)260 = 57.6 + 38.4 = 96 Dev(y) = ∑Kj=1(yj− ¯y)2n. j= (−1)250 + (1)250 = 50 + 50 = 100
ρxy= 40
√100 · 96= 0.408
Esercizio 7
La tabella seguente riporta i valori osservati per i caratteri X e Y relativamente a 5 unità statistiche con Y = 3 + 3X .
X Y=3+3X
A 2 9
B 4 15
C 6 21
D 8 27
E 10 33
Totale 30 105
1. fornire una rappresentazione grafica per i caratteri X e Y 2. calcolare il coefficiente di correlazione lineare
Soluzione
●
●
●
●
●
2 4 6 8 10
1015202530
x
y
xi yi xi· yi (xi− ¯x)2 (yi− ¯y)2
A 2 9 18 16 144
B 4 15 60 4 36
C 6 21 126 0 0
D 8 27 216 4 36
E 10 33 330 16 144
Totale 30 105 750 40 360
σxy= 750
5 − (6 · 21) = 150 − 126 = 24 σx=r 40
5 = 2.8284 σy=r 360
5 = 8.4853 ρxy= 24
2.8284 · 8.4853= 1
ρxy= 1 (come ci aspettavamo) significa che sussiste un perfetto legame lineare tra i due caratteri.
Inoltre verifichiamo che
• ¯y = a + b ¯x ⇒ ¯y = 3 + 3 · 6 = 21
• σy2= b2σx2⇒ σy2= 32· 8 = 72
• σxy= bσx2⇒ σxy= 3 · 8 = 24
Esercizio 8
Ripetere l’esercizio precedente sapendo che Y = 5 + (X − 6)2 X Y=5+(X-6)2
A 2 21
B 4 9
C 6 5
D 8 9
E 10 21
Totale 30 65
Soluzione
●
●
●
●
●
2 4 6 8 10
5101520
x
y
¯ x=30
5 = 6
¯ y= 65
5 = 13
xi yi xi· yi (xi− ¯x)2 (yi− ¯y)2
A 2 21 42 16 64
B 4 9 36 4 16
C 6 5 30 0 64
D 8 9 72 4 16
E 10 21 210 16 64
Totale 30 65 390 40 224
σxy=390
5 − (6 · 13) = 78 − 78 = 0 ρxy= σxy
σxσy = 0 σxσy = 0.
ρxy= 0 (come ci aspettavamo) significa che la relazione tra i due caratteri non è lineare.