`Statisti a per l'Analisi Organizzativa'
B. S arpa
AA 2006/07
0
Questiappuntisiriferis onoal orsoindi atosopraperladell'Università ommer iale
Rapporto tra medie e varianze ondizionate e media e varianza
marginali.
Una misura della dipendenza in media.
Analisi della varianza on un riterio di lassi azione.
Per er are di apire se e di quanto il tipo di Laurea inuenza il primo
stipendio deidipendenti diun'azienda, l'u io personale di un'azienda
ha onsiderato un ampione di 50 dipendenti.
In quest'azienda i dipendenti in onsiderazione possono essere laureati
in
Giurisprudenza (L)
Ingegneria (I)
E onomia e Commer io (EC)
Èan hedisponibile unari lassi azione del voto di laurea (GPA) dove
0 indi a il minimo voto e 4 il massimo dei voti.
Le prossime duepagine mostrano: (i) i dati elementari; (ii) il
diagram-ma s atola on ba delle alorie lassi ate per tipo di laurea e le
numerosità, medie e s arti quadrati i medi dei tre gruppi.
È evidente he, restringendo l'attenzione alle 50 misure disponibili, il
GPA sal TL TLF GPA sal TL TLF GPA sal TL TLF 1 2.54 21140 L 0 17 2.67 20586 L 0 34 3.41 28065 I 1 2 2.25 20667 L 0 18 2.89 21084 L 0 35 2.58 27885 I 1 3 2.69 21003 L 0 19 2.94 21256 L 0 36 2.78 23942 EC 2 4 2.84 21269 L 0 20 3.43 21651 L 0 37 2.50 23205 EC 2 5 2.73 20831 L 0 21 2.75 20794 L 0 38 2.92 23962 EC 2 6 2.83 21370 L 0 22 1.93 20380 L 0 39 3.08 24369 EC 2 7 2.48 20435 L 0 23 3.04 20961 L 0 40 2.96 23840 EC 2 8 2.58 20584 L 0 24 3.13 21796 L 0 41 3.06 24452 EC 2 9 3.95 21604 L 0 25 3.05 21075 L 0 42 2.72 23218 EC 2 10 3.00 20937 L 0 26 2.18 28219 I 1 43 2.82 23455 EC 2 11 2.59 20625 L 0 27 1.93 27946 I 1 44 4.00 25790 EC 2 12 2.27 20389 L 0 28 2.31 28053 I 1 45 3.22 24206 EC 2 13 3.14 21490 L 0 29 2.45 28209 I 1 46 2.83 23506 EC 2 14 2.95 21007 L 0 30 2.35 27899 I 1 47 2.52 22961 EC 2 15 2.67 21063 L 0 31 2.44 28295 I 1 48 3.36 24868 EC 2 16 2.67 21003 L 0 32 2.13 27672 I 1 49 3.18 24223 EC 2 33 2.22 27756 I 1 50 2.91 24004 EC 2
EC
I
L
22000
24000
26000
28000
Boxplot degli stipendi
Tipo di Laurea Numerosità
y
s
Giurisprudenza 15 21000 393.851
Ingegneria 10 27999.9 205.254
E onomia e Commer io 25 24000.07 721.343
dalla tabella pre edente ed in parti olare aronteremo i seguenti punti:
ome misurare la forza della dipendenza in media e
ome veri are se è plausibile he le dierenze osservate nelle medie
siano generalizzabili a tutti i neo-dipendenti dell'azienda (o almeno a
Per rendere il dis orso generale indi hiamo on
k
il numero dei gruppi
n
i
,i = 1, . . . , k
il numero di osservazioni per ogni gruppo.Nel nostro aso, ovviamente,
k = 3
e, onvenendo he, 1 indi a Laurea in Giurisprudenza, 2 Laurea in Ingegneria e 3 Laurea in E onomia eommer io,
n
1
= 15
,n
2
= 10
,n
3
= 25
.L'insieme di tutte le osservazioni può poi essere indi ato ome
y
ij
,
i = 1, . . . , k,
j = 1, . . . , n
i
.
Si osservi he stiamo onvenendo he il primo pedi e indi a il gruppo
mentre il se ondo l'osservazione entro il gruppo.
Per ogni gruppo possiamo al olare la media e la varianza
y
i
=
1
n
i
n
i
X
j=1
y
ij
v
2
i
=
1
n
i
n
i
X
j=1
(y
ij
−
y
i
)
2
Nelnostro aso, queste medie evarianze sonoriferibili alledistribuzioni
senza riferimento al gruppo di appartenenza
y =
1
n
k
X
i=1
n
i
X
j=1
y
ij
v
2
=
1
n
k
X
i=1
n
i
X
j=1
(y
ij
−
y)
2
doven =
k
X
i=1
n
i
indi a il numero totale di osservazioni disponibili.
y
ev
2
sono riferibili
alla distribuzione marginale degli stipendi.
Si osservi he abbiamo denito le varianze dividendo la somma dei
quadrati degli s arti dalla media per il numero delle osservazioni e
non per il numero delle osservazioni
−1
. Abbiamo quindi de iso, per il momento, di muover i in un ontesto des rittivo (le variev
2
sono la varianza delle osservazioni non la stima della varianza della
popolazione da ui le osservazioni provengono). In realtà, le relazioni
è la media delle medie delle
distribuzioni ondizionate
Pensiamo ad una distribuzione di frequenza in ui le modalità sono le
k
medie ondizionate e le frequenze (assolute) sono le numerosità delle osservazioni nei vari gruppi, ovvero, amodalità
y
1
y
2
...y
k
frequenzen
1
n
2
...n
k
La media (ponderata) di questa distribuzione è ovviamente
1
n
k
X
i=1
n
i
y
i
È immediato dimostrare he quest'ultima quantità oin ide on la
media marginale
y
. Infattiy =
1
n
k
X
i=1
n
i
X
j=1
y
ij
.
Ma, per qualsivoglia
i
, dalla denizione diy
i
segue hen
i
X
i=1
y
ij
= n
i
y
i
e quindi,y =
1
n
k
X
i=1
n
i
y
i
varianze ondizionate + la varianza
delle medie ondizionate
Ci si ri ordi he
v
2
indi a la varianza di tutti i dati (
=
la varianza della distribuzione marginale), mentre lev
2
i
sono le varianze dentro il gruppoi
-esimo (=
le varianze delle distribuzioni ondizionate).Dimostreremo he
v
2
=
1
n
k
X
i=1
n
i
v
2
i
+
1
n
k
X
i=1
n
i
(
y
i
−
y)
2
.
Si osservi he il primo addendo sul lato destro è la media (ponderata)
di una distribuzione in ui le
v
2
i
sono le modalità mentre len
i
sono le frequenze assolute, ovvero, è una media di varianze ondizionateal olata on pesi proporzionali alla numerosità dei vari gruppi.
Vi eversa, il se ondo addendo è la varianza della distribuzione
mo-strata pre edentemente, ovvero è la varianza delle medie ondizionate
v
2
=
1
n
k
X
i=1
n
i
X
j=1
(y
ij
−
y)
2
=
=
1
n
k
X
i=1
n
i
X
j=1
[(y
ij
−
y
i
) + (
y
i
−
y)]
2
=
=
1
n
k
X
i=1
n
i
X
j=1
[(y
ij
−
y
i
)
2
+ (
y
i
−
y)
2
+ 2(y
ij
−
y
i
)(
y
i
−
y)] =
=
1
n
k
X
i=1
n
i
X
k=1
(y
ij
−
y
i
)
2
+
1
n
k
X
i=1
n
i
(
y
i
−
y)
2
+
+
2
n
k
X
i=1
(
y
i
−
y)
n
i
X
i=1
(y
ij
−
y
i
) =
=
1
n
k
X
i=1
n
i
v
2
i
+
1
n
k
X
i=1
n
i
(
y
i
−
y)
2
Nell'ultima sempli azione abbiamo usato il fatto he, ome sappiamo, la
sommadelle osservazioni delgruppo
i
-esimodalla media delgruppoi
-esimo è uguale a zero.Larelazione appena dimostrata, mostra ome la varianza totale,
v
2
, sia
s omponibile in due parti:
1. la prima, il
1
o
addendo, dovuta alla variabilità entro i gruppi e
2. la se onda, il
2
o
addendo, legata le dierenze (in media) tra i
gruppi.
Per questo motivo, i due addendi sono spesso indi ati ome varianza
sono tutte uguali a
y
e quindi esiste indipendenza in media.Vi eversa, se la varianza tra i gruppi è molto grande rispetto alla
va-rianzaentroi gruppi, allora buona partedella variabilità totale
mostra-ta dai dati diventa interpretabile in termini di dierenze tra le medie
ondizionate. Siamo quindi in presenza di una situazione in ui la
di-pendenza in media esiste ed è importante (= le dierenze tra le medie
spiegano una larga frazione delle dierenze he osserviamo nei dati).
Sembra allora ragionevole usare
η
2
=
varianza tra i gruppi varianza totale=
= 1 −
varianza entro i gruppivarianza totale
1.
0 ≤ η
2
≤
1
.
2.
η
2
= 0
impli a indipendenza in media.
3.
η
2
= 1
impli a he la varianza entro i gruppi ènulla. Siamo quindi
in una situazione di dipendenza, in ogni senso e quindi an he in
media, perfetta.
4.
η
2
non è ovviamente ne denito ne sensato quando
v = 0
. Questo non è un grande problema visto hev
uguale a zero vuol dire he tutte le osservazioni sono uguali tra di loro e quindi he non esistenessuna variabilità interessante da indagare.
Nel aso degli stipendi,
η
2
è fa ilmente al olabile dai risultati della
tabella ottenuta in pre edenza
1
. In parti olare,
varianza entro i gruppi
≈
242271
varianza tra i gruppi≈
7347091
varianza totale
≈
7589362
e, quindi,η
2
≈
0.969
. Il valore trovato i indi a la presenza di una
fortissima dipendenza in media.
1
Cisiri ordi omunque henellatabella, omespiegatonellalegenda,
s
èlaradi edellastimadellavarianzaal olatadividendoperilnumerodeidati
−1
. Quindi, onnotazioniovvie,lavarianzaentroigruppideveessere al olata onlaformula
(
P
Fino a questo punto abbiamo solo guardato ai dati disponibili. In
realtà noi non siamo interessati spe i amente a nessuno dei 50
dipen-denti analizzati e quindi siamo interessati a sapere quanto le dierenze
evidenziate siano estendibili a tutti i dipendenti dell'azienda.
Una maniera di vedere il problema onsiste nel ri onos ere he no
a questo punto abbiamo tras urato una ulteriore fonte di variabilità,
quella ampionaria. Ad esempio, almeno una parte delle dierenze tra
le medie presentate nella tabella all'inizio è spe i a dei 50 dipendenti
studiati, nel senso he, repli ando l'esperimento (ovvero, prendendo
altri 50 dipendenti,...) i aspettiamo di trovare risultati diversi.
La domanda è: Di quanto diversi? Tanto diversi, ad esempio, da
por-tar i a on ludere he il minore stipendio osservato per i dipendenti
on Laurea in Giurisprudenza e in E onomia e Commer io sono
sola-mente unaspe i ità del ampione disponibile? Oppure, diversi si, ma
Pensiamo all'insieme dei milioni e milioni di possibili lavoratori he
potrebbero lavorare nell'azienda in questione o in una azienda simile.
Questa popolazione ovviamente può essere divisa in tre gruppi:
1. quelli Laureati in Giurisprudenza;
2. quelli Laureati in Ingegneria;
3. quelli Laureati in E onomia e Commer io.
Possiamoallora pensarealla media degli stipendiper ias uno diquesti
tre gruppi. Indi hiamole rispettivamente on
µ
1
,µ
2
eµ
3
.Un sistema di ipotesi he può essere interessante veri are on i dati è
H
0
: µ
1
= µ
2
= µ
3
H
1
:
almeno una delle
uguaglianze previste da
H
0
è falsa
Infatti, se
H
0
fosse vera, allora nella popolazione, ontrariamente a quanto osservato nel ampione, non esisterebbe dipendenza in media.Si osservi ome il problema sia molto simile a quello di onfronto tra
la media di due popolazioni. La dierenza è he adesso sono oinvolte
un riterio di lassi azione
Al solito, per arrivare ad una soluzione abbiamo bisogno di des rivere
la relazione he inter orre tra le osservazioni e la popolazione. In
par-ti olare, la relazione he inter orre tra le osservazioni ele tre medie
µ
1
,µ
2
eµ
3
. Una soluzione relativamente sempli e esiste nel aso in ui sia redibile assumere he:1. La distribuzione all'interno dell'
i
-esimo gruppo sia normale di me-diaµ
i
e varianzaσ
2
. Si osservi he stiamo supponendo he la
varianza non dipenda da
i
, ovvero, he tutti i gruppi abbiano la stessa variabilità interna.2. Le osservazioni sono tutte indipendenti tra di loro e, per
qualsivoglia
i
ej
,y
ij
∼ N(µ
i
, σ
2
)
.
La statisti a test omunemente usata è
F
oss
=
varianza tra i gruppi
varianza entro i gruppi
n − k
k − 1
.
La statisti a
F
oss
è in stretta relazione onη
2
. Infatti, ome è fa ile
veri are,
F
oss
=
η
2
1 − η
2
n − k
k − 1
.
Si noti inoltre he la funzione
f : x → x/(1 − x)
è monotona res en-te nell'intervallo[0, 1]
. Quindi, più è grandeη
2
più è grande
F
oss
e vi eversa.Ovviamente, poi hé i aspettiamo
F
oss
grande quandoH
0
è fal-sa, onsideriamo evidenza ontro l'ipotesi nulla valori elevati dellastatisti a.
Ilproblemaèal solito quantogrande deveessere
F
oss
per far idubitare diH
0
?.La risposta è fa ilitata dal fatto he è possibile dimostrare he,
nel-le ipotesi in ui i siamo messi (normalità, indipendenza,...),
F
oss
si distribuis e ome una variabile asualeF
di Snede or onk − 1
gradi di libertà al numeratore en − k
al denominatore. Per quello he i riguarda unaF
di Snede or è una variabile asuale, dipendente da due parametri, i gradi di libertà menzionati pre edentemente.Nel aso degli stipendi,
F
oss
≈
744
, he si distribuis e, quindi, ome una variabile asualeF
di Snede or onk − 1 = 3 − 1 = 2
gradi di libertà al numeratore en − k = 50 − 3 = 47
al denominatore. Il95
o
per entile di tale distribuzione vale 3.19 e il
99
o
vale 5.09, valori molto
inferiori di quello osservato; riuteremo per iò, on molta onvinzione,
l'ipotesi nulla di uguaglianza delle medie ondizionate, on ludendo
he le dierenze negli stipendi medi tra laureati in diverse dis ipline
non possono essere attribuiti al aso.
Ad analoghe on lusioni arriveremmo, ovviamente, onsiderando
il valore-
p
he perF
oss
≈
744
risulta un numero pi olissimo prati amente indistinguibile dallo0
.Un altro modo di vedere lo stesso problema onsiste nel er are di
ris rivere il modello di analisi della varianza ome un modello lineare
del tipo
Stipendio
=
Tipo di Laurea+
errorePer poter eettuare questa operazione dobbiamo trovare un modo
per trasformare la variabile qualitativa Tipo di Laurea in una o più
variabili quantitative.
Se rius iamo in questa operazione potremmo er are di utilizzare gli
al quantitativo onsiste nel ostruire, a partire dalla variabile
quali-tativa in esame (il Tipo di Laurea) al une variabili indi atri i delle
modalità.
Si ostruiranno ioè un numero di nuove variabili pari al numero
k
di modalità assuntedallavariabilequalitativa hestiamoanalizzando (nelaso degli stipendi, 3). Cias una di queste variabili assumerà valore
1
se l'unità statisti a assumerà una spe i a modalità e0
altrimenti. In questo modo, inserendo in un nuovo modello ome espli ative lenuovevariabili indi atri i, abbiamo trasformato la variabile qualitativa
in
k
quantitative (le indi atri i0 − 1
).Per poter stimare il modello, abbiamo però bisogno di aggiungere un
vin olo, per hé tutte le variabili indi atri i, onsiderate insieme, sono
ridondanti.
Ad esempio, se onsideriamo il aso di 3 modalità, onos endo due
di queste variabili posso prevedere on ertezza la terza, visto he le
y
i
= β
0
+ α
1
x
1
+ α
2
x
2
+ . . . + α
k
x
k
+ ε
i
dove
x
1
, x
2
, . . . , x
k
sono le variabili indi atri i per le modalità della variabile espli ativa he stiamo analizzando (nell'esempio il Tipo diLaurea).
Sipossono avere odi he di tipo diverso, a ias una delle quali rimane
asso iata una interpretazione diversa dei parametri stimati
1. Parametrizzazione d'angolo:
Tutte le modalità vengonoposte a onfronto on la prima heviene
assunta ome modalità di riferimento
^
β
0
=
y
1
^
α
1
= 0
^
α
2
=
y
2
−
y
1
^
α
3
=
y
3
−
y
1
. . . = . . .
^
α
k
=
y
k
−
y
1
La matri e dei onfronti he lega le diverse modalità alle nuove
variabili indi atri i sarà, nel aso di
k = 3
modalità
0 0
1 0
0 1
I parametri sono pari allo s ostamento delle medie della variabile di
risposta relativa alle unità aventi la
j
-esima modalità della variabile espli ativa dalla media omplessiva^
β
0
=
1
k
k
X
j=1
y
j
^
α
1
=
y
1
−
y
^
α
2
=
y
2
−
y
^
α
3
=
y
3
−
y
. . . = . . .
^
α
k
=
y
k
−
y
Con questa Parametrizzazione la matri e dei onfronti he lega le
diverse modalità alle nuove variabili indi atri i sarà, nel aso di
k = 3
modalità
1
0
0
1
−1 −1
3. Parametrizzazione di Helmert. I parametri sono pari allo s ostamento
del se ondo livello dal primo, del terzo dalla media dei primi due, e
osì via.
La matri e dei onfronti per questa parametrizzazione, nel aso di
k = 3
modalità, sarà
−1 −1
1
−1
0
2
Coeffi ients:
Estimate Std. Error t value Pr(|t|)
(Inter ept) 21000.00 98.44 213.32 <2e-16 ***
TLI 6999.90 184.17 38.01 <2e-16 ***
TLEC 3000.07 160.76 18.66 <2e-16 ***
Residual standard error: 492.2 on 47 degrees of freedom
Multiple R-Squared: 0.9694, Adjusted R-squared: 0.9681
F-statisti : 744 on 2 and 47 DF, p-value: 0
Parametrizzazione d'angolo
Call:
lm(formula = sal ~ TL, ontrasts = list(TL = " ontr.treatment"))
Coeffi ients:
(Inter ept) TLI TLEC
21000 3000 7000
Parametrizzazione rispetto alla media
lm(sal~TL, ontrasts = list(TL=" ontr.sum"))
Call:
lm(formula = sal ~ TL, ontrasts = list(TL = " ontr.sum"))
Coeffi ients: (Inter ept) TL1 TL2 24333.3 -3333.3 -333.3 Parametrizzazione di Helmert lm(sal~TL, ontrasts = list(TL=" ontr.helmert")) Call:
lm(formula = sal ~ TL, ontrasts = list(TL = " ontr.helmert"))
Coeffi ients:
(Inter ept) TL1 TL2
Abbiamo a disposizione an heuna indi azione quantitativa del voto di
Laurea.
Attraverso i boxplot ondizionati ne guardiamo la distribuzione per i
tre gruppi di laureati
EC
I
L
2.0
2.5
3.0
3.5
4.0
Boxplot dei punteggi di laurea
È evidente he i laureati in Ingegneria mediamente hanno
onse-guito un voto più basso degli altri mentre quelli in Giurisprudenza
Vogliamo ora vedere osa su ede al modello se aggiungiamo tra le
espli ative ilvoto di Laurea (GPA), per onsiderare se, a paritàdi
Lau-rea, studenti più bravi all'università vengono analogamente premiati
dallo stipendio nel mondo del lavoro
Adattiamo ioè un modello del tipo
y
i
= β
0
+ α
TL1
TL
1
+ α
TL2
TL
2
+ β
1
GPA
Ciò è equivalente ad adattare tre rette di regressione parallele
ias una orrispondente ad una ategoria della variabile TL (le 3
rette hanno inter etta diversa)
on un'uni a pendenza he rappresenta l'eetto sul reddito medio
dell'aumento di un punto del voto di laurea
In un modello senza interazione tra TL e GPA si assume he l'eetto
di GPA sul salario medio sia ostante nei 3 gruppi.
I oe ienti
α
j
qui esprimono la distanza tra le rette di regressione relativi ai 3 gruppiCall:
lm(formula = sal ~ TL + GPA)
Residuals:
Min 1Q Median 3Q Max
-887.31 -200.27 14.04 186.00 838.15
Coeffi ients:
Estimate Std. Error t value Pr(|t|)
(Inter ept) 18359.3 351.2 52.283 < 2e-16 *** TLI 7377.5 132.9 55.501 < 2e-16 *** TLEC 2820.6 110.3 25.581 < 2e-16 *** GPA 943.0 123.2 7.657 9.53e-10 *** ---Signif. odes: 0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1
Residual standard error: 329.9 on 46 degrees of freedom
Multiple R-Squared: 0.9865, Adjusted R-squared: 0.9857
parità di tipo di laurea, si ha una res ita di 943 euro nello stipendio
medio
rispetto ai laureati in Giurisprudenza lo stipendio all'assunzione è
si-gni ativamente più alto per i laureati in E onomia e Commer io ed
1.5
2.0
2.5
3.0
3.5
4.0
20000
22000
24000
26000
28000
Voto di Laurea
Stipendio
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
I
I
I
I
I
I
I I
I
I
E
E
E
E
E
E
E
E
E
E
E
E
E
E
E
0
1
2
3
4
20000
22000
24000
26000
28000
Voto di Laurea
Stipendio
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
I
I
I
I
I
I
I I
I
I
E
E
E
E
E
E
E
E
E
E
E
E
E
E
E
distudio. Ignorandol'informazione sul tipo dilaurea osa su ede? La
variabile GPA da sola non risulta signi ativa
summary(ris3)
Call:
lm(formula = sal ~ GPA)
Residuals:
Min 1Q Median 3Q Max
-3836.6 -2295.4 -522.5 1442.3 5449.3
Coeffi ients:
Estimate Std. Error t value Pr(|t|)
(Inter ept) 26304.3 2528.3 10.404 6.82e-14 ***
GPA -1081.7 899.5 -1.203 0.235
---Residual standard error: 2742 on 48 degrees of freedom
Multiple R-Squared: 0.02925, Adjusted R-squared: 0.009022
20000
22000
24000
26000
28000
−500
0
500
Valori interpolati
Residui
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
I
I
I I
I
I
II
I
I
E
E
E
E
E
E
E
E
E
E
E
E
E
E
E
−2
−1
0
1
2
Q−Q plot Normale
Quantili osservati
Mentre sembra rimangano al une relazioni non ompletamente
spie-gate parti olarmente nei gruppi dei laureati in Ingegneria e di quelli
laureati in E onomia e Commer io
proviamo a modi are il modello per des rivere meglio lo stipendio di
EC
I
L
22000
24000
26000
28000
Boxplot degli stipendi
EC
I
L
2.0
2.5
3.0
3.5
4.0
Boxplot dei punteggi di laurea
La distribuzioni dei punteggi alla laurea degli ingegneri è on entrata
verso i valori bassi mentre quella degli stipendi verso i valori alti!
È pertanto interessante introdurre un parametro he esprima
l'intera-zione tra GPA e TL. Ovvero un parametro he valuti se l'eetto del
punteggio di laurea sullo stipendio medio sia diverso neitre gruppi L,
lm(sal~TL+GPA+TL:GPA, ontrasts = list(TL=" ontr.treatment"))
Residuals:
Min 1Q Median 3Q Max
-311.91 -192.98 -27.58 163.24 535.64
Coeffi ients:
Estimate Std. Error t value Pr(|t|)
(Inter ept) 18787.9 330.6 56.822 < 2e-16 *** TLI 8917.1 569.0 15.672 < 2e-16 *** TLEC -386.3 599.0 -0.645 0.52236 GPA 789.9 116.9 6.755 2.61e-08 *** TLI:GPA -667.1 223.6 -2.983 0.00464 ** TLEC:GPA 1082.1 202.9 5.332 3.20e-06 *** ---Signif. odes: 0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1
Residual standard error: 228.8 on 44 degrees of freedom
Multiple R-Squared: 0.9938, Adjusted R-squared: 0.9931
F-statisti : 1412 on 5 and 44 DF, p-value: 0
L'interazione è signi ativa: a ias un gruppo è asso iata una retta di
regressione avente inter etta e pendenza diverse!
Rispetto alla laurea in Giurisprudenza quella in E onomia e
Commer- io è quella he porta ad un aumento più elevato del salario medio