• Non ci sono risultati.

4 - Analisi della varianza e variabili esplicative qualitative

N/A
N/A
Protected

Academic year: 2021

Condividi "4 - Analisi della varianza e variabili esplicative qualitative"

Copied!
38
0
0

Testo completo

(1)

`Statisti a per l'Analisi Organizzativa'

B. S arpa

AA 2006/07

0

Questiappuntisiriferis onoal orsoindi atosopraperladell'Università ommer iale

(2)

 Rapporto tra medie e varianze ondizionate e media e varianza

marginali.

 Una misura della dipendenza in media.

 Analisi della varianza on un riterio di lassi azione.

(3)

 Per er are di apire se e di quanto il tipo di Laurea inuenza il primo

stipendio deidipendenti diun'azienda, l'u io personale di un'azienda

ha onsiderato un ampione di 50 dipendenti.

 In quest'azienda i dipendenti in onsiderazione possono essere laureati

in

 Giurisprudenza (L)

 Ingegneria (I)

 E onomia e Commer io (EC)

 Èan hedisponibile unari lassi azione del voto di laurea (GPA) dove

0 indi a il minimo voto e 4 il massimo dei voti.

 Le prossime duepagine mostrano: (i) i dati elementari; (ii) il

diagram-ma s atola on ba delle alorie lassi ate per tipo di laurea e le

numerosità, medie e s arti quadrati i medi dei tre gruppi.

È evidente he, restringendo l'attenzione alle 50 misure disponibili, il

(4)

GPA sal TL TLF GPA sal TL TLF GPA sal TL TLF 1 2.54 21140 L 0 17 2.67 20586 L 0 34 3.41 28065 I 1 2 2.25 20667 L 0 18 2.89 21084 L 0 35 2.58 27885 I 1 3 2.69 21003 L 0 19 2.94 21256 L 0 36 2.78 23942 EC 2 4 2.84 21269 L 0 20 3.43 21651 L 0 37 2.50 23205 EC 2 5 2.73 20831 L 0 21 2.75 20794 L 0 38 2.92 23962 EC 2 6 2.83 21370 L 0 22 1.93 20380 L 0 39 3.08 24369 EC 2 7 2.48 20435 L 0 23 3.04 20961 L 0 40 2.96 23840 EC 2 8 2.58 20584 L 0 24 3.13 21796 L 0 41 3.06 24452 EC 2 9 3.95 21604 L 0 25 3.05 21075 L 0 42 2.72 23218 EC 2 10 3.00 20937 L 0 26 2.18 28219 I 1 43 2.82 23455 EC 2 11 2.59 20625 L 0 27 1.93 27946 I 1 44 4.00 25790 EC 2 12 2.27 20389 L 0 28 2.31 28053 I 1 45 3.22 24206 EC 2 13 3.14 21490 L 0 29 2.45 28209 I 1 46 2.83 23506 EC 2 14 2.95 21007 L 0 30 2.35 27899 I 1 47 2.52 22961 EC 2 15 2.67 21063 L 0 31 2.44 28295 I 1 48 3.36 24868 EC 2 16 2.67 21003 L 0 32 2.13 27672 I 1 49 3.18 24223 EC 2 33 2.22 27756 I 1 50 2.91 24004 EC 2

(5)

EC

I

L

22000

24000

26000

28000

Boxplot degli stipendi

Tipo di Laurea Numerosità

y

s

Giurisprudenza 15 21000 393.851

Ingegneria 10 27999.9 205.254

E onomia e Commer io 25 24000.07 721.343

(6)

dalla tabella pre edente ed in parti olare aronteremo i seguenti punti:

 ome misurare la forza della dipendenza in media e

 ome veri are se è plausibile he le dierenze osservate nelle medie

siano generalizzabili a tutti i neo-dipendenti dell'azienda (o almeno a

(7)

 Per rendere il dis orso generale indi hiamo on



k

il numero dei gruppi



n

i

,

i = 1, . . . , k

il numero di osservazioni per ogni gruppo.

Nel nostro aso, ovviamente,

k = 3

e, onvenendo he, 1 indi a Laurea in Giurisprudenza, 2 Laurea in Ingegneria e 3 Laurea in E onomia e

ommer io,

n

1

= 15

,

n

2

= 10

,

n

3

= 25

.

 L'insieme di tutte le osservazioni può poi essere indi ato ome

y

ij

,

i = 1, . . . , k,

j = 1, . . . , n

i

.

Si osservi he stiamo onvenendo he il primo pedi e indi a il gruppo

mentre il se ondo l'osservazione entro il gruppo.

 Per ogni gruppo possiamo al olare la media e la varianza

y

i

=

1

n

i

n

i

X

j=1

y

ij

v

2

i

=

1

n

i

n

i

X

j=1

(y

ij

y

i

)

2

Nelnostro aso, queste medie evarianze sonoriferibili alledistribuzioni

(8)

senza riferimento al gruppo di appartenenza

y =

1

n

k

X

i=1

n

i

X

j=1

y

ij

v

2

=

1

n

k

X

i=1

n

i

X

j=1

(y

ij

y)

2

dove

n =

k

X

i=1

n

i

indi a il numero totale di osservazioni disponibili.

y

e

v

2

sono riferibili

alla distribuzione marginale degli stipendi.

 Si osservi he abbiamo denito le varianze dividendo la somma dei

quadrati degli s arti dalla media per il numero delle osservazioni e

non per il numero delle osservazioni

−1

. Abbiamo quindi de iso, per il momento, di muover i in un ontesto des rittivo (le varie 

v

2



sono la varianza delle osservazioni non la stima della varianza della

popolazione da ui le osservazioni provengono). In realtà, le relazioni

(9)

è la media delle medie delle

distribuzioni ondizionate

 Pensiamo ad una distribuzione di frequenza in ui le modalità sono le

k

medie ondizionate e le frequenze (assolute) sono le numerosità delle osservazioni nei vari gruppi, ovvero, a

modalità

y

1

y

2

...

y

k

frequenze

n

1

n

2

...

n

k

 La media (ponderata) di questa distribuzione è ovviamente

1

n

k

X

i=1

n

i

y

i

 È immediato dimostrare he quest'ultima quantità oin ide on la

media marginale

y

.  Infatti

y =

1

n

k

X

i=1

n

i

X

j=1

y

ij

.

Ma, per qualsivoglia

i

, dalla denizione di

y

i

segue he

n

i

X

i=1

y

ij

= n

i

y

i

e quindi,

y =

1

n

k

X

i=1

n

i

y

i

(10)

varianze ondizionate + la varianza

delle medie ondizionate

 Ci si ri ordi he

v

2

indi a la varianza di tutti i dati (

=

la varianza della distribuzione marginale), mentre le

v

2

i

sono le varianze dentro il gruppo

i

-esimo (

=

le varianze delle distribuzioni ondizionate).

 Dimostreremo he

v

2

=

1

n

k

X

i=1

n

i

v

2

i

+

1

n

k

X

i=1

n

i

(

y

i

y)

2

.

 Si osservi he il primo addendo sul lato destro è la media (ponderata)

di una distribuzione in ui le

v

2

i

sono le modalità mentre le

n

i

sono le frequenze assolute, ovvero, è una media di varianze ondizionate

al olata on pesi proporzionali alla numerosità dei vari gruppi.

 Vi eversa, il se ondo addendo è la varianza della distribuzione

mo-strata pre edentemente, ovvero è la varianza delle medie ondizionate

(11)

v

2

=

1

n

k

X

i=1

n

i

X

j=1

(y

ij

y)

2

=

=

1

n

k

X

i=1

n

i

X

j=1

[(y

ij

y

i

) + (

y

i

y)]

2

=

=

1

n

k

X

i=1

n

i

X

j=1

[(y

ij

y

i

)

2

+ (

y

i

y)

2

+ 2(y

ij

y

i

)(

y

i

y)] =

=

1

n

k

X

i=1

n

i

X

k=1

(y

ij

y

i

)

2

+

1

n

k

X

i=1

n

i

(

y

i

y)

2

+

+

2

n

k

X

i=1

(

y

i

y)

n

i

X

i=1

(y

ij

y

i

) =

=

1

n

k

X

i=1

n

i

v

2

i

+

1

n

k

X

i=1

n

i

(

y

i

y)

2

Nell'ultima sempli azione abbiamo usato il fatto he, ome sappiamo, la

sommadelle osservazioni delgruppo

i

-esimodalla media delgruppo

i

-esimo è uguale a zero.

(12)

 Larelazione appena dimostrata, mostra ome la varianza totale,

v

2

, sia

s omponibile in due parti:

1. la prima, il

1

o

addendo, dovuta alla variabilità entro i gruppi e

2. la se onda, il

2

o

addendo, legata le dierenze (in media) tra i

gruppi.

Per questo motivo, i due addendi sono spesso indi ati ome varianza

(13)

sono tutte uguali a

y

e quindi esiste indipendenza in media.

 Vi eversa, se la varianza tra i gruppi è molto grande rispetto alla

va-rianzaentroi gruppi, allora buona partedella variabilità totale

mostra-ta dai dati diventa interpretabile in termini di dierenze tra le medie

ondizionate. Siamo quindi in presenza di una situazione in ui la

di-pendenza in media esiste ed è importante (= le dierenze tra le medie

spiegano una larga frazione delle dierenze he osserviamo nei dati).

 Sembra allora ragionevole usare

η

2

=

varianza tra i gruppi varianza totale

=

= 1 −

varianza entro i gruppi

varianza totale

(14)

1.

0 ≤ η

2

1

.

2.

η

2

= 0

impli a indipendenza in media.

3.

η

2

= 1

impli a he la varianza entro i gruppi ènulla. Siamo quindi

in una situazione di dipendenza, in ogni senso e quindi an he in

media, perfetta.

4.

η

2

non è ovviamente ne denito ne sensato quando

v = 0

. Questo non è un grande problema visto he

v

uguale a zero vuol dire he tutte le osservazioni sono uguali tra di loro e quindi he non esiste

nessuna variabilità interessante da indagare.

 Nel aso degli stipendi,

η

2

è fa ilmente al olabile dai risultati della

tabella ottenuta in pre edenza

1

. In parti olare,

varianza entro i gruppi

242271

varianza tra i gruppi

7347091

varianza totale

7589362

e, quindi,

η

2

0.969

. Il valore trovato i indi a la presenza di una

fortissima dipendenza in media.

1

Cisiri ordi omunque henellatabella, omespiegatonellalegenda,

s

èlaradi edellastimadellavarianza

al olatadividendoperilnumerodeidati

−1

. Quindi, onnotazioniovvie,lavarianzaentroigruppideve

essere al olata onlaformula

(

P

(15)

 Fino a questo punto abbiamo solo guardato ai dati disponibili. In

realtà noi non siamo interessati spe i amente a nessuno dei 50

dipen-denti analizzati e quindi siamo interessati a sapere quanto le dierenze

evidenziate siano estendibili a tutti i dipendenti dell'azienda.

 Una maniera di vedere il problema onsiste nel ri onos ere he no

a questo punto abbiamo tras urato una ulteriore fonte di variabilità,

quella ampionaria. Ad esempio, almeno una parte delle dierenze tra

le medie presentate nella tabella all'inizio è spe i a dei 50 dipendenti

studiati, nel senso he, repli ando l'esperimento (ovvero, prendendo

altri 50 dipendenti,...) i aspettiamo di trovare risultati diversi.

 La domanda è: Di quanto diversi? Tanto diversi, ad esempio, da

por-tar i a on ludere he il minore stipendio osservato per i dipendenti

on Laurea in Giurisprudenza e in E onomia e Commer io sono

sola-mente unaspe i ità del ampione disponibile? Oppure, diversi si, ma

(16)

 Pensiamo all'insieme dei milioni e milioni di possibili lavoratori he

potrebbero lavorare nell'azienda in questione o in una azienda simile.

 Questa popolazione ovviamente può essere divisa in tre gruppi:

1. quelli Laureati in Giurisprudenza;

2. quelli Laureati in Ingegneria;

3. quelli Laureati in E onomia e Commer io.

Possiamoallora pensarealla media degli stipendiper ias uno diquesti

tre gruppi. Indi hiamole rispettivamente on

µ

1

,

µ

2

e

µ

3

.

 Un sistema di ipotesi he può essere interessante veri are on i dati è

H

0

: µ

1

= µ

2

= µ

3

H

1

:

almeno una delle

uguaglianze previste da

H

0

è falsa

Infatti, se

H

0

fosse vera, allora nella popolazione, ontrariamente a quanto osservato nel ampione, non esisterebbe dipendenza in media.

 Si osservi ome il problema sia molto simile a quello di onfronto tra

la media di due popolazioni. La dierenza è he adesso sono oinvolte

(17)

un riterio di lassi azione

 Al solito, per arrivare ad una soluzione abbiamo bisogno di des rivere

la relazione he inter orre tra le osservazioni e la popolazione. In

par-ti olare, la relazione he inter orre tra le osservazioni ele tre medie

µ

1

,

µ

2

e

µ

3

. Una soluzione relativamente sempli e esiste nel aso in ui sia redibile assumere he:

1. La distribuzione all'interno dell'

i

-esimo gruppo sia normale di me-dia

µ

i

e varianza

σ

2

. Si osservi he stiamo supponendo he la

varianza non dipenda da

i

, ovvero, he tutti i gruppi abbiano la stessa variabilità interna.

2. Le osservazioni sono tutte indipendenti tra di loro e, per

qualsivoglia

i

e

j

,

y

ij

∼ N(µ

i

, σ

2

)

.

 La statisti a test omunemente usata è

F

oss

=



varianza tra i gruppi

varianza entro i gruppi

  n − k

k − 1



.

La statisti a

F

oss

è in stretta relazione on

η

2

. Infatti, ome è fa ile

veri are,

F

oss

=



η

2

1 − η

2

  n − k

k − 1



.

Si noti inoltre he la funzione

f : x → x/(1 − x)

è monotona res en-te nell'intervallo

[0, 1]

. Quindi, più è grande

η

2

più è grande

F

oss

e vi eversa.

(18)

 Ovviamente, poi hé i aspettiamo

F

oss

grande quando

H

0

è fal-sa, onsideriamo evidenza ontro l'ipotesi nulla valori elevati della

statisti a.

Ilproblemaèal solito quantogrande deveessere

F

oss

per far idubitare di

H

0

?.

La risposta è fa ilitata dal fatto he è possibile dimostrare he,

nel-le ipotesi in ui i siamo messi (normalità, indipendenza,...),

F

oss

si distribuis e ome una variabile asuale

F

di Snede or on

k − 1

gradi di libertà al numeratore e

n − k

al denominatore. Per quello he i riguarda una

F

di Snede or è una variabile asuale, dipendente da due parametri, i gradi di libertà menzionati pre edentemente.

 Nel aso degli stipendi,

F

oss

744

, he si distribuis e, quindi, ome una variabile asuale

F

di Snede or on

k − 1 = 3 − 1 = 2

gradi di libertà al numeratore e

n − k = 50 − 3 = 47

al denominatore. Il

95

o

per entile di tale distribuzione vale 3.19 e il

99

o

vale 5.09, valori molto

inferiori di quello osservato; riuteremo per iò, on molta onvinzione,

l'ipotesi nulla di uguaglianza delle medie ondizionate, on ludendo

he le dierenze negli stipendi medi tra laureati in diverse dis ipline

non possono essere attribuiti al aso.

 Ad analoghe on lusioni arriveremmo, ovviamente, onsiderando

il valore-

p

he per

F

oss

744

risulta un numero pi olissimo prati amente indistinguibile dallo

0

.

(19)

 Un altro modo di vedere lo stesso problema onsiste nel er are di

ris rivere il modello di analisi della varianza ome un modello lineare

del tipo

Stipendio

=

Tipo di Laurea

+

errore

 Per poter eettuare questa operazione dobbiamo trovare un modo

per trasformare la variabile qualitativa Tipo di Laurea in una o più

variabili quantitative.

 Se rius iamo in questa operazione potremmo er are di utilizzare gli

(20)

al quantitativo onsiste nel ostruire, a partire dalla variabile

quali-tativa in esame (il Tipo di Laurea) al une variabili indi atri i delle

modalità.

 Si ostruiranno ioè un numero di nuove variabili pari al numero

k

di modalità assuntedallavariabilequalitativa hestiamoanalizzando (nel

aso degli stipendi, 3). Cias una di queste variabili assumerà valore

1

se l'unità statisti a assumerà una spe i a modalità e

0

altrimenti.  In questo modo, inserendo in un nuovo modello ome espli ative le

nuovevariabili indi atri i, abbiamo trasformato la variabile qualitativa

in

k

quantitative (le indi atri i

0 − 1

).

 Per poter stimare il modello, abbiamo però bisogno di aggiungere un

vin olo, per hé tutte le variabili indi atri i, onsiderate insieme, sono

ridondanti.

 Ad esempio, se onsideriamo il aso di 3 modalità, onos endo due

di queste variabili posso prevedere on ertezza la terza, visto he le

(21)

y

i

= β

0

+ α

1

x

1

+ α

2

x

2

+ . . . + α

k

x

k

+ ε

i

dove

x

1

, x

2

, . . . , x

k

sono le variabili indi atri i per le modalità della variabile espli ativa he stiamo analizzando (nell'esempio il Tipo di

Laurea).

 Sipossono avere odi he di tipo diverso, a ias una delle quali rimane

asso iata una interpretazione diversa dei parametri stimati

1. Parametrizzazione d'angolo:

Tutte le modalità vengonoposte a onfronto on la prima heviene

assunta ome modalità di riferimento

^

β

0

=

y

1

^

α

1

= 0

^

α

2

=

y

2

y

1

^

α

3

=

y

3

y

1

. . . = . . .

^

α

k

=

y

k

y

1

La matri e dei  onfronti he lega le diverse modalità alle nuove

variabili indi atri i sarà, nel aso di

k = 3

modalità

0 0

1 0

0 1

(22)

I parametri sono pari allo s ostamento delle medie della variabile di

risposta relativa alle unità aventi la

j

-esima modalità della variabile espli ativa dalla media omplessiva

^

β

0

=

1

k

k

X

j=1

y

j

^

α

1

=

y

1

y

^

α

2

=

y

2

y

^

α

3

=

y

3

y

. . . = . . .

^

α

k

=

y

k

y

Con questa Parametrizzazione la matri e dei  onfronti he lega le

diverse modalità alle nuove variabili indi atri i sarà, nel aso di

k = 3

modalità

1

0

0

1

−1 −1

3. Parametrizzazione di Helmert. I parametri sono pari allo s ostamento

del se ondo livello dal primo, del terzo dalla media dei primi due, e

osì via.

La matri e dei  onfronti per questa parametrizzazione, nel aso di

k = 3

modalità, sarà

−1 −1

1

−1

0

2

(23)

 Coeffi ients:

Estimate Std. Error t value Pr(|t|)

(Inter ept) 21000.00 98.44 213.32 <2e-16 ***

TLI 6999.90 184.17 38.01 <2e-16 ***

TLEC 3000.07 160.76 18.66 <2e-16 ***

Residual standard error: 492.2 on 47 degrees of freedom

Multiple R-Squared: 0.9694, Adjusted R-squared: 0.9681

F-statisti : 744 on 2 and 47 DF, p-value: 0

(24)

 Parametrizzazione d'angolo

Call:

lm(formula = sal ~ TL, ontrasts = list(TL = " ontr.treatment"))

Coeffi ients:

(Inter ept) TLI TLEC

21000 3000 7000

 Parametrizzazione rispetto alla media

lm(sal~TL, ontrasts = list(TL=" ontr.sum"))

Call:

lm(formula = sal ~ TL, ontrasts = list(TL = " ontr.sum"))

Coeffi ients: (Inter ept) TL1 TL2 24333.3 -3333.3 -333.3  Parametrizzazione di Helmert lm(sal~TL, ontrasts = list(TL=" ontr.helmert")) Call:

lm(formula = sal ~ TL, ontrasts = list(TL = " ontr.helmert"))

Coeffi ients:

(Inter ept) TL1 TL2

(25)

 Abbiamo a disposizione an heuna indi azione quantitativa del voto di

Laurea.

 Attraverso i boxplot ondizionati ne guardiamo la distribuzione per i

tre gruppi di laureati

EC

I

L

2.0

2.5

3.0

3.5

4.0

Boxplot dei punteggi di laurea

 È evidente he i laureati in Ingegneria mediamente hanno

onse-guito un voto più basso degli altri mentre quelli in Giurisprudenza

(26)

 Vogliamo ora vedere osa su ede al modello se aggiungiamo tra le

espli ative ilvoto di Laurea (GPA), per onsiderare se, a paritàdi

Lau-rea, studenti più bravi all'università vengono analogamente premiati

dallo stipendio nel mondo del lavoro

 Adattiamo ioè un modello del tipo

y

i

= β

0

+ α

TL1

TL

1

+ α

TL2

TL

2

+ β

1

GPA

 Ciò è equivalente ad adattare tre rette di regressione parallele

 ias una orrispondente ad una ategoria della variabile TL (le 3

rette hanno inter etta diversa)

 on un'uni a pendenza he rappresenta l'eetto sul reddito medio

dell'aumento di un punto del voto di laurea

 In un modello senza interazione tra TL e GPA si assume he l'eetto

di GPA sul salario medio sia ostante nei 3 gruppi.

 I oe ienti

α

j

qui esprimono la distanza tra le rette di regressione relativi ai 3 gruppi

(27)

Call:

lm(formula = sal ~ TL + GPA)

Residuals:

Min 1Q Median 3Q Max

-887.31 -200.27 14.04 186.00 838.15

Coeffi ients:

Estimate Std. Error t value Pr(|t|)

(Inter ept) 18359.3 351.2 52.283 < 2e-16 *** TLI 7377.5 132.9 55.501 < 2e-16 *** TLEC 2820.6 110.3 25.581 < 2e-16 *** GPA 943.0 123.2 7.657 9.53e-10 *** ---Signif. odes: 0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1

Residual standard error: 329.9 on 46 degrees of freedom

Multiple R-Squared: 0.9865, Adjusted R-squared: 0.9857

(28)

parità di tipo di laurea, si ha una res ita di 943 euro nello stipendio

medio

 rispetto ai laureati in Giurisprudenza lo stipendio all'assunzione è

si-gni ativamente più alto per i laureati in E onomia e Commer io ed

(29)

1.5

2.0

2.5

3.0

3.5

4.0

20000

22000

24000

26000

28000

Voto di Laurea

Stipendio

L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

I

I

I

I

I

I

I I

I

I

E

E

E

E

E

E

E

E

E

E

E

E

E

E

E

(30)

0

1

2

3

4

20000

22000

24000

26000

28000

Voto di Laurea

Stipendio

L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

I

I

I

I

I

I

I I

I

I

E

E

E

E

E

E

E

E

E

E

E

E

E

E

E

(31)

distudio. Ignorandol'informazione sul tipo dilaurea osa su ede? La

variabile GPA da sola non risulta signi ativa

summary(ris3)

Call:

lm(formula = sal ~ GPA)

Residuals:

Min 1Q Median 3Q Max

-3836.6 -2295.4 -522.5 1442.3 5449.3

Coeffi ients:

Estimate Std. Error t value Pr(|t|)

(Inter ept) 26304.3 2528.3 10.404 6.82e-14 ***

GPA -1081.7 899.5 -1.203 0.235

---Residual standard error: 2742 on 48 degrees of freedom

Multiple R-Squared: 0.02925, Adjusted R-squared: 0.009022

(32)

20000

22000

24000

26000

28000

−500

0

500

Valori interpolati

Residui

L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

I

I

I I

I

I

II

I

I

E

E

E

E

E

E

E

E

E

E

E

E

E

E

E

−2

−1

0

1

2

Q−Q plot Normale

Quantili osservati

(33)

 Mentre sembra rimangano al une relazioni non ompletamente

spie-gate parti olarmente nei gruppi dei laureati in Ingegneria e di quelli

laureati in E onomia e Commer io

 proviamo a modi are il modello per des rivere meglio lo stipendio di

(34)

EC

I

L

22000

24000

26000

28000

Boxplot degli stipendi

EC

I

L

2.0

2.5

3.0

3.5

4.0

Boxplot dei punteggi di laurea

 La distribuzioni dei punteggi alla laurea degli ingegneri è on entrata

verso i valori bassi mentre quella degli stipendi verso i valori alti!

 È pertanto interessante introdurre un parametro he esprima

l'intera-zione tra GPA e TL. Ovvero un parametro he valuti se l'eetto del

punteggio di laurea sullo stipendio medio sia diverso neitre gruppi L,

(35)

 lm(sal~TL+GPA+TL:GPA, ontrasts = list(TL=" ontr.treatment"))

Residuals:

Min 1Q Median 3Q Max

-311.91 -192.98 -27.58 163.24 535.64

Coeffi ients:

Estimate Std. Error t value Pr(|t|)

(Inter ept) 18787.9 330.6 56.822 < 2e-16 *** TLI 8917.1 569.0 15.672 < 2e-16 *** TLEC -386.3 599.0 -0.645 0.52236 GPA 789.9 116.9 6.755 2.61e-08 *** TLI:GPA -667.1 223.6 -2.983 0.00464 ** TLEC:GPA 1082.1 202.9 5.332 3.20e-06 *** ---Signif. odes: 0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1

Residual standard error: 228.8 on 44 degrees of freedom

Multiple R-Squared: 0.9938, Adjusted R-squared: 0.9931

F-statisti : 1412 on 5 and 44 DF, p-value: 0

 L'interazione è signi ativa: a ias un gruppo è asso iata una retta di

regressione avente inter etta e pendenza diverse!

 Rispetto alla laurea in Giurisprudenza quella in E onomia e

Commer- io è quella he porta ad un aumento più elevato del salario medio

(36)

0

1

2

3

4

5

6

7

18000

20000

22000

24000

26000

28000

Voto di Laurea

Stipendio

L

L

L

L

L

L

LL

L

L

L

L

L

L

L

L

L

LL

L

L

L

L

L

L

I

I

I I

I

I

I I

I

I

E

E

E

E

E

E

E

E

E

E

E

E

E

E

E

(37)

2.0

2.5

3.0

3.5

4.0

22000

24000

26000

28000

GPA

sal

TL

EC

I

L

(38)

20000

22000

24000

26000

28000

−200

0

200

400

Valori interpolati

Residui

L

L L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

I

I

I

I

I

I

I

I

I

I

E

E

E

E

E

E

E

E

E

E

E

E

E

E

E

−2

−1

0

1

2

−1

0

1

2

Q−Q plot Normale

Quantili teorici

Quantili osservati

Riferimenti

Documenti correlati

così, se la funzione viene invocata con un argomento di tipo Empty restituisce un valore di tipo Empty, mentre con un argomento di tipo NonEmpty restituisce un valore di ti- po

Lo stimatore di un parametro non ` e unico: per decidere quale tra 2 stimatori corretti sia il migliore si usa il criterio di scegliere quello pi` u efficiente ossia quello per cui

Si vuole studiare se i valori della variabile quantitativa dipendono dall’appartenenza o meno delle osservazioni a una delle classi della variabile qualitativa.. La

Both methods used, the wavelet transform modulus maxima and the multifractal detrended fluctuation analysis reveal significant multifractality for all series

Un metodo usato per fornire una stima approssimata degli standard error si basa sulla teoria sviluppata da Binder (1991) e da Binder e Patak (1994) conosciuta come “Theory

In ogni caso l’analisi viene condotta scomponendo la varianza complessiva della variabile dipendente (o delle variabili dipendenti) nella varianza spiegata, imputabile ai fattori (o

Determinare il voto medio delle ragazze. 14) Si lancino contemporaneamente 3 monete, le prime due perfettamente bilanciate e la terza truccata in modo che la

CTP:tRNA cytidylyltransferase activity /// CTP:3'- cytidine-tRNA cytidylyltransferase activity /// ATP:3'- cytidine-cytidine-tRNA adenylyltransferase activity /// NADPH binding