• Non ci sono risultati.

Regressione lineare:

N/A
N/A
Protected

Academic year: 2021

Condividi "Regressione lineare: "

Copied!
48
0
0

Testo completo

(1)

STATISTICA

Regressione-3

L’inferenza per il modello lineare semplice

(2)

Regressione lineare:

A. Valutazione preliminare se una retta possa essere una buona

approssimazione

B. Stima dei parametri della retta.

C. Valutazione della bontà di adattamento del

modello ai dati

D. Significatività della regressione

GRAFICO DI DISPERSIONE

&

& analisi residui

(3)

~ ,

Inferenza

Il modello della

regressione lineare semplice:

Verificare se il vero valore della pendenza nella popolazione di riferimento è davvero diverso da zero ( ⇔ previsioni!) oppure no:

∶ , ∶

(4)

Inferenza

, … , . . . ~ ,

stima di : varianza

degli errori errori o residui

Il modello della

regressione lineare semplice:

Osserviamo

(5)

Inferenza

, … , . . . ~ ,

errori o residui

Il modello della

regressione lineare semplice:

Osserviamo

1 1

stima di : varianza

degli errori

(6)

Inferenza

, … , . . . ~ ,

errori o residui

Il modello della

regressione lineare semplice:

Osserviamo

1 1

stima di : varianza

degli errori

0 10 20 30 40

-50510

(7)

Inferenza

~ 0,

~ ,

e v.c. gaussiane dalle stime agli stimatori:

∶ 0 ∶ 0

1 2

>

rifiutiamo se:

(rifiutiamo la casualità

di una pendenza 0)

(8)

Inferenza

~ 0,

~ ,

e v.c. gaussiane dalle stime agli stimatori:

∶ ∶

1 2

rifiutiamo se:

>

(9)

Regressione lineare:

A. Valutazione preliminare se una retta possa essere una buona

approssimazione

B. Stima dei parametri della retta.

C. Valutazione della bontà di adattamento del

modello ai dati

D. Significatività della regressione

GRAFICO DI DISPERSIONE

&

& analisi residui

∶ ∶

(10)

Esempio, x y

i

1 2 3 4 5

i

1.5 2.5 3 2.5 3.5

1.8 2.2 2.6 3.0 3.4

-0.3 0.3 0.4 -0.5 0.1

1.4 0.4

Cont.

0.85

0.72

1 3 0.2

(11)

Esempio, x y

i

1 2 3 4 5

i

1.5 2.5 3 2.5 3.5

1.8 2.2 2.6 3.0 3.4

-0.3 0.3 0.4 -0.5 0.1

1.4 .

Cont.

0.85

0.72

1

3 .

∶ 0 ∶ 0

>

×

(12)

Esempio, x y

i

1 2 3 4 5

i

1.5 2.5 3 2.5 3.5

1.8 2.2 2.6 3.0 3.4

-0.3 0.3 0.4 -0.5 0.1

1.4 .

Cont.

0.85

0.72

1

3 .

∶ 0 ∶ 0

.

. . >

.

? ? ?

× .

NON POSSIAMO RIFIUTARE , LA

REGR. NON E’ SIGNIFICATIVA , AL 5%!

(13)

1 2 3 4 5

1.52.02.53.03.5

Esempio x y

i

1 2 3 4 5

i

1.5 2.5 3 2.5 3.5

Grafico di dispersione

0.4 1.4

1.4 0.4

̅ 3, 2.6

. , . . × . . 4.5

La previsione è attendibile?

NOOOOO !!!

Previsione:

Cont.

(14)

1 2 3 4 5

1.52.02.53.03.5

Esempio x y

i

1 2 3 4 5

i

1.5 2.5 3 2.5 3.5

Grafico di dispersione

0.4 1.4

1.4 0.4

̅ 3, 2.6

4.5

Cont.

La pendenza è positiva

«per caso»

(15)

Esercizio 2

2 3 5 7.5 8 10

3.1 4.3 5.9 4.8 7 9

1. Le due variabili sono correlate? Come e quanto?

2. Stimare i parametri della retta dei minimi quadrati per i dati , .

3. Valutare la bontà di adattamento ai dati della retta 4. Determinare se la regressione sia statisticamente

significativa al livello del 5%

5. Fornire la previsione del modello per i valori 4 e 15 della

variabile indipendente

(16)

Esercizio 2

2 3 5 7.5 8 10

3.1 4.3 5.9 4.8 7 9

1. Le due variabili sono

correlate? Come e quanto?

2 4 6 8 10

3456789

y

̅ 5.9 5.68

5.9 8.23

5.68 3.73

(17)

Esercizio 2

1. Le due variabili sono

correlate? Come e quanto?

2 4 6 8 10

3456789

y

̅ 5.9 5.68

8.23 3.73

×

38.43 33.51 .

2 3 5 7.5 8 10

3.1 4.3 5.9 4.8 7 9

6.2 12.9 29.5 36 56 90

(18)

Esercizio 2

1. Le due variabili sono

correlate? Come e quanto?

̅ 5.9 5.68

8.23 3.73

×

38.43 33.51 .

2 3 5 7.5 8 10

3.1 4.3 5.9 4.8 7 9

6.2 12.9 29.5 36 56 90

.

. × . .

Indicazione di correlazione

lineare, positiva

(19)

Esercizio 2

2 3 5 7.5 8 10

3.1 4.3 5.9 4.8 7 9

1. Le due variabili sono correlate? Come e quanto?

2. Stimare i parametri della retta dei minimi quadrati per i dati , .

3. Valutare la bontà di adattamento ai dati della retta . . > . , accettabile

(risposta parziale)

(20)

Esercizio 2

2 3 5 7.5 8 10

3.1 4.3 5.9 4.8 7 9

2. Stimare i parametri della retta dei minimi quadrati per i dati , .

̅ 5.9 5.68

8.23 3.73 4.92

. . .

. . × . .

(21)

2 4 6 8 10

3456789

Esercizio 2

2 3 5 7.5 8 10

3.1 4.3 5.9 4.8 7 9

. .

. .

, . . × .

(22)

Esercizio 2

2 3 5 7.5 8 10

3.1 4.3 5.9 4.8 7 9

3.34 3.94 5.14 6.64 6.94 8.14

- 0.24

0.36 0.76

- 1.84

0.06 0.86

. .

.

. .

. .

(23)

Esercizio 2

2 3 5 7.5 8 10

3.1 4.3 5.9 4.8 7 9

3.34 3.94 5.14 6.64 6.94 8.14

- 0.24

0.36 0.76

- 1.84

0.06 0.86 3. Valutare la bontà di

adattamento ai dati della

retta (se avessimo più dati…)

1 2 3 4 5 6

-1.5-1.0-0.50.00.5

res

(24)

Esercizio 2

2 3 5 7.5 8 10

3.1 4.3 5.9 4.8 7 9

4. Determinare se la regressione sia statisticamente significativa al livello del 5%

∶ ∶ .

.

̅ 5.9 5.68

8.23

3.73

4.92

(25)

Esercizio 2

2 3 5 7.5 8 10

3.1 4.3 5.9 4.8 7 9

4. Determinare se la regressione sia statisticamente significativa al livello del 5%

.

. ∶ ∶

̅ 5.9 5.68

8.23

3.73

4.92

(26)

Esercizio 2

2 3 5 7.5 8 10

3.1 4.3 5.9 4.8 7 9

4. Determinare se la regressione sia statisticamente significativa al livello del 5%

.

.

× . . . .

∶ ∶

̅ 5.9 5.68

8.23

3.73

4.92

(27)

Esercizio 2

2 3 5 7.5 8 10

3.1 4.3 5.9 4.8 7 9

4. Determinare se la regressione sia statisticamente significativa al livello del 5%

8.23 4.92

.

× . . . .

∶ ∶ Rifiutiamo l’ipotesi

nulla, e quindi la regressione é

significativa al livello del 5%

4

.

4

.

2.7764

(28)

Esercizio 2

2 3 5 7.5 8 10

3.1 4.3 5.9 4.8 7 9

5. Fornire la previsione del modello per i valori 4 e 15 della variabile

indipendente

2 4 6 8 10

3456789

, . . ×

.

: non è possibile

fare una previsione, perché fuori dal campo delle

osservazioni

(29)

Inferenza per la previsione

∓ 2 × 1 ∑ ̅

IC della risposta di un nuovo “individuo” con

covariata pari a

(30)

Esercizio 2, cont.

2 3 5 7.5 8 10

3.1 4.3 5.9 4.8 7 9

5. Fornire la previsione del modello per i valori 4 e 15 della variabile

indipendente

, . . ×

.

∓ 2 × 1 ∑ ̅

4.54 ∓ 2.7764 × 1.22 1 1

6 .

6 × 8.23 ⇒ 1.12, 7.95

0.05

(31)

Esercizio 2, cont.

2 3 5 7.5 8 10

3.1 4.3 5.9 4.8 7 9

5. Fornire la previsione del modello per i valori 4 e 15 della variabile

indipendente

, . . ×

. 4.54 ∓ 2.7764 × 1.22 1 1

6 .

6 × 8.23 ⇒ 1.12, 7.95 0.05

2 4 6 8 10

3456789

(32)

Esercizio 3

Su un campione di 5 unità sono state osservate due variabili, X ed Y:

x

i

1 4 5 7 10

y

i

-0.5 -2 -1 -2 -3

1. Rappresentare l’andamento congiunto di Y in funzione di X mediante un opportuno grafico: le due variabili sono correlate? Come e quanto?

2. Determinare le stime dei minimi quadrati dei parametri della retta interpolatrice dei dati

3. Determinare la significatività del modello di regressione lineare basato sulla retta al punto 2.

4. Valutare con un opportuno indice la bontà di adattamento del modello ai dati

5. Indicare entro quale intervallo sia possibile fare previsione sui valori di Y

(33)

2 4 6 8 10

-3.0-2.5-2.0-1.5-1.0-0.5

Esercizio 3

Su un campione di 5 unità sono state osservate due variabili, X ed Y:

x y

x

i

1 4 5 7 10

y

i

-0.5 -2 -1 -2 -3

̅ 5.4 1.7

9.04

0.76

(34)

2 4 6 8 10

-3.0-2.5-2.0-1.5-1.0-0.5

Esercizio 3

Su un campione di 5 unità sono state osservate due variabili, X ed Y:

x y

x

i

1 4 5 7 10

y

i

-0.5 -2 -1 -2 -3

xy -0.5 -8 -5 -14 -30

̅ 5.4 1.7

9.04 0.76

11.5 5.4 × 1.7 2.32

(35)

Esercizio 3

Su un campione di 5 unità sono state osservate due variabili, X ed Y:

x y

x

i

1 4 5 7 10

y

i

-0.5 -2 -1 -2 -3

̅ 5.4 1.7

9.04 0.76

2.32

2 4 6 8 10

-3.0-2.5-2.0-1.5-1.0-0.5

2.32

9.04 × 0.76 0.885

Correlazione lineare

negativa

(36)

Esercizio 3

Su un campione di 5 unità sono state osservate due variabili, X ed Y:

x

i

1 4 5 7 10

y

i

-0.5 -2 -1 -2 -3

̅ 5.4 1.7

. .

2 4 6 8 10

-3.0-2.5-2.0-1.5-1.0-0.5

.

. .

x

y

(37)

Esercizio 3

Su un campione di 5 unità sono state osservate due variabili, X ed Y:

x

i

1 4 5 7 10

y

i

-0.5 -2 -1 -2 -3

. .

9.04 2.32

2 4 6 8 10

-3.0-2.5-2.0-1.5-1.0-0.5

.

. .

x y

. . × . .

(38)

Esercizio 3

Su un campione di 5 unità sono state osservate due variabili, X ed Y:

x

i

1 4 5 7 10

y

i

-0.5 -2 -1 -2 -3

2 4 6 8 10

-3.0-2.5-2.0-1.5-1.0-0.5

.

x y

. .

.

. . × .

(39)

Esercizio 3

Su un campione di 5 unità sono state osservate due variabili, X ed Y:

x

i

1 4 5 7 10

y

i

-0.5 -2 -1 -2 -3

1. Rappresentare l’andamento congiunto di Y in funzione di X mediante un opportuno grafico: le due variabili sono correlate? Come e quanto?

2. Determinare le stime dei minimi quadrati dei parametri della retta interpolatrice dei dati

3. Determinare la significatività del modello di regressione lineare basato sulla retta al punto 2.

4. Valutare con un opportuno indice la bontà di adattamento del modello ai dati

5. Indicare entro quale intervallo sia possibile fare previsione sui valori di Y

(40)

Esercizio 3

Su un campione di 5 unità sono state osservate due variabili, X ed Y:

x

i

1 4 5 7 10

y

i

-0.5 -2 -1 -2 -3

1. Rappresentare l’andamento congiunto di Y in funzione di X mediante un opportuno grafico: le due variabili sono correlate? Come e quanto?

2. Determinare le stime dei minimi quadrati dei parametri della retta interpolatrice dei dati

3. Valutare con un opportuno indice la bontà di adattamento del modello ai dati

. . > .

(41)

Esercizio 3

Su un campione di 5 unità sono state osservate due variabili, X ed Y:

x

i

1 4 5 7 10

y

i

-0.5 -2 -1 -2 -3

1. Rappresentare l’andamento congiunto di Y in funzione di X mediante un opportuno grafico: le due variabili sono correlate? Come e quanto?

2. Determinare le stime dei minimi quadrati dei parametri della retta interpolatrice dei dati

5. Indicare entro quale intervallo sia possibile fare previsione sui valori di

Y

≤ ≤

(42)

Esercizio 3

Su un campione di 5 unità sono state osservate due variabili, X ed Y:

x

i

1 4 5 7 10

y

i

-0.5 -2 -1 -2 -3

1. Rappresentare l’andamento congiunto di Y in funzione di X mediante un opportuno grafico: le due variabili sono correlate? Come e quanto?

2. Determinare le stime dei minimi quadrati dei parametri della retta interpolatrice dei dati

3. Determinare la significatività del modello di regressione lineare basato sulla retta al punto 2.

∶ ∶

(43)

Esercizio 3

Su un campione di 5 unità sono state osservate due variabili, X ed Y:

x

i

1 4 5 7 10

y

i

-0.5 -2 -1 -2 -3

-0.56 -1.34 -1.6 -2.12 -2.9 0.06 -0.66 0.6 0.12 -0.1

∶ ∶

. ⇒ . .

. ,

.

(44)

Esercizio 3

Su un campione di 5 unità sono state osservate due variabili, X ed Y:

x

i

1 4 5 7 10

y

i

-0.5 -2 -1 -2 -3

-0.56 -1.34 -1.6 -2.12 -2.9 0.06 -0.66 0.6 0.12 -0.1

∶ ∶

. ⇒ . .

. ,

.

.

(45)

Esercizio 3

Su un campione di 5 unità sono state osservate due variabili, X ed Y:

∶ ∶ 0.26 ⇒ 0.3 0.26 0.3,

1

3 0.27

9.04

| | .

× . .

.

x

i

1 4 5 7 10

y

i

-0.5 -2 -1 -2 -3

-0.56 -1.34 -1.6 -2.12 -2.9

0.06 -0.66 0.6 0.12 -0.1

(46)

Esercizio 3

Su un campione di 5 unità sono state osservate due variabili, X ed Y:

x

i

1 4 5 7 10

y

i

-0.5 -2 -1 -2 -3

-0.56 -1.34 -1.6 -2.12 -2.9 0.06 -0.66 0.6 0.12 -0.1

∶ ∶ 0.26 ⇒ 0.3 0.26 0.3,

1

3 0.27

9.04

| | .

× . .

.

(47)

Esercizio 3

Su un campione di 5 unità sono state osservate due variabili, X ed Y:

x

i

1 4 5 7 10

y

i

-0.5 -2 -1 -2 -3

-0.56 -1.34 -1.6 -2.12 -2.9 0.06 -0.66 0.6 0.12 -0.1

∶ ∶ 0.26 ⇒ 0.3 0.26 0.3,

1

3 0.27

9.04

| | .

× . .

.

.

.

(48)

Esercizio 3

Su un campione di 5 unità sono state osservate due variabili, X ed Y:

x

i

1 4 5 7 10

y

i

-0.5 -2 -1 -2 -3

-0.56 -1.34 -1.6 -2.12 -2.9 0.06 -0.66 0.6 0.12 -0.1

∶ ∶ 0.26 ⇒ 0.3 0.26 0.3,

1

3 0.27

9.04

| | .

× . .

.

.

.

LA REGRESSIONE E’

SIGNIFICATIVA AL LIVELLO DEL 5%

IL p-valore E’ < 0.025 x 2 = 0.05

Riferimenti

Documenti correlati

L’algoritmo di regressione lineare da’ sempre come risultato una retta, indipendemente dal fatto che i punti si collochino o meno sulla una retta stessa.. E’ necessario

In questi commenti ci proponiamo di trovare tutti i punti di flesso

Per le soluzioni di una equazione algebrica di quarto grado non c’`e una formula ragionevole (per dire la verit`a, esiste una formula, ma `e troppo complicata e non

Perci`o dovrebbe esistere un punto di flesso a sinistra di −1.. In questi commenti ci proponiamo di trovare tutti i punti di

Scienza dei Media e della

In tali punti la funzione vale x e rispettivamente −x e quindi essi non sono di massimo e

La funzione `e assegnata in un dominio non limitato e quindi, pur essendo continua, non si pu`o assicurare l’esistenza del massimo e del minimo assoluto... Quindi la funzione non

Un massimo o minimo vincolato per una funzione di due variabili è un massimo o minimo da ricercarsi non su tutto il dominio ma all'interno del sottoinsieme del dominio che