• Non ci sono risultati.

Settimana 3

N/A
N/A
Protected

Academic year: 2021

Condividi "Settimana 3"

Copied!
26
0
0

Testo completo

(1)

Settimana 3

G. M. Marchetti

2018

(2)

Prima parte

Relazioni tra variabili e regressione lineare

(3)

Una legge fisica approssimata

Il fisico scozzese Forbes

(4)

L’esperimento di Forbes

• Sulla cima delle montagne l’acqua bolle a temperature più basse di 100 gradi.

• Forbes cercò di stimare l’altitudine sul livello del mare a partire dalla misura del punto di ebollizione dell’acqua.

• L’altitudine → pressione → temperatura di ebollizione. (Nota:

il barometro era uno strumento delicato e pesante)

I diverse zone delle Alpi misurò Y : la pressione atmosferica (con un barometro, in mm di Hg) e X : il punto di ebollizione dell’acqua (in gradi Celsius)

(5)

Scatter del punto di ebollizione e della temperatura

I dati sono rappresentati su uno scatter

90 92 94 96 98 100

550600650700750

Punto di ebollizione

pressione

(6)

Andamento lineare

A giudicare dallo scatter sembra i dati seguano una legge lineare

Pressione ≈ α + β · (Punto di ebollizione)

• I punti non sono perfettamente allineati perché ci sono imprecisioni dovute ad errori di misura

• La pressione e la temperatura sono su due piani diversi

La pressione è la variabiile dipendente

La temperatura è il la variabile esplicativa

(7)

Una legge economica

• Vendite e spese di pubblicità

0 50 100 150 200 250

5101520

SpeseTV

Vendite

Vendite ≈ α + β · SpeseTV

(8)

Relazioni matematiche

Il concetto base è quello di funzione y = f (x ).

Permettono di descrivere delle leggi semplici come una retta, una parabola, una sinusoide, un polinomio. . .

0.0 0.4 0.8 0.00

0.05 0.10 0.15 0.20 0.25

0 2 4 6 8 10

−1.0

−0.5 0.0 0.5 1.0

0 1 2 3 4 5

−5 0 5 10

(9)

La retta

La relazione più semplice è quella lineare

y = a + bx dove a è l’intercetta e b è la pendenza.

(10)

Leggere il grafico

• Trovale sulla figura

0 2 4 6 8 10

0 2 4 6 8 10

x

y

y = intercetta + pendenza · x = 2 +1 2x

(11)

Relazioni statistiche

Segnale più rumore

Y = f (x ) + residuo

0.0 0.4 0.8 0.0

0.5 1.0 1.5 2.0 2.5 3.0

0 2 4 6 8 10

−1.5

−1.0

−0.5 0.0 0.5 1.0 1.5

0 1 2 3 4 5

−5 0 5 10

(12)

Stima dei minimi quadrati

• Come si ottengono i coefficienti della legge lineare?

Si adatta la retta dei minimi quadrati, la retta che passa FRA i punti ed è ad essi più vicina

90 92 94 96 98 100

550650750

Punto di ebollizione

pressione

Si dice anche retta di regressione tra Y e X

(13)

Risultati e interpretazione

90 92 94 96 98 100

550650750

Punto di ebollizione

pressione

- Si stimano i due coefficienti a e b della retta dai dati pressione = −1634.0 + 23.9 · temperatura

- Per ogni grado di aumento del punto di ebollizione la pressione aumenta di 23.9 millimetri.

(14)

Retta dei minimi quadrati tra vendite e spese

0 50 100 150 200 250

5101520

SpeseTV in migliaia di euro

Vendite in migliaia di unità

Vendite ≈ 5.82 + 0.054 · SpeseTV

Per ogni 1000 euro in più le vendite aumentano di 54 unità

(15)

Minimi quadrati

• Idea di Gauss

(16)

• La retta si trova minimizzando la somma dei quadrati delle distanze verticali tra i punti e la retta

0 50 100 150 200 250

5 10 15 20

SpeseTV in migliaia di euro

Vendite in migliaia di unità

• Vendite = variabile dipendente

• Spese TV = predittore

(17)

Minimi quadrati

Non sono le distanze euclidee tra i punti e la retta

−2 0 2 4 6

0 1 2 3 4

x

y

Sono scarti per la variabile dipendente tra osservato e previsto

(18)

Minimi quadrati

La retta dei minimi quadrati ha due proprietà

1 Passa sicuramente per il punto (x , y ) (media di X , media di Y ).

2 ha pendenza b =

P

i(xi− x )(yi − y ) P

i(xi− x )2 = cov(X , Y ) var(X )

• Equazione

y ≈ y + b(x − x )

(19)

Esercizio

• Relazione tra reddito e anni di istruzione

Unità 1 2 3 4 5 6

Anni 8 10 12 14 16 18

Reddito 14 18 25 30 38 40

0 5 10 15

010203040

AnniIstruz

Reddito

(20)

Esercizio

• Relazione tra reddito e anni di istruzione

Unità 1 2 3 4 5 6 Media

Anni 8 10 12 14 16 18 13.0

Reddito 14 18 25 30 38 40 27.5

Scarti x -5 -3 -1 1 3 5 0

Scarti y -13.5 -9.5 -2.5 2.5 10.5 12.5 0 Prodotto 67.5 28.5 2.5 2.5 31.5 62.5 195/5*

Scarti xˆ2 25 9 1 1 9 25 70/5*

Pendenza: b = 195/70 = 2.79

• Retta dei MQ: by = 27.5 + 2.786(x − 13)

(21)

Grafico e interpretazione

0 5 10 15

010203040

AnniIstruz

Reddito

r = 0.98

Per ogni anno di istruzione in più il reddito atteso aumenta di 2790 Euro all’anno.

(22)

Serie storiche

• Una serie storica (o temporale) è una serie di osservazioni su una unità statistica in tempi successivi.

• Esempio n. di disoccupati mensili (in migliaia), 2010-2015 (USA)

2010 2011 2012 2013 2014 2015

9000110001300015000

Anni

Disoccupati

(23)

Andamento tendenziale

• Usiamo la retta dei minimi quadrati

2010 2011 2012 2013 2014 2015

9000110001300015000

Anni

Disoccupati

r = 0.98

Retta MQ: Disoccupazione ≈ 2605180 − 1288 · Anno

(24)

Relazioni tra correlazione e retta dei MQ

Disegnare i punti e visualizzare la retta dei minimi quadrati

Applet

b = 0 se e solo se r = 0

• La retta è fallace se

ci sono outlier

la relazione è fortemente non lineare

(25)

Quattro esempi da ricordare

x

y

0 5 10 15

0 2 4 6 8 10 12

x

y

0 5 10 15

0 2 4 6 8 10 12

x

y

0 5 10 15

0 2 4 6 8 10 12

x

y

0 5 10 15

0 2 4 6 8 10 12

(26)

Dati di Anscombe

Stessa retta di regressione y = 3 + 0.5x

Stesso coefficiente di correlazione r = 0.82

x1 y1 x2 y2 x3 y3 x4 y4

1 10 8.04 10 9.14 10 7.46 8 6.58 2 8 6.95 8 8.14 8 6.77 8 5.76 3 13 7.58 13 8.74 13 12.74 8 7.71 4 9 8.81 9 8.77 9 7.11 8 8.84 5 11 8.33 11 9.26 11 7.81 8 8.47 6 14 9.96 14 8.10 14 8.84 8 7.04 7 6 7.24 6 6.13 6 6.08 8 5.25 8 4 4.26 4 3.10 4 5.39 19 12.50 9 12 10.84 12 9.13 12 8.15 8 5.56 10 7 4.82 7 7.26 7 6.42 8 7.91 11 5 5.68 5 4.74 5 5.73 8 6.89

Riferimenti

Documenti correlati

• Nelle stazioni in quota si supera sistematicamente l’OLT in primavera ed estate per oltre 28 giorni. • E’ da prevedere nella normativa UE e nazionale in casi

Questo è il caso delle aziende agricole. Possono fare domanda solo se non sono iscritte nell’elenco speciale delle aziende agricole alla CCIAA.?. Racchiudere più alberghi

Somma di livelli sonori Somma di livelli sonori.. 21 ottobre 2010 Sistema Uditivo e Analisi in Frequenza 14.. Metodiche di analisi in frequenza Metodiche di analisi in frequenza..

21 ottobre 2010 Sistema Uditivo e Analisi in Frequenza 1. Misura della pressione acustica Misura della

▪ Semplicità di messa in servizio grazie al display integrato di grandi dimensioni con calibrazione conforme allo standard VDMA e testi supplementari.. RILEVAMENTO DI SOGLIA

• idoneo per la misura i portata in tubazioni con liquidi sporchi e con presenza di solidi sospesi • installazione non intrusiva, mediante sensori clamp-on • disponibili versioni

Un automobilista sta guidando su una lunga strada inclinata. Dopo 2.40 km nota che i segnali stradali a fianco della carreggiata indicano che la sua altitudine ` e aumentata di 160

Attraverso la formulazione del modello predittivo è stato possibile individuare aree idonee alla presenza potenziale del Quercino sulle Prealpi Orobie bergamasche;..