• Non ci sono risultati.

regressione lineare

N/A
N/A
Protected

Academic year: 2021

Condividi "regressione lineare"

Copied!
19
0
0

Testo completo

(1)

regressione lineare

(2)

Regressione Lineare Semplice

Per ottenere la velocità di un corpo si misura la sua posizione a vari tempi. Sapendo che la relazione tra la posizione del corpo s al tempo t è data dalla legge s = v t trovare con la regressione lineare la velocità del corpo. Si ipotizzi di avere un cronometro perfetto.

Notate che nell’esercizio non si fa nessuna menzione sull’errore nella misura delle osservabili, viene solamente specificato che l’errore sul tempo è trascurabile rispetto a quello sulla posizione.

L’algoritmo in questo caso chiede di mettere sulle X l’osservabile nota con piu’ precisione

Notate che il metodo di regressione lineare valuta in 6.68 cm la deviazione standard su ciascuna misura di posizione. E’ realistica ? Deve essere verificato dallo sperimentatore.

Notate che la regressione lineare evidenzia la presenza di un termine noto. E’ fondamentale interrogarsi sul suo significato fisico. In questo caso per t=0 la posizione del corpo è in -263 ± 18 quindi ho ottenuto anche la posizione del corpo nell’instante in cui la misura è iniziata.

In altri casi può essere un indizio per la presenza di un errore sistematico nei dati.

n)

(3)

 

 

 

2

2

1

2

1

 

 

i i

i i i

i i

i i i

i

x x

N

y x x

y x

a

y x

y x N

b

a bx

y

 

2

1 2

2 2

2

2 2

2

1 

 

 

 

N

i

i i

y

i y

a

y b

ax b

N y

x N

 

Formule usate

(4)

Cosa succede nel caso sia nota la deviazione standard sull’osservabile y.

Supponiamo inizialmente che la deviazione standard sia strumentale e quindi costante per tutte le misure, sia cioè 

y

= costante. Il problema può diventare:

Per ottenere la velocità di un corpo si misura la sua posizione a vari tempi. Sapendo che la relazione tra la posizione del corpo s al tempo t è data dalla legge s = v t trovare con la regressione lineare la velocità del corpo.

Si ipotizzi di avere un cronometro perfetto e che 

y

= 2 cm

L’errore sulla posizione è noto e va messo come valore di 

y

.

Cambia solo il valore dell’incertezza su a e b (elemento chiave per il test c

2

)

(5)

 

 

 

2

2

1

2

1

 

 

i i

i i i

i i

i i i

i

x x

N

y x x

y x

a

y x

y x b

a bx

y

(exp )

2 2

2 2

2

2 2

y y

i y

a

y b

x N

 

 

 

Formule usate

(6)

Cosa succede nel caso sia nota la deviazione standard sull’osservabile x e y.

Supponiamo inizialmente che la deviazione standard sia strumentale e quindi costante per tutte le misure, inoltre sia che 

y

> 

x

. Il problema può diventare:

Per ottenere la velocità di un corpo si misura la sua posizione a vari tempi. Sapendo che la relazione tra la posizione del corpo s al tempo t è data dalla legge s = v t trovare con la regressione lineare la velocità del corpo. Sia 

y

= 2 cm e 

x

= 3 s

Come nel primo caso l’errore sulla posizione è dominante rispetto a quello sul tempo. L’errore sul tempo tuttavia non è trascurabile.

Per poterci ricondurre al caso precedente dobbiamo 1 -- ricondurre alla ordinata l’incertezza sull’ascissa

2 – utilizzare la misura sperimentale dell’incertezza sull’ordinata

(7)

Per poterci ricondurre al caso precedente dobbiamo 1 -- ricondurre alla ordinata l’incertezza sull’ascissa

in prima approssimazione, sapendo che y = bx+a posso dire che:

quindi

2 – utilizzare la misura sperimentale dell’incertezza sull’ordinata

allora sostituisco al valore di 

y

estratto con la relazione (come nel primo caso) il valore di quella ottenuta sperimentalmente

(exp) (exp)

)

(

2 2 2

2

x y

y

totb

  

x x

y

b

x

y  

  

 

 

(8)

Cioe’

Per ottenere la velocità di un corpo si misura la sua posizione a vari tempi. Sapendo che la relazione tra la posizione del corpo s al tempo t è data dalla legge s = v t trovare con la regressione lineare la velocità del corpo. Sia 

y

= 2 cm e 

x

= 3 s.

t [s] t/t s [cm] s/s

1 325 0,9% -20 -10,0%

2 375 0,8% 17 11,8%

3 425 0,7% 42 4,8%

4 475 0,6% 94 2,1%

5 525 0,6% 127 1,6%

Notate che non è cambiato il valore dell’intercetta e del termine noto ma sono cambiate le loro

incertezze.

(9)

 

 

 

2

2

1

2

1

 

 

i i

i i i

i i

i i i

i

x x

N

y x x

y x

a

y x

y x b

a bx

y

(exp ) (exp )

2 2

2 2

2 2

2

2 2

x y

y

i y

a

y b

b x

N

 

 

 

Formule usate

(10)

Cosa succede nel caso sia nota la deviazione standard sull’osservabile y (differente per ogni coppie di dati)

Supponiamo ora di avere una differente incertezza per ciascuna misura sulle y e che non esista incertezza sulla misura dell’osservabile x. Sia inoltre 

y

> 

x

.

Per ottenere la velocità di un corpo si misura la sua posizione a vari tempi (vedi tabella).

Sapendo che la relazione tra la posizione del corpo s al tempo t è data dalla legge s = v t trovare con la regressione lineare la velocità del corpo.

Allora non è possibile ricondursi ai casi precedenti ed è necessario usare una nuova relazione

per estrarre a e b colle rispettive incertezze. La nuova relazione non è altro che la precedente

pesata sulle incertezze dei dati sperimentali.

(11)

 

 

 

 

 

 

 

 

 

 

 

 

 

2 2 2

2 2

2 2

2 2

2 2

2

2 2

2 2

1 1

1 1

1 1

1

i b

i i a

i i i

i i

i i

i

i i i

i i

i i i

i i i

i i

x

y x x

y a x

y x

y b x

x x

 

 

Le nuove relazioni diventano (pg. 201 Taylor):

(12)

Per ottenere la velocità di un corpo si misura la sua posizione a vari tempi (vedi tabella).

Sapendo che la relazione tra la posizione del corpo s al tempo t è data dalla legge s = v t trovare con la regressione lineare la velocità del corpo.

Notate che rispetto ai casi precedenti sono variati sia i valori di a e b sia la stima della loro

incertezza

(13)

Le relazioni fino ad ora usate IMPLICANO la presenza di un termine noto - anche compatibile con zero -

Se viene IMPOSTO il passaggio per l’origine:

1) Le formule saranno differenti (si derivano dalle precedenti ma non solo le stesse)

• Vedi capitolo 12.6 del cannelli

2) E’ un vincolo molto forte che ovviamente:

1) Deve essere giustificato da un punto di vista fisico

• Ricordatevi che un errore sistematico e/o casuale non puo essere considerato non esistente

2) Non si applica con leggerezza, ha conseguenze importanti

• Nei risultati della regressione

• Nel check di linearità

3) il più delle volte deve avere una origine strumentale

• Esempio, da fare a lezione - sul digitalizzatore

(14)

Nota sull’intercetta in una regressione lineare

Supponiamo di aver misurato il periodo del pendolo al variare della sua lunghezza

Oppure è possibile fare una regressione lineare

Dai dati si può direttamente

estrarre l’accelerazione di gravità per ogni lunghezza

Notate che:

• il valore di g estratto con la regressione lineare è più basso di ogni valore estratto dalle misure

• L’intercetta è differente da zero (negativa) per cui risulterebbe che un pendolo di lunghezza pari a 0.7 cm oscillerebbe con periodo 0, ovviamente un non-senso fisico

a bL g T

T L T

g 4

2 L22 4

22  

g b

b g 1

1 4

4

2  

2

(15)

Un termine noto differente dal valore atteso (in questo caso zero) è una evidenza di errore sistematico (su L o su T) !

 

 

 4 22 T gL

In un pendolo il termine noto deve essere nullo, se L=0, allora non ho un pendolo e quindi T=0 1 2

2 1 2

2 2

2 4

L L

T T

a g b

L a

T

 

 

(16)

Analizziamo meglio l’intercetta della retta in questo caso sperimentale

per capire l’errore sistematico

(17)

0 2 2

0 2

2 2

0 2

0

2 2

2 2

è 4 angolare te

coefficien il

mentre

0 b

noto termine

un Compare

4 4

L su o sistematic Errore

4 ideale 4

Caso

a g sempre L

b aT

L

L g T

g T L

L L

L L

L

a g aT

L g T

L

misurato

misurato vero

misurato vero

misurato

 il valore dell’accelerazione di gravità ottenuto dalla regressione lineare è differente da quello estratto direttamente con la formula del pendolo.

 Il valore corretto è quello estratto con la regressione lineare, infatti:

 il coefficiente angolare della retta non dipende da L

o

 a = g/4

2

 il valore di g estratto direttamente dai dati dipende da L

0

 g = 4

2

(L

vero

)/T

2 =

4

2

(L

misurato

+L

o

)/T

2

 Il termine noto indica direttamente L

o

cioè l’errore sistematico sulla misura della lunghezza

del pendolo

(18)

 

0 noto

termine con

ma

retta una

avere ad

ritorna si

altri agli

rispetto piccolo

molto sia

termine il

cui in caso Nel

).

test (i.e.

acquisiti dati

nei vederlo dovreste

questo e

retta, una

è non quindi

curva La

2 4 4

4

L y e T

x quindi

Avrei

: costante) T

(con parabola

una è , quadratica

ma lineare più

è non quindi

relazione la

4 2 4

2 )

(

che 4 dice fisica la

2 2

2 2 2

2 misurato

0 2

2 2 2

2

2 2

2 2

2 0 2

b k

g T k

g T g b

a

x k b ax y

T T

T g T

L g T

L

T T

T T

T T

T

g T L

T T

T

T su o sistematic Errore

o o

o misurato o

misurato vero

o misurato o

misurato o

misurato vero

vero misurato

vero

c

 anche in questo caso il valore dell’accelerazione di gravità ottenuto dalla regressione lineare è differente da quello estratto direttamente con la formula del pendolo.

 Formalmente l’algoritmo di regressione lineare NON è corretto, l’equazione di partenza NON è una retta

 In certe condizioni (da verificare), anche una curva può essere approssimata ad una retta e quindi è possibile estrarre osservabili fisiche in più precisamente che usando la formula

Ovviamente NON ha senso estrapolare

(19)

Riferimenti

Documenti correlati

Supponendo di aver effettuato anche una misura di tempo, il cui risultato e` anche in questo caso , e di voler utilizzare la combinazione delle due misure per stimare la velocit`a

Analogalmente, abbiamo visto nelle pagine precedenti come la previsione della media aritmetica di variabili casuali aventi la stessa distribuzione di probabilit`a e` uguale

Innanzitutto, dal confronto fra i singoli valori osservati e la loro media o un valore vero convenzionale, nei casi fortunati in cui si riesca a calibrare le misure su una grandezza

• Per ogni contributo d’incertezza di categoria A il numero di gradi di libertà υ i da considerare è uguale al numero dei dati considerati n a cui va sottratto il numero di

L’algoritmo di regressione lineare da’ sempre come risultato una retta, indipendemente dal fatto che i punti si collochino o meno sulla una retta stessa.. E’ necessario

La legge (matematica) per la propagazione delle incertezze nelle misure indirette (grandezze derivate) richiede la Varianza... Il teorema di Čebyšëv fornisce la massima

I dati sono mostrai in tabella: durante la caduta libera l’accelerazione misurata è vicina a zero (efetti di attrito e taratura possono modificare il valore misurato). Calcolare

Ogni misurazione ha delle ‘’imperfezioni’’ che influiscono sul valore della misura dando luogo al cosiddetto errore di. misura che rende la misura diversa dai