regressione lineare
Regressione Lineare Semplice
Per ottenere la velocità di un corpo si misura la sua posizione a vari tempi. Sapendo che la relazione tra la posizione del corpo s al tempo t è data dalla legge s = v t trovare con la regressione lineare la velocità del corpo. Si ipotizzi di avere un cronometro perfetto.
Notate che nell’esercizio non si fa nessuna menzione sull’errore nella misura delle osservabili, viene solamente specificato che l’errore sul tempo è trascurabile rispetto a quello sulla posizione.
L’algoritmo in questo caso chiede di mettere sulle X l’osservabile nota con piu’ precisione
Notate che il metodo di regressione lineare valuta in 6.68 cm la deviazione standard su ciascuna misura di posizione. E’ realistica ? Deve essere verificato dallo sperimentatore.
Notate che la regressione lineare evidenzia la presenza di un termine noto. E’ fondamentale interrogarsi sul suo significato fisico. In questo caso per t=0 la posizione del corpo è in -263 ± 18 quindi ho ottenuto anche la posizione del corpo nell’instante in cui la misura è iniziata.
In altri casi può essere un indizio per la presenza di un errore sistematico nei dati.
n)
22
1
21
i i
i i i
i i
i i i
i
x x
N
y x x
y x
a
y x
y x N
b
a bx
y
21 2
2 2
2
2 2
2
1
N
i
i i
y
i y
a
y b
ax b
N y
x N
Formule usate
Cosa succede nel caso sia nota la deviazione standard sull’osservabile y.
Supponiamo inizialmente che la deviazione standard sia strumentale e quindi costante per tutte le misure, sia cioè
y= costante. Il problema può diventare:
Per ottenere la velocità di un corpo si misura la sua posizione a vari tempi. Sapendo che la relazione tra la posizione del corpo s al tempo t è data dalla legge s = v t trovare con la regressione lineare la velocità del corpo.
Si ipotizzi di avere un cronometro perfetto e che
y= 2 cm
L’errore sulla posizione è noto e va messo come valore di
y.
Cambia solo il valore dell’incertezza su a e b (elemento chiave per il test c
2)
22
1
21
i i
i i i
i i
i i i
i
x x
N
y x x
y x
a
y x
y x b
a bx
y
(exp )
2 2
2 2
2
2 2
y y
i y
a
y b
x N
Formule usate
Cosa succede nel caso sia nota la deviazione standard sull’osservabile x e y.
Supponiamo inizialmente che la deviazione standard sia strumentale e quindi costante per tutte le misure, inoltre sia che
y>
x. Il problema può diventare:
Per ottenere la velocità di un corpo si misura la sua posizione a vari tempi. Sapendo che la relazione tra la posizione del corpo s al tempo t è data dalla legge s = v t trovare con la regressione lineare la velocità del corpo. Sia
y= 2 cm e
x= 3 s
Come nel primo caso l’errore sulla posizione è dominante rispetto a quello sul tempo. L’errore sul tempo tuttavia non è trascurabile.
Per poterci ricondurre al caso precedente dobbiamo 1 -- ricondurre alla ordinata l’incertezza sull’ascissa
2 – utilizzare la misura sperimentale dell’incertezza sull’ordinata
Per poterci ricondurre al caso precedente dobbiamo 1 -- ricondurre alla ordinata l’incertezza sull’ascissa
in prima approssimazione, sapendo che y = bx+a posso dire che:
quindi
2 – utilizzare la misura sperimentale dell’incertezza sull’ordinata
allora sostituisco al valore di
yestratto con la relazione (come nel primo caso) il valore di quella ottenuta sperimentalmente
(exp) (exp)
)
(
2 2 22
x y
y
tot b
x x
y
b
x
y
Cioe’
Per ottenere la velocità di un corpo si misura la sua posizione a vari tempi. Sapendo che la relazione tra la posizione del corpo s al tempo t è data dalla legge s = v t trovare con la regressione lineare la velocità del corpo. Sia
y= 2 cm e
x= 3 s.
t [s] t/t s [cm] s/s
1 325 0,9% -20 -10,0%
2 375 0,8% 17 11,8%
3 425 0,7% 42 4,8%
4 475 0,6% 94 2,1%
5 525 0,6% 127 1,6%
Notate che non è cambiato il valore dell’intercetta e del termine noto ma sono cambiate le loro
incertezze.
22
1
21
i i
i i i
i i
i i i
i
x x
N
y x x
y x
a
y x
y x b
a bx
y
(exp ) (exp )
2 22 2
2 2
2
2 2
x y
y
i y
a
y b
b x
N
Formule usate
Cosa succede nel caso sia nota la deviazione standard sull’osservabile y (differente per ogni coppie di dati)
Supponiamo ora di avere una differente incertezza per ciascuna misura sulle y e che non esista incertezza sulla misura dell’osservabile x. Sia inoltre
y>
x.
Per ottenere la velocità di un corpo si misura la sua posizione a vari tempi (vedi tabella).
Sapendo che la relazione tra la posizione del corpo s al tempo t è data dalla legge s = v t trovare con la regressione lineare la velocità del corpo.
Allora non è possibile ricondursi ai casi precedenti ed è necessario usare una nuova relazione
per estrarre a e b colle rispettive incertezze. La nuova relazione non è altro che la precedente
pesata sulle incertezze dei dati sperimentali.
2 2 2
2 2
2 2
2 2
2 2
2
2 2
2 2
1 1
1 1
1 1
1
i b
i i a
i i i
i i
i i
i
i i i
i i
i i i
i i i
i i
x
y x x
y a x
y x
y b x
x x
Le nuove relazioni diventano (pg. 201 Taylor):
Per ottenere la velocità di un corpo si misura la sua posizione a vari tempi (vedi tabella).
Sapendo che la relazione tra la posizione del corpo s al tempo t è data dalla legge s = v t trovare con la regressione lineare la velocità del corpo.
Notate che rispetto ai casi precedenti sono variati sia i valori di a e b sia la stima della loro
incertezza
Le relazioni fino ad ora usate IMPLICANO la presenza di un termine noto - anche compatibile con zero -
Se viene IMPOSTO il passaggio per l’origine:
1) Le formule saranno differenti (si derivano dalle precedenti ma non solo le stesse)
• Vedi capitolo 12.6 del cannelli
2) E’ un vincolo molto forte che ovviamente:
1) Deve essere giustificato da un punto di vista fisico
• Ricordatevi che un errore sistematico e/o casuale non puo essere considerato non esistente
2) Non si applica con leggerezza, ha conseguenze importanti
• Nei risultati della regressione
• Nel check di linearità
3) il più delle volte deve avere una origine strumentale
• Esempio, da fare a lezione - sul digitalizzatore
Nota sull’intercetta in una regressione lineare
Supponiamo di aver misurato il periodo del pendolo al variare della sua lunghezza
Oppure è possibile fare una regressione lineare
Dai dati si può direttamente
estrarre l’accelerazione di gravità per ogni lunghezza
Notate che:
• il valore di g estratto con la regressione lineare è più basso di ogni valore estratto dalle misure
• L’intercetta è differente da zero (negativa) per cui risulterebbe che un pendolo di lunghezza pari a 0.7 cm oscillerebbe con periodo 0, ovviamente un non-senso fisico
a bL g T
T L T
g 4
2 L2 2 4
2 2 g b
b g 1
1 4
4
2
2
Un termine noto differente dal valore atteso (in questo caso zero) è una evidenza di errore sistematico (su L o su T) !
4 2 2 T g L
In un pendolo il termine noto deve essere nullo, se L=0, allora non ho un pendolo e quindi T=0 1 2
2 1 2
2 2
2 4
L L
T T
a g b
L a
T
Analizziamo meglio l’intercetta della retta in questo caso sperimentale
per capire l’errore sistematico
0 2 2
0 2
2 2
0 2
0
2 2
2 2
è 4 angolare te
coefficien il
mentre
0 b
noto termine
un Compare
4 4
L su o sistematic Errore
4 ideale 4
Caso
a g sempre L
b aT
L
L g T
g T L
L L
L L
L
a g aT
L g T
L
misurato
misurato vero
misurato vero
misurato
il valore dell’accelerazione di gravità ottenuto dalla regressione lineare è differente da quello estratto direttamente con la formula del pendolo.
Il valore corretto è quello estratto con la regressione lineare, infatti:
il coefficiente angolare della retta non dipende da L
o a = g/4
2 il valore di g estratto direttamente dai dati dipende da L
0 g = 4
2(L
vero)/T
2 =4
2(L
misurato+L
o)/T
2 Il termine noto indica direttamente L
ocioè l’errore sistematico sulla misura della lunghezza
del pendolo
0 noto
termine con
ma
retta una
avere ad
ritorna si
altri agli
rispetto piccolo
molto sia
termine il
cui in caso Nel
).
test (i.e.
acquisiti dati
nei vederlo dovreste
questo e
retta, una
è non quindi
curva La
2 4 4
4
L y e T
x quindi
Avrei
: costante) T
(con parabola
una è , quadratica
ma lineare più
è non quindi
relazione la
4 2 4
2 )
(
che 4 dice fisica la
2 2
2 2 2
2 misurato
0 2
2 2 2
2
2 2
2 2
2 0 2
b k
g T k
g T g b
a
x k b ax y
T T
T g T
L g T
L
T T
T T
T T
T
g T L
T T
T
T su o sistematic Errore
o o
o misurato o
misurato vero
o misurato o
misurato o
misurato vero
vero misurato
vero