Propagazione degli Errori
La maggior parte delle grandezze fisiche di solito non può essere misurata attraverso una singola misura diretta ma viene invece determinata in due passi distinti, come detto nella definizione di misure indirette:
1. Si misurano una o più grandezze che possono essere misurate direttamente e dalle quali la grandezza che ci interessa può essere calcolata
2. Utilizzando i valori misurati si calcola la grandezza in questione
Un tipico esempio è la velocità media di un corpo. Essa necessita la misura dello spazio percorso e dell’intervallo di tempo necessario per percorrerlo:
Quanto vale l’errore sulla velocità in questo caso ?
s m t
x v
s s
t
m m
x
t x v
m m
/ 6098 .
2 /
) 03 . 0 (
09 . 0 23
. 1
) 01 . 0 (
04 . 0 21
. 3
/
Propagazione degli Errori
In un caso come questo, quando la misura comporta queste due fasi, allora anche la stima delle incertezze necessita di due fasi distinte.
1. Occorre stimare le incertezze nelle grandezze che sono state misurate direttamente 2. Occorre trovare come gli errori si sono propagati
Questa ultima fase si chiama: Propagazione degli errori
Nota:
Il libro di testo presenta prima una serie di relazioni approssimate poi dimostra la relazione generale. Noi salteremo subito alla relazione generale
Propagazione degli Errori
formula quasi completa (caso 2 variabili)
Supponiamo che le osservabili fisiche x,y siano misurate ciascuna con deviazione standard
x,y . Supponiamo che le osservabili x,y siano necessarie per estrarre il valore della osservabile q attraverso la formula q(x,y)
Allora, in prima approssimazione, la deviazione standard q è espressa dalla relazione:
) ,
0 q(x y q
standard deviazione
covarianza )
)(
1 (
misurati ,
x in calcolata x
ad rispetto parziale
derivata )
, (
) , ( )
, 2 (
) , ( )
, (
, , 1
2
,
, 2
2
, 2
2
,
x
y y x n x
i
i i
xy
y y x x
xy y y x x y
y y x x x
y y x x q
y y x N x
x y y x q dove
y y x q x
y x q y
y x q x
y x q
Propagazione degli Errori
- Formula quasi completa ma ‘semplificata’
Supponiamo che le osservabili fisiche x,y, ..., z siano misurate ciascuna con deviazione standard x,y,…,z . Supponiamo che le osservabili x,y,…,z siano necessarie per estrarre il valore della osservabile q attraverso la formula q(x,y,…,z)
Allora, se gli errori di x,y,…,z sono indipendenti e casuali tra loro, la deviazione standard
q è espressa dalla relazione:
) ,..., ,
0 q(x y z
q
standard deviazione
misurati ,...,
, x in calcolata x
ad rispetto parziale
derivata )
,..., , (
) ,..., , ... (
) ,..., , ( )
,..., , (
,.., ,
2 2
,.., , 2
2
,.., , 2
2
,.., ,
x
z z y y x x
z z z y y x x x y
z z y y x x x
z z y y x x q
z x y
z y x q dove
z z y x q y
z y x q x
z y x q
Propagazione degli Errori
Nota importante 1
la formula ‘quasi ‘completa nel caso di piu’ di due variabili ha tutte le derivare incrociate
Nota Importante 2 (pagina 111 Cannelli)
zy xz
xy z
y x
q y
q z
q z
q x
q y
q x
q x
q y
q x
q
() ()
() 2 2 ()
() 2 ()
() ()
() 2
2 2
2 2
2
Esempio
Calcoliamo l’errore sul seno di un angolo
Sia q = 1.484 radianti 85 gradi Sia q = 0.017 radianti 0.97 gradi
Voglio conoscere come l’errore si propaga l’errore su x f (q) sin q
0015 .
0 9962 .
0
0014737 .
0 9962356
. 0
0014737 .
0 017
. 0 484
. 1 cos cos
2 2
2 2
x x
Quindi
x x
x
q
q
Esercizio:
Un gruppo di studenti vuole misurare l’accelerazione di gravità utilizzando un pendolo.
Effettua una serie di misure per estrarre il periodo di oscillazione e la lunghezza del pendolo. Supponendo che
) (
947285 .
9
s 0.005
s 0.012
s 1.945
m 0.0004 m
0.0012
m 0.9532 4 2 2
calcolato ancora
stato è
non perche
decimali i
tutti usano
si g T d
T g d
m m
Applicando la formula generale di propagazione degli errori
alla relazione che da g
Si ottiene
Da cui
2 2
,.., , 2
2
,.., , 2
2
,..,
, 0 0 0 0 0 0 0 0
0
) ,..., , ... (
) ,..., , ( )
,..., , (
z z z y y x x y
z z y y x x x
z z y y x x
q z
z y x q y
z y x q x
z y x
q
2 2
, 2
2
, 0 0 0
0
) , ( )
, (
T T T d d d
T T d d
g T
T d g d
T d
g
2 2
, 3
2 2
2
, 2 2
0 0 0
0
4 2
4 1 T
T T d d d
T T d d
g T
d
T
T su errore Domina
12 . 0 015066 .
0 000157 .
0
012 . 0 256 . 3 0012
. 0 321 . 3 012
. 945 0
. 1
9532 . 0 4 2
0012 . 945 0 . 1
4 1 2 2 2 2 2
2 3 2
2 2
2 2
g g
Esempio (pg. 53 bevington):
N
N N N
x N x
x x N N
x x
x x x
x
x x x
x
N x N
x x
x x
x
N x
N i
N i
i
N
i N
i i
x
N
i
i N
1 2
2
2 1
2 1
1
2 1
2 2
1 2
1
1
... 1 1
...
...
Se le misure sono ripetibili, indipendenti e senza errore sistematico allora la deviazione standard è sempre la medesima indipendentemente dall’indice ‘i’
cioè
Notate che la propagazione degli errori puo’ anche avere un uso predittivo, infatti si potrebbe anche rispondere al seguente quesito
A che angolo viene minimizzato l’errore di misura su D ?
L’incertezza che contribuisce di più all’errore sulla gittata è quello relativo alla velocità
Provate a fare gli esercizi dal 3.43, 3.45, 3.46, 3.47, 3.48, 3.49, 3.50,
Quando devo usare il termine di covarianza nella propagazione ? Quando l’errore delle variabili x, y, .. non è indipendente tra loro, quando cioè una sovrastima o sottostima di x implica una sovrastima o sottostima di yallora la
relazione di propagazione degli errori, nell’ipotesi di una funzione a due variabili x e y, diventa:
) )(
1 ( Covarianza
) 2 , ( ) , ( )
, ( )
, (
, 2
2
, 2
2
,
x x y N y
dove
y y x q x
y x q y
y x q x
y x q
i i
xy
xy y
y x x y
y y x x x
y y x x q
Quando devo usare il termine di covarianza nella propagazione ? La covarianza xy stima in che proporzione “x” fluttua assieme a “y”.
- Se le osservabili fluttuano in modo indipendente il prodotto degli scarti si annulla (posto che N sia sufficientemente grande)
- Se le osservabili non fluttuano in modo indipendente il prodotto degli scarti ha segno positivo e così da rendere σ2xy non nulla e non trascurabile rispetto a σ2x e σ2y
- nel caso in cui N (numero di misure) sia piccolo allora val la pena fare una prova - Calcolo ipotizzando la non correlazione
- Calcolo ipotizzando la massima correlazione - e’ chiamato errore massimo
N yi y xi x
xy
Covarianza 1
Nota:
Se ci fosse la massima correlazione tra le incertezze delle osservabili allora
Le incertezze quindi si sommano !
Si può dimostrare quindi che vale sempre questa disuguaglianza
y y y x x x
y y x x q
y x y y x x b
y y x x a
y y x x q
y x xy
y y x q x
y x q
y y x q x
y x q b
y x q x
y x q
, ,
, 2
2
, 2
2
, 2
) , ( )
, (
) 2 , ( ) , ( )
, ( )
, (
Covarianza
b b b a
a a
q b
b a q a
b a
q
0 0
) , ( )
, (
Quindi:
Calcolo ipotizzando la non correlazione
Calcolo ipotizzando la massima correlazione (errore massimo)
Nel caso ci fosse una differenza sostanziale tra i due valori allora il contesto fisico e/o la analisi dati specifica mi dirà se posso ritenere i dati correlati o in generale cosa riportare come errore sperimentale
2 2
, 2
2
,
) , ( )
, (
y y y x x x
y y x x
q y
y x q x
y x
q
y y y x x x
y y x x
q y
y x q x
y x
q
, ,
) , ( )
, (
Cannelli pag. 111
Posso stimare se gli errori su a e b sono indipendenti tra loro ?
1) Calcolate la covarianza
2) Riflettete sulla fisica del sistema che state studiando - Esempio:
- Avete una serie di coppie dati sperimentali che devono seguire un andamento lineare (i.e. la lunghezza del pendolo L e il suo periodo al quadrato T2)
- Avete estratto dai dati sperimentali i coefficienti di una retta (coefficiente
angolare a±a e termine noto b ±b (ad esempio con una regressione lineare) y = ax + b ad esempio L = a T2 + b
-Volete estrapolare il valore della retta yo nel punto xo e volete anche avere una stima dell’errore sulla vostra estrapolazione
-ad esempio la lunghezza che deve avere un pendolo per oscillare con un periodo di 5 s
- Notate che ora le variabili con incertezza sono a e b non x e y
Allora il valore della variabile yo è dato da
y0 = a x0 + b ad esempio L = 25 a + b L’errore si dovrà calcolare con la propagazione degli errori
In questo caso però le osservabili a e b (termine noto e coefficiente angolare) sono correlate perche estratte da dati sperimentali, in altra parole se cambia una deve cambiare anche l’altra opportunamente per riprodurre i dati sperimentali
Attenzione quindi che la covarianza si calcola a partire dai dati sperimentali con i quali avete estratto il parametro a (coefficiente angolare) e b (termine noto). Nel caso del pendolo a partire dai periodi e dalle lunghezza misurate.
Quindi:
2 0 2
2
2 2
0 o a b ab
y x x
Estrapolazione - Interpolazione
La procedura di calcolo della variabile Y (non misurata) è detta interpolazione quando il valore della x è compreso tra due valori di X misurati. E’ detta invece estrapolazione quandoil valore della X è all’esterno dei valori misurati
Il valore della Y estrapolata/interpolata si ottiene applicando la relazione lineare
Più complessa risulta l’estrazione dell’incertezza della osservabile interpolata/estrapolata Y infatti:
- Il punto di partenza sono le coppie di misure (xi,yi)
- da queste coppie di misure sono stati estratti i parametri a, a, b, b
- da questi parametri vogliamo ora estrarre una Y (interpolata o estrapolata) a partire da una determinata x
- da questi parametri vogliamo ora estrarre la corrispondente y - posso usare la propagazione degli errori
- Attenzione che stavolta l’errore di a e quello di b sono correlati perche sono estratti da un medesimo dataset.
a bx
y
Estrapolazione - Interpolazione
Devo usare il termine di covarianza nella relazione di propagazione degli errori
Eseguendo un certo ammontare di conti si arriva alla relazione più semplice:
Quindi, come già preannunciato, l’errore sulla Y interpolata/estrapolata NON è la y estratta dai dati sperimentali o dalla regressione lineare ma qualcosa di più
complesso
)
; cov(
2 2
2 2
2
b b a
y a
y b
y a
y a bx
y
b a
y
N
i
i y
b a
y x x
x a
bx y
1 2 2 2
2 2
Esempio
E’ tutto Chiaro ?
Dovreste aver chiari i seguenti argomenti:
• Propagazione degli errori
• Quando usare la covarianza nella propagazione degli errori
Discrepanza
Nella stragrande maggioranza dei casi le conclusioni sperimentali implicano il confronto tra due o più valori. Questi valori possono essere delle misure (e quindi con un’incertezza), delle stime teoriche (con o senza incertezza) o grandezze note.
Nell’ipotesi che i dati sperimentali si distribuiscono su una gaussiana è possibile fare un confronto quantitativo.
Data una misura sperimentale xbest ± con deviazione dalla media pari a m ed una stima teorica xteo della medesima quantità, definiamo:
m
teo best
teo best
x t x
x x
D
La quantità D è detta discrepanza, mentre la quantità t indica quanto è distante xbest da xteo in unità di deviazione standard (lo abbiamo già incontrato quando abbiamo parlato della gaussiana, e della ‘t di student’).
Ricordatevi che abbiamo definito un tgauss e tstud identici per N ∞ ma molto differenti se relativi a poche misure.
Se tgauss = 0.32 significa che xbest dista da xteo di 0.32 deviazioni standard della media. Quindi:
- esiste il 75% di probabilità che xteo sia il valore medio della distribuzione statistica misurata - esiste il 75% di probabilità che la differenza tra xteo e xbest sia di origine statistica.
Da questo si conclude che la misura sperimentale è compatibile con il valore atteso !
Se tgauss = 3.5 significa che xbest dista da xteo di 3.5 deviazioni standard della media. Quindi:
- esiste il 0.05 % di probabilità che xteo sia il valore medio della distribuzione statistica misurata - esiste il 0.05 % di probabilità che che la differenza tra xteo e xbest sia di origine statistica
Da questo si conclude che la misura NON è compatibile con il valore atteso ! In altre parole:
• Lo strumento non funziona correttamente (poco probabile)
• La mia procedura di misura non è corretta
• Esistono degli effetti fisici che disturbano la misura
• Esiste un errore sistematico
• ………
• ………
• Ho fatto una scoperta !
Nota:
Quale è il significato ‘statistico’ di t ?
- Ho ottenuto una misura xbest con deviazione standard deviazione standard dalla media m - Devo verificare se xbest o xteo sono statisticamente uguali
- Questo equivale a verificare con che probabilità D = | xbest - xteo | sia zero
- Poiché xbest è una misura allora con la propagazione degli errori posso ricavare l’errore su D
- Allora t non è altro che la distanza di D da zero in unità di sigma dalla media
m Dm
D teo
best
media dalla
deviazione
alla relazione
la estendere posso
e particolar caso
questo in
x x
D
) variabile sola
una ho
(
m teo best
Dm
x D x
t
Cosa succede se devo confrontare due misure sperimentali o due osservabili, ciascuna con una incertezza ?
Data una misura sperimentale xbest1 ± 1 con deviazione dalla media pari a m1 effettuata dallo studente A ed una misura una misura sperimentale xbest2 ± 2 con deviazione dalla media pari a m2 effettuata dallo studente B
Il resto è esattamente lo stesso
Notate che si può dimostrare la formula sopra con la propagazione degli errori
2 2 2
1
2 1
2 1
m m
best best
best best
x t x
x x
D
Il limite entro il quale stabilire la compatibilità è stabilito a priori e varia tra i diversi ambiti sperimentali. Nel caso di questo corso di laboratorio lo stabiliremo entro 2
oppure 2m . Se è tra due o tre sigma allora l’esperimento non è conclusivo. Quindi:
• un dato sperimentale è compatibile con una stima teorica/attesa se tgauss < 2
• una misura sperimentale con e m è compatibile con un’altra misura (con e m ) o con un valore noto se tgauss < 2
Abbiamo già visto in una gaussiana (non necessariamente per le altre distribuzioni statistiche) l’intervallo xbest ± corrisponde al 68 % dei dati
In altre parole, nel caso di una distribuzione gaussiana, le singole misure cadranno nell’intervallo <x> ± con “livello di confidenza” pari al 68%
Analogamente per 2 (95%) o 3 (99.7%) o X
Per distribuzioni non gaussiane, si dice [xo - xx, xo + xx] al 95% C.L.
Questo significa che il 95% delle misure cadono nell’intervallo [xo-xx xo+xx]
Quindi:
Quando devo confrontare due misure o una previsione teorica ed una misura devo:
1) Accertarmi se usare la gaussiana o l’approccio della ‘t di student’. In quest’ultimo caso a partire dalla tstud estraggo la tgauss equivalente.
2) Sapere quali sono gli intervalli di confidenza (in altre parole la finestra entro quale intervallo ho il 68%, 95%, 99.7% degli eventi).
3) Decidere una soglia di probabilità oltre la quale ritengo la probabilità irragionevolmente piccola.
Cioè decidere ad esempio che "se l'evento è fuori da un intervallo di confidenza del 95%
allora è improbabile“.
4) Calcolare la discrepanza, t, P(t), (1-P(t)) - Lo so fare con la gaussiana - Non lo so fare con altre distribuzioni (ho bisogno di conoscere il C.L)
Esempio (vedi il file precedente o lucido successivo)
Cosa bisogna fare quando ho poche misure:
Esempio:
ho 4 Misure che mi hanno dato un valore medio di 5.32 ed una deviazione standard della media 0.17. Voglio verificare la compatibilità di questo risultato con un valore atteso di 4.92.
• La funzione ERF della gaussiana (‘t’), poiché costruita con la deviazione standard del campione non produce le corrette probabilità
• Estraggo l’osservabile ‘t’ usando la deviazione standard misurata
• tstud = (5.32 – 4.92)/0.17 = 2.35
• Utilizzando la tabella della ‘t di Student’ trovo la probabilità associata alla ‘t’ ottenuta
• P(esterna,tstud=2.35) = 1 – 0.90 = 0.1
• Ricavo la probabilità equivalente a 0.1 = 10% con la funzione ERF gaussiana
• P(gaussiana-esterna)= 10% -> tgauss = 1.64
• Eseguo tutti i ragionamenti di compatibilità come se la ‘t’ ricavata dai miei dati sperimentali fosse 1.64
• Poiché tgauss < 2 allora il dato sperimentale è compatibile con il valore atteso
• Ho il 10% di probabilità che la differenza tra la mia misura e il valore atteso sia di origine statistica e quindi lo accetto
• Se non avessi usato la distribuzione di ‘Student’ avrei concluso che la compatibilità tra il dato sperimentale e quello atteso
ESEMPIO : Tiro due dadi ‘uguali’ in forma
Voglio sapere se statisticamente i due dadi sono uguali ?
media dalla
deviazione la
usare bisogna
x t x
errore a discrepanz
m m
2 2 2
1 2 1
0 < t < 1 Le due misure sono certamente consistenti – i dadi sono uguali 1 < t < 2 Ho tra il 5 - 30% di probabilità che le due misure siano consistenti
Le due misure sono consistenti - i dadi sono uguali
2 < t < 3 Ho tra lo 0.3 - 5% di probabilità che le due misure siano consistenti Le due misure con molta probabilità non sono consistenti
- i dadi con molta probabilità NON sono uguali - sarebbe opportuno fare ulteriori misure
t > 3 Ho meno del 0.3 % di probabilità che le due misure siano consistenti Le due misure non sono consistenti - i dadi NON sono uguali
Misura sperimentale
11.10 11.15 11.20 11.25 11.30 11.35 11.40 11.45
0 0.5 1arb. units1.5 2 2.5
media dadi
Misura sperimentale
9.70 9.80 9.90 10.00 10.10 10.20
0 0.5 1arb. units1.5 2 2.5
Accelerazione di Gravità (m/s2)
Media Dadi Media Dadi
Dado 1 Dado 2 Dado 1 Dado 2
0 < t < 1 La teoria ed i dati sono consistenti
1 < t < 2 Ho tra il 5 - 30% di probabilità che la teoria ed i dati siano consistenti 2 < t < 3 Ho tra lo 0.3 - 5% di probabilità che la teoria ed i dati siano consistenti t > 3 Ho meno del 0.3 % di probabilità che la teoria ed i dati siano consistenti
media dalla
deviazione la
usare bisogna
x t x
m teo
1 1
10.00 10.25 10.50 10.75 11.00 11.25 11.50
0 1 arb. units2 3 4
media dadi
Valore Atteso Misura sperimentale
10.00 10.25 10.50 10.75 11.00 11.25 11.50
0 1 arb. units2 3 4
media dadi
Valore Atteso Misura sperimentale
ESEMPIO : Tiro un dado
Voglio sapere se il dato è truccato
Significatività Statistica
Supponiamo di avere una misura singola x0 e una distribuzione (per semplicità di tipo gaussiana con valor medio <x> e deviazione standard ).
Ci chiediamo se la differenza tra x0 e <x> sia di origine statistica o ‘reale’
Calcoliamo quindi la tgauss (usando o meno la tstud) Significatività
Se 1-P(t) < 5 % (oppure tgauss > 1.96) - si dice che ho evidenza significativa che x0 NON appartenga alla distribuzione statistica che ha generato <x> e .
Ovvero la discrepanza è significativa .
Se 1-P(t) < 1 % (oppure tgauss > 2.32) - si dice che ho evidenza altamente significativa che x0 NON appartenga alla distribuzione statistica che ha generato <x>e .
Ovvero la discrepanza è altamente significativa .
HP : Distribuzione gaussiana e misure ripetibili ed indipendenti
Cosa significa scartare i dati la cui differenza dal valor medio sia significativa ?
- Significa scartare i dati per i quali tgauss > 1.96
- Significa che sono sicuro di eliminare circa il 5% di dati ‘buoni’
- Significa che avrò il 5% di probabilità di scartare un evento che in realtà è buono
Esempio:
Ho delle scatole con 1000 componenti elettrici che devono avere un valore di resistenza pari a 10 ± 1 Ohm. Poiché non posso misurare la resistenza di tutti i componenti elettrici della scatola ne piglio 20 e ne misuro la resistenza. Se il valor medio della resistenza è compreso tra 8.04 ed 11.96 Ohm (nota 1.96 = 1.96*1, quindi 10-1.96=8.04 e
10+1.96=11.96) allora la scatola viene avviata alla vendita. In caso contrario si butta via.
In questo caso, poichè il mio limite è 1.96 sigma, sono sicuro di buttare via il 5% di scatole buone (con resistenza 10 ± 1 Ohm) insieme a quelle con resistenza diversa da 10 ± 1 Ohm
HP : Distribuzione gaussiana e misure ripetibili ed indipendenti
Cosa significa scartare i dati la cui differenza dal valor medio sia altamente significativa ?
- Significa scartare i dati per i quali tgauss > 2.56
- Significa che sono sicuro di eliminare l’1% di dati ‘buoni’
- Significa che avrò l’1% di probabilità di scartare un evento che in realtà è buono
Esempio:
Ho delle scatole con 1000 componenti elettrici che devono avere un valore di resistenza pari a 10 ± 1 Ohm. Poichè non posso misurare la resistenza di tutti i componenti elettrici della scatola ne piglio 20 e ne misuro la resistenza. Se il valor medio della resistenza è compreso tra 7.44 ed 12.56 Ohm allora la scatola viene avviata alla vendita. In caso contrario si butta via.
In questo caso, poichè il mio limite è 2.56 sigma, sono sicuro di buttare via solo l’1% di scatole buone insieme a quelle con materiale difettoso
Notate che in questo caso butto via meno scatole (solo l’1%) ma è più facile avviare alla vendita scatole con materiale difettoso