Propagazione degli Errori

(1)

Propagazione degli Errori

La maggior parte delle grandezze fisiche di solito non può essere misurata attraverso una singola misura diretta ma viene invece determinata in due passi distinti, come detto nella definizione di misure indirette:

1. Si misurano una o più grandezze che possono essere misurate direttamente e dalle quali la grandezza che ci interessa può essere calcolata

2. Utilizzando i valori misurati si calcola la grandezza in questione

Un tipico esempio è la velocità media di un corpo. Essa necessita la misura dello spazio percorso e dell’intervallo di tempo necessario per percorrerlo:

Quanto vale l’errore sulla velocità in questo caso ?

s m t

x v

s s

t

m m

x

t x v

m m

/ 6098 .

2 /

) 03 . 0 (

09 . 0 23

. 1

) 01 . 0 (

04 . 0 21

. 3

/

























(2)

In un caso come questo, quando la misura comporta queste due fasi, allora anche la stima delle incertezze necessita di due fasi distinte.

1. Occorre stimare le incertezze nelle grandezze che sono state misurate direttamente 2. Occorre trovare come gli errori si sono propagati

Questa ultima fase si chiama: Propagazione degli errori

Nota:

Il libro di testo presenta prima una serie di relazioni approssimate poi dimostra la relazione generale. Noi salteremo subito alla relazione generale

(3)

formula quasi completa (caso 2 variabili)

Supponiamo che le osservabili fisiche x,y siano misurate ciascuna con deviazione standard

_x,_y . Supponiamo che le osservabili x,y siano necessarie per estrarre il valore della osservabile q attraverso la formula q(x,y)

Allora, in prima approssimazione, la deviazione standard _q è espressa dalla relazione:

) ,

0 q(x y q 

standard deviazione

covarianza )

)(

1 (

misurati ,

x in calcolata x

ad rispetto parziale

derivata )

, (

) , ( )

, 2 (

) , ( )

, (

, , 1

2

,

, 2

2

, 2

2

,







 



 









 







 



 







 



 







 



 







 



 



 





x

y y x n x

i

i i

xy

y y x x

xy y y x x y

y y x x x

y y x x q

y y x N x

x y y x q dove

y y x q x

y x q y

y x q x

y x q



(4)

- Formula quasi completa ma ‘semplificata’

Supponiamo che le osservabili fisiche x,y, ..., z siano misurate ciascuna con deviazione standard _x,_y,…,_z . Supponiamo che le osservabili x,y,…,z siano necessarie per estrarre il valore della osservabile q attraverso la formula q(x,y,…,z)

Allora, se gli errori di x,y,…,z sono indipendenti e casuali tra loro, la deviazione standard

_q è espressa dalla relazione:

) ,..., ,

0 q(x y z

q 

standard deviazione

misurati ,...,

, x in calcolata x

ad rispetto parziale

derivata )

,..., , (

) ,..., , ... (

) ,..., , ( )

,..., , (

,.., ,

2 2

,.., , 2

2

,.., , 2

2

,.., ,



 



 









 







 

 



 







 



 







 



 



 



x

z z y y x x

z z z y y x x x y

z z y y x x x

z z y y x x q

z x y

z y x q dove

z z y x q y

z y x q x

z y x q



(5)

Nota importante 1

la formula ‘quasi ‘completa nel caso di piu’ di due variabili ha tutte le derivare incrociate

Nota Importante 2 (pagina 111 Cannelli)

zy xz

xy z

y x

q y

q z

q x

q y

q x

q y

q x

q      

 _



 







 



 







 



 







 



 







 



 







 



 







 



 







 



 







 



 







  () ()

() 2 2 ()

() 2 ()

() ()

() 2

2 2

2

(6)

Esempio

Calcoliamo l’errore sul seno di un angolo

Sia q = 1.484 radianti 85 gradi Sia _q = 0.017 radianti 0.97 gradi

Voglio conoscere come l’errore si propaga l’errore su x  f (q) sin q

 

   

0015 .

0 9962 .

0

0014737 .

0 9962356

. 0

0014737 .

0 017

. 0 484

. 1 cos cos

2 2





x x

Quindi

x x

x



 q

 _q

(7)

Esercizio:

Un gruppo di studenti vuole misurare l’accelerazione di gravità utilizzando un pendolo.

Effettua una serie di misure per estrarre il periodo di oscillazione e la lunghezza del pendolo. Supponendo che

) (

947285 .

9

s 0.005

s 0.012

s 1.945

m 0.0004 m

0.0012

m 0.9532 4 ² ₂

calcolato ancora

stato è

non perche

decimali i

tutti usano

si g T d

T g d

m m







(8)

Applicando la formula generale di propagazione degli errori

alla relazione che da g

Si ottiene

Da cui

2 2

,.., , 2

2

,.., , 2

2

,..,

, ₀ ₀ ₀ ₀ ₀ ₀ ₀ ₀

0

) ,..., , ... (

) ,..., , ( )

,..., , (

z z z y y x x y

z z y y x x x

z z y y x x

q z

z y x q y

z y x q x

z y x

q   





 



 





 







 

 



 







 



 







 

2 2

, 2

2

, ₀ ₀ ₀

0

) , ( )

, (

T T T d d d

T T d d

g T

T d g d

T d

g  







 







 



 







 

2 2

, 3

2 2

2

, 2 2

0 0 0

0

4 2

4 1 _T

T T d d d

T T d d

g T

d

T   









 



 



 



 

       

T su errore Domina

12 . 0 015066 .

0 000157 .

0

012 . 0 256 . 3 0012

. 0 321 . 3 012

. 945 0

. 1

9532 . 0 4 2

0012 . 945 0 . 1

4 1 ² ² ² ² ²

2 3 2

2 2











 



 



 



 



 



 

g g







(9)

Esempio (pg. 53 bevington):

N

N N N

x N x

x x N N

x x

x x x

x

x x x

x

N x N

x x

x

N x

N i

i

N

i N

i i

x

N

i

i N

 





 



 



 





 

 





 



 









 







 



 







 

 



 





1 2

2

2 1

1

2 1

2 2

1 2

1

... 1 1

...

Se le misure sono ripetibili, indipendenti e senza errore sistematico allora la deviazione standard è sempre la medesima indipendentemente dall’indice ‘i’

cioè 

(10)

Notate che la propagazione degli errori puo’ anche avere un uso predittivo, infatti si potrebbe anche rispondere al seguente quesito

A che angolo viene minimizzato l’errore di misura su D ?

(11)

L’incertezza che contribuisce di più all’errore sulla gittata è quello relativo alla velocità

(12)

Provate a fare gli esercizi dal 3.43, 3.45, 3.46, 3.47, 3.48, 3.49, 3.50,

(13)

Quando devo usare il termine di covarianza nella propagazione ? Quando l’errore delle variabili x, y, .. non è indipendente tra loro, quando cioè una sovrastima o sottostima di x implica una sovrastima o sottostima di yallora la

relazione di propagazione degli errori, nell’ipotesi di una funzione a due variabili x e y, diventa:



  





 







 



 







 



 







 





 



) )(

1 ( Covarianza

) 2 , ( ) , ( )

, ( )

, (

, 2

2

, 2

2

,

x x y N y

dove

y y x q x

y x q y

y x q x

y x q

i i

xy

xy y

y x x y

y y x x x

y y x x q



(14)

Quando devo usare il termine di covarianza nella propagazione ? La covarianza _xystima in che proporzione “x” ﬂuttua assieme a “y”.

- Se le osservabili ﬂuttuano in modo indipendente il prodotto degli scarti si annulla (posto che N sia sufficientemente grande)

- Se le osservabili non ﬂuttuano in modo indipendente il prodotto degli scarti ha segno positivo e così da rendere σ²_xy non nulla e non trascurabile rispetto a σ²_x e σ²_y

- nel caso in cui N (numero di misure) sia piccolo allora val la pena fare una prova - Calcolo  ipotizzando la non correlazione

- Calcolo  ipotizzando la massima correlazione - e’ chiamato errore massimo

 

  _^

  



 _N  ^yⁱ ^y ^xⁱ ^x

xy

Covarianza 1



(15)

Nota:

Se ci fosse la massima correlazione tra le incertezze delle osservabili allora

Le incertezze quindi si sommano !

Si può dimostrare quindi che vale sempre questa disuguaglianza

y y y x x x

y y x x q

y x y y x x b

y y x x a

y y x x q

y x xy

y y x q x

y x q

y y x q x

y x q b

y x q x

y x q





 



 





 







 



 







 



 







 



 







 



 







 



, ,

, 2

2

, 2

2

, 2

) , ( )

, (

) 2 , ( ) , ( )

, ( )

, (

Covarianza

b b b a

a a

q b

b a q a

b a

q  



0 0

) , ( )

, (





 







 



 







 

(16)

Quindi:

Calcolo  ipotizzando la non correlazione

Calcolo  ipotizzando la massima correlazione (errore massimo)

Nel caso ci fosse una differenza sostanziale tra i due valori allora il contesto fisico e/o la analisi dati specifica mi dirà se posso ritenere i dati correlati o in generale cosa riportare come errore sperimentale

2 2

, 2

2

,

) , ( )

, (

y y y x x x

y y x x

q y

y x q x

y x

q  





 

 



 







 



 







 

y y y x x x

y y x x

q y

y x q x

y x

q  





 

 

 







 



 







 

, ,

) , ( )

, (

Cannelli pag. 111

(17)

Posso stimare se gli errori su a e b sono indipendenti tra loro ?

1) Calcolate la covarianza

2) Riflettete sulla fisica del sistema che state studiando - Esempio:

- Avete una serie di coppie dati sperimentali che devono seguire un andamento lineare (i.e. la lunghezza del pendolo L e il suo periodo al quadrato T²)

- Avete estratto dai dati sperimentali i coefficienti di una retta (coefficiente

angolare a±_a e termine noto b ±_b(ad esempio con una regressione lineare) y = ax + b ad esempio L = a T² + b

-Volete estrapolare il valore della retta y_o nel punto x_o e volete anche avere una stima dell’errore sulla vostra estrapolazione

-ad esempio la lunghezza che deve avere un pendolo per oscillare con un periodo di 5 s

- Notate che ora le variabili con incertezza sono a e b non x e y

(18)

Allora il valore della variabile y_o è dato da

y₀ = a x₀ + b ad esempio L = 25 a + b L’errore si dovrà calcolare con la propagazione degli errori

In questo caso però le osservabili a e b (termine noto e coefficiente angolare) sono correlate perche estratte da dati sperimentali, in altra parole se cambia una deve cambiare anche l’altra opportunamente per riprodurre i dati sperimentali

Attenzione quindi che la covarianza si calcola a partire dai dati sperimentali con i quali avete estratto il parametro a (coefficiente angolare) e b (termine noto). Nel caso del pendolo a partire dai periodi e dalle lunghezza misurate.

Quindi:

2 0 2

2

2 2

0 o a b ab

y x   x 

   

(19)

Estrapolazione - Interpolazione

La procedura di calcolo della variabile Y (non misurata) è detta interpolazione quando il valore della x è compreso tra due valori di X misurati. E’ detta invece estrapolazione quandoil valore della X è all’esterno dei valori misurati

Il valore della Y estrapolata/interpolata si ottiene applicando la relazione lineare

Più complessa risulta l’estrazione dell’incertezza della osservabile interpolata/estrapolata Y infatti:

- Il punto di partenza sono le coppie di misure (x_i,y_i)

- da queste coppie di misure sono stati estratti i parametri a, _a, b, _b

- da questi parametri vogliamo ora estrarre una Y (interpolata o estrapolata) a partire da una determinata x

- da questi parametri vogliamo ora estrarre la corrispondente _y - posso usare la propagazione degli errori

- Attenzione che stavolta l’errore di a e quello di b sono correlati perche sono estratti da un medesimo dataset.

a bx

y  

(20)

Estrapolazione - Interpolazione

Devo usare il termine di covarianza nella relazione di propagazione degli errori

Eseguendo un certo ammontare di conti si arriva alla relazione più semplice:

Quindi, come già preannunciato, l’errore sulla Y interpolata/estrapolata NON è la _y estratta dai dati sperimentali o dalla regressione lineare ma qualcosa di più

complesso

)

; cov(

2 2

2

b b a

y a

y b

y a

y a bx

y

b a

y 



 







 



 







 



 







 



 







 







   





 









N

i

i y

b a

y x x

x a

bx y

1 2 2 2

2  2 



(21)

Esempio

(22)

E’ tutto Chiaro ?

Dovreste aver chiari i seguenti argomenti:

• Propagazione degli errori

• Quando usare la covarianza nella propagazione degli errori

(23)

Discrepanza

Nella stragrande maggioranza dei casi le conclusioni sperimentali implicano il confronto tra due o più valori. Questi valori possono essere delle misure (e quindi con un’incertezza), delle stime teoriche (con o senza incertezza) o grandezze note.

Nell’ipotesi che i dati sperimentali si distribuiscono su una gaussiana è possibile fare un confronto quantitativo.

Data una misura sperimentale x_best ±  con deviazione dalla media pari a _m ed una stima teorica x_teo della medesima quantità, definiamo:

m

teo best

x t x

x x

D



 





La quantità D è detta discrepanza, mentre la quantità t indica quanto è distante x_best da x_teo in unità di deviazione standard (lo abbiamo già incontrato quando abbiamo parlato della gaussiana, e della ‘t di student’).

Ricordatevi che abbiamo definito un t_gauss e t_stud identici per N ∞ ma molto differenti se relativi a poche misure.

(24)

Se t_gauss = 0.32 significa che x_best dista da x_teo di 0.32 deviazioni standard della media. Quindi:

- esiste il 75% di probabilità che x_teo sia il valore medio della distribuzione statistica misurata - esiste il 75% di probabilità che la differenza tra x_teo e x_best sia di origine statistica.

Da questo si conclude che la misura sperimentale è compatibile con il valore atteso !

Se t_gauss = 3.5 significa che x_best dista da x_teo di 3.5 deviazioni standard della media. Quindi:

- esiste il 0.05 % di probabilità che x_teo sia il valore medio della distribuzione statistica misurata - esiste il 0.05 % di probabilità che che la differenza tra x_teo e x_best sia di origine statistica

Da questo si conclude che la misura NON è compatibile con il valore atteso ! In altre parole:

• Lo strumento non funziona correttamente (poco probabile)

• La mia procedura di misura non è corretta

• Esistono degli effetti fisici che disturbano la misura

• Esiste un errore sistematico

• ………

• Ho fatto una scoperta !

(25)

Nota:

Quale è il significato ‘statistico’ di t ?

- Ho ottenuto una misura x_best con deviazione standard  deviazione standard dalla media _m - Devo verificare se x_best o x_teo sono statisticamente uguali

- Questo equivale a verificare con che probabilità D = | x_best - x_teo | sia zero

- Poiché x_best è una misura allora con la propagazione degli errori posso ricavare l’errore su D

- Allora t non è altro che la distanza di D da zero in unità di sigma dalla media

m Dm

D teo

best

media dalla

deviazione

alla relazione

la estendere posso

e particolar caso

questo in

x x

D











) variabile sola

una ho

(

m teo best

Dm

x D x

t  

 



(26)

Cosa succede se devo confrontare due misure sperimentali o due osservabili, ciascuna con una incertezza ?

Data una misura sperimentale x_best1 ± ₁ con deviazione dalla media pari a _m1 effettuata dallo studente A ed una misura una misura sperimentale x_best2 ± ₂ con deviazione dalla media pari a _m2 effettuata dallo studente B

Il resto è esattamente lo stesso

Notate che si può dimostrare la formula sopra con la propagazione degli errori

2 2 2

1

2 1

m m

best best

x t x

x x

D



 

 





(27)

 Il limite entro il quale stabilire la compatibilità è stabilito a priori e varia tra i diversi ambiti sperimentali. Nel caso di questo corso di laboratorio lo stabiliremo entro 2

oppure 2_m . Se è tra due o tre sigma allora l’esperimento non è conclusivo. Quindi:

• un dato sperimentale è compatibile con una stima teorica/attesa se t_gauss < 2

• una misura sperimentale con  e _m è compatibile con un’altra misura (con  e _m ) o con un valore noto se t_gauss < 2

 Abbiamo già visto in una gaussiana (non necessariamente per le altre distribuzioni statistiche) l’intervallo x_best ±  corrisponde al 68 % dei dati

In altre parole, nel caso di una distribuzione gaussiana, le singole misure cadranno nell’intervallo <x> ±  con “livello di confidenza” pari al 68%

Analogamente per 2  (95%) o 3 (99.7%) o X

 Per distribuzioni non gaussiane, si dice [x_o - xx, x_o + xx] al 95% C.L.

Questo significa che il 95% delle misure cadono nell’intervallo [x_o-xx x_o+xx]

(28)

Quindi:

Quando devo confrontare due misure o una previsione teorica ed una misura devo:

1) Accertarmi se usare la gaussiana o l’approccio della ‘t di student’. In quest’ultimo caso a partire dalla t_studestraggo la t_gauss equivalente.

2) Sapere quali sono gli intervalli di confidenza (in altre parole la finestra entro quale intervallo ho il 68%, 95%, 99.7% degli eventi).

3) Decidere una soglia di probabilità oltre la quale ritengo la probabilità irragionevolmente piccola.

Cioè decidere ad esempio che "se l'evento è fuori da un intervallo di confidenza del 95%

allora è improbabile“.

4) Calcolare la discrepanza, t, P(t), (1-P(t)) - Lo so fare con la gaussiana - Non lo so fare con altre distribuzioni (ho bisogno di conoscere il C.L)

Esempio (vedi il file precedente o lucido successivo)

(29)

Cosa bisogna fare quando ho poche misure:

Esempio:

ho 4 Misure che mi hanno dato un valore medio di 5.32 ed una deviazione standard della media 0.17. Voglio verificare la compatibilità di questo risultato con un valore atteso di 4.92.

• La funzione ERF della gaussiana (‘t’), poiché costruita con la deviazione standard del campione non produce le corrette probabilità

• Estraggo l’osservabile ‘t’ usando la deviazione standard misurata

• t_stud = (5.32 – 4.92)/0.17 = 2.35

• Utilizzando la tabella della ‘t di Student’ trovo la probabilità associata alla ‘t’ ottenuta

• P(esterna,t_stud=2.35) = 1 – 0.90 = 0.1

• Ricavo la probabilità equivalente a 0.1 = 10% con la funzione ERF gaussiana

• P(gaussiana-esterna)= 10% -> t_gauss= 1.64

• Eseguo tutti i ragionamenti di compatibilità come se la ‘t’ ricavata dai miei dati sperimentali fosse 1.64

• Poiché t_gauss < 2 allora il dato sperimentale è compatibile con il valore atteso

• Ho il 10% di probabilità che la differenza tra la mia misura e il valore atteso sia di origine statistica e quindi lo accetto

• Se non avessi usato la distribuzione di ‘Student’ avrei concluso che la compatibilità tra il dato sperimentale e quello atteso

(30)

ESEMPIO : Tiro due dadi ‘uguali’ in forma

Voglio sapere se statisticamente i due dadi sono uguali ?

media dalla

deviazione la

usare bisogna

x t x

errore a discrepanz

m m

2 2 2

1 2 1



 

 



0 < t < 1 Le due misure sono certamente consistenti – i dadi sono uguali 1 < t < 2 Ho tra il 5 - 30% di probabilità che le due misure siano consistenti

Le due misure sono consistenti - i dadi sono uguali

2 < t < 3 Ho tra lo 0.3 - 5% di probabilità che le due misure siano consistenti Le due misure con molta probabilità non sono consistenti

- i dadi con molta probabilità NON sono uguali - sarebbe opportuno fare ulteriori misure

t > 3 Ho meno del 0.3 % di probabilità che le due misure siano consistenti Le due misure non sono consistenti - i dadi NON sono uguali

Misura sperimentale

11.10 11.15 11.20 11.25 11.30 11.35 11.40 11.45

0 0.5 1arb. units1.5 2 2.5

media dadi

Misura sperimentale

9.70 9.80 9.90 10.00 10.10 10.20

0 0.5 1arb. units1.5 2 2.5

Accelerazione di Gravità (m/s2)

Media Dadi Media Dadi

Dado 1 Dado 2 Dado 1 Dado 2

(31)

0 < t < 1 La teoria ed i dati sono consistenti

1 < t < 2 Ho tra il 5 - 30% di probabilità che la teoria ed i dati siano consistenti 2 < t < 3 Ho tra lo 0.3 - 5% di probabilità che la teoria ed i dati siano consistenti t > 3 Ho meno del 0.3 % di probabilità che la teoria ed i dati siano consistenti

media dalla

deviazione la

usare bisogna

x t x

m teo

1 1



 

10.00 10.25 10.50 10.75 11.00 11.25 11.50

0 1 arb. units2 3 4

media dadi

Valore Atteso Misura sperimentale

10.00 10.25 10.50 10.75 11.00 11.25 11.50

0 1 arb. units2 3 4

media dadi

Valore Atteso Misura sperimentale

ESEMPIO : Tiro un dado

Voglio sapere se il dato è truccato

(32)

Significatività Statistica

Supponiamo di avere una misura singola x₀ e una distribuzione (per semplicità di tipo gaussiana con valor medio <x> e deviazione standard ).

Ci chiediamo se la differenza tra x₀ e <x> sia di origine statistica o ‘reale’

Calcoliamo quindi la t_gauss (usando o meno la t_stud) Significatività

Se 1-P(t) < 5 % (oppure t_gauss > 1.96) - si dice che ho evidenza significativa che x₀ NON appartenga alla distribuzione statistica che ha generato <x> e .

Ovvero la discrepanza è significativa .

Se 1-P(t) < 1 % (oppure t_gauss > 2.32) - si dice che ho evidenza altamente significativa che x₀ NON appartenga alla distribuzione statistica che ha generato <x>e  .

Ovvero la discrepanza è altamente significativa .

(33)

HP : Distribuzione gaussiana e misure ripetibili ed indipendenti

Cosa significa scartare i dati la cui differenza dal valor medio sia significativa ?

- Significa scartare i dati per i quali t_gauss > 1.96

- Significa che sono sicuro di eliminare circa il 5% di dati ‘buoni’

- Significa che avrò il 5% di probabilità di scartare un evento che in realtà è buono

Esempio:

Ho delle scatole con 1000 componenti elettrici che devono avere un valore di resistenza pari a 10 ± 1 Ohm. Poiché non posso misurare la resistenza di tutti i componenti elettrici della scatola ne piglio 20 e ne misuro la resistenza. Se il valor medio della resistenza è compreso tra 8.04 ed 11.96 Ohm (nota 1.96 = 1.96*1, quindi 10-1.96=8.04 e

10+1.96=11.96) allora la scatola viene avviata alla vendita. In caso contrario si butta via.

In questo caso, poichè il mio limite è 1.96 sigma, sono sicuro di buttare via il 5% di scatole buone (con resistenza 10 ± 1 Ohm) insieme a quelle con resistenza diversa da 10 ± 1 Ohm

(34)

HP : Distribuzione gaussiana e misure ripetibili ed indipendenti

Cosa significa scartare i dati la cui differenza dal valor medio sia altamente significativa ?

- Significa scartare i dati per i quali t_gauss > 2.56

- Significa che sono sicuro di eliminare l’1% di dati ‘buoni’

- Significa che avrò l’1% di probabilità di scartare un evento che in realtà è buono

Esempio:

Ho delle scatole con 1000 componenti elettrici che devono avere un valore di resistenza pari a 10 ± 1 Ohm. Poichè non posso misurare la resistenza di tutti i componenti elettrici della scatola ne piglio 20 e ne misuro la resistenza. Se il valor medio della resistenza è compreso tra 7.44 ed 12.56 Ohm allora la scatola viene avviata alla vendita. In caso contrario si butta via.

In questo caso, poichè il mio limite è 2.56 sigma, sono sicuro di buttare via solo l’1% di scatole buone insieme a quelle con materiale difettoso

Notate che in questo caso butto via meno scatole (solo l’1%) ma è più facile avviare alla vendita scatole con materiale difettoso