Propagazione degli errori di misura Covarianza e correlazione
Sia q(x,y) una grandezza fisica misurata indirettamente a partire dalle grandezze xey
misurate direttamente.
Si consideri per esempio la formula g=41C LfT2 per la misura indiretta di g
L
Si richiama dall'analisi lo sviluppo in serie di Taylor di una funzione y=f(x).
Il --Ù~li~)------
I
I \xr-I:t __ ) - -_ _ _ ~-L -
j I f(xJ _ _ _ ~-I
I !
l i
l' I:
I I
i il T \
ili
: ~ ,-ex.
,i! -- --- ')
! La retta L tangente in P al grafico della funzione ha I
I pendenza data dalla derivata della flUlZione in P I arrestato al I ordine per un (X-Xo) =dx infinitesimo
f(x)=f(xO)+ (df/dx)o(x-xo)
ha il significato di linearizzare la f(x) nell'intorno di un Xo e calcolare la funzione f(x) in un punto x= Xo +dx lungo la tangente L
Se la funzione e' a due variabili q =q(x,y) si considera lo sviluppo in due dimensioni
nell'intorno di un definito xo' Yo
ovvero q(x,y)=q(xo' yo)+ (oq/ox)o(x-xo)+(oq/oy)o(y-yo)+···
e si possano trascurare i termini superiori se sia (x-xo) sia (Y-Yo) sono piccoli
.-
La q(x,y) e' della forma lineare q(x,y) =ax+by+c
essendo a=(oq/ox)o ' b= (8q/oy) e c=q(xo' yo)-(oq/ox)oxo-(8q/oy)oYo
Si e' supposto che per la funzione q=q(x,y) valga lo sviluppo in serie di Taylor nell'intorno di un definito xo' Yo' Si sceglie xo=x e Yo=y
ovvero q(xi'Yj)=q(x, y)+ (oqlox)x,y(xj-x)+(oqloY)x,y(Yry)+···
(trascurare i termini superiori significa supporre che gli errori siano piccoli )
Dimostriamo che: a)
q= q(x,y) il valor medio di q si calcola sostituendo nella formula alle x,y i valori medi x,y b) la varianza della q= CI 2 q
= (oqlox)x,/ C1 \ + (oqloy)x,/ CI 2 Y +2(oqlox)x,/oqloy)x,y C1 xy
essendo C1 xy =1/NMeLj,j(Xj-x)(YrY) Ila covarianza calcolata dalle misure
Per un campione si di N misure xj si ha valor medio X=~Xi IN e varianza 02
x =~(Xi-X) 2 IN
e per un campione di M misure Yj
valor medio Y="i..Yi 1M e varianza o 2 y ="i..(yi-y)2 1M Calcoliamo gli NM valori q(xi'yj)=qjj e definiamo
per le NM misure calcolate
Il valor medio q=~jjqjj INM e varianza o 2q=~(qfq)2 INM
Dimostrazione:
si ponga per comodita' (8q/ox)x,y =a e (oq/oy)x,y =b a)q=(1 INM) Lijq{(1 INM)Ljj[ q(x, y)+ a(xj-x)+b(y(y) ]=
=(1/NM)eLijq(X, y) +(a/NM)eLij(xj-x)+(b/NM) Lij(YrY)=
=q(x,y) +a/NeLj(XjmX)+ b/MoLj(YrY)
ma per definizione di media 1/N LjXj=X e 1/MLjY
t
y il 2° e 3° termine sono nulli e risultaq= q(x,y)
b) Calcolo 0'2 q=Lij(qi(q) 2 INM=(1/NM)Lij[q(X, y)+ a(xj-x)+b(YrY) -q]2=
=( 1 INM)Lij[ a(x(x)+b(y(y)]2=( a2/NM)Lij(X(x)2+(b2/N M)Lij(y(y)2+(2ab/NM) Ljj (x(x)(y(y)=
=( a2/N)" Li(X(X)2+(b2/M)
LlYr
y)2 +(2ab/N M) Lij(x(x)(YrY)2
qCoefficiente di correlazione lineare
Un problema particolarmente interessante nella misura si presenta quando vengono misurate coppie di grandezze
(esempio: gli allungamenti LJ.l di una molla in funzione dei Pesi applicati P; si noti che
i LJ.l e P non sono misure ripetute della stessa grandezza perche' cambiano le
condizioni sperimentali)
In questo caso si definisce coefficiente di correlazione linearer
re' adimensionale e ,mostreremo, varia tra -1 e +1
Se le misure xi,Y; sono indipendenti fra loro la covarianza
O"xy =0 ed anche il coefficiente r=0
A/limite opposto supponiamo che le xi'Yj dipendenti e legate da una relazione lineare yj=A+Bxi ,il coefficiente r risulta =1
Infatti dalla y;-A+Bx; segue anche per i valori medi x e Y
y= A+Bx da cui
"ijxrx )(Yry)IN=B 'fjxrx) 2 IN
Se fosse Y; A-Bx; si otterrebbe r=-1.
In ogni caso risulta -1< r« 1
Appunti della lezione
Taylor Capitolo 9.4 e Appendice C
Significato qualitativo del coefficiente di correlazione lineare r
Siano N coppie {Xi,Yi} di dati sperimentali.
Supponiamo che siano non correlati ( o incorrelati); al limite per un numero di misure tendenti all'infinito,il coefficiente di correlazione lineare r dovrebbe essere O. Dopo un numero finito di misure e' molto improbabile che sia esattamente O. Ci si puo' chiedere qual'e' la probabilita' che le N misure incorrelate ('(io)';) producano un co~fjiciente di correlazione lineare l' in modulo piu' grande de/modulo del valore calcolato
fO :::::;
L:( Xi - Xmedio) (Yi - Ymedio)
. / ? ?
~ L( Xi - XmediotL (Yi - Ym'diot
Detta probabilita' si indica
PN (I rl2: I rol)
Puo' essere calcolata, come indicato in Appendice C.
essendo -IS roS+1
I risultati ottenuti vengono tabulati nella tabella C per valori crescenti di N ed I rol
Per esempio 20 misure {Xi,Yi} diano fO=O.4. Dalla tabella nella pagina successiva si legge P20 (lrl2:0.4) = 8.1% ovvero la probabilita' che 20 misure incorre/ate diano un coefficiente di correlazione I rl2:0.4 e' 1'8.1 %.
Ci si deve chiedere: l' 8.1 % e' una probabilità abbastanza grande per sostenere l'ipotesi che le 20 misure siano incorrelate? La scelta della soglia di probabilita' minima accettabile per sostenere l'ipotesi e'arbitraria; si conviene di fissarla al 5% ovvero si conviene che:
se PN (Irl2: I rol) 2: 5% le N misure {Xi,Yi} sono incorrelate
o equivalentemente se PN (Irl2: I rol) S 5% le N misore non sono incorrelate (e quindi correlate) Quindi nell' esempio le 20 misure NON sono correlate
Si preferisce fissare il criterio nella II fOlmulazione e dire che:
Se N misure {Xi,Yi} producono Illl coefficiente di correlazione ro per cui PN (lrl2: I rol) ::; 5%
c'e' evidenza significativa che le misure siano correlate linearmente.
Si definisce anche una correlazione altamente significativa fissando la soglia all' 1% e si dice che Se N misure {x"y;} producono lIn coefficiente di correlazione l'o per clli PN (lrl2: I rol) Sl%
c'e' el'idenza altamente significativa che le misure siano correlate linearmente.
,g
ATTENZIONE:
Il fatto che esista evidenza che le misure siano correlate linearmente NON esclude il fatto che possano essere meglio descritte da una curva che non sia una retta.
ESEMPIO:
Facciamo il coefficiente di correlazione lineare su i punti di una sinusoide y=sen(x).
Colonna 1 '* Contatore No
Colonna 2 '* Angolo in radianti X Colonna 3 '* Seno dell'angolo sen(X)
Colonna 4 '* Coefficiente di correlazione da N=l a N=No
i
0.7" 0.99821
0.866 0.9959 ... ...::
0.940 0.9918 ... , ... ) 0.985 0.9845: ,i
1.000 o.9721i .il
0,985 0.9513, ... :~
0.940 0.9167, :
N X Sen(X) R l· 0.17 0,174 2 0.35 0.342 1.0000 3' 0.52 0.500 0.9998:
4' 0.70 0.643 0.9993:
5 0.87:
6 1.05:
7' 1.22:
8 1.110 9 1.57:
lO: 1.75' 11 1.92:
Y=sen{xJ
1500
r---
l.Ui);) 1-· - ~__t_'*_o/' ~- -~- I --t"'" "''i"
C.5:.!!) 1···4}t * .. ~.~<?. .>
~ c (l.DO;) J* r---~---{<-..;;;.. 0---.
g I -«, <3-
D.pa 1 [;O 2.DO 3.00.,:}· 4.00 5DG f:ì;{la -D.sOO l'" ... " .... H _ H ' • H . . . &-1.. .. .. · ... ··:&0 ..
l "?:.:.,. §;-"1-
-l.DDD J ... ~:1'4-44-~ ... .
-1.500 I---~---
t.OD
12 2,09: 0.866 Q,8601:
0.766 0,7699:
, )( Iradianti)
13: 2.2f :! ... _ ... _._ ... _ .... --_ ... _ ... _._ .. _ .. _ ... -... ,
14' 2.44: 0.643 0.6334! ···1 r'
15: 2.62: 0.500 0.4464: I
16 2.79:
17 2.97~
18 3.14 0.000 -0.1967: . ···1 J
0.342 0.2243:
0.174 0.0000:
19 3.32] -0.174--0.3541:
20 3.49: -0.341;-0.4748:
11 3.67: -0.500:-0.5663:
22 3.84: -0.643:-0.6363:
13 4.01: -0.766:-0.6907;
24: 4.19~ -0.866.-0.7337'
l I
25 4.36 ·0.940: -0.7683' ... , •... ; •...•.. ·1
I
j 26 4.54 -0.985:-0.7961' ii
R nel caso di una sinusoide
15000 r-·~--·-~-_·_-_·_---_· ---.---~----._._-~---.. _~.
! ,
l.il;););) ~f~~;~---
, '"
- ! •
,g o 5::!'JD ~._--_._---- ··----·w·--
~ .
<1>
;.-~ O.D;)-::!';)- ... __ ... ____ ... ~? . H ' . . H_ . . . . , . . . . .
':l.po 1.:)[1 1.00
--{J.5~OO
-1.0-000
6
3.(;'04- 4.0D 5.00 6.DO
4:~~
"<>,
:':;;-,y***%"*-$-#~4 intervallo Q·X !r .. dìanti)
1.00
27.4.71: -1.000 -0.8186:
18 ~'.~?: .~~.:~~.~.::.~'.~~?f.
19: 5.06: -0.9LIO:-0.8495;
30 5.24, -0.866--0.8582:
31 5.41: -0.766: __ .~ .. ~~~~) 32: 5.59: -0.643'-0.8600:
33 5.76' -0.500.-0.8517, 34 5.93i -0.342:-0.8359:
35 6.11: -0.174' -0.8116:
36 6.28: 0.000:-0.7780:
I. ••••••••••••••••• .. ... _ ... --... --... . : ..
.A-\0
Dai valori del coefficiente di regressione lineare si nota che:
• Se ho dne punti (No=2) il coefficiente di correlazione lineare è uno! Infatti per due punti passa sempre una retta.
• Fino a quando X = TI/2, la sinusoide sembra una retta (ma non lo è) e quindi il coefficiente di correlazione lineare è molto vicino a 1
• Tra X= TI/2 e x= TI la curva, anche se regolare, si allontana sempre più da una retta e, di conseguenza, il coefficiente di correlazione lineare si riduce sempre di piu'.
• Per x= TI ho R=O cioè assenza assoluta di correlazione lineare. Meditate su questo!
Quindi:
1) Anche se tra O e TI/2 il coefficiente di correlazione lineare è molto vicino a Ila curva è pur sempre una sinusiode e quindi assomiglia solo ad una retta ma non lo è.
2) Anche se tra O e TI il coefficiente di correlazione lineare è nullo la curva rimane una sinusoide, quindi una curva regolare descritta da una equazione. I punti sono correlati ma non linemmente
~"[