Dalla correlazione alla covarianza
Troviamo la re/a che più si avvicina ai daC uClizzando il MMQ:
Siamo interessaC all’andamento solo rispe/o alle coppie di daC, per cui consideriamo le incertezze sulle yi costanC.
Per cui rimane solo l’incertezza σY, ovvero la deviazione standard della re/a teorica:
min
yi−( A+Bxδy i)(
i)
2i=1 N
⎧ ∑
⎨ ⎩
⎫ ⎬
⎭ .
σ
Y=
(y
i− A − Bx
i)
2i N
∑
N − 2 ⇒
Per introdurre il coefficiente di correlazione supponiamo di aver registrato le seguenC coppie di daC (xi, yi): (1, 6), (3, 5) e (5,1), dove per [x]= s e [y]=cm:
meglio variabile sulle ascisse meglio variabile sulle ordinate
Quindi A=7.75 + 1.48 cm e B= 1.25 + 0.43 cm s-1 (si riportano più cifre significaCve per evidenziare le differenze con i calcoli seguenC).
⇒
δ
A =σ
Y Σxi2
Δ
δ
B =σ
Y NΔ
⎧
⎨
⎪⎪
⎩
⎪⎪ dalla quale o/eniamo le
incertezze sui parametri della re/a ideale
Adesso la minimizzazione del χ’2 è la segue
dove ci limitiamo all’analisi con i valori meglio stimati, considerando le incertezze costanti. Le incertezze da propagare sui parametri A’ e B’ sono date dalla sola σ’Y.
Inver.amo le variabili
Invertiamo le variabili quindi x’ risulta ora la precedente y. Diversamente y’
risulta la precedente x
min
y'i−( A'+B' x 'i) δy'i( )
2i=1 N
⎧ ∑
⎨ ⎩
⎫ ⎬
⎭
σ '
Y=
(y'
i− A'− B' x '
i)
2i N
∑
N − 2 ⇒
Si o\ene A’=5.86 + 1.12 s e B’= 0.71 + 0.25 s cm-1 (si riportano più cifre significaCve per evidenziare le differenze con i calcoli seguenC).
⇒
δ A' = σ '
YΣx '
i2
Δ' δ B' = σ '
YN
Δ'
⎧
⎨
⎪ ⎪
⎩
⎪
⎪
dalla quale o/eniamo le
incertezze sui parametri della re/a ideale Y’ =A’+ B’x’
Riscrivo l’equazione y’=A’+B’x’ rispe/o alle variabili iniziali:
Grafico di y=A+Bx e y (x) day’=A’+B’x’ .
y' = A'+ B' x
x '=y y'=x
= x = A'+ B' y da cui : y = − A'
B' + 1 B' x
Etichetto
A* = − A' B' B* = 1
B'
⎧
⎨
⎪ ⎪
⎩
⎪
⎪
⇒ y = A * +B * x
Riporto la y(x) o/enuta con la minimizzazione del chi-quadro dalle Variabili invertite come
o/eniamo A* = 8.2 cm e B* = -1.4 cm s-2 diversi da A e B o/enuC dalla minimizzazione del chi-quadro sulle y.
Propago le incertezze di A’ e B’ su A* e B* e ottengo: A*= 8.2 + 3.6 cm , B*=1.4 + 0.5 cm s-1
Il MMQ applicato alle coppie di daC sudde\ (sulle yi) dà come risultato ovviamente:
A= 7.75 cm e B = -1.25 cm s-1 (σY = 0, incertezze nulle ovviamente).
Inverto le variabili della suddetta tabella e applico il MMQ alle y’, ottengo altri A’ e B’ da cui deduco A* e B* che risultano:
A* = 7.75 cm, B* = -1.25 cm s-1 .
Coppie di da. disposte su un re9a: .
Come esempio prendo i daC di partenza e uClizzo l’equazione y=A+Bx o/engo quindi i valori y dei punC sulla re/a trovate con il MMQ sulle coppie iniziali (xi , yi)
Calcoliamo BB’ nel caso dei daC iniziali e o/eniamo: BB’=0.892.
Nel caso in cui le coppie di punC si trovino su una re/a si o\ene un risultato rispe/o ai coefficienC angolari delle re/e, tale che:
B*= 1/B’= B che possiamo riportare anche come
BB’=1
Coppie di da. non disposte su un re9a: .
Prendo il caso in cui i punC non siano disposC su una re/a, che a questo punto chiamo non correlaC.
O/engo A=5.91 + 12.3 cm e B=0.25 + 3.61 cm s-1 Si osservi come la re/a tende a orientarsi
orizzontalmente, dato che nella minimizzazione,
si lavora sulla distanza media delle y.
Sebbene fatto per poche coppie, per una più chiara visualizzazione, tale situazione vale anche per più punti.
Inverto le variabili e ricavo le A’ e B’:
A’=2.87 + 2.91 s cm e B’= 0.019 + 0.85 s cm-1 ;
Per i daC non correlaC o/engo le due equazioni, riportate qui su
grafico.
Si osservi come la y =(x) dedotta dalla
minimizzazione
delle yi=xi’ ovviamente risulta parallela invece all’asse y.
dopodiché riscrivo l’equazione iniziale y=y(x) con i parametri A* e B* , dedo\ dalla minimizzazione del chi-quadro rispe/o alle y’=x.
Abbiamo osservato come nel caso di daC non correlaC B e B’ tendono a zero pertanto BB’ tende quadraticamente a zero.
Formalizzazione del prodo9o BB’: .
Deduzione alla
come esercizio
Il coeff. di correlazione r rispetto agli scarti : .
Se riprendo le formule degli scarC quadraCci medi e del prodo/o misto:
Posso esprimere il coefficiente di correlazione nel seguente modo:
Osserviamo che al denominatore compaiono le sommatorie degli scarC quadraCci delle x
irispe/o al valore medio delle x, nonché delle y
irispe/o al valore
medio delle y
i, al numerato la sommatoria dei prodotti misti degli scarti.
Si osservi ancora che se considero le cui componenC siano gli scarC, ho al numeratore Il prodo/o scalare e al denominatore il prodo/o dei moduli dei rispe\vi ve/ori.
La probabilità di o9enere un dato r > r O : .
Il coefficiente di correlazione r (nonché il suo valore assoluto |r|) è funzione di
variabili casuali e quindi a sua volta una variabile casuale, che segue una sua densità di probabilità f(|r|).
La densità di probabilità del coefficiente di correlazione è fornita rispetto a variabili non correlate ed è tabulata rispetto al numero di coppie di dati N
f (| r |)
0 ro
∫ d|r|
La tabella in appendice B riporta la probabilità di ottenere nel caso di variabili non correlate un un valore |r| > rO.
Covarianza e correlazione:
ParCamo dalla approssimazione di una grandezza g=g(x,y,z …)
Mi limito all’approssimazione al primo ordine e considero due variabili:
Da cui o/engo:
Considero ora la varianza di g
2
2
A Pag. 172 di G. Ciullo correggere
l’errore editoriale
Chiamo covarianza la media dei prodo\ misC:
Fine della lezione del 21 maggio
Inizio della lezione del 22 maggio
Dalla correlazione …....
B X B’
…... alla covarianza.
Deduzione alla come esercizio!
Se le variabili non sono correlate r → 0 , anche σ
xy→ 0
a = a
1u
1+ a
2u
2 + !a
Nu
N= (x
1− x )u
1+ (x
2− x )u
2 + ! +(x
N− x )u
Nb = b
1u
1+ b
2u
2 + !b
Nu
N= (y
1− y )u
1+ (y
2− y )u
2 + ! +(y
N− y )u
N|a • b| ≤ ab
| a
1b
1+ a
2b
2 + ! +a
Nb
N| ≤ ( a
12+ a
22!a
N2) ( b12 + b
22!b
N2 )
a è adesso (x
1− x )u
1+ (x
2− x )u
2 + ! +(x
N− x )u
Nb è adesso (y
1− y )u
1+ (y
2− y )u
2 + ! +(y
N− y )u
N|a • b| ≤ ab
(x
1− x )u
1+ (x
2− x )u
2 + ! +(x
N− x )u
N[ ] • y [
1− y )u
1+ (y
2− y )u
2 + ! +(y
N− y )u
N] ≤
≤ (x
1− x )
2+ (x
2− x )
2 +! +(x
N− x )
2( y
1− y )
2+ (y
2− y )
2 +! +(y
N− y )
2(x
1− x ) y (
1− y ) + (x
2− x )(y
2− y )
+! +(x
N− x )(y
N− y )
⎡⎣ ⎤⎦ ≤
≤ (x
1− x )
2+ (x
2− x )
2 +! +(x
N− x )
2( y
1− y )
2+ (y
2− y )
2 +! +(y
N− y )
2(x
i− x ) y (
i− y )
i=1 N
∑ ≤ (x
i− x )
2i=1 N
∑ ( y
i− y )
2i=1 N
∑
Divido la disuguaglianza per N-1 si ha:
(x
i− x ) y (
i− y )
i=1 N
∑
N −1 ≤
(x
i− x )
2i=1 N
∑
N −1
y
i− y
( )
2i=1 N
∑
N −1 ≡ σ xy ≤ σ x σ y
Se vale (grandezze correlate) |σxy | < σxσy vale anche σxy <|σxy | < σxσy , quindi σxy < σxσy
Refusi a Pag. 174 in rosso