Facoltà di Chimica Industriale
LABORATORIO DI FISICA GENERALE
(CORSO B) a.a. 1999/2000
dr. Maurizio SPURIO
spurio@bo.infn.it
Parte 1: Misure, errori di misura e statistica.
INDICE
Errori di misura
Come indicare gli errori di misura
Analisi degli errori casuali
Cenni sul calcolo delle Probabilità
Distribuzioni limite o continue
La distribuzione normale o di Gauss
Media e varianza come migliori stimatori di X e
Propagazione degli errori
Errori “relativi” o percentuali
Esempi sulla propagazione degli errori
Deviazione standard della media delle medie
Medie pesate
Confidenza di una misura
Dati che si distribuiscono lungo una retta
Metodo della regressione lineare
Stima degli errori per la retta di regressione
Linearizzazione di una funzione esponenziale
La distribuzione binomiale
Distribuzione di Poisson
Il test del 2, ossia: come prendere una decisione
Un esempio applicato alla distribuzione di Poisson
Nota: le pagine seguenti sono fotocopie dei lucidi presentati a lezione. Per questo motivo, non sono autoconsistenti, ma necessitano delle spiegazioni, dimostrazioni e dei passaggi presentati alla lavagna durante la lezione. Sono però utili per
aiutare lo studente a prendere appunti, per avere sottomano le formule da usare nelle prove di laboratorio e per selezionare nei libri consigliati le parti svolte.
Maurizio Spurio
Errori di misura
L’errore in una misura scientifica rappresenta l’inevitabile incertezza che è presente in ogni misura.
Le incertezze sulle misure sono inevitabili e non eliminabili. Si può pero’ cercare di ridurle ad un livello “accettabile”.
Il più comune errore, corrisponde alla lettura di
scale
(metri, termometri, ohmetri…) sia analogiche sia digitali. Qualsiasi grandezza fisica è soggetta ad un’indeterminazione.
Ad esempio, il rapporto tra la circonferenza C ed il diametro D di un cerchio, misurato con differenti strumenti, può essere:
C/D = 3.1 0.2 (misura rozza)
= 3.16 0.03 (misura più accurata)
= 3.1417 0.0002 (“ con molta cura)
= 3.1415927….. (rapporto matematico)
Il problema di come si stima un dato sperimentale e la corrispondente incertezza (l’errore a destra del segno ) è uno dei problemi del corso.
Uno dei metodi per valutare l’errore è quello di effettuare una sequenza di misure della stessa quantità (errore
statistico)
L’errore sistematico è di natura diversa, e la sua stima è a volte più complessa.
Come indicare gli errori di misura
Una “misura” di una grandezza è la miglior stima della grandezza stessa, nell’intervallo in cui riteniamo essa si trovi; ad es. C = (2.375 0.005) m
Nel valore sopra indicato, l’indeterminazione è di 0.5 cm, dovuta ad es. alla scala di lettura.
In generale, scriveremo:
valore misurato di x = (xb x) unita’
x è l’incertezza stimata su xb.
Durante il corso, impareremo come si stimano x e xb .
CIFRE SIGNIFICATIVE: il valore dell’errore deve essere arrotondato con una (al più, due) cifre significative.
I RISULTATI della misura devono essere dati con lo stesso ordine di grandezza (cifra decimale) dell’errore. Ad es:
C/D = 3.256973 0.2
NO
= 3.16 0.03471
NO
= 3.1417 0.0002
SI
Con le potenze di dieci, conviene scrivere (ad esempio, per la carica elettrica):
qe = (1.62 0.02) 10-19 C
Analisi degli errori casuali
Aumentare l’affidabilità della misura = ripetere la misura
Errori casuali possono essere ridotti
Errori sistematici NON possono essere ridotti La singola misura (es. periodo T del pendolo) può essere
soggetta a molte fluttuazioni (reazione start/stop orologio, attrito del pendolo con aria, attrito nel meccanismo di oscillazione, modi di oscillazione nel piano normale) ….
Ciascuna causa può aumentare/diminuire T di una singola misura. Un errore sistematico influisce sempre nello stesso verso (es. ritardo dell’orologio)
I metodi statistici forniscono il procedimento per stimare e ridurre le indeterminazione casuali. Le “sistematiche” sono più difficili da valutare e da rivelare.
Media di una misura
Supponiamo di aver effettuato N= 10 misure Ti (secondi).
8.16 , 8.14, 8.12 , 8.16, 8.18, 8.17, 8.14, 8.16, 8.15, 8.20
Quale è il valore vero? Una stima è :
Tbest = (media dei valori) = 1/N
i Ti = 8.158 s Per definizione, Tbest è calcolato in modo che
i (Ti - Tbest) = 0(somma delle deviazioni nulla).
Una grandezza che esprime la qualità della misura è lo
sparpagliamento attorno al valor medio. Un modo di stimare lo sparpagliamento, è quello di istogrammare i valori di T.
Il modo matematico per esprimere lo sparpagliamento, è quello di elevare al quadrato le deviazioni, e sommarle.
Nota: Gli istogrammi degli esempi riportati sono stati generati con il programma (freeware, ossia distribuito gratuitamente) PAW del CERN, istallato sul PC presente in laboratorio. Le istruzioni necessarie per generare tutti gli istogrammi, funzioni,
"fit" etc. sono riportati in appendice e sono a libera disposizione degli studenti.
Entries = numero di eventi Mean = Valor medio <x>
RMS = Varianza (vedi sotto)
Negli esempi successivi, (Esempio 1) sono presentati tre diversi istogrammi (H); la grandezza riportata è il periodo Ti . Il primo H è "male organizzato". Il secondo ed il terzo hanno un numero diverso di divisioni lungo l'asse delle x (rispettivamente 15 e 30 divisioni)
Nell'Esempio 2 sono riportati gli H di 20, 100 e 1000 misure di Ti (30 divisioni lungo l'asse x) . Si possono notare le seguenti caratteristiche:
Il valor medio non cambia drasticamente
La varianza non cambia drasticamente
La forma dell'istogramma diventa più regolare all'aumentare del numero degli eventi.
Esempio 1
Entries = N. Eventi Mean = Media RMS= Varianza
ID = 12345 Istogramma male organizzato
ID = 1 15 divisioni larghe 0.30s/15 bin = 0.02 s/bin
ID = 2 30 divisioni larghe 0.30s/30 bin = 0.01 s/bin
Esempio 2
Gli stessi dati di prima, con 0.01 s/bin
ID= 3 20 eventi
ID= 4 100 eventi
ID= 5 1000 eventi
La media e la varianza non variano apprezzabilmente!
Cenni sul calcolo delle Probabilità
La probabilità di un evento è il rapporto tra il numero dei casi favorevoli su quello dei casi possibili.
A volte il numero dei casi possibili non è noto (ad es.,
probabilità che un calciatore sia espulso durante una partita;
prob. di rottura di un circuito elettronico…)
In questi casi, si utilizza la
frequenza = n/N
= numero di eventi favorevoli n sul numero delle prove fatte N. Teorema: per
N ,
la frequenza tende alla probabilitàEnunciati di Kolmogorov:
1. Ad ogni evento A può essere associato uno ed un solo numero p(A)
2. La probabilità che non accada A è p(A). La probabilità che accada o non è la certezza, ossia:
p(A)+p(A)=1, da cui 0 p(A) 1.
3. Se due eventi A e B sono mutuamente esclusivi, allora:
p(A+B) = p(A) + p(B) .
4. Se A si verifica se e solo se si verificano B1 e B2, che sono indipendenti tra loro, allora:
p(A) = p(B1) p(B2)
Distribuzioni limite o continue
Una serie di misure può essere ordinata in un istogramma, come frequenza fk di dati in un dato intervallo.
fk = nk /N = numero eventi nell’intervallo k diviso il numero totale N di eventi
La proprietà (normalizzazione) delle frequenze:
fk = 1 In termini di questo ordinamento, il valor medio e la varianza di x sono:
<x>
xknk /N =
xkfk Sx2 =
(xk - <x>)2fk Nella maggior parte dei casi, all’aumentare di N, l’istogramma tende ad assumere qualche forma semplice e definita.
La distribuzione limite è una funzione continua f(x). Come fk
rappresenta la probabilità che gli eventi siano nell’intervallo k f(x)dx rappresenta la probabilità di trovare la misura nell’intervallo dx. Inoltre,
-
+ f(x)dx = 1 Il valor medio e la varianza di una distribuzione continua possono essere calcolate come:
<x> =
-
+x f(x) dx
Sx2 =
-
+(x - <x> )2 f(x) dx
La distribuzione normale o di Gauss
Le misure di una grandezza soggetta a molte piccole sorgenti di errore casuali, e trascurabili errori sistematici, tendono a
distribuirsi su una curva a campana chiamata distribuzione normale o di Gauss, centrata sul valore vero X.
La curva di Gauss con due parametri: X , è la funzione:
g(x) =
(
1/2)
e
–(x-X)2/22 La costante di normalizzazione e’ tale che
-
+ g(x)dx = 1 Utilizzando te tavole degli integrali, si può mostrare che:
<x> =
-
+x g(x) dx = X Sx =
-
+(x - <x> )2 g(x) dx = 2
Ossia: se una variabile e’ distribuita normalmente, il valor medio corrisponde al parametro X e la varianza al parametro della curva di Gauss.
Questo ci permette di stabilire il significato della varianza di una grandezza distribuita normalmente; infatti, in generale l’integrale:
a
bf(x) dx = probabilità di trovare la misura tra a e b allora:X-
X+ g(x) dx =(1/2)X-
X+e
–(x-X)2/22dx == (1/2)
-1
1e
–z2/2 dz = 0.68 ossia: la probabilità di trovare la misura in un intervallo pari ad una deviazione standard dal “valore vero” e’ del 68%.
La probabilità di trovare la misura entro “
t
sigma” da X e’riportata nel grafico seguente (i valori di P vs. t si possono leggere nella tabella in basso)
Media e varianza come migliori stimatori di X e
Un numero molto grande di misure di una grandezza x tende a distribuirsi secondo la funzione di Gauss.
Un numero finito di N misure x1, x2… xN può stimare il “valore vero” X e la varianza della distribuzione.
P(x1)
1/e
– (x1-X)2/22P(x2)
1/e
– (x2-X)2/22….
P(xN)
1/e
– (xN-X)2/22Se le misure sono indipendenti, la probabilità Ptot di avere quell’insieme delle N letture è il prodotto delle N probabilità:
Ptot = P(x1) P(x2) P(xN) = (1/N
) e
–
i (xi-X)2/22X e non sono noti, e debbono essere stimati. La miglior stima è quella che massimizza la probabilità . Procedimento o metodo della massima verosimiglianza.
X’ Stima di X
P/X = 0
i (xi – X’) = 0
X’ =
i (xi /N)’ = stima di
P/ = 0
’ = 1/N
i (xi – X’)2
Ricapitolando:
1. Se le misure di una grandezza sono soggette solo a (molti e piccoli) errori casuali, la loro distribuzione limite e’ la funzione di Gauss
2. La migliore stima del valore vero X della popolazione e’ il valor medio, perché massimizza la probabilità che proprio quelle N misure siano state ottenute.
3. La miglior stima della larghezza della Gaussiana (sigma) è la varianza Sx.
4. La larghezza della distribuzione corrisponde alla confidenza che il 68% delle misure di x cadano nell’intervallo
(valore x misurato) = <x> x
Errori “relativi” o percentuali
Spesso è utile ricorrere all’errore relativo di una grandezza.
L’errore (spesso chiamato assoluto) ha le stesse dimensioni fisiche della grandezza:
(valore di x) = xb x unita’
L’errore relativo è indicato come:
(valore di x) = xb (1 x/xb) unita’
L’errore relativo x/xb è adimensionale; è molto utile nei calcoli di propagazione degli errori (vedi esempi successivi), quando una grandezza dipende da molte altre variabili.
Talvolta, moltiplicato per 100 viene chiamato “errore percentuale”. In tal caso, si aggiunge il simbolo “ %”.
L’errore percentuale fornisce immediatamente la qualità della misura (ossia, il grado di precisione).
Propagazione degli errori
Se la grandezza x e’ distribuita normalmente, con media <x>
varianza x , allora la grandezza (A= costante):
q = A + x
e’ gaussiana, con media <q> = A+ <x> e varianza x
Se la grandezza x e’ distribuita normalmente, con media x e varianza x , allora la grandezza (B= costante):
q = Bx
e’ gaussiana, con media <q> = B <x> e varianza Bx
Se le grandezze x e y sono distribuite normalmente, con (rispettivamente) media <x> e varianza x , media <y> e varianza y , allora :
q = x + y
e’ gaussiana, con media: <q> = <x> + <y>
varianza: q =
x2 + y2 In generale, se x e y sono variabili gaussiane, allora anche q = f(x,y ) è gaussiana con:
media: <q> = f(<x>,<y>)
varianza: q =
(
q/x)
<x>,<y> x2 +(
q/y)
<x>,<y> y2Esempi sulla propagazione degli errori
1. Lo spessore di una risma di 100 fogli (supposti identici) è S=3.3 0.1 cm. Determinare lo spessore di un foglio
2. Le quantità di moto (rispettivamente) finali ed iniziali di un oggetto sono pf = 33.7 0.3 kgm/s e pi = 12.2 0.4 kgm/s . Calcolare la variazione della quantità di moto.
3. Determinare l’area di un rettangolo di dimensioni a = 33.12 0.05 mm e b= 12.71 0.07 mm .
4. Il tempo di caduta t di un sasso (inizialmente in quiete) da una altezza h=14.1 0.1 m è t= 1.6 0.1 s. Determinare g.
Nota: l’incertezza relativa di una variabile q= Axn è q/q = n x/x
5. Determinare la temperatura T di n=2.2 moli di gas perfetto alla pressione di 1.0 atm. ed al volume di V=1.2 litri. R è noto con una precisione dello 0.1%, n e P al 5% e V al 2%.
6. Se = 20o 3o , determinare cos.
7. Determinare l’attività (dicembre 1999) di una sorgente
radioattiva con vita media =(30.0 0.5) y , preparata nel marzo 1967 con attività nominale
Ao = (100 12) Curie
Deviazione standard della media delle medie
N misure della grandezza x hanno media <x> e varianza x.
Se ripetiamo N volte la stessa serie di N misure, la grandezza
<x> avrà varianza pari a:
<x> = x/
N.
La deviazione standard x rappresenta l’incertezza su
una
singola misura
Se aggiungiamo altre misure, utilizzando la stessa tecnica, ci aspettiamo che x non cambi apprezzabilmente.
La media di molte medie non fluttua “troppo” attorno alla media <x> di una serie di misure. La dispersione delle medie,
<x> = x/
N , decresce lentamente con N. Occorre ricordare che gli errori sistematici Non diminuiscono all’aumentare del numero di misure.
(Nell’esempio delle pagine successive, i 1000 valori del periodo T misurati sono stati suddivisi in 20 sotto campioni, ciascuno di 50 misure. Per ciascun campione è stata calcolata la media e la
varianza. Infine sono state istogrammate le 20 medie calcolate.)
ESEMPIO 4 - 20 campioni, ciascuno di 50 misure di T (solo 10 grafici)
Media delle medie al lavoro
Consideriamo le 20 medie ottenute dai precedenti sottocampioni, ciascuno con 50 misure di T.
La distribuzione della media delle medie ha un certo valor medio (media delle medie) ed una certa larghezza.
La media delle medie è:
<x> = 8.164 s
La varianza si può ottenere dalla varianza x delle singole distribuzioni (una delle 20) , diviso (numero di eventi)
<x>=
x/ N
=
x/ 7 = 0.003 s
<x> NON dipende dal numero di campioni (nel nostro caso, 20). E' sufficiente un solo campione per stimare <x>
<x>corrisponde all'errore statistico delle nostre
misure, ossia è l'errore da associare alla misura di x
Medie Pesate
Spesso occorre combinare misure separate, con diverso grado di precisione. Ad es. in due laboratori diversi sono state effettuate due misure per la velocità della luce.
Lab. A cA = xA A
Lab. B cB = xB B
Com’è possibile combinare le due misure, tenendo conto della diversa qualità delle misure stesse?
Il metodo della massima verosimiglianza dà la risposta. Infatti, se al solito P(A) e P(B) sono le probabilità delle due misure, la probabilità di avere entrambe le misure è:
P(A+B) (1/ AB ) exp[-(xA-X)2/22A - (xB -X)2/22B] = (1/ AB ) exp[-2/2]
dove
2 = [(xA-X)2/22A + (xB -X)2/22B]
Per il principio della massima verosimiglianza, il miglior valore per X è quello che massimizza la probabilità, ossia minimizza il chi quadro
2 ( d2/dX) = 0
Questo stimatore, è la media pesata, definita come:
i i i
w N
i N i
w x x w
1
1
wi1i2
Confidenza di una misura
Siamo giunti a stimare una grandezza x, con un certo valor medio e deviazione standard della media delle medie
valore di x = <x> <x>
Se confrontiamo il nostro valore di x con un valore atteso, noto anch’esso con una certa indeterminazione, possiamo stabilire se le nostre misure sono o meno in accordo con l’aspettazione entro un certo intervallo di confidenza.
Nel caso di accordo, la differenza tra la misura ed il valore previsto sarà compatibile con zero.
Esempio (attualità!) : SuperKamiokande misura un rapporto tra il numero di eventi indotti da neutrini del e neutrini dell’e pari a R=(1.20 0.12) . La fisica dei Raggi Cosmici prevede un valore Ratteso = (2.0 0.1). Sono compatibili i due risultati ?
In generale, si stima il rapporto
t
tra la differenza delle quantità e l’errore sulla differenza. In gergot
viene spesso chiamato numero di sigma della differenza. La probabilità che le due misure siano compatibili è:se t = 1 Pcompat = 1- 0.68 = 32%
se t = 2 Pcompat = 1- 0.95 = 5%
se t = 3 Pcompat = 1- 0.998 = 0.2%
Misure con t > 2 vengono generalmente considerate
incompatibili. Attenzione: può accadere che a volte misure
incompatibili NON lo siano, per sottostima di errori o per non identificazione di errori sistematici.
Dati che si distribuiscono lungo una retta
Talvolta, un esperimento consiste nella verifica di una relazione lineare (ad es. v(t) = v0 + gt ) . In generale, del tipo:
. y = A + B x
dove A e B sono due costanti incognite, e y ed x due variabili misurabili.
Noi effettuiamo delle misure dei valori yi in corrispondenza di altrettanti punti xi . Ci aspettiamo che, entro le incertezze i punti (xi , yi ) si dispongano lungo una retta
Nel seguito, vedremo di:
1. determinare i parametri A e B dell'equazione
2. verificare se la relazione lineare sussiste (cioè, se i dati sono in accordo con quanto aspettato).
Metodo della regressione lineare
Assumiamo per semplicità che gli errori su x siano trascurabili, e che quelli su y siano gaussiani. Ci aspettiamo cioè che la grandezza:
z = y - (A+Bx)
sia distribuita normalmente, abbia media nulla, e abbia una varianza z = y
Il metodo per determinare A e B si basa ancora sulla proprietà che la probabilità di osservare quel dato insieme di N misure sia massima. Ciò corrisponde a minimizzare (rispetto ad A e B) la grandezza:
2 = i=1
N[y
i- (A + B
x
i)]
2 Si ottengono cosi' due equazioni in due incognite le cui soluzioni sono:
i i
N i i
N i i
N i i
N
i x y x x y
A 1 1 1
2 1
N
i i
i N i i
N
i xiy x y
N
B 1 1 1
NiN1xi2Ni1xi2
La retta y = (A+Bx) basata sulle coppie di punti misurati (xi ,yi) si chiama retta dei minimi quadrati, o retta di regressione
Stima degli errori per la retta di regressione
Le N misure yi non sono misure della stessa variabile.
Dipendono, infatti, da xi . Quindi ci si aspetta che sia la grandezza
z = y - (A+Bx)
a distribuirsi in modo gaussiano, con varianza z = y
Al solito, la miglior stima di y è la grandezza
Sy (N12)N1 yiABxi2
Attenzione: nella espressione compare un N-2 al denominatore.
La dimostrazione di ciò è piuttosto complessa. E' semplice però ricordarlo perché per due punti passa una retta; i gradi di
libertà del problema sono diminuiti di due unità!
Poiché nella retta di regressione determiniamo A e B, occorre stimare il loro errore. La varianza di A e B dipende da y e si ottiene (al solito) minimizzando il chi quadro. Si ottiene:
y N i
A
x
1 2 2
2
B2 Ny2
Un esempio: (da Taylor, p.130)
Per un gas perfetto che si espande a volume costante:
T = a + b P
ove T è la temperatura del gas (misurata) in funzione di alcuni valori di pressione P, anch'essi misurati con incertezza
trascurabile
Supponiamo che siano state fatte 5 misure di T in corrispondenza di altrettanti valori di P
Prova Pi (mm hg)
Ti (oC) a+bPi [Ti-(a+bPi)]2
1 65 -20 -22.2 4.84
2 75 17 14.9 4.41
3 85 42 52.0 100.
4 95 94 89.1 24.0
5 105 127 126.2 0.64
n.b. le colonne 4 e 5 possono essere riempite solo dopo aver determinato i parametri a e b
Dobbiamo:
1. determinare i parametri a e b
2. stimare la dispersione delle misure 3. stimare l'errore sui parametri a e b
Con l'ausilio di una calcolatrice, determiniamo le grandezze che ci occorrono per stimare i parametri della retta di regressione:
Pi=425 ;
P2i=37125 ;
Ti=260;
TiPi=25810 ; = 5000 da cui:
a = -263.35 oC
b = 3.71 oC/(mm hg)
Possiamo calcolare la dispersione delle misure, sommando l'ultima colonna della tabella e dividendo per (N-2)=3
T =
(134/3) = 6.7 oC La varianza sulla temperatura è una stima della precisione della misura della stessa grandezza. Quindi, la precisione sulla determinazione di T è di circa 7 gradi centigradi.
Ora possiamo determinare gli errori sui parametri a e b della correlazione lineare:
2a = 2T (
P2i) / = 331 a = 18 oCe
2b = N2T / = 0.045 b = 0.21 oC/(mm hg) Possiamo quindi esprimere il risultato come:
a = (-260 20 ) oC
b = ( 3.7 0.2 ) oC/(mm hg)
Si noti che, entro l'errore, il valore di a è compatibile con il valore T0= -273 oC
Si noti inoltre che l'incertezza di circa 7 oC nella regione della misura si è propagata sino a diventare 20 oC.
La stessa cosa può essere qualitativamente ottenuta col metodo grafico, in cui si tracciano le rette di massima e minima pendenza compatibili con gli errori
Esperimento Pressione/ Temperatura (I)
Rappresentazione grafica dei dati in tabella.
La retta rappresentata è quella ottenuta dal fit.
Il grafico è stato realizzato con PAW (vedi appendice)
I parametri del fit possono anch'essi essere ottenuti con PAW
Esperimento Pressione/ Temperatura (II)
Gli stessi dati del grafico precedente, ma su una scala espansa
Linearizzazione di una funzione esponenziale
Accade spesso che una legge fisica sia descritta da una funzione esponenziale del tipo:
.
N(x) = N
oexp(-
x)
. Questo accade ad esempio nella legge del decadimento radioattivo, o nell'esperienza del contatore Geiger
In quest'ultimo caso, si misurano i conteggi nell'unità di tempo
N(x) (conteggi/sec)
registrati dal contatore in funzione dello spessorex (cm)
di materiale assorbitore frapposto tra la sorgente radioattiva ed il Geiger.N
o è lafrequenza di conteggi in mancanza si materiale, e
(cm
-1)
è la costante che si deve determinare. La legge può essere linearizzata nel modo:
lnN(x) = lnN
o-
x y = A + B
x
In questo modo, per determinare
B = -
si utilizzano le formule note per la retta. Inoltre, può essere stimato l'errore nella misura della variabile y .La distribuzione binomiale
Talvolta, occorre risolvere problemi del tipo: "qual è la probabilità di ottenere tre 6 lanciando tre dadi? E la probabilità di ottenere due 6?"
A questo tipo di problema risponde la distribuzione binomiale
TERMINOLOGIA:
Supponiamo di effettuare "n prove" (ossia, lanci di dadi, monete…).
Ciascuna prova può avere varie uscite, di cui una (o una combinazione) è il nostro successo . Ad es., l'uscita del 6.
Il successo ha una probabilità
p
di verificarsi. Nel nostro caso,p
(6 nei dadi) = 1/6. L'insuccesso (= non successo) ha probabilità
q=(1-p)
(nel nostro caso,
q
=5/6) La probabilità di ottenere
v
successi inn
prove è:n n n p qn
2 1
) 1 (
) 1 prove) (
n in P(
ossia, in altre notazioni
nn p qn np qn
)!
1 (
! n) ! | P(
Ad esempio, la probabilità di "due 6 su tre dadi" è:
P(due 6 su tre dadi) = 3!/2! (1/6)2 (5/6) = 3 0.0277 0.83 = 0.069 ~7%
Esempio 1: lancio di 4 monete. Qual è la probabilità di ottenere 0,1,2,3,4 teste?
Esempio 2: un ospedale ricovera 4 malati, con una malattia la cui mortalità è (dopo un mese) dell'80%. Calcolare la
probabilità che 0,1,2,3,4 malati sopravvivano dopo un mese.
Proprietà della distribuzione binomiale:
La distribuzione binomiale è una distribuzione discreta (ossia, può assumere un numero finito di valori). Si può calcolare il valor medio e la varianza di questa distribuzione:
Valor medio =
<v> = n p
Varianza =
v= n p(1-p)
Nota: se il numero delle prove è grande (>30), per un valore fissato della probabilità p la distribuzione binomiale viene
approssimata dalla distribuzione di Gauss con media X=
n p
e varianza n p(1-p)Distribuzione di Poisson
La distribuzione di Poisson e’ una nuova distribuzione statistica che si applica per eventi casuali, ma con media temporale definita .
Esempio : una sostanza radioattiva ha una certa attività’ decadimenti/secondo). Facendo n misure di 1 minuto, quale distribuzione di conteggi ci dobbiamo aspettare?
P( v conteggi in t) =
) !
P(
e
Nella figura (pag. successiva) vengono presentate tre curve per tre valori di (= 0.8 , 3 , 11 conteggi/s).
La distribuzione di Poisson può essere utilizzata in molti casi ( ad es. , la fig. 2 può adattarsi anche alla quantita’ di pasta venduta da un ipermercato, la cui vendita media e’ di 3 quintali di pasta al giorno).
Proprieta’ della distribuzione di Poisson
Valore medio
:<v> =
Varianza :
=
Queste formule sono molto importanti in pratica. Supponiamo di aver effettuato una certa misura: ad esempio, di aver misurato in un rivelatore, 202 interazioni in 4.2 anni di osservazione dovute a rare interazioni di particelle presenti nei Raggi
Cosmici. L’errore che può essere associato a questa misura e’
proprio
202 , poiche’ in numero di eventi attesi segue la statistica di Poisson. In generale, quando si effettua una misura di v conteggi in un dato periodo di osservazione, il “valor medio” della misura coincide con la misura stessa, e l’errore associato pari alla
v :Stima conteggi = v v
Esercizio: il numero medio di disintegrazioni di un certo campione radioattivo e’ 20/minuto. Quanto tempo occorre aspettare per una misura precisa al 3% ? E all’1%?
Il test del
2Ossia: come prendere una decisione
In precedenza, abbiamo conosciuto tre distribuzioni di probabilità (Gauss, Binomiale, Poisson).
Abbiamo visto come stimare i parametri che adattano i dati ad una retta (ed e’ facile estrapolare al caso di una qualunque polinomiale).
Come e’ possibile stimare se i dati si adattano meglio ad una curva, piuttosto che all’altra?
Per questo, esiste un criterio : il test del chi quadro (
2).
S
upponiamo di avere una serie diN
misure yk di unagrandezza osservabile y, con varianza Sy. Riteniamo che la grandezza y sia in accordo con una legge fisica del tipo
f(x
k)
y
k= f(x
k)
.
Nel caso ideale, in cui non esistano errori:y
k- f(x
k) = 0
Poiche’ ci sono le indeterminazioni, quello che ci aspettiamo e’qualcosa del tipo:
(y
k y)- f(x
k) = 0 [(y
k- f(x
k) ]
2/ y
2= 1
Sommando su tutte le N misure:
k[ (yk - f(x
k) ]
2/ y
2= N
La grandezza “chi quadro” viene definita come:
2 =
k [ (yk - f(x
k) ]
2/ y
2In generale, ci si aspetta che il valore atteso per la grandezza chi quadro per un insieme di N osservazioni coincide con N, ossia che 2 / N ~ 1. (chi quadro ridotto)
Un numero ‘troppo grande’ per il chi quadro significa che i nostri dati non sono in accordo, entro gli errori, con i valori attesi.
La grandezza chi quadro segue una propria funzione di
probabilita’ (la funzione chi quadro) la cui descrizione esula dagli scopi del corso. Ciononostante, e’ relativamente semplice utilizzarla seguendo le seguenti indicazioni:
1. Calcolare il 2 utilizzando la definizione.
2. Dividere per il “numero dei gradi di libertà” (coincide con il numero di osservazioni se le predizioni sono note, e non sono state ricavate con adattamenti (fit). Altrimenti, in numero dei gradi di liberta’ e’ N-numero dei parametri del fit)
3. Se 2 >> 1, il risultato non e’ soddisfacente, se 2 1 l’accordo e’ soddisfacente.
4. Per un confronto piu’ quantitativo, utilizzare le tabelle nei libri. Ad esempio, per 1, 5 e 10 gradi di liberta’:
d = 1 d = 5 d = 10 P(2 1.0) 32% 42% 44%
P(2 2.0) 16% 7.5 % 2.9%
P(2 3.0) 8.3% 1.0% 0.1%
Un esempio applicato alla distribuzione di Poisson
In un esperimento, si effettuano 100 misure della durata di un minuto. Ciascuna misura, consiste nel contare il numero di Raggi Cosmici rivelati da un contatore Geiger. La distribuzione dei conteggi/min e’ riportata nella prima colonna.
Frequenza
di conteggi Occorrenza yk
Attesa ak
poissoniana
Errore dk
su attesa
[(yk -ak)/dk]2
0 7 7.5 2.7 0.03
1 17 19.4 4.4 0.3
2 29 25.2 5.0 0.9
3 20 21.7 4.7 0.13
4 16 14.1 3.7 0.3
5 8 7.4 2.7 0.05
6 1 3.1 1.7 1.5
7 2 1.2 1.1 0.5
>7 0 0.4 0.6 0.4
Stima del valor medio: v = 2.59
Da v ,con la funzione di Poisson, si ottengono i valori di probabilita’ attesi per 0,1…7 occorrenze, e l’errore.
Il chi quadro e’ 3.8 per (9-1) gradi di liberta’. C’e’ infatti da tener conto che con I dati abbiamo calcolato il valor medio v.
Il chi quadro ridotto e’ 3.8/8 = 0.48
I dati effettivamente si adattano alla distribuzione di Poisson.