Misure Ripetute ed Indipendenti
Una delle metodologie più semplici per valutare l’affidabilità di una misura consiste nel ripeterla diverse volte, nelle medesime condizioni, ed esaminare i diversi valori ottenuti.
Ovviamente, una volta stimato in qualche modo l’errore, mi aspetto di ottenere misure sempre diverse numericamente ma ‘identiche’ entro l’incertezza della misura stessa.
Esempio:
Se la prima misura ha dato come risultato L = 1.234 m con incertezza 0.001 m mi aspetto che la grande maggioranza delle misure cada nell’intervallo 1.233-1.235 .
Perché solo la grande maggioranza e non tutte ?
Perché al momento non so stimare la probabilità che una misura di una grandezza fisica cada al di fuori della incertezza (saranno i concetti di deviazione standard in una gaussiana o di limite di confidenza per le altre distribuzioni statistiche a darmi questo valore)
• Dalla dispersione delle misure è possibile però avere un’idea dell’entità dell’errore casuale.
• Non si avrà tuttavia pero’ alcuna informazione sulla presenza o meno di errore
sistematico.
Attenzione:
E’ necessario essere assolutamente sicuri che la grandezza da misurare sia esattamente la medesima (questo significa misure ripetute nelle stesse condizioni) ogni volta che si effettua la misura. Inoltre il risultato di una misura non deve influenzare la misura successiva (questo significa Indipendenti):
• Possono cambiare le condizioni al contorno (lo vedremo con il pendolo)
• Il sistema può evolvere
• Se pesiamo un bicchiere d’acqua in ebollizione ogni misura sarà differente (minore) della precedente poichè un po’ di acqua sarà evaporata.
Le misure non sono indipendenti.
In questa prima parte supporremo vere le seguenti ipotesi
Ipotesi-1: Le condizioni sperimentali non devono variare lungo l’arco di tempo in cui si effettuano le misure (Indipendenza e Ripetibilità) Ipotesi-2: Non sono presenti errori sistematici
Date N misure di una data osservabile fisica (x 1 , x 2 , ... x N ) e supposte valide le ipotesi 1 e 2 allora la migliore stima del valore dell’osservabile da misurare potrebbe essere data dalla media aritmetica delle singole misure:
N x N
x x
x x x
x
N
i
i N
best
1 2 ... 1
N x
N
i
i N
lim 1
Media Campionaria
Media della popolazione
Notate la notazione differente ( e x best o <x>)
In seguito, una volta definite le distribuzioni e sotto opportune ipotesi (ecco il perche del
condizionale nella definizione), sarà possibile dimostrare queste affermazioni in maniera più
rigorosa.
Misuriamo ad esempio la massa di un oggetto
• Eseguo 21 misure della stessa quantità.
• Ottengo 21 numeri differenti.
• Media = 0.904 mg
• Max = 2.01 mg
• Min = 0.60 mg
Posso costruire un grafico che ha come ascissa il valore della misura (in intervalli) e sull’ordinata la frequenza assoluta o il numero di volte in cui ho ottenuto tale misura.
Esempio
Per costruire un istogramma bisogna:
1. Trovare la misura con valore massimo x max e la misura con valore minimo x min e l’intervallo D tra questi due valori detto ‘range’ della distribuzione
• Nel nostro caso: x max = 2.01 mg, x min = 0.6 g D = 1.41 mg
2. Dividere l’intervallo D in un numero conveniente di sottointervalli o classi di ampiezza Dx
• Nella maggioranza delle classi dovrebbero cadere almeno 3-5 misure
• Non necessariamente tutte le classi devono avere la stessa ampiezza Dx anche se sarebbe meglio che lo fosse
• Per evitare che una misura coincida con il confine tra due classi esprimente i confini della classe con una cifra significative in più rispetto a quello delle misure
• Non tutte queste condizioni potrebbero essere soddisfatte contemporaneamente
• A volte ci sono troppo poche misure per fare un istogramma
• Nel caso d = 0.5 mg - vedi plot successivo
• Nel caso d = 0.025 mg - vedi plot tra due pagine
3. Costruire una Tabella/Grafico con il numero di misure che cadono in ciascun
sottointervallo
Classe troppo larga (0.5 mg) Classe troppo stretta (0.025 mg)
Notate la notazione con cui scrivo l’asse delle Y in cui si scrive esplicitamente la classe usata
Con un passo troppo largo quasi tutte le misure cadranno in uno o due intervalli, con un
Passo troppo stretto ogni intervallo conterrà al più una sola misura
Esempio di istogramma
Confine di Classe Centro Classe
Assoluta
Esempio di istogramma
Confine di Classe Centro Classe
Assoluta
Esempio di istogramma Esempio di plot di dati
Notare che l’unità di misura
è sull’asse delle Y Notare che l’unità di misura
è sull’asse delle X
I due plot rappresentano la stessa cosa ma sono totalmente diversi e hanno un significato
totalmente differente
Attenzione
Misure Sperimentali E’ una lista di N misure della stessa quantità Ogni valore ha un’unità di misura
Media
N
x x
x x
x best 1 2 ... N
Media = 0.90381 g 0.904 mg
Attenzione
E’ una lista del numero di misure della lista precedente che cadono all’interno di un determinato intervallo o classe (p.es. 0.65-0.75 g)
Ogni Classe ha una unità di misura
M
i
i M
i
i i best
n n x x
x
1 1
Media
Media = 0.903571 g 0.904 mg M = Numero Classi
N = numero di misure S n i = N
Confine di Classe Centro Classe
Assoluta
Attenzione
Misure Sperimentali Distribuzione Associata
Confine di Classe Centro Classe
Assoluta
Stima dell’incertezza casuale
Immaginate tre casi generali:
1) Si usa uno strumento inadatto, cioè uno strumento con una sensibilità bassa rispetto all’errore casuale
E’ inutile fare tante misure (darebbero tutte lo stesso risultato) Si ha un errore di sensibilità pari alla sensibilità dello strumento
definito come la più piccola frazione di unità misura che lo strumento è in grado di misurare (un righello ad esempio avrà una sensibilità
compresa tra 0.5 e 0.25 mm)
Stima dell’incertezza casuale
2) Si usa uno strumento adatto, cioè uno strumento con una sensibilità buona rispetto a quella richiesta dalla misura ma è possibile fare solo poche misure
- La statistica fornisce strumenti per dare una stima dell’incertezza (ad esempio la ‘t di student’)
- Una sovrastima grossolana per l’incertezza è quella di usare la semidispersione massima definita come la metà tra la differenza tra il valore massimo e minimo della misura
2
min
max X
x X
D
Stima dell’incertezza casuale
3) Si usa uno strumento adatto, cioè uno strumento con una sensibilità buona rispetto a quella richiesta dalla misura ed è possibile fare un buon numero di misure (N> 10-30)
- la semidispersione massima non può essere usata come stima dell’incertezza poiché è una sua sovrastima.
- E’ necessario trovare una osservabile in grado di quantificare in maniera corretta questa incertezza.
- La differenza dal caso precedente è che, in questo caso, si ha a
disposizione un elevato numero di misure e quindi questo
permette una più accurata valutazione (magari con delle
ipotesi) della incertezza delle misure.
Caso 3 – Ipotizziamo vere le seguenti due ipotesi
Ipotesi-1: Le condizioni sperimentali non devono variare lungo l’arco di tempo in cui si effettuano le misure (Indipendenza e Ripetibilità) Ipotesi-2: Non sono presenti errori sistematici
Date N misure di una data osservabile fisica (x 1 , x 2 , ... x N ) e supposte valide le ipotesi 1 e 2 allora la migliore stima del valore dell’osservabile da misurare potrebbe essere data dalla media aritmetica delle singole misure:
Altre possibili stime del valore vero potrebbero essere la MODA o la MEDIANA
N x N
x x
x
N x N
x x
x x x
N
i
i N
N N
N
i
i N
best
1 2
1
1 2
1
... lim lim
...
Date N misure di una data osservabile fisica (x 1 , x 2 , ... x N ) e supposte valide le ipotesi 1 e 2 allora la migliore stima della incertezza media delle misure è data dalla deviazione
standard definita come:
Come nel caso del valore vero che si stima con il valore medio, può essere utile definire la deviazione standard di un campione e quella di popolazione.
Se si hanno a disposizione poche misure e se si usasse la formula della deviazione standard di popolazione (usando il valore medio) in generale si ha una sottostima del valore vero di s.
Notate come in un caso si usa il simbolo s e nell’altro il simbolo s
N
N x N
x x
x
N
i i
N 1
2 2
2 2
2 1
) ) (
( ...
) (
)
(
s
1 ) (
1
) (
...
) (
)
( 1
2 2
2 2
2 1
N
x x N
x x
x x
x s x
N
i
i N
Deviazione standard del campione
Deviazione standard di popolazione
mostriamo la definizione di deviazione standard
Media
FWHM
Con teg gi / 0.05g
La deviazione standard è un indicatore della larghezza della distribuzione Nota la differenza tra s e s
Per una Distribuzione Gaussiana FWHM = 2.35 s
s s
Nuova Osservabile:
Densità di frequenza o Densità di probabilità (per n che tende a infinito)
numero di misure che cadono nell’intervallo (x k -Dx/2; x k +Dx/2) diviso per il numero di misure totale
Densità di frequenza =
Ovviamente deve succedere che:
x N
x n f
totali misure
k
k
D 1
) (
1 1 '
) ( '
1 1
D D
D
x x N
istogramma n dell
Area
x x f istogramma
dell Area
Classi Numero k
totali misure
k Classi Numero
k k