Trattamento e Analisi statistica dei dati sperimentali
Modulo II : Sintesi dei dati sperimentali
L5. Indici di dispersione
Prof. Carlo Meneghini
dip. di Scienze Università Roma Tre e-mail: carlo.meneghini@uniroma3.it
Funzioni EXCEL
Indice Funzione
Intervallo (Range) = MAX(dati)-MIN(dati)
Distanza interquartile =QUARTILE(dati,3)-QUARTILE(dati,1) Deviazione standard
campionaria: s = DEV.ST(dati) Varianza campionaria: s
2= VAR(dati)
Deviazione standard: σ = DEV.ST.POP(dati)
Varianza: σ
2= VAR.POP(dati)
Dispersione
Intervallo
Intervallo (Range)
E’ la differenza tra il valore massimo e il valore minimo.
= MAX(dati)-MIN(dati)
-4 -3 -2 -1 0 1 2 3 4
MIN Range MAX
Distanza Interquartile
Distanza interquartile ∆Q
E’ la differenza tra Q
3e Q
1massimo e il valore minimo.
= QUARTILE(dati;3)-Quartile(dati;1)
Nota: la distanza interquartile è meno sensibile ai valori estremi (outlayers) rispetto a Range e Varianza
-4 -3 -2 -1 0 1 2 3 4
Q1 Q3
∆Q
Scarti
µ ε
i= x
i−
Lo Scarto ε
ιè la differenza tra il dato i-esimo e un valore di riferimento.
In questo caso lo scarto rispetto al valore atteso:
-4 -3 -2 -1 0 1 2 3 4
µ ε
ix
iVarianza della Popolazione
La Varianza di una distribuzione è la media del quadrato degli scarti:
La deviazione standard σ è la radice quadrata della varianza
( )
∑
=
−
=
N
i
x
iN
12
1 µ
2σ
( )
∑
=
−
=
N
i
x
iN
11
2µ σ
= VAR.POP(DATI)
= DEV.ST.POP(DATI)
s
σ
Varianza Campionaria
La Varianza campionaria s2 di una distribuzione è la media del
quadrato degli scarti:
La deviazione standard campionaria s è la radice quadrata della varianza
campionaria
x x
ii
= −
ε
Lo Scarto dalla media εi è la differenza tra il dato i-esimo la media campionaria
( ) ∑ ( )
=
− −
=
N
i
i
x
N x s
1
2
1 1
Sperimentalmente non abbiamo accesso a tutti i dati della popolazione, quindi, come per la media campionaria, varianza e deviazione standard sono una stima dei valori veri (attesi)
( ) ∑ ( )
=
− −
=
N
i
i
x
N x s
1 2 2
1 1
= VAR(DATI)
Varianza per dati aggregati
La Varianza campionaria per dati aggregati
nota: Se i dati sono aggregati in classi xi è il punto medio della classe i-esima
( )
∑
=
−
=
K
i
i
j
x x
f s
1 2 2
Calcolo della varianza (dati Aggregati)
La Varianza campionaria per dati
aggregati ∑ ( )
=
−
=
K
i
i
i
x x
f s
1 2 2
2 3 4
5
1. calcola la media 2. calcola gli scarti ε
3. calcola il quadrato degli scarti ε2 4. calcola f ε2
5. calcola Varianza (s2) e dev.st. (s) campionarie
Calcolo della varianza (dati Aggregati)
La Varianza campionaria per dati aggregati
1
2
3
1. calcola la media
2. calcola il quadrato degli scarti ε
23. calcola Varianza (s
2) usando la
funzione:
=matrice.somma.prodotto(dati1;dati2)
( )
∑
=
−
=
K
i
i
i
x x
f s
1 2 2
Calcolo della varianza (dati Aggregati)
La Varianza campionaria per dati aggregati
Se i dati sono aggregati in classi x
jè il punto medio della classe j-esima.
( )
∑
=
−
=
K
j
i
j
x x
f s
1 2 2
Il procedimento è del tutto analogo al caso precedente a patto di usare il valore
centrale delle classi per i calcoli.
Calcolo della varianza (dati Aggregati)
La Varianza campionaria per dati
aggregati ∑ ( )
=
−
=
K
j
i
j
x x
f s
1 2 2
Nota: Sarebbe corretto considerare nella stima della varianza, la
variabilità dovuta all’ampiezza degli intervalli ∆x
.ε
iε
i∆x =15
Calcolo della varianza (dati Aggregati)
La Varianza campionaria per dati
aggregati ∑ ( )
=
−
=
K
j
i
j
x x
f s
1 2 2
Nota: Sarebbe corretto considerare nella stima della varianza, la variabilità dovuta all’ampiezza degli intervalli ∆x .
( ) ( )
12
2
1
2 2 x
x x
f s
K
j
i j
+ ∆
−
=
∑
=
( )
12 x 2
∆ è la varianza di una distribuzione uniforme di ampiezza ∆x
Se
( )2 2
12x s
<<
∆
Il Box-plot (scatola a baffi)
Mediana (II Quartile) III Quartile
I Quartile
Massimo valore
"non anomalo"
Minimo valore
"non anomalo"
Valori anomali
∆Q
I valori anomali distando da QIII più di 1.5∆Q
I valori anomali distando da QI più di 1.5∆Q