http
http:://www//www..biostatisticabiostatistica..unichunich..itit http
http:://www//www..biostatisticabiostatistica..unichunich..itit
LE MISURE DI SINTESI
(misure di tendenza centrale) STATISTICA DESCRITTIVA STATISTICA DESCRITTIVA
Individuare un indice che rappresenti significativamente un
insieme di dati statistici.
OBIETTIVO
Estremi inferiori delle classi Altezza (cm)
Frequenza
150 155 160 165 170 175 180 185 190 195
0510152025303540455055
Altezza (cm)
Frequenza
152 157 162 167 172 177 182 187 192
0510152025303540455055
Punti centrali delle classi Tabella dei dati
Classi Punto
Centrale n %
150 - 154 152 4 2.1
155 - 159 157 10 5.3
160 - 164 162 20 10.6
165 - 169 167 53 28.2
170 - 174 172 25 13.3
175 - 179 177 36 19.1
180 - 184 182 27 14.4
185 - 189 187 11 5.9
190 - 194 192 2 1.1
Totale 188 100.0
Altezza degli studenti 2004-05 (cm)
LA MEDIA ARITMETICA
La media aritmeticaè definita come quel valore che avrebbero tutte le osservazioni se non ci fosse la variabilità (casuale o sistematica).
n
n
1 i
∑
=
⋅
=
i if x x
Altezza (cm)
Frequenza
150 155 160 165 170 175 180 185 190 195
0510152025303540455055
∑
= ⋅
= n
i i
i f
n x x
1
1
Media (171.5 cm)
Il calcolo della media aritmetica utilizza tutte le osservazioni, risulta quindi estemamente sensibile ai valori atipici
LA MEDIA ARITMETICA
Altezza (cm)
Frequenza
150 155 160 165 170 175 180 185 190 195
0510152025303540455055
∑
=
⋅
= n
i i
i f
n x x
1 Media (171.5 cm) 1
È possibile calcolare la media anche dai dati raggruppati in classi:
•Utilizzo i punti centrali e le frequenze di classe
•La stima della media approssima quella ottenuta con i singoli dati
•Assume la distribuzione uniforme dei valori all’interno delle classi
LA MEDIA ARITMETICA PROPRIETA’ DELLA MEDIA ARITMETICA
compresa tra il minimo dei dati e il massimo dei dati;
la somma degli scarti dalla media aritmetica è sempre uguale a zero;
la somma degli scarti al quadrato dalla media aritmetica assume valore minimo;
la media dei valori: k⋅xi è pari a la media aritmetica⋅k (dove k è un numero reale qualsiasi);
la media dei valori: xi±h è pari a: media aritmetica±h (dove h è un numero reale qualsiasi).
0 )
( − =
∑ xi x
∑
∑(xi−x)2< (xi−z)2
LA MEDIANA
La mediana (Me) è definita come quell’osservazione che bipartisce la distribuzione in modo tale da lasciare al “di sotto” lo stesso numero di termini che lascia al “di sopra”.
L'idea che e alla base della mediana e di cercare un numero che sia più grande di un 50% delle osservazioni e più piccolo del restante 50%.
Altezza (cm)
Frequenza
150 155 160 165 170 175 180 185 190 195
0510152025303540455055 Mediana (171 cm)
( ) ( )
( )
+
=
+ + 2 / ) 1 (
1 2 / 2
/ )/2
(
n n n
x x
Me x se n pari
se n dispari
La mediana si dice robusta rispetto ai valori estremi, perché tiene conto solo dell’ordinamento delle osservazioni, considerando solo il valore centrale
LA MEDIANA
LA MODA
La Moda (Mo)è definita come l’osservazione che si verifica con maggiore frequenza in una data distribuzione.
In una distribuzione si possono avere anche più valori modali.
Altezza (cm)
Frequenza
150 155 160 165 170 175 180 185 190 195
0510152025303540455055 Moda (classe 165-170 cm)
LA MODA
DISTRIBUZIONI E SIMMETRIA
SIMMETRICA BIMODALE
ASIMMETRICA DESTRA
ASIMMETRICA SINISTRA
I QUANTILI
Generalizzano la mediana;
L'idea alla base di un quantile-p dove
p∈ [0; 1] e di cercare un numero che sia più grande p% dei dati osservati e più piccolo del restante (1-p%) dei dati.
I quantili con p uguale a 0,25; 0,50 e 0,75 vengono chiamati rispettivamente il primo, il secondo e il terzo quartile.
Dividono la popolazione in quattro parti uguali.
Si osservi che il 2 quartile coincide con la mediana.
I quantili con p = 0,01; … ; 0,99 si chiamano percentili.
I QUANTILI
Altezza (cm)
Frequenza
150 155 160 165 170 175 180 185 190 195
0510152025303540455055
1°Quartile (165 cm)
3°Quartile
(178 cm) Q1=x(0.25⋅(n+1)) (0.75( 1))
3=x ⋅n+
Q
I quartili dividono la distribuzione ordinata in quattro parti uguali.
Il secondo quartile (Q2) corrisponde alla mediana
I QUANTILI
Altezza (cm)
Percentuale Cumulativa
150 155 160 165 170 175 180 185 190 195
0102030405060708090100
5°Centile (157 cm)
1°Quartile (165 cm)
Mediana (171 cm)
3°Quartile (178 cm)
95°Centile (185 cm)
LE MISURE DI
DISPERSIONE
(misure di variabilità)
STATISTICA DESCRITTIVA
STATISTICA DESCRITTIVA
IL CAMPO DI VARIAZIONE (RANGE )
Il Campo di variazione o Rangecorrisponde alla differenza fra la modalità più piccola e la modalità più grande della distribuzione.
R = X
max- X
minLIMITI
è troppo influenzato dai valori estremi;
tiene conto dei due soli valori estremi, trascurando tutti gli altri.
( )
∑
=
− −
= n
i
i x
n x s
1 2 2
) 1 (
1
( 171.5) 72.5 )
1 188 (
1
1
2 − 2=
= −
∑
= n
i
xi
s
VARIANZA
Altezza (cm)
Frequenza
150 155 160 165 170 175 180 185 190 195
0510152025303540455055 sx+sx− x
( )
∑
=
− −
= n
i
i x
n x s
1 2
) 1 (
1
È una misura riassuntiva delle differenze di ogni osservazione dalla media
( 171.5) 8.5 )
1 188 (
1
1
2=
− −
= ∑
= n
i
xi
s
DEVIAZIONE STANDARD
Altezza (cm)
Frequenza
150 155 160 165 170 175 180 185 190 195
0510152025303540455055 sx+sx− x
Altezza (cm)
Frequenza
150 155 160 165 170 175 180 185 190 195
0510152025303540455055 Q1 Q3
13 cm
Differenza interquartile: Q3 – Q1
All’interno di questo range sono contenute il 50%
delle osservazioni
RANGE INTERQUARTILE
IL COEFFICIENTE DI VARIAZIONE
-La variabilità guarda alle differenze tra le unità sperimentali. E' pero evidente che il significato pratico delle differenze può dipendere dal livello del fenomeno considerato.
⋅100
=x CV s
-Misura di variabilità relativa
-Consente il confronto in termini di variabilità tra due fenomeni
Media e deviazione standard di due campioni ne indicano l’omogeneità o la variabilità
Mediana e range interquartile per le variabili ordinali
Frequenze nei due gruppi per la variabili qualitative