• Non ci sono risultati.

(misure di tendenza centrale) STATISTICA DESCRITTIVA STATISTICA DESCRITTIVA

N/A
N/A
Protected

Academic year: 2021

Condividi "(misure di tendenza centrale) STATISTICA DESCRITTIVA STATISTICA DESCRITTIVA"

Copied!
5
0
0

Testo completo

(1)

http

http:://www//www..biostatisticabiostatistica..unichunich..itit http

http:://www//www..biostatisticabiostatistica..unichunich..itit

LE MISURE DI SINTESI

(misure di tendenza centrale) STATISTICA DESCRITTIVA STATISTICA DESCRITTIVA

Individuare un indice che rappresenti significativamente un

insieme di dati statistici.

OBIETTIVO

Estremi inferiori delle classi Altezza (cm)

Frequenza

150 155 160 165 170 175 180 185 190 195

0510152025303540455055

Altezza (cm)

Frequenza

152 157 162 167 172 177 182 187 192

0510152025303540455055

Punti centrali delle classi Tabella dei dati

Classi Punto

Centrale n %

150 - 154 152 4 2.1

155 - 159 157 10 5.3

160 - 164 162 20 10.6

165 - 169 167 53 28.2

170 - 174 172 25 13.3

175 - 179 177 36 19.1

180 - 184 182 27 14.4

185 - 189 187 11 5.9

190 - 194 192 2 1.1

Totale 188 100.0

Altezza degli studenti 2004-05 (cm)

LA MEDIA ARITMETICA

La media aritmeticaè definita come quel valore che avrebbero tutte le osservazioni se non ci fosse la variabilità (casuale o sistematica).

n

n

1 i

=

=

i i

f x x

Altezza (cm)

Frequenza

150 155 160 165 170 175 180 185 190 195

0510152025303540455055

=

= n

i i

i f

n x x

1

1

Media (171.5 cm)

Il calcolo della media aritmetica utilizza tutte le osservazioni, risulta quindi estemamente sensibile ai valori atipici

LA MEDIA ARITMETICA

(2)

Altezza (cm)

Frequenza

150 155 160 165 170 175 180 185 190 195

0510152025303540455055

=

= n

i i

i f

n x x

1 Media (171.5 cm) 1

È possibile calcolare la media anche dai dati raggruppati in classi:

•Utilizzo i punti centrali e le frequenze di classe

•La stima della media approssima quella ottenuta con i singoli dati

•Assume la distribuzione uniforme dei valori all’interno delle classi

LA MEDIA ARITMETICA PROPRIETA’ DELLA MEDIA ARITMETICA

compresa tra il minimo dei dati e il massimo dei dati;

la somma degli scarti dalla media aritmetica è sempre uguale a zero;

la somma degli scarti al quadrato dalla media aritmetica assume valore minimo;

la media dei valori: k⋅xi è pari a la media aritmeticak (dove k è un numero reale qualsiasi);

la media dei valori: xi±h è pari a: media aritmetica±h (dove h è un numero reale qualsiasi).

0 )

( =

xi x

(xix)2< (xiz)2

LA MEDIANA

La mediana (Me) è definita come quell’osservazione che bipartisce la distribuzione in modo tale da lasciare al “di sotto” lo stesso numero di termini che lascia al “di sopra”.

L'idea che e alla base della mediana e di cercare un numero che sia più grande di un 50% delle osservazioni e più piccolo del restante 50%.

Altezza (cm)

Frequenza

150 155 160 165 170 175 180 185 190 195

0510152025303540455055 Mediana (171 cm)

( ) ( )

( )



+

=

+ + 2 / ) 1 (

1 2 / 2

/ )/2

(

n n n

x x

Me x se n pari

se n dispari

La mediana si dice robusta rispetto ai valori estremi, perché tiene conto solo dell’ordinamento delle osservazioni, considerando solo il valore centrale

LA MEDIANA

LA MODA

La Moda (Mo)è definita come l’osservazione che si verifica con maggiore frequenza in una data distribuzione.

In una distribuzione si possono avere anche più valori modali.

Altezza (cm)

Frequenza

150 155 160 165 170 175 180 185 190 195

0510152025303540455055 Moda (classe 165-170 cm)

LA MODA

(3)

DISTRIBUZIONI E SIMMETRIA

SIMMETRICA BIMODALE

ASIMMETRICA DESTRA

ASIMMETRICA SINISTRA

I QUANTILI

Generalizzano la mediana;

L'idea alla base di un quantile-p dove

p

∈ [0; 1] e di cercare un numero che sia più grande p% dei dati osservati e più piccolo del restante (1-p%) dei dati.

I quantili con p uguale a 0,25; 0,50 e 0,75 vengono chiamati rispettivamente il primo, il secondo e il terzo quartile.

Dividono la popolazione in quattro parti uguali.

Si osservi che il 2 quartile coincide con la mediana.

I quantili con p = 0,01; … ; 0,99 si chiamano percentili.

I QUANTILI

Altezza (cm)

Frequenza

150 155 160 165 170 175 180 185 190 195

0510152025303540455055

Quartile (165 cm)

Quartile

(178 cm) Q1=x(0.25(n+1)) (0.75( 1))

3=x n+

Q

I quartili dividono la distribuzione ordinata in quattro parti uguali.

Il secondo quartile (Q2) corrisponde alla mediana

I QUANTILI

Altezza (cm)

Percentuale Cumulativa

150 155 160 165 170 175 180 185 190 195

0102030405060708090100

Centile (157 cm)

Quartile (165 cm)

Mediana (171 cm)

Quartile (178 cm)

95°Centile (185 cm)

LE MISURE DI

DISPERSIONE

(misure di variabilità)

STATISTICA DESCRITTIVA

STATISTICA DESCRITTIVA

(4)

IL CAMPO DI VARIAZIONE (RANGE )

Il Campo di variazione o Rangecorrisponde alla differenza fra la modalità più piccola e la modalità più grande della distribuzione.

R = X

max

- X

min

LIMITI

è troppo influenzato dai valori estremi;

tiene conto dei due soli valori estremi, trascurando tutti gli altri.

( )

=

= n

i

i x

n x s

1 2 2

) 1 (

1

( 171.5) 72.5 )

1 188 (

1

1

2 2=

=

= n

i

xi

s

VARIANZA

Altezza (cm)

Frequenza

150 155 160 165 170 175 180 185 190 195

0510152025303540455055 sx+sxx

( )

=

= n

i

i x

n x s

1 2

) 1 (

1

È una misura riassuntiva delle differenze di ogni osservazione dalla media

( 171.5) 8.5 )

1 188 (

1

1

2=

=

= n

i

xi

s

DEVIAZIONE STANDARD

Altezza (cm)

Frequenza

150 155 160 165 170 175 180 185 190 195

0510152025303540455055 sx+sxx

Altezza (cm)

Frequenza

150 155 160 165 170 175 180 185 190 195

0510152025303540455055 Q1 Q3

13 cm

Differenza interquartile: Q3 – Q1

All’interno di questo range sono contenute il 50%

delle osservazioni

RANGE INTERQUARTILE

IL COEFFICIENTE DI VARIAZIONE

-La variabilità guarda alle differenze tra le unità sperimentali. E' pero evidente che il significato pratico delle differenze può dipendere dal livello del fenomeno considerato.

⋅100

=x CV s

-Misura di variabilità relativa

-Consente il confronto in termini di variabilità tra due fenomeni

Media e deviazione standard di due campioni ne indicano l’omogeneità o la variabilità

Mediana e range interquartile per le variabili ordinali

Frequenze nei due gruppi per la variabili qualitative

(5)

Riferimenti

Documenti correlati

Sviluppando la teoria perturbativa (seconda parte), abbiamo trovato un’espressione della velocità di transizione in funzione della densità di energia della radiazione, e questa aveva

Si calcolino i percentili di ordine 25 e 75 di una variabile quantitativa a scelta rispetto ai livelli di una variabile qualitativa che si ritiene possa influenzare i valori di

Il dataset è tratta dal libro &#34;Statistical Analysis: A Computer Oriented Approach&#34; by A.A. Afifi and S.P. I dati sono stati raccolti alla Shock Research Unit della University

In modo simile, dal secondo grafico (componenti principali colonna standardizzate e riga non standardizzate) si osserva che la media delle componenti principali delle frequen- ze

Per ogni singola classe (intervallo di valori di X) è possibile determinare la probabilità teorica per il modello proposto (distribuzione normale in questo

Per ogni singola classe (intervallo di valori di X) è possibile determinare la probabilità teorica per il modello proposto (distribuzione normale in questo

Portogallo Spagna Regno Unito Paesi Bassi Grecia Italia Danimarca Irlanda Germania Belgio Francia... Peso dei neonati

2 punti: risposta corretta, soluzione migliore, buona proprietà di linguaggio, esposizione chiara e leggibile.. 1,8 punti: risposta corretta, soluzione migliore con qualche