• Non ci sono risultati.

Requisiti di un indice di variabilità

N/A
N/A
Protected

Academic year: 2021

Condividi "Requisiti di un indice di variabilità"

Copied!
46
0
0

Testo completo

(1)

∆ ∆

Unità 5

Gli indici di variabilità e forma

(2)

Requisiti di un indice di variabilità

• Gli indici di variabilità devono soddisfare alcuni requisiti necessari:

1. Devono assumere un valore non negativo 2. Devono assumere un valore nullo quando la

distribuzione è costante, ovvero tutte le

osservazioni sono uguali tra loro (in tal caso si parla di variabile degenere)

3. Aggiungendo una costante a una variabile, l’indice di variabilità non deve cambiare

STATISTICA - Università di Salerno 2

(3)

La variabilità:

esempio voti esami

• Distribuzioni statistiche molto diverse possono presentare la stessa posizione.

STATISTICA - Università di Salerno

A 22 22 23 23 24 25 26 27 27 28 28 B 22 22 22 22 22 25 28 28 28 28 28 C 25 25 25 25 25 25 25 25 25 25 25

= 25 x

A

= 25 x

B

= 25 x

C

3

(4)

La variabilità:

esempio

• Distribuzioni statistiche molto diverse possono presentare la stessa posizione.

STATISTICA - Università di Salerno 4

(5)

La variabilità

• La variabilità è l’attitudine di un fenomeno ad assumere differenti modalità.

• Distinguiamo le misure di variabilità in quattro classi:

A. variabilità rispetto ad una posizione (media, mediana) B. variabilità delle modalità ordinate

C. variabilità reciproca (mutua) tra tutte le modalità di un carattere considerate due a due.

D. variabilità delle frequenze

STATISTICA - Università di Salerno 5

(6)

Varianza: serie di dati

STATISTICA - Università di Salerno

= Media degli

scarti al quadrato

La varianza è un indice di variabilità appartenente alla categoria A. Essa può essere calcolata soltanto per caratteri quantitativi.

( )

=

− −

=

n

i

i

x

n x s

1 2 2

1 1

N.B.: la formula e il simbolo cambiano a seconda che si lavori sul campione (statistica) o sulla popolazione (parametro)

( )

=

=

N

i

i

x

N

1

x

2

1

2

σ

6

(7)

Varianza:

esempio

• Distribuzioni statistiche molto diverse possono presentare la stessa posizione.

STATISTICA - Università di Salerno

A 22 22 23 23 24 25 26 27 27 28 28 B 22 22 22 22 22 25 28 28 28 28 28 C 25 25 25 25 25 25 25 25 25 25 25

2

4.91

σ

A

=

2

8.18

σ

B

=

2

0.0 σ

C

=

= 25 x

A

= 25 x

B

= 25 x

C

7

(8)

Varianza: proprietà (1)

STATISTICA - Università di Salerno

Variabilità nulla

2

0

σ = Variabilità massima

x x

x

x

1

=

2

= L =

N

=

x N x

x x

x

N

N

=

=

=

=

=

2 1

0

1

L

( 1 )

2

2

= x N

σ

( 1 )

0 ≤ σ

2

x

2

N

8

(9)

Varianza: proprietà (2)

STATISTICA - Università di Salerno

Y = ⋅ b X σ

Y2

= ⋅ b

2

σ

X2

Y = + a X σ

Y2

= σ

X2

Y = + ⋅ a b X σ

Y2

= ⋅ b

2

σ

X2

2 2

2

= µ − x

σ ∑

=

=

N

i

x

i

dove N

1 2 2

µ 1

9

(10)

Varianza: distribuzioni di frequenza

STATISTICA - Università di Salerno

Distribuzioni di frequenza

(N.B.: formula per campione)

Distribuzioni di frequenza con dati raggruppati in classi

(N.B.: formula per campione)

( )

=

− −

=

k

i

i

i

x n

n x s

1 2 2

1 1

( )

=

− −

=

k

i

i

i

x n

n c s

1 2 2

1 1

10

(11)

Varianza: distribuzioni di frequenza

STATISTICA - Università di Salerno

1 2 k

N = + + n n L + n

X n

i

x

1

n

1

x

2

n

2

… …

x

k

n

k

N

(x

i

- )

2

· n

i

(x

1

- )

2

· n

1

(x

2

- )

2

· n

2

(x

k

- )

2

· n

k

( )

=

=

k

i

i

i

x n

N

1

x

2

1

2

σ

x x x

x ∑ ( )

= k

i

i

i

x n

x

1

2

11

(12)

Deviazione Standard

STATISTICA - Università di Salerno

Una difficoltà nell’interpretazione della varianza è che essa viene espressa nella unità di misura del fenomeno al quadrato.

Per ovviare a questo inconveniente si può utilizzare lo Scarto Quadratico Medio o Deviazione Standard

2 2

oppure s = s

= σ σ

12

(13)

Esempio

STATISTICA - Università di Salerno

Paese GNI ($ correnti)

Nicaragua 420

Honduras 850

Guatemala 1690

El Salvador 1990

Panama 3260

Costa Rica 3960

Mexico 5080

Canada 21050

United States 34260

63 , 247 .

= 1

σ

56 , 013 .

= 11

Tutti

σ

13

(14)

Campo di variazione o range

• Questo indice di variabilità appartiene alla categoria B.

• È un indice di variabilità poco attendibile perché non robusto

STATISTICA - Università di Salerno

Min Max

Range = −

14

(15)

Differenza tra quartili

• Questo indice di variabilità appartiene alla categoria B.

• Esso misura la variabilità del 50% dei dati centrali

• È quindi un indice di variabilità robusto

STATISTICA - Università di Salerno

1

3

Q

Q

DI = −

15

(16)

Indici di variabilità: il coefficiente di variazione

• Un indice indipendente dall’unità di misura è il coefficiente di variazione

CV = σ x

16

(17)

Coefficiente di variazione:

esempio

A 22 22 23 23 24 25 26 27 27 28 28 B 22 22 22 22 22 25 28 28 28 28 28 C 25 25 25 25 25 25 25 25 25 25 25

A

2.22

σ =

B

2.86

σ =

C

0.0

σ =

A

0.09 CV =

B

0.11 CV =

C

0.0 CV =

17

(18)

Limitazioni del CV

• Non è definito per fenomeni con media nulla.

Perde di significato per fenomeni con media molto piccola e prossima a zero.

18

(19)

Scostamento semplice mediano

• Se l’indice di posizione scelto è la

mediana, la dispersione del fenomeno intorno a questa posizione viene

misurata dallo scostamento semplice mediano:

( ) =

= N

i

x

i

Me Me N

S

1

1

19

(20)

Scostamento semplice medio

• Un altro indice appartenente alla categoria A. è basato sugli scarti assoluti dalla media

• Si dimostra che:

( ) ∑

=

=

N

i

i

x

N x x

S

1

1

STATISTICA - cdl in SAO e SPRI -

Università di Salerno 20

( ) ( ) Me S x σ

S

(21)

Riepilogo sugli indici statistici

• Riassumono alcune caratteristiche delle distribuzioni di frequenza consentendo il confronto tra diverse distribuzioni.

• Possono calcolarsi basandosi solo sulle frequenze oppure anche sulle modalità del carattere.

• Qualora l’indice coinvolga anche le modalità del carattere, quest’ultimo deve essere

necessariamente quantitativo.

STATISTICA - Università di Salerno 21

(22)

Tipi di indici

• Indici assoluti.

• Indici relativi.

• Indici normalizzati

22

(23)

Indici assoluti

• Sono misure che variano liberamente tra un minimo ed un massimo, anche infiniti.

• L’intervallo di variazione dell’indice dipende dal campo di variazione della variabile in esame.

• Sono espressi nella stessa unità di misura del fenomeno oggetto di studio.

• Esempi:

– Media

– Deviazione standard

– ………

23

(24)

Indici relativi

• Sono misure svincolate dall’unità di misura

• Sono ottenuti:

– rapportando due indici assoluti

– rapportando un indice assoluto al suo massimo

• Sono “numeri puri” e sono utili per confrontare fenomeni simili.

• Esempi:

– Coefficiente di variazione – …………

24

(25)

Indici normalizzati

• Sono particolari indici relativi il cui campo di

variazione è un intervallo finito, generalmente [0, 1] oppure [-1, +1].

• Vengono utilizzati per sintesi e confronto di qualsiasi tipo di fenomeno, misurato anche in unità diverse, purché logicamente confrontabili.

• Esempi:

– Coefficiente di variazione normalizzato – …………

25

(26)

Una tecnica di normalizzazione

0 ≤ Φ ≤* 1

( ) ( )

min Φ ≤ Φ ≤ max Φ

Indice compreso tra un minimo ed un massimo

( ) ( ) ( )

* Min

Max Min Φ − Φ

Φ = Φ − Φ

Indice normalizzato

26

(27)

Aspetti rilevanti distribuzione

Posizione : è un valore rappresentativo della distribuzione nella sua globalità.

Variabilità : è l’attitudine di una variabile ad assumere diverse modalità.

Forma : è l’aspetto complessivo di una

distribuzione rispetto a configurazioni standard

– simmetria

– grado di appiattimento (curtosi).

STATISTICA - Università di Salerno 27

(28)

Forma di una distribuzione

• Due distribuzioni possono avere stessa posizione e variabilità ma differire per il peso, l’importanza, dei valori più grandi o più piccoli, rispetto al valore

centrale, a causa di un comportamento

differenziato nelle due “code” della distribuzione.

STATISTICA - Università di Salerno 28

(29)

Simmetria

• Una distribuzione è simmetrica, rispetto ad un dato valore, se presenta un comportamento

speculare rispetto ad un asse passante per tale valore.

STATISTICA - Università di Salerno 29

(30)

Esempio (1)

STATISTICA - Università di Salerno 30

(31)

Esempio (2)

STATISTICA - Università di Salerno 31

(32)

Esempio: Asimmetria positiva

STATISTICA - Università di Salerno 32

(33)

Esempio: Asimmetria negativa

STATISTICA - Università di Salerno 33

(34)

Commento (1)

Distribuzione simmetrica: media = mediana.

STATISTICA - Università di Salerno

Me x =

34

(35)

Commento (2)

Asimmetrica positiva: mediana < media

STATISTICA - Università di Salerno

Me x >

35

(36)

Commento (3)

Asimmetrica negativa: mediana > media

STATISTICA - Università di Salerno

Me x <

36

(37)

Distribuzione simm. unimodale

STATISTICA - Università di Salerno

Mo Me

x = =

37

(38)

Commento (2)

In una distribuzione unimodale valgono le seguenti relazioni:

– Media = Mediana = Moda (simmetria)

– Moda < Mediana < Media (asimmetria +) – Media < Mediana < Moda (asimmetria -)

STATISTICA - Università di Salerno 38

(39)

Indici di asimmetria

• Un indice di asimmetria misura la presenza di asimmetria in una distribuzione. E’ logico

aspettarsi che tale indice sia:

– Nullo quando la distribuzione è simmetrica – Negativo quando vi è asimmetria negativa – Positivo quando vi è asimmetria positiva

STATISTICA - Università di Salerno 39

(40)

Misure di asimmetria (1)

STATISTICA - Università di Salerno

s

0

A >

Asimmetria positiva

s

0

A <

Asimmetria negativa

s

0

A =

Simmetria

Me x

A

s

= −

40

(41)

Misure di asimmetria (2)

1 1 ≤

*

A

s

* > 0 As

*

= 0 A

s

STATISTICA - Università di Salerno

Asimmetria positiva

Asimmetria negativa Simmetria

* < 0 As

σ

Me

A

s*

= x

(42)

Misure di asimmetria (3)

( ) ( )

(

33 22

) (

22 11

)

R

Q Q Q Q

A Q Q Q Q

− − −

= − + −

STATISTICA - Università di Salerno

R

0

A >

Asimmetria positiva

R

0

A <

Asimmetria negativa

R

0

A =

Simmetria

Indice di Yule e Bowley

42

(43)

Misure di asimmetria (4)

• Questo indice è

positivo, nel caso di asimmetria positivanegativo, nel caso di asimmetria negativanullo, per distribuzioni simmetriche

STATISTICA - Università di Salerno

Indice di Fisher

=

 

 

 −

=

N

i

i

x

x N

1

3 1

1 γ σ

43

(44)

Formule per distribuzioni…

STATISTICA - Università di Salerno

Distribuzioni di frequenza

Distribuzioni di frequenza in classi di modalità

=

 

 

 −

=

k

i

i

i

x n

x N

1

3 1

1 γ σ

=

 

 

 −

k

i

i

i

x n

c N

1

3 1

1 γ σ

44

(45)

Curtosi

• Due distribuzioni che hanno approssimativamente stessa media, varianza e indice di asimmetria, possono ancora differire per la diversa “pesantezza” delle due code.

• È quindi necessario tener conto di un ulteriore aspetto della distribuzione, legato al concetto di curtosi

• Per curtosi si intende il maggiore o minore appuntimento e, conseguentemente, il peso più o meno marcato delle code rispetto alla parte centrale della distribuzione

.

STATISTICA - Università di Salerno 45

(46)

Misure di curtosi

• Se l’indice di curtosi di Fisher risulta

positivo, si parla di distribuzione leptocurticanegativo, si parla di sitribuzione platicurticanullo, si parla di distribuzione mesocurtica.

STATISTICA - Università di Salerno

Indice di Fisher

1 3

1

4

2

 −

 

 −

= ∑

= k

i

i

i

x n

x

N σ

γ

46

Riferimenti

Documenti correlati

Presentazione dei concetti di base di popolazione e campione Sintesi e presentazione in tabelle dei dati categorici. Presentazione grafica dei

Presentazione dei concetti di base di popolazione e campione Sintesi e presentazione in tabelle dei dati categorici. Presentazione grafica dei

Nondimeno, alcune non idoneità gene- riche riscontrate durante l’analisi dei campioni in labo- ratorio assumono rilievo maggiore nella diagnostica emocoagulativa, e

Gli enormi progressi com- piuti nel miglioramento della qualità analitica hanno consentito di circoscrivere le dimensioni del proble- ma, al punto che la massima parte (fino

È importante segnalare come il programma di attività del nostro gruppo di ricerca non si limiti alle sole serie termometriche e pluviometriche, ma consideri anche altre

VICEVERSA IL SINGOLO ELEMENTO DI COSTO RIENTRA NELLA CATEGORIA DEI COSTI FISSI (O COSTI COSTANTI) QUANDO IL SUO IMPORTO. COMPLESSIVO NON VARIA AL VARIARE DEI LIVELLI

Il grande e più noto divulgatore di questi fatti è l'americano Raymond Moody Jr con un best seller del 1975, apparso in un'edizione italiana due anni dopo 2 ,per cui può passare

• La media (average in inglese) più comune è quella «aritmetica»: i dati vengono considerati indipendenti (come gli elementi di un campione statistico) e, in virtù di tale