Antonio Azzollini [email protected] Statistica

(1)

Statistica

Antonio Azzollini

[email protected]

Anno accademico 2018/2019

Dipartimento di Matematica, Informatica ed Economia (DiMIE) Dipartimento di Matematica, Informatica ed Economia (DiMIE)

(2)

Distribuzione del carattere

Come si definisce e si valuta un indice di concentrazione?

(3)

Distribuzione del carattere

1, 4,2, 3

Come si definisce e si valuta un indice di concentrazione?

Consideriamo la distribuzione . Il primo passo consiste nel

mettere in ordine la distribuzione: x 1, 4,2, 3

₍₁₎

1, 4,2, 3 1, 4,2, 3 x ≤ x

₍₁₎ ₍₂₎

≤ x x

₍₁₎

≤! ≤ x

₍₂₎

1, 4,2, 3 ≤ x ≤! ≤ x

₍₂₎

^. ≤! ≤ x

_(n) _(n) _(n)

(4)

Distribuzione del carattere

1, 4,2, 3

Come si definisce e si valuta un indice di concentrazione?

Consideriamo la distribuzione . Il primo passo consiste nel mettere in ordine la distribuzione: 1, 4,2, 3

Successivamente, poniamo A A

₁₁

= 1, A = 1, A A

₁ ₂

= 1, A

₂

= 3, A = 3, A 1, 4,2, 3 1, 4,2, 3 1, 4,2, 3

^{+ =}₂

A A = 3, A

₁₁₃₃

= 1, A = 1, A = 6, = 6,

₃

A A

₂₂

1, 4,2, 3 = 6,

₄₄

1, 4,2, 3 = 3, A = 3, A 1, 4,2, 3 = 10 = 10

^{+ +}

A

₄ ₃₃

= 10 = 6, = 6, A A

₄₄

= 10 = 10 ^. x

₍₁₎

≤ x

₍₂₎

≤! ≤ x

_(n)

x

₍₁₎

≤ x

₍₂₎

≤! ≤ x

_(n)

x 1, 4,2, 3

₍₁₎

1, 4,2, 3 ≤ x

₍₂₎

≤! ≤ x 1, 4,2, 3 ^.

_(n)

(5)

Distribuzione del carattere

1, 4,2, 3

Come si definisce e si valuta un indice di concentrazione?

Consideriamo la distribuzione . Il primo passo consiste nel mettere in ordine la distribuzione: 1, 4,2, 3

Successivamente, poniamo

Si osservi che l'ultima quantità introdotta corrisponde all'ammontare del carattere.

Poniamo A

₁

= 1, A

₂

= 3, A

₃

= 6, A

₄

= 10 Q

₁

= 1

10 , Q

₂

= 3

10 , Q

₃

= 3

5 , Q

₄

= 1 Q

₁

= 1

10 , Q

₂

= 3

10 , Q

₃

= 3

5 , Q

₄

= 1 Q

₁

= 1

10 , Q

₂

= 3

10 , Q

₃

= 3

5 , Q

₄

= 1

A

₁

= 1, A

₂

= 3, A

₃

= 6, A

₁

= 1, A / A

₄

= 10

₂

= 3, A A Q

₁ ₁

= 1, A =

₃

= 6, 1

₂

^/ = 3, A A

₄

= 10

₃

= 6, A

₄

= 10 10 , Q

₂

= 3

10 , Q

₃

= 3

5 , Q

₄

= 1

ed in analogia .

x

₍₁₎

≤ x

₍₂₎

≤! ≤ x

_(n)

A A

₁₁

= 1, A = 1, A A

₁ ₂

= 1, A

₂

= 3, A = 3, A 1, 4,2, 3 1, 4,2, 3 1, 4,2, 3

^{+ =}₂

A A = 3, A

₁₁₃₃

= 1, A = 1, A = 6, = 6,

₃

A A

₂₂

1, 4,2, 3 = 6,

₄₄

1, 4,2, 3 = 3, A = 3, A 1, 4,2, 3 = 10 = 10

^{+ +}

A

₄ ₃₃

= 10 = 6, = 6, A A

₄₄

= 10 = 10 ^. x

₍₁₎

≤ x

₍₂₎

≤! ≤ x

_(n)

x

₍₁₎

≤ x

₍₂₎

≤! ≤ x

_(n)

x 1, 4,2, 3

₍₁₎

1, 4,2, 3 ≤ x

₍₂₎

≤! ≤ x 1, 4,2, 3 ^.

_(n)

(6)

Distribuzione del carattere

In generale consideriamo n dati e li ordiniamo: ^x x ^x _x ^x

₍₁₎₍₁₎₍₁₎₍₁₎₍₁₎

= x = x = x _{≤ x} = x x

₍₂₎₍₂₎₍₂₎₍₁₎₍₂₎₍₂₎

= ! = x ≤ x = ! = x = ! = x _{≤! ≤ x} = ! = x x

₍₁₎₍₂₎

≤ x ≤! ≤ x

_(n)₍₂₎_(n)_(n)_(n)_(n)

. ≤! ≤ x = = = = µ µ µ µ

_(n) _(n)

(7)

Distribuzione del carattere

In generale consideriamo n dati e li ordiniamo:

x

₍₁₎

= x

₍₂₎

= ! = x

_(n)

= µ

x

₍₁₎

= x

₍₂₎

= ! = x

_(n−1)

= 0, x

_(n)

= n µ massima concentrazione si ha se

In una equidistribuzione si ha , mentre la

.

x

₍₁₎

= x

₍₂₎

= ! = x

_(n)

= µ x

₍₁₎

≤ x

₍₂₎

≤! ≤ x

_(n)

x

₍₁₎

= x

₍₂₎

= ! = x

_(n)

= µ

x x

₍₁₎₍₁₎

= x = x x

₍₂₎₍₂₎₍₁₎

= ! = x ≤ x = ! = x x

₍₁₎₍₂₎

≤ x ≤! ≤ x

₍₂₎_(n)_(n)

. = ≤! ≤ x = µ µ

_(n) _(n)

(8)

Distribuzione del carattere

A

_i

= x

₍₁₎

+ x

₍₂₎

+!+ x

_{(i )} informazione disponibile fino al dato

i

^-esimo.

Informazione totale:

A

_n

= x

₍₁₎

+ x

₍₂₎

+!+ x

_(n)

👉 ^A

ⁿ

^{= n} ^µ

In generale consideriamo n dati e li ordiniamo:

x

₍₁₎

= x

₍₂₎

= ! = x

_(n)

= µ

x

₍₁₎

= x

₍₂₎

= ! = x

_(n−1)

= 0, x

_(n)

= n µ

, mentre la

.

x

₍₁₎

= x

₍₂₎

= ! = x

_(n)

= µ x

₍₁₎

≤ x

₍₂₎

≤! ≤ x

_(n)

x

₍₁₎

= x

₍₂₎

= ! = x

_(n)

= µ

x x

₍₁₎₍₁₎

= x = x x

₍₂₎₍₂₎₍₁₎

= ! = x ≤ x = ! = x x

₍₁₎₍₂₎

≤ x ≤! ≤ x

₍₂₎_(n)_(n)

≤! ≤ x = = µ µ

_(n) _(n)

massima concentrazione si ha se In una equidistribuzione si ha

.

(9)

Distribuzione del carattere

A

_i

= x

₍₁₎

+ x

₍₂₎

+!+ x

_{(i )} informazione disponibile fino al dato

i

^-esimo.

Informazione totale:

A

_n

= x

₍₁₎

+ x

₍₂₎

+!+ x

_(n)

👉 ^A

ⁿ

^{= n} ^µ

Q

_i

= A

_i

A

_n

= x

₍₁₎

+ x

₍₂₎

+!+ x

_{(i )}

x

₍₁₎

+ x

₍₂₎

+!+ x

_(n)

i

-esima quota del carattere.

In generale consideriamo n dati e li ordiniamo:

x

₍₁₎

= x

₍₂₎

= ! = x

_(n)

= µ

x

₍₁₎

= x

₍₂₎

= ! = x

_(n−1)

= 0, x

_(n)

= n µ

, mentre la

.

x

₍₁₎

= x

₍₂₎

= ! = x

_(n)

= µ x

₍₁₎

≤ x

₍₂₎

≤! ≤ x

_(n)

x

₍₁₎

= x

₍₂₎

= ! = x

_(n)

= µ

x x

₍₁₎₍₁₎

= x = x x

₍₂₎₍₂₎₍₁₎

= ! = x ≤ x = ! = x x

₍₁₎₍₂₎

≤ x ≤! ≤ x

₍₂₎_(n)_(n)

≤! ≤ x = = µ µ

_(n) _(n)

massima concentrazione si ha se In una equidistribuzione si ha

.

(10)

Distribuzione del carattere

Nel caso di equidistribuzione, in cui tutti i dati sono uguali,

Q

_i

= i µ n µ ⁼

i

n 👉 i

-esima quota del carattere

👉 ^P

ⁱ

⁼ _n ⁱ

quota unità

ⁱ

^-esima

Il rapporto di concentrazione di Gini dell’insieme di dati

x

₁

, x

₂

, …, x

_n è dato da:

C = ∑

_i=1ⁿ⁻¹

( P

_i

− Q

_i

)

P

_i

i=1

∑

n−1

Si hanno le seguenti implicazioni:

P

_i

= Q

_i per ogni

i = 1,2,…,n 👉 ^C ^{= 0}

Q

_i

= 0

^{per ogni}

i = 1,2,…,n 👉 ^C ^{= 1}

Se invece non c’è equidistribuzione si ha sempre

P

_i

≥ Q

_i.

.

C = 1 C = ∑

_i=1ⁿ⁻¹

( P

_i

− Q

_i

)

P

_i

i=1

∑

n−1

^C ^{= 1}

C = ∑

_i=1ⁿ⁻¹

( P

_i

− Q

_i

)

P

_i

i=1

∑

n−1

(11)

Distribuzione del carattere

Osserviamo che vale la disuguaglianza

P

_i

− Q

_i

( )

i=1

∑

n−1

^≤ ^P

ⁱ i=1

∑

n−1

dove a sinistra abbiamo una misura della concentrazione che è nulla nel caso di equidistribuzione ed è massima nel caso di massima concentrazione, cioè

P

_i

i=1

∑

n−1

Una scrittura equivalente del rapporto di concentrazione di Gini è data da

C = 2

n −1 ( P

_i

− Q

_i

)

i=1

∑

n−1

.

(12)

Distribuzione del carattere

Osserviamo che vale la disuguaglianza

P

_i

− Q

_i

( )

i=1

∑

n−1

^≤ ^P

ⁱ i=1

∑

n−1

dove a sinistra abbiamo una misura della concentrazione che è nulla nel caso di equidistribuzione ed è massima nel caso di massima concentrazione, cioè

P

_i

i=1

∑

n−1

Una scrittura equivalente del rapporto di concentrazione di Gini è data da

C = 2

n −1 ( P

_i

− Q

_i

)

i=1

∑

n−1

P

_i

i=1

∑

n−1

⁼ ¹ + 2 +!+ n −1

n = 1

n

1 + n −1 ( )

2 ( n −1 )

⎛

⎝⎜

⎞

⎠⎟ = n −1 2 .

.

(13)

Distribuzione del carattere

Alcuni esempi

Esempio: 1<2<3<4 Dati

1 1 0,25 0,1 0,15

2 3 0,50 0,3 0,2

3 6 0,75 0,6 0,15

Totale 1,5 0,5

C = 0,33 verificare che il risultato è uguale con ambedue le formule.

La concentrazione è tanto maggiore quanto più le quote unità differiscono dalle quote carattere.

A

_i

P

_i

Q

_i

P

_i

− Q

_i

(14)

Distribuzione del carattere

Alcuni esempi

1 1 0,25 0,1 0,15

2 3 0,50 0,3 0,2

3 6 0,75 0,6 0,15

Totale 1,5 0,5

A

_i

P

_i

Q

_i

P

_i

− Q

_i

Esempio: 1=1<3<5 Dati

1 1 0,25 0,1 0,15

1 2 0,50 0,2 0,3

3 5 0,75 0,5 0,25

Totale 1,5 0,7

C = 0,47

A

_i

P

_i

Q

_i

0 0 0,25 0 0,25

0 0 0,50 0 0,5

1 1 0,75 0,1 0,65

Totale 1,5 1,4

C = 0,93

A

_i

P

_i

Q

_i

P

_i

− Q

_i

P

_i

− Q

_i

(15)

Distribuzione del carattere

Alcuni esempi

1 1 0,25 0,1 0,15

2 3 0,50 0,3 0,2

3 6 0,75 0,6 0,15

Totale 1,5 0,5

A

_i

P

_i

Q

_i

P

_i

− Q

_i

1 1 0,25 0,1 0,15

1 2 0,50 0,2 0,3

3 5 0,75 0,5 0,25

Totale 1,5 0,7

C = 0,47

A

_i

P

_i

Q

_i

0 0 0,25 0 0,25

0 0 0,50 0 0,5

1 1 0,75 0,1 0,65

Totale 1,5 1,4

C = 0,93

A

_i

P

_i

Q

_i

Esempio: 2=2<3=3 Dati

2 2 0,25 0,2 0,05

2 4 0,50 0,4 0,1

3 7 0,75 0,7 0,05

Totale 1,5 0,2

C = 0,13

A

_i

P

_i

Q

_i

Esempio: 1=1=1<7 Dati

1 1 0,25 0,1 0,15

1 2 0,50 0,2 0,3

1 3 0,75 0,3 0,45

Totale 1,5 0,9

C = 0,6

A

_i

P

_i

Q

_i

P

_i

− Q

_i

P

_i

− Q

_i

P

_i

− Q

_i

P

_i

− Q

_i

(16)

Distribuzione del carattere

Se una quantità viene spostata da una unità con dato minore ad un’altra con dato superiore l’indice aumenta:

x

₍₁₎

<! < x

_{(i )}

− c <! < x

_{(k )}

+ c <! < x

_(n)

Alcune proprietà

(17)

Distribuzione del carattere

Se una quantità viene spostata da una unità con dato minore ad un’altra con dato superiore l’indice aumenta:

x

₍₁₎

<! < x

_{(i )}

− c <! < x

_{(k )}

+ c <! < x

_(n)

Q

₁

, …,Q

_i₋₁

non cambiano

Q

_k

, …,Q

_n

non cambiano

Alcune proprietà

Q

_i

, …,Q

_k₋₁

diminuiscono

P

_i

− Q

_i

, …,P

_k₋₁

− Q

_k−1

aumentano

(18)

Distribuzione del carattere

Se una quantità viene spostata da una unità con dato minore ad un’altra con dato superiore l’indice aumenta:

x

₍₁₎

<! < x

_{(i )}

− c <! < x

_{(k )}

+ c <! < x

_(n)

Q

₁

, …,Q

_i₋₁

non cambiano

Q

_k

, …,Q

_n

non cambiano

Alcune proprietà

Q

_i

, …,Q

_k₋₁

diminuiscono

P

_i

− Q

_i

, …,P

_k₋₁

− Q

_k−1

aumentano La quota carattere

x

₁

, x

₂

, …, x

_n a

cx

₁

,cx

₂

, …,cx

_n

Q

_i

= cx

₍₁₎

+ cx

₍₂₎

+!+ cx

_{(i )}

cx

₍₁₎

+ cx

₍₂₎

+!+ cx

_(n)

= c x (

₍₁₎

+ x

₍₂₎

+!+ x

_{(i )}

)

c x (

₍₁₎

+ x

₍₂₎

+!+ x

_(n)

) ⁼ ^x ^x

⁽¹⁾⁽¹⁾

^{+ x} ^{+ x}

⁽²⁾⁽²⁾

^{+!+ x} ^{+!+ x}

⁽ⁿ⁾^{(i )}

⁼ ^A ^A

ⁿⁱ

non cambia da

Q

_i

L’indice rimane anche esso invariato.

C = 0

(19)

Distribuzione del carattere

Se una quantità viene spostata da una unità con dato minore ad un’altra con dato superiore l’indice aumenta:

x

₍₁₎

<! < x

_{(i )}

− c <! < x

_{(k )}

+ c <! < x

_(n)

Q

₁

, …,Q

_i₋₁

non cambiano

Q

_k

, …,Q

_n

non cambiano

Alcune proprietà

Q

_i

, …,Q

_k₋₁

diminuiscono

P

_i

− Q

_i

, …,P

_k₋₁

− Q

_k−1

aumentano La quota carattere

x

₁

, x

₂

, …, x

_n a

cx

₁

,cx

₂

, …,cx

_n

Q

_i

= cx

₍₁₎

+ cx

₍₂₎

+!+ cx

_{(i )}

cx

₍₁₎

+ cx

₍₂₎

+!+ cx

_(n)

= c x (

₍₁₎

+ x

₍₂₎

+!+ x

_{(i )}

)

c x (

₍₁₎

+ x

₍₂₎

+!+ x

_(n)

) ⁼ ^x ^x

⁽¹⁾⁽¹⁾

^{+ x} ^{+ x}

⁽²⁾⁽²⁾

^{+!+ x} ^{+!+ x}

⁽ⁿ⁾^{(i )}

⁼ ^A ^A

ⁿⁱ

Se ad ogni elemento di

x

₁

, x

₂

, …, x

_n si aggiunge una quantità positiva, l’indice diminuisce perché le quote carattere aumentano, mentre le quote unità restano invariate. Esempi: 2 = 2 < 3 = 3, C = 0,13 ^- 3 = 3 < 4 = 4, C = 0,096

non cambia da

Q

_i

L’indice rimane anche esso invariato.

C = 0

(20)

La curva di Lorenz

Assegnato un insieme di dati

x

₁

, x

₂

, …, x

_n si chiama curva di Lorenz o curva di concentrazione la spezzata che unisce i punti di coordinate

( ) 0,0 ^{, P} (

1

,Q

₁

) ^{, P} (

²

^,Q

²

) ^, ^{…, P} (

ⁿ

^,Q

ⁿ

)

Esempio: 1,4,2,3 Dati

1 0,25 0,1 2 0,50 0,3 3 0,75 0,6

4 1 1

P

_i

Q

_i

👉

Esempio: 1,4,2,3

0,2 0,5 0,8 1,1

0 0,25 0,5 0,75 1

Massima concentrazione

0,2 0,5 0,8 1,1

0 0,25 0,5 0,75 1

Massima concentrazione

Dati

0 0,25 0

0 0,50 0

0 0,75 0

10 1 1

P

_i

Q

_i

👈

n −1 n ,0

⎛ ⎝⎜ ⎞

⎠⎟

(21)

Equidistribuzione Dati

2,5 0,25 0,25 2,5 0,50 0,50 2,5 0,75 0,75

2,5 1 1

P

_i

Q

_i

La curva di Lorenz

Equidistribuzione

0,2 0,5 0,8 1,1

0 0,25 0,5 0,75 1

👉

0,2 0,5 0,8 1,1

0 0,25 0,5 0,75 1

equidistribuzione

massima concentrazione esempio qualsiasi

Si mostra che il rapporto di concentrazione di Gini dell’insieme di dati è

C = S max S

dove

S

è l’area racchiusa fra il segmento blu e la curva rossa mentre

max S

^è

l’area racchiusa fra il segmento blu e la spezzata verde.

Fornisce un’interpretazione geometrica del rapporto di concentrazione.

S

(22)

La curva di Lorenz

0,2 0,5 0,8 1,1

0 0,25 0,5 0,75 1

equidistribuzione

massima concentrazione

A

B

D C

max S = area ABC ( ) ^{− area BCD} ( ) 👉

n

n −1

n × 1 2 n −1

n n ≈ 1 −1

n × 1 2 n −1

n ≈ 1 n −1

n n ≈ 1 −1

n × 1 2 n −1

n × 1 2 -

Infatti:

(23)

La curva di Lorenz

0,2 0,5 0,8 1,1

0 0,25 0,5 0,75 1

equidistribuzione

A

B

D C

max S = area ABC ( ) ^{− area BCD} ( ) 👉

n −1

n × 1 2

n

n −1

n × 1 2 n −1

n n ≈ 1 −1

n × 1 2 n −1

n ≈ 1 n −1

n n ≈ 1 −1

n × 1 2 n −1

n × 1 2 -

=

Infatti:

(24)

La curva di Lorenz

0,2 0,5 0,8 1,1

0 0,25 0,5 0,75 1

equidistribuzione

A

B

D C

max S = area ABC ( ) ^{− area BCD} ( ) 👉

n −1

n × 1 2

n

n −1

n × 1 2 n −1

n n ≈ 1 −1

n × 1 2 n −1

n ≈ 1 n −1

n n ≈ 1 −1

n × 1 2 n −1

n × 1 2 -

=

Infatti:

Mentre si mostra che

C = S 2

n −1 ( P

_i

− Q

_i

)

i=1

∑

n−1

^.

n

n −1

n × 1

= 2

(25)

La curva di Lorenz

0,2 0,5 0,8 1,1

0 0,25 0,5 0,75 1

equidistribuzione

A

B

D C

max S = area ABC ( ) ^{− area BCD} ( ) 👉

n −1

n × 1 2

C = S max S

L’espressione ci permette di capire il significato dell’indice: poiché

max S

è costante, al crescere di

S

la curva si allontana dal segmento di equidistribuzione.

n

n −1

n × 1 2 n −1

n n ≈ 1 −1

n × 1 2 n −1

n ≈ 1 n −1

n n ≈ 1 −1

n × 1 2 n −1

n × 1 2 -

=

Infatti:

Mentre si mostra che

C = S 2

n −1 ( P

_i

− Q

_i

)

i=1

∑

n−1

^.

n

n −1

n × 1

= 2

Dunque C = S

max S C = 2

n −1 ( P

_i

− Q

_i

)

i=1

∑

n−1

^.

(26)

La curva di Lorenz

Introduciamo il parametro

R = n −1

n C

che mediante la formula già vista

C = 2

n −1 ( P

_i

− Q

_i

)

i=1

∑

n−1 si scrive come

R = 2

n ( P

_i

− Q

_i

)

i=1

∑

n−1

. .

.

Quest’ultima poi può essere posta nella forma

R = 1

n _⎡⎣ ( P

_i−1

− Q

_i−1

) ^{+ P} (

ⁱ

^{− Q}

ⁱ

) _⎤⎦

i=1

∑

n

(27)

Per modalità

Esempio. Distribuzione delle aziende di credito di una certa regione secondo il numero degli sportelli operanti nel territorio.

Numero di sportelli

Aziende di credito

Totale sportelli per azienda

Frequenze cumulate aziende

5 2 10 2

8 3 24 5

15 2 30 7

20 4 80 11

52 1 52 12

x_i n_i x_i × n_i ^N_i

x

_i ^modalità

n

_i frequenze assolute

k = 5 N = 12

A

_i

= x

_{( )}₁

× n

_{( )}₁

+ x

_{( )}₂

× n

_{( )}₂

+!+ x

_{( )}_i

× n

_{( )}_i informazione disponibile al momento

A

_k

= x

_{( )}₁

× n

_{( )}₁

+ x

_{( )}₂

× n

_{( )}₂

+!+ x

_{( )}_k

× n

_{( )}_k informazione totale

Q

_i

= x

_{( )}₁

× n

_{( )}₁

+ x

_{( )}₂

× n

_{( )}₂

+!+ x

_{( )}_i

× n

_{( )}_i

x

_{( )}₁

× n

_{( )}₁

+ x

_{( )}₂

× n

_{( )}₂

+!+ x

_{( )}_k

× n

_{( )}_k

ⁱ

-esima quota di carattere

P

_i

= N

_i

N i

-esima quota unità

(28)

Per modalità

Il rapporto di concentrazione delle modalità

x

₁

, x

₂

, …, x

_k è dato da

R = 1

n n

_i

_⎡⎣ ( P

_i−1

− Q

_i−1

) ^{+ P} (

ⁱ

^{− Q}

ⁱ

) _⎤⎦

i=1

∑

k

Numero di sportelli

Aziende di credito

Frequenze cumulate aziende

5 2 10 10 0,05 2 0,17

8 3 24 34 0,17 5 0,42

15 2 30 64 0,33 7 0,58

20 4 80 144 0,73 11 0,92

52 1 52 196 1,00 12 1,00

x_i n_i x_i × n_i A_i Q_i ^N_i P_i

A

₅

= 196 👉

informazione totale

(29)

Per modalità

Il rapporto di concentrazione delle modalità

x

₁

, x

₂

, …, x

_k è dato da

R = 1

n n

_i

_⎡⎣ ( P

_i−1

− Q

_i−1

) ^{+ P} (

ⁱ

^{− Q}

ⁱ

) _⎤⎦

i=1

∑

k

^{= 0,36}

Numero di sportelli

Aziende di credito

5 2 10 0,17 0,05 0,12 0,24

8 3 24 0,42 0,17 0,25 1,11

15 2 30 0,58 0,33 0,25 1,00

20 4 80 0,92 0,73 0,19 1,76

52 1 52 1,00 1,00 0,19

x_i n_i x_i × n_i Q_i ^Pⁱ ^{− Q}ⁱ π_i

A

₅

= 196 👉

informazione totale P_i

(30)

Per modalità

In questo caso la curva di concentrazione di Lorenz è

0,17 0,05 0,42 0,17 0,58 0,33 0.92 0,73 1,00 1,00

Q_i P_i

0 0,25 0,5 0,75 1

0 0,17 0,42 0,58 0,92 1

(31)

Per classi di modalità

Lo stesso indice di concentrazione può essere utilizzato per classi di modalità scegliendo come valori di riferimento i centri delle classi al posto delle modalità.

Esempio. Distribuzione dei comuni della Valle D’Aosta secondo la superficie.

Superficie Numero dei  comuni

Superficie  totale

Centri delle  classi

Fino a 1.000 8 6.209 500

1.001-2.000 14 21.024 1.500

2.001-4.000 27 78.445 3.000

4.001-6.000 9 44.871 5.000

6.001-10.000 8 57.034 8.000

10.001-25.000 8 118.944 17.500

n_i T_i c_i

R = 0,44

A

_i

= x

_{( )}₁

× n

_{( )}₁

+ x

_{( )}₂

× n

_{( )}₂

+!+ x

_{( )}_i

× n

_{( )}_i

informazione disponibile al momento

A

_k

= x

_{( )}₁

× n

_{( )}₁

+ x

_{( )}₂

× n

_{( )}₂

+!+ x

_{( )}_k

× n

_{( )}_k

informazione totale

A

_i

= T

_{( )}₁

+ T

_{( )}₂

+!+ T

_{( )}_i

A

_i

= T

_{( )}₁

+ T

_{( )}₂

+!+ T

_{( )}_k

Antonio Azzollini [email protected] Statistica

Statistica