• Non ci sono risultati.

Antonio Azzollini antonio.azzollini@unibas.it Statistica

N/A
N/A
Protected

Academic year: 2021

Condividi "Antonio Azzollini antonio.azzollini@unibas.it Statistica"

Copied!
96
0
0

Testo completo

(1)

Statistica

Antonio Azzollini

antonio.azzollini@unibas.it

Anno accademico 2018/2019

Dipartimento di Matematica, Informatica ed Economia (DiMIE) Dipartimento di Matematica, Informatica ed Economia (DiMIE)

(2)

La regola empirica vs

la regola di Čebyšëv

Quando siamo in presenza di una generica distribuzione

(anche asimmetrica), interviene la cosiddetta regola di

Čebyšëv:

(3)

La regola empirica vs

la regola di Čebyšëv

Quando siamo in presenza di una generica distribuzione (anche asimmetrica), interviene la cosiddetta regola di Čebyšëv:

"Detto k un numero intero maggiore o uguale a 2, la percentuale di valori che non si discosta dalla media (a destra o sinistra) più di k volte la deviazione standard è pari ALMENO a

S

k

n ≥ 1− 1 k

2

( )

X 100 % ".

(4)

La regola empirica

Consideriamo l'istogramma delle densità relativo alle ore di studio della I scuola

10,3; 12,9; 12,9; 13,5; 13,7; 14,0; 14,2; 15,0; 15,4; 15,7;

16,6; 17,1; 17,4; 17,8; 18,3; 18,3; 18,6; 18,9; 19,7; 20,3;

20,7; 20,8; 21,4; 23,0; 23,2; 23,7; 26,1; 27,1; 29,8; 33,8.

0 0.03 0.06 0.09 0.12

[10;14) [14;18) [18;22) [22;26) [26;30) [30,34]

Secondo la regola empirica, circa il 68% dei dati appartiene a

X - 2s + 2s

µ − s; µ + s

[

X. . X

]

= 13,65; 24,7

[ ]

+ s

X X

- s

X

. Nel nostro caso 2

30 = 0,07

22 73

👉

73%

µ − 2s; µ + 2s

[

X. . X

]

= 8,29; 29,72

[ ]

Secondo la regola empirica, circa il 95% dei dati appartiene a . Nel nostro caso 2

30 = 0,07

28 93

👉

93%

37

]

(5)

La regola di Čebyšëv

Consideriamo l'istogramma delle densità relativo alle ore di studio della I scuola

10,3; 12,9; 12,9; 13,5; 13,7; 14,0; 14,2; 15,0; 15,4; 15,7;

16,6; 17,1; 17,4; 17,8; 18,3; 18,3; 18,6; 18,9; 19,7; 20,3;

20,7; 20,8; 21,4; 23,0; 23,2; 23,7; 26,1; 27,1; 29,8; 33,8.

µ − 2s; µ + 2s

[

X. . X

]

= 8,29; 29,72

[ ]

Secondo la regola di Čebyšëv, non meno del 75% dei dati appartiene a

Nel nostro caso 2

30 = 0,07

28 93

👉

93%

. Infatti k =2

👉 S n

k

( ≥ 1− k 1

2

)

X 100 % =75%

(6)

0 2.5 5 7.5 10

[10;14) [14;18) [18;22) [22;26) [26;30) [30,34]

0 3 6 9 12

[10;14) [14;18) [18;22) [22;26) [26;30]

10,3; 12,9; 12,9; 13,5; 13,7;

14,0; 14,2; 15,0; 15,4; 15,7;

16,6; 17,1; 17,4; 17,8; 18,3;

18,3; 18,6; 18,9; 19,7; 20,3;

20,7; 20,8; 21,4; 23,0; 23,2;

23,7; 26,1; 27,1; 29,8; 33,8.

25,8; 23,2; 10,1; 24,2; 21,0;

22,3; 15,1; 22,4; 28,3; 25,7;

19,8; 21,4; 17,7; 19,3; 18,2;

21,5; 23,3; 24,3; 20,9; 27,0;

22,3; 20,9; 21,1; 25,1; 23,9;

21,1.

µ = 19,01, s = 5,36

µ = 21,77, s = 3,78

La deviazione standard del secondo dataset è inferiore a quella del primo.

Per avere una misura del grado di dispersione si può confrontare la deviazione standard con la metà della lunghezza dell’intervallo che contiene il 70% dei dati.

Concentrazione: uso dei percentili

. . X

X

(7)

10,3; 12,9; 12,9; 13,5; 13,7; 14,0; 14,2; 15,0; 15,4; 15,7;

16,6; 17,1; 17,4; 17,8; 18,3; 18,3; 18,6; 18,9; 19,7; 20,3;

20,7; 20,8; 21,4; 23,0; 23,2; 23,7; 26,1; 27,1; 29,8; 33,8.

70%

15% 15%

15-esimo percentile 85-esimo percentile

p = 0,15 :

(

30 +1

)

× 0,15 = 4,65

Il 15-esimo percentile si colloca fra gli elementi di posizione 4 e 5, ossia fra 13,5 e 13,7:

13,5 + 0,65 × 13,7 −13,5

( )

= 13,63

p = 0,85 :

(

30 +1

)

× 0,85 = 26,35 L’85-esimo percentile si colloca fra

gli elementi di posizione 26 e 27, ossia fra 23,7 e 26,1:

23, 7 + 0,35 × 26,1− 23,7

( )

= 24,54

👉

24,542−13,63 = 5,46 > 5,36

Concentrazione: uso dei percentili

(8)

70%

15% 15%

15-esimo percentile 85-esimo percentile

p = 0,15 :

(

26 +1

)

× 0,15 = 4,05

Il 15-esimo percentile si colloca fra gli elementi di posizione 4 e 5, ossia fra 18,2 e 19,3:

18,2 + 0,05 × 19,3−18,2

( )

= 18,26

p = 0,85 :

(

26 +1

)

× 0,85 = 22,95 l’85-esimo percentile si colloca fra

gli elementi di posizione 22 e 23, ossia fra 25,1 e 25,7:

25,1+ 0,95 × 25,7 − 25,1

( )

= 25,67

👉

25,67 −18,262 = 3,71 < 3,78

10,1; 15,1; 17,7; 18,2; 19,3; 19;8; 20,9; 20,9; 21,0; 21,1;

21,1; 21,4; 21,5; 22,3; 22,3; 22,4; 23,2; 23,3; 23,9; 24,2;

24,3; 25,1; 25,7; 25,8; 27,0; 28,3.

Concentrazione: uso dei percentili

(9)

La deviazione standard per classi

Supponiamo che i dati relativi al numero di ore siano stati forniti in tabella secondo le classi di modalità già usate per l’istogramma.

Per il calcolo della varianza, e quindi della deviazione standard, si usa lo stesso procedimento visto per la media, ossia:

Classi [10;14) [14;18) [18;22) [22;26) [26;30) [30;34]

Centri 12 16 20 24 28 32

Frequenze


assolute 5 9 9 3 3 1

s2 =

∑ (

centri delle classi − media

)

2 × frequenze assolute taglia −1

= 1

29 ⎡⎣

(

12 −19,1

)

2 × 5 +!+ 32 −19,1

( )

2 ×1⎤⎦ = 28,34

👉 s = 5,32

(10)

La deviazione standard

Un caso particolare: stessa media e stessa deviazione standard

s = 1

.

-3 -2 -1 0 1 2 3

0

-3 -2 -1 0 1 2 3

-3 -2 -1 1 2 3

µ = 0

. X

(11)

Per caratteri qualitativi, la variabilità è più opportunamente stimata attraverso un indice di eterogeneità.

Variabilità nei caratteri qualitativi

Indice di eterogeneità (di Gini):

E = 1− f (

12

+!+ f

k2

)

Minimo quando vi è una sola modalità con frequenza relativa

1

E 👇 = 0

Massimo quando tutte le

k

modalità sono equifrequenti:

1 k

E = 1− 1

k

2

+!+ 1 k

2

⎛ ⎝⎜ ⎞

⎠⎟ = 1 − k

k

2

= k −1 k

👇

E' il caso di massima omogeneità nella distribuzione di frequenze.

E' il caso di massima eterogeneità nella distribuzione di frequenze.

(12)

E = 1− 0,047 (

2

+ 0,079

2

+!+ 0,047

2

) = 0,67

Poiché

k −1

k = 6

7 = 0,86

, concludiamo che la distribuzione è piuttosto eterogenea!

Variabilità nei caratteri qualitativi

Colore dei

capelli N° di persone Frequenze relative

Neri 10 0,35

Castano chiaro 3 0,11

Castano scuro 6 0,21

Rossi 1 0,04

Biondi 5 0,18

Bianchi 3 0,11

Totale 28 1

0,35 0,11 0,11 0,78 5

6 0,83

(13)

Il coefficiente di variazione

Una proprietà auspicabile per un indice di variabilità è che esso non dipenda dalla unità di misura in cui il carattere è espresso. Questa proprietà consente di effettuare confronti fra grandezze con misure diverse e non solo…

Esempio: l’altezza di 5 studenti (in cm) è: 172, 175, 176, 178, 180.

Si ha

µ = 176,2

ed

s = 3,033

In metri la media sarebbe

µ = 1,762

mentre la deviazione standard sarebbe

s = 0,03 !

X.

X.

.

(14)

Il coefficiente di variazione

Una proprietà auspicabile per un indice di variabilità è che esso non dipenda dalla unità di misura in cui il carattere è espresso. Questa proprietà consente di effettuare confronti fra grandezze con misure diverse e non solo…

Esempio: l’altezza di 5 studenti (in cm) è: 172, 175, 176, 178, 180.

Si ha

µ = 176,2

ed

s = 3,033

In metri la media sarebbe

µ = 1,762

mentre la deviazione standard sarebbe

s = 0,03

Possiamo concludere che nel secondo caso la variabilità sia inferiore?

!

X.

X.

.

(15)

Il coefficiente di variazione

Una proprietà auspicabile per un indice di variabilità è che esso non dipenda dalla unità di misura in cui il carattere è espresso. Questa proprietà consente di effettuare confronti fra grandezze con misure diverse e non solo…

Esempio: l’altezza di 5 studenti (in cm) è: 172, 175, 176, 178, 180.

Si ha

µ = 176,2

ed

s = 3,033

In metri la media sarebbe

µ = 1,762

mentre la deviazione standard sarebbe

s = 0,03

Possiamo concludere che nel secondo caso la variabilità sia inferiore?

!

Certamente NO!

X.

X.

.

(16)

Il coefficiente di variazione

Si introduce il cosiddetto coefficiente di variazione, definito come il

rapporto fra la deviazione standard e la media campionaria (presa

con il segno positivo). Tale definizione è ben posta per distribuzioni

statistiche a media non nulla.

(17)

Il coefficiente di variazione

CV = 0,0172

In simboli

X.

s = 3,033

Si introduce il cosiddetto coefficiente di variazione, definito come il rapporto fra la deviazione standard e la media campionaria (presa con il segno positivo). Tale definizione è ben posta per distribuzioni statistiche a media non nulla.

.

(18)

Si introduce il cosiddetto coefficiente di variazione, definito come il rapporto fra la deviazione standard e la media campionaria (presa con il segno positivo). Tale definizione è ben posta per distribuzioni statistiche a media non nulla.

Nell’esempio appena visto il coefficiente di variazione è

CV = 0,0172

Il coefficiente di variazione

CV = 0,0172

In simboli

X.

s = 3,033

.

.

(19)

Il coefficiente di variazione

Esempio: l’altezza di 5 neonati (in cm) è: 52, 50, 46, 51, 53.

(20)

Il coefficiente di variazione

Esempio: l’altezza di 5 neonati (in cm) è: 52, 50, 46, 51, 53.

Risulta che:

la media è 50,4 cm;

la deviazione standard è 2,70 cm.

(21)

Il coefficiente di variazione

Esempio: l’altezza di 5 neonati (in cm) è: 52, 50, 46, 51, 53.

Risulta che:

la media è 50,4 cm;

la deviazione standard è 2,70 cm.

(22)

Il coefficiente di variazione

Esempio: l’altezza di 5 neonati (in cm) è: 52, 50, 46, 51, 53.

Risulta che:

la media è 50,4 cm;

la deviazione standard è 2,70 cm.

(23)

Il coefficiente di variazione

Esempio: l’altezza di 5 neonati (in cm) è: 52, 50, 46, 51, 53.

Risulta che:

la media è 50,4 cm;

la deviazione standard è 2,70 cm.

E pertanto...


il coefficiante di variazione è

(24)

Il coefficiente di variazione

Esempio: l’altezza di 5 neonati (in cm) è: 52, 50, 46, 51, 53.

Risulta che:

la media è 50,4 cm;

la deviazione standard è 2,70 cm.

E pertanto...


il coefficiente di variazione è CV = 0,0172 0,053.

(25)

Il coefficiente di variazione

Anche quando le unità di misura sono le stesse il coefficiente di variazione può tornare utile.

Regione DC PLI Regione DC PLI Regione DC PLI

Piemonte 27,6 6,6 Toscana 25,3 1,4 Puglia 36,3 2,1

Lombardia 33,4 3,8 Umbria 26,2 1,2 Basilicata 46,0 0,8

Veneto 42,6 2,8 Marche 33,4 1,6 Calabria 36,8 0,9

Liguria 27,3 0,7 Lazio 31,1 2,7 Sardegna 31,7 1,5

Friuli V. G. 34,5 2,2 Abruzzo 42,2 1,7 Sicilia 26,9 1,7 Trentino A.

A. 27,6 1,6 Molise 55,5 2,2

Emilia R. 22,8 2,3 Campania 36,2 2,4

Distribuzione delle percentuali di voto nel 1963

La percentuale media è del 33,9% per la DC mentre per il PLI è del 2,3%.

Le differenze fra una regione e l’altra sono maggiori, in punti percentuali, nella DC. Infatti tra la Basilicata e l’Emilia Romagna vi è una differenza di 23,2 punti percentuali mentre per il PLI la differenza massima è solo di 5,8 punti percentuali.

La deviazione standard della percentuale di voti è 8,23 per la DC mentre è 1,41 per il PLI.


Se si confrontano i coefficienti di variazione il risultato si rovescia. La distribuzione di voto della DC presenta una variabilità minore rispetto a quella del PLI.

CV

DC

= 8,23

33,9 = 0,24, CV

PLI

= 1, 41

2, 3 = 0,61

(26)

Precisione della media campionaria

Il coefficiente di variazione consente di valutare anche la “correttezza” della media campionaria. Infatti la media campionaria si ritiene un indice corretto se il coefficiente di variazione assume valori inferiori a 0,5.

Esempio:

CV

DC

= 8,23

33,9 = 0,24, CV

PLI

= 1, 41

2, 3 = 0,61

La media è un indice corretto per la percentuale della DC ma non per quella del PLI.

Si definisce precisione della media campionaria

SEM = s

n = 1,5 per la DC 0,27 per il PLI

SEM

il rapporto fra la deviazione standard e la radice quadrata della taglia.

Al crescere della taglia il parametro

SEM

diminuisce e quindi la media campionaria fornisce una valutazione più precisa.

(27)

I rapporti statistici sono rapporti fra due grandezze, di cui almeno una di natura statistica, legate da una relazione logica.


Essi vengono prevalentemente calcolati per eliminare l’influenza di circostanze che, altrimenti, non renderebbero confrontabili i dati.

Rapporti Statistici

Fra i rapporti statistici riconosciamo:

Rapporti di composizione

Rapporti di coesistenza

Rapporti di derivazione

Rapporti di densità

Rapporti indici

(28)

Rapporto di composizione

(29)

Sono chiamati anche rapporti di parte al tutto. Si ottengono rapportando una intensità (o una frequenza) parziale all’intensità (o frequenza) totale. Il risultato in genere viene moltiplicato per 100 ottenendo i rapporti percentuali.

Rapporto di composizione

(30)

In una distribuzione di frequenze servono per confrontare l’incidenza (il contributo) di ciascuna modalità alla numerosità totale. In questa situazione essi non sono altro che le frequenze relative.

Sono chiamati anche rapporti di parte al tutto. Si ottengono rapportando una intensità (o una frequenza) parziale all’intensità (o frequenza) totale. Il risultato in genere viene moltiplicato per 100 ottenendo i rapporti percentuali.

Rapporto di composizione

(31)

una parte

totale ×100

👉

1.500.0009.000.000 ×100 = 16,67% Volkswagen

( )

Totale 9.000.000 x = una parte

totale ×100

👉 una parte : totale = x :100

Al posto del totale si può utilizzare un’altra quantità che viene detta base.

Rapporto di composizione

(32)

Rapporto di coesistenza

(33)

Riguardano quelle situazioni in cui si vuole confrontare modalità in qualche modo antitetiche o due quantità concettualmente differenti.

Rapporto di coesistenza

(34)

In una distribuzione di frequenze esso consiste in un rapporto (eventualmente moltiplicato per 100) tra la frequenza corrispondente ad una modalità e la frequenza corrispondente ad un’altra modalità.

Riguardano quelle situazioni in cui si vuole confrontare modalità in qualche modo antitetiche o due quantità concettualmente differenti.

Rapporto di coesistenza

(35)

x = b

a ×100 👉

È quel valore di

x

tale che

b : a = x :100

Il rapporto di coesistenza è il rapporto, espresso in percentuale, fra due grandezze riferite a due modalità.

a

e

b

Rapporto di coesistenza

Esprime a quanto corrisponde il numeratore avendo posto il denominatore uguale a 100.

(36)

Esempio: supponiamo di avere un campione casuale 181 persone la cui distribuzione di frequenza sul carattere sesso è la seguente:

Maschi Femmine

124 57

x = b

a ×100 👉

È quel valore di

x

tale che

b : a = x :100

Il rapporto di coesistenza é il rapporto, espresso in percentuale, fra due grandezze riferite a due modalità.

a

e

b

Rapporto di coesistenza

Esprime a quanto corrisponde il numeratore avendo posto il denominatore uguale a 100.

(37)

Esempio: supponiamo di avere un campione casuale 181 persone la cui distribuzione di frequenza sul carattere sesso è la seguente:

Maschi Femmine

124 57

57

124 ×100 = 45,96

👉

x = b

a ×100 👉

È quel valore di

x

tale che

b : a = x :100

Il rapporto di coesistenza é il rapporto, espresso in percentuale, fra due grandezze riferite a due modalità.

a

e

b

Rapporto di coesistenza

Esprime a quanto corrisponde il numeratore avendo posto il denominatore uguale a 100.

Ogni 100 maschi ci sono 45,96 femmine. Rapporto di femminilità

(38)

Esempio: supponiamo di avere un campione casuale 181 persone la cui distribuzione di frequenza sul carattere sesso è la seguente:

Maschi Femmine

124 57

57

124 ×100 = 45,96

👉

Ogni 100 maschi ci sono 45,96 femmine. Rapporto di femminilità

x = b

a ×100 👉

È quel valore di

x

tale che

b : a = x :100

Esprime a quanto corrisponde il numeratore avendo posto il denominatore uguale a 100.

Il rapporto di coesistenza é il rapporto, espresso in percentuale, fra due grandezze riferite a due modalità.

a

e

b

124

57 ×100 = 217,54

👉

Ogni 100 femmine ci sono 217,54 maschi. Rapporto di mascolinità

Rapporto di coesistenza

(39)

Le medie e le deviazioni standard delle quotazioni giornaliere dei titoli azionari Indesit & De Longhi nell’arco del 2006 sono state:

Indesit: media = 9,89; deviazione standard = 1,16

De Longhi: media = 3,03; deviazione standard = 0,57 Quale dei due titoli ha meno variabilità?

Rapporto di coesistenza

(40)

Le medie e le deviazioni standard delle quotazioni giornaliere dei titoli azionari Indesit & De Longhi nell’arco del 2006 sono state:

Indesit: media = 9,89; deviazione standard = 1,16

De Longhi: media = 3,03; deviazione standard = 0,57

Quale dei due titoli ha meno variabilità?

media Indesit = 3 × media De Longhi

deviazione standard Indesit > deviazione standard De Longhi

Rapporto di coesistenza

(41)

Le medie e le deviazioni standard delle quotazioni giornaliere dei titoli azionari Indesit & De Longhi nell’arco del 2006 sono state:

Indesit: media = 9,89; deviazione standard = 1,16

De Longhi: media = 3,03; deviazione standard = 0,57

Quale dei due titoli ha meno variabilità?

media Indesit = 3 × media De Longhi

deviazione standard Indesit > deviazione standard De Longhi Un giusto confronto fra le variabilità dei due titoli può avvenire previa rimodulazione della deviazione standard in rapporto alla media.


In sostanza le quantità da confrontare sono i rapporti di coesistenza che altro non sono che...

Rapporto di coesistenza

(42)

Le medie e le deviazioni standard delle quotazioni giornaliere dei titoli azionari Indesit & De Longhi nell’arco del 2006 sono state:

Indesit: media = 9,89; deviazione standard = 1,16

De Longhi: media = 3,03; deviazione standard = 0,57

Quale dei due titoli ha meno variabilità?

media Indesit = 3 × media De Longhi

deviazione standard Indesit > deviazione standard De Longhi Un giusto confronto fra le variabilità dei due titoli può avvenire previa rimodulazione della deviazione standard in rapporto alla media.


In sostanza la quantità da confrontare é il rapporto di coesistenza che altro non é che...deviazione standard


media

Rapporto di coesistenza

(43)

Le medie e le deviazioni standard delle quotazioni giornaliere dei titoli azionari Indesit & De Longhi nell’arco del 2006 sono state:

Indesit: media = 9,89; deviazione standard = 1,16

De Longhi: media = 3,03; deviazione standard = 0,57 Quale dei due titoli ha meno variabilità?

coefficiente di variazione De Longhi ×100= 0,57

3,03 = 18,81 coefficiente di variazione Indesit ×100= 1,16

9,89 = 11,73

...il già noto

coefficiente di variazione percentualizzato

Rapporto di coesistenza

(44)

Rapporto di derivazione

(45)

Rapporto di derivazione

Tale tipo di rapporto interviene quando si vuole effettuare

correttamente un confronto fra le frequenze con le quali

occorrono diverse modalità di un carattere che, sul piano logico o

temporale, segue da un altro che ne costituisce l’antecedente o il

presupposto.

(46)

Rapporto di derivazione

In una distribuzione di frequenze, esso è dato dal rapporto fra la frequenza della modalità di un carattere e la frequenza di una corrispondente modalità di un altro carattere che si ritiene esserne la causa o il presupposto.

Tale tipo di rapporto interviene quando si vuole effettuare

correttamente un confronto fra le frequenze con le quali

occorrono diverse modalità di un carattere che, sul piano logico o

temporale, segue da un altro che ne costituisce l’antecedente o il

presupposto.

(47)

B A

Regione b=veicoli incidentati a=veicoli b/a b/a × 1.000

Abruzzo 7.252 1.131.299 0,006 6

Basilicata 1.726 457.376 0,004 4

Calabria 6.570 1.565.296 0,004 4

Campania 21.587 4.350.447 0,005 5

Emilia Romagna 38.497 3.724.937 0,010 10

Friuli-Venezia Giulia 8.207 1.010.877 0,008 8

Lazio 53.240 4.859.950 0,011 11

Liguria 17.048 1.328.553 0,013 13

Lombardia 74.672 7.693.053 0,010 10

Marche 12.373 1.350.814 0,009 9

Molise 933 272.883 0,003 3

Piemonte 25.341 3.710.183 0,007 7

Puglia 24.377 2.862.659 0,009 9

Sardegna 8.628 1.303.464 0,007 7

Sicilia 26.528 4.257.928 0,006 6

Toscana 34.380 3.289.007 0,010 10

Trantino-Alto Adige 5.097 1.050.066 0,005 5

Umbria 5.680 803.525 0,007 7

Valle D’Aosta 642 201.564 0,003 3

Veneto 29.396 3.903.220 0,008 8

Il rapporto di derivazione è il rapporto fra due quantità a b

A e B

rappresenta una manifestazione di una variabile rappresenta una manifestazione di una variabileb e a dove generata da A.

Rapporto di derivazione

(48)

L’esempio del numero di incidenti con le auto per regione si riferisce a rapporti di derivazione.

b

a ×1000

La quinta colonna della tabella ci indica, regione per regione, quanti incidenti si verificano per ogni 1.000 macchine immatricolate nella regione stessa: ci sono 6 incidenti in Abruzzo, 4 in Basilicata e così via.

su 1.000, ma se necessario si può utilizzare un valore più elevato.

Rapporto di derivazione

B A

Regione b=veicoli incidentati a=veicoli b/a b/a × 1.000

Abruzzo 7.252 1.131.299 0,006 6

Basilicata 1.726 457.376 0,004 4

Calabria 6.570 1.565.296 0,004 4

Emilia Romagna 21.587 4.350.447 0,005 5

... ... ... ... ...

In questo caso abbiamo usato la formula per esprimere il rapporto su

(49)

Età Decessi Popolazione Femmin

e

Maschi Femmine Maschi

<1 25 21 272.400 258.566

1-14 61 58 3.887.954 3.684.265 15-29 317 129 5.395.451 5.239.304 30-44 1.568 589 6.622.520 6.610.429 45-59 7.073 2.416 5.365.813 5.548.221 60-69 13.825 6.566 3.084.258 3.460.637 70-79 32.498 26.089 2.142.455 2.947.833 80-89 36.153 55.900 713.313 1.363.955 90 & oltre 13.852 38.149 102.818 295.552

Totale 105.372 129.917 27.586.982 29.408.762

La tabella riporta i morti per malattie dell’apparato cardio-circolatorio per popolazione, per genere e classi di età (ISTAT 2001).

In generale, le donne hanno una

mortalità inferiore per queste cause.

👇

105.372

27.586.982 ×100.000 = 382,0 129.917

29.408.762 ×100.000 = 441,8

Si tratta di rapporti di derivazione, visto che il numero di decessi dipende anche dalla numerosità della popolazione dei singoli generi. Il numero di decessi preso da solo non è un dato di per sé confrontabile.

Rapporto di derivazione

(50)

Rapporto di densità

(51)

Rapporto di densità

I rapporti di densità sono utilizzati quando si vogliono confrontare

grandezze la cui eterogeneità è dovuta al fatto che sono osservate in

riferimento a campi di dimensioni diverse.

(52)

Rapporto di densità

I rapporti di densità sono utilizzati quando si vogliono confrontare grandezze la cui eterogeneità è dovuta al fatto che sono osservate in riferimento a campi di dimensioni diverse.

Un esempio si ha quando si vogliono confrontare le frequenze relative

osservate in due distribuzioni per classi in cui l'ampiezza delle classi

della prima è differente rispetto a quella della seconda.

(53)

Rapporto di densità

I rapporti di densità sono utilizzati quando si vogliono confrontare grandezze la cui eterogeneità è dovuta al fatto che sono osservate in riferimento a campi di dimensioni diverse.

Un esempio si ha quando si vogliono confrontare le frequenze relative osservate in due distribuzioni per classi in cui l'ampiezza delle classi della prima è differente rispetto a quella della seconda.

Come già osservato, un corretto confronto è possibile ricorrendo alla

distribuzione delle densità di frequenze relative che si ottengono

dividendo le frequenze relative delle classi per l'ampiezza della classe.

(54)

Rapporto di densità

In generale il rapporto di densità si definisce come il rapporto

dove a numeratore appare la grandezza oggetto di osservazione

ed a denominatore la dimensione del campo in cui essa è stata

osservata (può essere un intervallo temporale, un'area

geografica...)

(55)

Rapporto di densità

Regione Popolazione


residenti


Superficie
 Km2

Densità
 abitanti/Km2

Sicilia 5.094.937 25.832,39 197

Piemonte 4.436.798 25.387,07 175

Sardegna 1.663.859 24.100,02 69

Lombardia 9.973.397 23.863,65 418

Toscana 3.750.511 22.987,04 163

Emilia Romagna 4.446.354 22.452,78 198

Puglia 4.090.266 19.540,90 209

Veneto 4.926.818 18.407,42 268

Lazio 5.870.451 17.232,29 341

Calabria 1.980.533 15.221,90 130

Campania 5.869.965 13.670,95 429

Trentino-Alto Adige 1.051.951 13.605,50 77

Abruzzo 1.333.939 10.831,84 123

Basilicata 578.391 10.073,32 57

Marche 1.553.138 9.401,38 165

Umbria 896.742 8.464,33 106

Friuli-Venezia Giulia 1.229.363 862,30 1426

Liguria 1.591.939 5.416,21 294

Molise 314.725 4.460,65 71

Val D’Aosta 128.591 3.260,90 39

(56)

Indici semplici

(57)

Indici semplici

Quando le quantità coinvolte nei rapporti sono associate ad un tempo (un momento storico), il rapporto prende il nome di indice.

L'indice valuta la modifica occorsa, nel tempo, della misurazione

espressa al numeratore rispetto a quella espressa al denominatore la

quale viene presa come base di riferimento.

(58)

Indici semplici

IN SOSTANZA

Quando le quantità coinvolte nei rapporti sono associate ad un tempo (un momento storico), il rapporto prende il nome di indice.

L'indice valuta la modifica occorsa, nel tempo, della misurazione

espressa al numeratore rispetto a quella espressa al denominatore la

quale viene presa come base di riferimento.

(59)

Indici semplici

pongono a confronto le intensità o le frequenze di uno stesso fenomeno in tempi diversi.

IN SOSTANZA

Quando le quantità coinvolte nei rapporti sono associate ad un tempo (un momento storico), il rapporto prende il nome di indice.

L'indice valuta la modifica occorsa, nel tempo, della misurazione

espressa al numeratore rispetto a quella espressa al denominatore la

quale viene presa come base di riferimento.

(60)

Indici semplici

Esempio

Nel Gennaio 1987 la paga oraria media di un operaio è stata di €4,30.


Nel Gennaio 2003 la paga oraria media di un operaio è stata di €6,70.

paga oraria gennaio 2003

paga oraria gennaio 1987 ×100 = 6, 7

4, 3 ×100 = 155,81

Il rapporto 155,81 rappresenta l’indice di paga oraria di un operaio

nel Gennaio 2003, riferito al periodo Gennaio 1987.

(61)

Indici semplici

Esempio

Nel Gennaio 1987 la paga oraria media di un operaio è stata di €4,30.


Nel Gennaio 2003 la paga oraria media di un operaio è stata di €6,70.

paga oraria gennaio 2003

paga oraria gennaio 1987 ×100 = 6, 7

4, 3 ×100 = 155,81

Il rapporto 155,81 rappresenta l’indice di paga oraria di un operaio nel Gennaio 2003, riferito al periodo Gennaio 1987.

👇

La paga oraria nel 2003 è 1,5 volte la paga del 1987.

(62)

Indici semplici

Esempio

Nel Gennaio 1987 la paga oraria media di un operaio è stata di €4,30.


Nel Gennaio 2003 la paga oraria media di un operaio è stata di €6,70.

paga oraria gennaio 2003

paga oraria gennaio 1987 ×100 = 6, 7

4, 3 ×100 = 155,81

Il rapporto 155,81 rappresenta l’indice di paga oraria di un operaio nel Gennaio 2003, riferito al periodo Gennaio 1987.

👇

La paga oraria nel 2003 è 1,5 volte la paga del 1987.

Ma di quanto è variata?

(63)

paga oraria gennaio 2003

paga oraria gennaio 1987 ×100 −100 = 6, 7

4, 3 ×100 −100 = 55,81

👇

paga oraria gennaio 2003-paga oraria gennaio 1987

paga oraria gennaio 1987 ×100 = 55,81

Indici semplici

Variazione percentuale

(64)

paga oraria gennaio 2003

paga oraria gennaio 1987 ×100 −100 = 6, 7

4, 3 ×100 −100 = 55,81

👇

paga oraria gennaio 2003-paga oraria gennaio 1987

paga oraria gennaio 1987 ×100 = 55,81

C’è stato un aumento del 55,81% nella paga oraria di un operaio nel periodo da gennaio 1987 a gennaio 2003.

Indici semplici

Variazione percentuale

(65)

In generale per valutare le variazioni percentuali che si registrano nel tempo è necessario sottrarre ai numeri che costituiscono gli indici il valore 100, ossia

Indici semplici

Variazione percentuale

(66)

In generale per valutare le variazioni percentuali che si registrano nel tempo è necessario sottrarre ai numeri che costituiscono gli indici il valore 100, ossia

a

h

a

b

×100 −100 = a

h

a

b

−1

⎝⎜

⎠⎟ ×100 = a

h

− a

b

a

b

⎝⎜

⎠⎟ ×100

Indici semplici

Variazione percentuale

(67)

In generale per valutare le variazioni percentuali che si registrano nel tempo è necessario sottrarre ai numeri che costituiscono gli indici il valore 100, ossia

a

h

a

b

×100 −100 = a

h

a

b

−1

⎝⎜

⎠⎟ ×100 = a

h

− a

b

a

b

⎝⎜

⎠⎟ ×100

Se

a

h rappresenta la misura della grandezza al tempo

h

ed

a

b rappresenta la misura della stessa grandezza al tempo iniziale

b

allora

ah − ab

ab ×100

rappresenta la variazione percentuale della grandezza dal tempo

b

al

tempo

h

.

Indici semplici

Variazione percentuale

(68)

Assegnate le grandezze

a 1 ,a 2 , …,a k

si dicono numeri indice a base fissa i seguenti rapporti:

I i, i −1 = a i

a i −1 ×100, i = 2,…,k

Indici semplici a base fissa

a b

a

b

a 1 . ,a 2 , …,a k

a

. . b .

(69)

Esempio

Anni Acciaio Grandezza Indici

1976 23.447 100

1977 23.334 99,5

1978 24.383 103,6

1979 24.250 103,4

1980 26.501 113

1981 24.777

a a a a a a

165243 105,7

Gli indici riportati in ultima c o l o n n a r a p p re s e n t a n o i rapporti percentualizzati fra la p r o d u z i o n e d e l l ' a n n o considerato e quella del 1976 (base fissa).

Indici semplici a base fissa

La seguente tabella riporta la produzione di acciaio di prima fabbricazione in Italia dal 1976 al 1981.

I

1978,1976

I

1977,1976

−1

⎝⎜

⎠⎟ ×100 = 103,6

99,5 −1

⎛ ⎝⎜ ⎞

⎠⎟ ×100 = 4,12 ≈ 103,6 − 99,5

Utilizziamo la notazione I

1978,1976

I

1977,1976

−1

⎝⎜

⎠⎟ ×100 = 103,6

99,5 −1

⎛ ⎝⎜ ⎞

⎠⎟ ×100 = 4,12 ≈ 103,6 − 99,5

anno,1976

.

per indicare l'indice di un anno

in rapporto alla base fissa data dalla produzione del 1976. Per

esempio =103,6 rappresenta l'indice del 1978 in rapporto

al 1976.

(70)

Anni Acciaio Grandezza Indici Variazioni

1976 23.447 100 ———

1977 23.334 99,5 -0,5

1978 24.383 103,6 +3,6

1979 24.250 103,4 +3,4

1980 26.501 113 +13

1981 24.777

a a a a a a

165432 105,7 +5,7

Esempio

Indici semplici a base fissa

Se si vuole conoscere le variazioni dell’indice sempre in rapporto alla base fissa considerata, a ciascun indice bisogna sottrarre 100.

Nell'ultima colonna sono

ripor tate le variazioni di

produzione in rapporto alla

produzione del 1976 (base

fissa).

(71)

Anni Acciaio Grandezza Indici Variazioni

1976 23.447 100 ———

1977 23.334 99,5 -0,5

1978 24.383 103,6 +3,6

1979 24.250 103,4 +3,4

1980 26.501 113 +13

1981 24.777

a a a a a a

165432 105,7 +5,7

Esempio

Se si vuole conoscere la variazione dell’indice fra il 1978 e il 1977 basterà utilizzare la formula

I1978,1976

I1977,1976 −1

⎝⎜

⎠⎟ ×100 = 103,6 99,5 −1

⎝⎜

⎠⎟ ×100 = 4,12 ≈ 103,6 − 99,5

La formula precedente è giustificata dalla formula di cambio di base fissa. Per esempio, per passare dall'indice in base "anno 1976" all'indice in base "anno 1977": .

I1978,1976

I1977,1976 −1

⎝⎜

⎠⎟ ×100 = 103,6

99,5 −1

⎝⎜

⎠⎟ ×100 = 4,12 ≈ 103,6 − 99,5 I1978,1976

I1977,1976 −1

⎝⎜

⎠⎟ ×100 = 103,6

99,5 −1

⎝⎜

⎠⎟ ×100 = 4,12 ≈ 103,6 − 99,5 I1978,1976

I1977,1976 −1

⎝⎜

⎠⎟ ×100 = 103,6

99,5 −1

⎝⎜

⎠⎟ ×100 = 4,12 ≈ 103,6 − 99,5

.

=

Indici semplici a base fissa

(72)

Il periodo di riferimento può non essere un singolo anno.

Anno Prezzo Indice (1990) Indice (1990-91) Indice (1990-91-92)

1985 18,00 € 1990 20,00 €

1991 22,00 € 110,0 1992 23,00 € 115,0 2004 38,00 € 190,0

18

20 ×100 = 90,0 20

20 ×100 = 100,0

Esempio

Il prezzo di una spillatrice da ufficio è

Indici semplici a base fissa

(73)

Il periodo di riferimento può non essere un singolo anno.

Anno Prezzo Indice (1990) Indice (1990-91) Indice (1990-91-92)

1985 18,00 € 1990 20,00 €

1991 22,00 € 110,0 104,8

1992 23,00 € 115,0 109,5

2004 38,00 € 190,0 181,0

18

20 ×100 = 90,0 18

21×100 = 85,7 20

20 ×100 = 100,0 20

21 ×100 = 95,2

20 + 22

2 = 21 Prezzo medio 1990-91

Esempio

Il prezzo di una spillatrice da ufficio è

Indici semplici a base fissa

(74)

Il periodo di riferimento può non essere un singolo anno.

Anno Prezzo Indice (1990) Indice (1990-91) Indice (1990-91-92)

1985 18,00 € 1990 20,00 €

1991 22,00 € 110,0 104,8 101,5

1992 23,00 € 115,0 109,5 106,1

2004 38,00 € 190,0 181,0 175,5

18

20 ×100 = 90,0 18

21×100 = 85,7 18

21,67 ×100 = 90,0 20

20 ×100 = 100,0 20

21 ×100 = 95,2 20

21,67 ×100 = 92,3

20 + 22 + 23

3 = 21,67 Prezzo medio 1990-91-92

Esempio

Il prezzo di una spillatrice da ufficio è

Indici semplici a base fissa

(75)

Gli sconti e le variazioni

Calcolo del prezzo scontato

a

2 di un articolo a partire dal prezzo iniziale

a

1

sconto

s

. e dallo

(76)

Gli sconti e le variazioni

Se ad esempio l’articolo costa 90 euro e c’è uno sconto del 30%, per determinare il prezzo scontato si calcola

90 − 90 × 0,30 = 63 ( )

1

Calcolo del prezzo scontato

a

2 di un articolo a partire dal prezzo iniziale

a

1

sconto

s

. e dallo

(77)

Gli sconti e le variazioni

Se ad esempio l’articolo costa 90 euro e c’è uno sconto del 30%, per determinare il prezzo scontato si calcola

90 − 90 × 0,30 = 63 ( )

1

In questo caso 30 rappresenta la variazione percentuale. In generale, a quale operazione corrisponde la 1

( )

?

a

1

− a

1

× s = a

2

Calcolo del prezzo scontato

a

2 di un articolo a partire dal prezzo iniziale

a

1

sconto

s

. e dallo

(78)

Gli sconti e le variazioni

Se ad esempio l’articolo costa 90 euro e c’è uno sconto del 30%, per determinare il prezzo scontato si calcola

90 − 90 × 0,30 = 63 ( )

1

In questo caso 30 rappresenta la variazione percentuale. In generale, a quale operazione corrisponde la 1

( )

?

a

1

− a

1

× s = a

2

👉 a

1

a − a

1 2

×100 = p

sconto percentuale.

p

Calcolo del prezzo scontato

a

2 di un articolo a partire dal prezzo iniziale

a

1

sconto

s

. e dallo

(79)

Indici semplici a base mobile

Assegnate le grandezze

a 1 ,a 2 , …,a k

si dicono numeri indice a base mobile i seguenti rapporti:

I i, i −1 = a i

a i −1 ×100, i = 2,…,k

(80)

Indici semplici a base mobile

Esempio

La seguente tabella riporta la produzione di acciaio di prima fabbricazione in Italia dal 1976 al 1981

a

1

a

2

a

3

a

4

a

5

a

6

a

2

/ a

1

a

3

/ a

2

a

4

/ a

3

a

5

/ a

4

a

6

/ a

5

x 100 x 100 x 100 x 100 x 100

Anni Acciaio Grandezze Indici Indici

1976 23.447 —— ——

1977 23.334 99,5

1978 24.283 104,1

1979 24.250 99,9

1980 26.501 109,3

1981 24.777 93,5

(81)

Indici semplici a base mobile

Questi numeri forniscono la variazione di prima fabbricazione avutasi rispetto all’anno precedente. Per esempio la variazione percentuale di produzione dal 1979 al 1980 è...

Esempio

La seguente tabella riporta la produzione di acciaio di prima fabbricazione in Italia dal 1976 al 1981

(109,3 - 100)% = 9,3%.

a

1

a

2

a

3

a

4

a

5

a

6

a

2

/ a

1

a

3

/ a

2

a

4

/ a

3

a

5

/ a

4

a

6

/ a

5

x 100 x 100 x 100 x 100 x 100

Anni Acciaio Grandezze Indici Indici

1976 23.447 —— ——

1977 23.334 99,5

1978 24.283 104,1

1979 24.250 99,9

1980 26.501 109,3

1981 24.777 93,5

(82)

Indici semplici a base mobile

Quale è la variazione percentuale media nell'intervallo temporale 1976 - 1981?

Esempio

La seguente tabella riporta la produzione di acciaio di prima fabbricazione in Italia dal 1976 al 1981

a

1

a

2

a

3

a

4

a

5

a

6

a

2

/ a

1

a

3

/ a

2

a

4

/ a

3

a

5

/ a

4

a

6

/ a

5

x 100 x 100 x 100 x 100 x 100

Anni Acciaio Grandezze Indici Indici

1976 23.447 —— ——

1977 23.334 99,5

1978 24.283 104,1

1979 24.250 99,9

1980 26.501 109,3

1981 24.777 93,5

(83)

Indici semplici a base mobile

a

1

a

2

a

3

a

4

a

5

a

6

a

2

/ a

1

a

3

/ a

2

a

4

/ a

3

a

5

/ a

4

a

6

/ a

5

Quale è la variazione percentuale media nell'intervallo temporale 1976 - 1981?

La variazione percentuale media è la media geometrica di indici a base mobile meno 100

99,5 ×104,1× 99,9 ×109,3× 93,5

5

−100

Esempio

La seguente tabella riporta la produzione di acciaio di prima fabbricazione in Italia dal 1976 al 1981

x 100 x 100 x 100 x 100 x 100

Anni Acciaio Grandezze Indici Indici

1976 23.447 —— ——

1977 23.334 99,5

1978 24.283 104,1

1979 24.250 99,9

1980 26.501 109,3

1981 24.777 93,5

(84)

Indici semplici a base mobile

Formalizzando

Date le grandezze a

1

, ,..., a

2

a

6

ed i rispettivi indici a base mobile,

a

b+1

a

b

×100 × a

b+2

a

b+1

×100 ×!× a

t

a

t−1

×100

t−b .

−100

a

5

/ a

4

a

6

/ a

5

a

5

/ a

4

a

6

/ a

5

a

3

/ a

2

a

4

/ a

3

a

3

/ a

2

a

4

/ a

3

a

1

a

2

X100 X X100 X X100 X X100 X X100 - 100

.

al 1981 vale a

5

/ a

4

, la crescita percentuale media dal 1976

X100,

a

1

a

2

a

3

/ a

2

a

4

/ a

3

X100, … ,

a

5

/ a

4

a

6

/ a

5

X100

Riferimenti

Documenti correlati

Se un carattere non ha alcuna influenza sull’altro—e viceversa—allora si dice che i due caratteri sono indipendenti...

Quando la distribuzione dei dati non è caratterizzata da una forte asimmetria e le osservazioni sono concentrate in prossimità di media e mediana, vale la seguente

non solo la variazione intervenuta fra il tempo base e quello attuale, ma anche…. … la variazione a breve fra

Lo stesso indice di concentrazione può essere utilizzato per classi di modalità scegliendo come valori di riferimento i centri delle classi al posto delle

Se un carattere non ha alcuna influenza sull’altro—e viceversa—allora si dice che i due caratteri sono indipendenti...

Il Box-plot (o diagramma a scatola e baffi) è un diagramma che fornisce una rappresentazione grafica della distribuzione dei dati, evidenziando dove cade

come indice centrale, considerando la deviazione standard come indice di dispersione dei dati, ci si pone la questione di stabilire a priori una stima della percentuale di dati che

Le medie e le deviazioni standard delle quotazioni giornaliere dei titoli azonari Indesit &amp; De Longhi nell’arco del 2006 sono state:.. Indesit: media = 9,89; deviazione standard