• Non ci sono risultati.

Dipartimento di Scienze politiche, della comunicazione e delle relazioni internazionali - a.a. 2013-2014

N/A
N/A
Protected

Academic year: 2022

Condividi "Dipartimento di Scienze politiche, della comunicazione e delle relazioni internazionali - a.a. 2013-2014"

Copied!
34
0
0

Testo completo

(1)

comunicazione e delle relazioni

internazionali - a.a. 2013-2014

(2)

Gli indici sintetici Tendenza centrale Forma

Variabilità

La scelta dell’indice di tendenza centrale/posizione dipende dal tipo e dalle caratteristiche della distribuzione;

ü

Più che individuare l’indice “migliore in assoluto” (che non esiste), è importante anche valutare le differenze tra le diverse misure, che possono fornire ulteriori, importanti informazioni anche, ad esempio, sulla forma della distribuzione;

ü

Qualche considerazione

(3)

Gli indici sintetici Posizione Forma

Variabilità

Volendo comunque definire delle caratteristiche dei diversi indici di tendenza centrale/posizione, possiamo dire che: (Piccolo, 2003)

ü

La moda è utile quando occorre “minimizzare gli scontenti”, e quindi in tutte quelle situazioni in cui il consenso e il numero delle singole unità ha significato per la decisione. In breve, la moda è un indice per governare;

F

La mediana minimizza i costi complessivi ed è resistente ai valori estremi. Quindi, la mediana è un indice per decisioni che implicano costi elevati nei casi estremi;

F

La media aritmetica è il baricentro dei dati e propone, quindi, un valore che equi-ripartisce il fenomeno tra le unità statistiche, pervenendo così a decisioni nelle quali contano, a parità numerica, gli estremi molto più dei valori centrali. Quindi, la media aritmetica è un indice di equilibrio generale.

F

Qualche considerazione

(4)

La variabilità di un fenomeno è la sua attitudine ad assumere differenti modalità.

Per comprendere il ruolo centrale della variabilità nell’ambito di problematiche statistiche, esaminiamo un caso concreto….

Le seguenti 3 distribuzioni delle Età hanno tutte Media = Mediana= 25…..

Ma la dispersione attorno al valore 25 risulta differente nei 3 casi!!!!

Il solo uso di indici di posizione non è sufficiente per

discriminare tra situazioni tra loro molto differenziate

(5)

Gli indici sintetici

Posizione Forma

Variabilità

La variabilità di un fenomeno è la sua attitudine ad assumere differenti modalità.

ü

Un indice di variabilità è una misura di tale attitudine, e dovrebbe possedere almeno le seguenti caratteristiche:

ü

F E’ nullo se e solo se tutte le unità presentano la stessa modalità del carattere;

F Aumenta all ’ aumentare della diversità tra le unità.

La variabilità può essere misurata ü

Rispetto a un centro (Dispersione)

Come misura delle differenze tra tutte le possibili coppie di unità osservate (Disuguaglianza)

F Ogni indice di variabilità è sempre maggiore o uguale a 0

F Aggiungendo una costante ad una variabile l’indice di variabilità non

deve cambiare.

(6)

Gli indici sintetici

Posizione

Indici assoluti

ü

Forma

Variabilità

Indici relativi

ü

Indici

normalizzati

ü

Dipendono dalla natura della variabile che si sta esaminando e sono espressi nella stessa unità di misura della variabile.

Sono svincolati dallunità di misura perché costruiti come rapporti tra indici assoluti o tra indici assoluti e loro valori estremi. Sono, quindi, numeri puri, utili per confrontare fenomeni

omogenei.

Sono particolari indici relativi che variano in un intervallo finito, generalmente in [0, 1] oppure in [-1, +1].

Sono, quindi, di immediata interpretazione.

(7)

X

X

La variabilità rispetto a un centro

( i )

i

x − µ

= 0

( i ) 2

i

x − µ

(

i

)

2

i

x n

µ

∑ −

devianza

varianza

(

i

)

2 i

i

x − µ ⋅ n

(

i

)

2 i

i

x n

n µ

− ⋅

Distribuzioni di frequenza

Distribuzioni di frequenza

m =30,4

m =30,4

18 21 22 23 26 28 30 31 32 38 40 42 44

28 29

30 31

32 34

(8)

La varianza

Età studenti del Corso

Frequenze assolute

(n

i

)

(x

i

- µ )n

i

(x

i

- µ )

2

n

i

18 2 -5,32 14,13

19 44 -72,95 120,94

20 66 -43,42 28,57

21 32 10,95 3,75

22 18 24,16 32,42

23 13 30,45 71,31

24 9 30,08 100,53

25 6 26,05 113,12

Totale 190 0,00 484,76

Età media 20,6579

( ) (

i

)

2 i

i

x n

Var X

n µ

− ⋅

= ∑

(9)

La varianza

Età studenti del Corso

Frequenze assolute

(n

i

)

(x

i

- µ )n

i

(x

i

- µ )

2

n

i

18 2 -5,32 14,13

19 44 -72,95 120,94

20 66 -43,42 28,57

21 32 10,95 3,75

22 18 24,16 32,42

23 13 30,45 71,31

24 9 30,08 100,53

25 6 26,05 113,12

Totale 190 0,00 484,76

Età media 20,6579

( ) (

i

)

2 i

i

x n

Var X

n µ

− ⋅

= ∑

(10)

Età studenti del Corso

Frequenze assolute

(n

i

)

(x

i

- µ )n

i

(x

i

- µ )

2

n

i

18 2 -5,32 14,13

19 44 -72,95 120,94

20 66 -43,42 28,57

21 32 10,95 3,75

22 18 24,16 32,42

23 13 30,45 71,31

24 9 30,08 100,53

25 6 26,05 113,12

Totale 190 0,00 484,76

Età media 20,6579

( ) ( µ )

σ

=

2

= ∑

i

x

i 2

n

i

Var X

n

( ) 484,76 190

Var X = = 2,55

Il problema dell ’ unità di misura

Lo Scarto quadratico medio

( ) ( µ )

σ

= = ∑

i

x

i 2

n

i

Sqm X

n

( ) 2,55

Sqm X

⇒ = = 1,60

La Varianza

e lo Scarto quadratico medio

(11)

La Varianza

Lo Scarto quadratico medio

•  La varianza è sempre non negativa (perché media di quadrati)

•  E ’ un indice assoluto espresso nell ’ unità di misura del fenomeno al quadrato

•  Ha come valore minimo 0 (se tutte le unità presentano lo stesso valore che è pari alla media)

•  Il massimo può crescere indefinitamente (perché gli scarti possono anche essere estremamente lontani dalla media aritmetica

•  È un indice assoluto espresso nella stessa unità di misura del carattere

•  Ha come valore minimo 0 (se tutte le unità presentano lo stesso

valore che è pari alla media)

(12)

( )

σ

2

= M X

2

− ⎡ ⎤ ⎣ ⎦ µ

2

La Varianza

e lo Scarto quadratico medio

Un metodo alternativo per il calcolo di s 2

Età studenti del Corso

Frequenze assolute

(ni) X2 X2ni

18 2 324 648

19 44 361 15884

20 66 400 26400

21 32 441 14112

22 18 484 8712

23 13 529 6877

24 9 576 5184

25 6 625 3750

190 81567

µ 20,66

Varianza 2,5514

(13)

( )

σ

2

= M X

2

− ⎡ ⎤ ⎣ ⎦ µ

2

La Varianza

e lo Scarto quadratico medio

Un metodo alternativo per il calcolo di s 2

Età studenti del Corso

Frequenze assolute

(ni) X2 X2ni

18 2 324 648

19 44 361 15884

20 66 400 26400

21 32 441 14112

22 18 484 8712

23 13 529 6877

24 9 576 5184

25 6 625 3750

190 81567

µ 20,66

Varianza 2,5514

(14)

( )

σ

2

= M X

2

− ⎡ ⎤ ⎣ ⎦ µ

2

La Varianza

e lo Scarto quadratico medio

Un metodo alternativo per il calcolo di s 2

Età studenti del Corso

Frequenze assolute

(ni) X2 X2ni

18 2 324 648

19 44 361 15884

20 66 400 26400

21 32 441 14112

22 18 484 8712

23 13 529 6877

24 9 576 5184

25 6 625 3750

190 81567

µ 20,66

Varianza 2,5514

( )

2

81567 190

M X = = 429,30 µ =

⎡ ⎤ ⎣ ⎦

2

20,66

2

= 426,75

2

429,30 426,75

σ

X

= −

= 2,55

(15)

Peso

(Kg.) n

45 - 50 4 50 - 55 12 55 - 60 22 60 - 65 40 65 - 70 19 70 - 75 3

100 Mamme

( ) (

i

)

2 i

i

x n

Sqm X

n µ

− ⋅

= ∑

La Varianza

e lo Scarto quadratico medio

.) Non è definito per m <0

Peso

(Kg.) n

1,5 - 2,0 5 2,0 - 2,5 12 2,5 - 3,0 25 3,0 - 3,5 35 3,5 - 4,0 18 4,0 - 4,5 5

100 Neonati

( ) (

i

)

2 i

i

x n

Var X

n µ

− ⋅

= ∑

( )

µ X = 60,85

X Y

( ) 31,528

Var X =

( ) 5,615

Sqm X =

( )

µ Y = 3,07

( ) 0,358

Var Y =

( ) 0,598

Sqm Y =

Coefficiente di variazione

CV σ

= µ

( ) 0,092

CV X = CV Y ( ) = 0,195

.) Tende ad “esplodere”per m≈0

Il confronto fra misure di variabilità

(16)

Il coefficiente di variazione

.) Non è definito per m <0

CV σ

= µ

.) Tende ad esplodereper m≈0

.) Confronto tra distribuzioni espresse in diverse unità di misura

.) Confronto tra distribuzioni espresse nella stessa unità di misura ma con valori medi molto

differenti

(17)

Altri indici di variabilità

.) Campo di variazione (Range): R x =

max

x

min

.) Differenza interquartile: Q 3Q 1

.) Differenza semplice media: Δ =

x i − x j

i ≠ j=1

n

n ⋅ n − 1 ( )

(18)

.) Campo di variazione (Range): R x =

max

x

min

.) Differenza interquartile:

3 1

QQ

N.B. il Range può essere influenzato da valori

anomali. E’ preferibile

esaminare la variazione tra

quantili intermedi

(19)

.) Differenza semplice media:

Δ =

x

i

− x

j

i≠ j =1

n

n ⋅ n − 1 ( )

È una misura di mutua variabilità e consente di

misurare la diversità tra le singole unità statistiche piuttosto che rispetto ad un ipotetico centro

rappresentativo

Per una

successione di dati

Δ =

x

i

− x

j

n

i

n

j

i≠ j =1

n

n ⋅ n − 1 ( )

Per una distribuzione di frequenza

Min(Δ)=0 Si verifica quando i dati coincidono tra loro (minima mutua variabilità)

Max(Δ)=2µ Si verifica quando (n-1) unità possiedono 0 e

e una sola unità possiede l’ammontare complessivo di x

(20)

Dove e come studiare

Esercizio n. 1 – punto 7 Esercizio n.3 – punto e Esercizio n. 5 – punto b Esercizio n. 6 – punto b Esercizio n. 8 – punto b Esercizio n. 10 – punto b Esercizio n. 11 – punto a Esercizio n. 12 – punto a

File “esercizi indici sintetici.pdf”

•  Libro di testo: D. Piccolo (2004) – Statistica per le decisioni – Il Mulino.

Cap. 5 (escluso paragrafi 5.4, 5.5, 5.6)

•  Libro di testo: S. Borra, A. Di Ciaccio (2008) – Statistica – Metodologie per le scienze economiche e sociali – McGraw-Hill.

Cap. 4 (escluso paragrafi 4.4)

(21)

Determinare il campo di variazione del seguente insieme di numeri:

35, 4, 28, 76, 12, 5, 7

Per ottenere il campo di variazione bisogna ordinare in modo crescente la sequenza di numeri

1° Step

4, 5, 7, 12, 28, 35, 76

Fare la differenza tra il numero più grande e il numero più piccolo

2° Step

ω= 76-4= 72 N.B stesso criterio per

modalità divise in classi

(22)

Dato il seguente insieme di numeri:

4.5, 6.2, 7.8, 10.4, 15.9 Determinare:

a) La devianza, utilizzando anche la formula semplificata;

b) La varianza;

c)  Lo scarto quadratico medio;

d) Il coefficiente di variazione

1° Step

Calcolare il valore medio della distribuzione µ= (4.5+6.2+7.8+10.4+15.9)/5= 8.96

SOLUZIONE PUNTO a

(23)

DEV(x) = ( x i − µ )

i 2

Per determinare la devianza è necessario calcolare gli scarti dalla media al quadrato

2° Step

x i x i (x i -µ) 2

4,50 -4,46 19,89

6,20 -2,76 7,62

7,80 -1,16 1,35

10,40 1,44 2,07

15,90 6,94 48,16

0,00 79,09

DEV(x)=79,09

(24)

Calcolo della devianza con la formula semplificata

Per applicare la formula semplificata della devianza è necessario calcolare il quadrato delle modalità:

1° Step

X

i

(X

i

)

2

4,50 20,25

6,20 38,44

7,80 60,84

10,40 108,16 15,90 252,81 totale 480,50

DEV(x) = ( ) x i

i 2 − n µ 2

Essendo nµ 2 = 5*(8,96) 2 = 401.408

Dev(x)= 480.5-401.408=79.092

(25)

SOLUZIONE PUNTO b

Var X ( ) = ( x

i

µ )

i 2

n

Var x ( ) = DEV(x) n = 79,09 5 = 15,81

SOLUZIONE PUNTO c

sqm(x) = Var x ( ) = DEV(x) n = 79,09 5 = 15,81 = 3,97

(26)

SOLUZIONE PUNTO d

CV = sqm(x)

µ × 100 = σ

µ × 100

sqm(x) = 3,97 µ (x) = 8,96

CV = sqm(x)

µ × 100 =

3,97

8,96 × 100 = 44,39

(27)

Data la seguente distribuzione di frequenza:

Determinare:

a)  La devianza;

b)  La varianza;

c) Lo scarto quadratico medio.

Classi di

altezze n. di atleti 170-|175 14

175-|180 18

180-|185 28

185-|190 33

190-|195 17

195-|200 15

Totale 125

(28)

SOLUZIONE PUNTO a

Classi di

altezze n. di

atleti Valori

centrali x

i

*n

i

x

i

-µ (x

i

-µ)

2

(x

i

-µ)

2

*n

i

170-|175 14 172,5 2415 -12,64 159,76 2236,77 175-|180 18 177,5 3195 -7,64 58,36 1050,65 180-|185 28 182,5 5110 -2,64 6,96 195,14 185-|190 33 187,5 6187,5 2,36 5,56 183,79 190-|195 17 192,5 3272,5 7,36 54,16 920,88 195-|200 15 197,5 2962,5 12,36 152,76 2291,54

Totale 125 23142,5 6878,8

µ= 23142,5/125=185,14

Dev(x)

(29)

SOLUZIONE PUNTO b

SOLUZIONE PUNTO c

Var x ( ) = DEV(x) n = 6878,80 125 = 55,03

sqm(x) = Var x ( ) = DEV(x) n = 6878,80 125 = 55,03 = 7,41

(30)

La tabella seguente riporta la distribuzione delle età di 366 persone (distinte per sesso) colpite da malattie

alcool-correlate:

Determinare i coefficienti di variazione relativi ai maschi e alle femmine.

Classi di età maschi femmine

30-|40 81 30

40-|50 31 42

50-|60 36 36

60-|70 35 75

Totale 183 183

(31)

1° Step Calcolare il coefficiente di variazione per i maschi

Classi di

età maschi Valori

centrali x

i

*n

i

x

i

(x

i

-µ)

2

(x

i

-µ)

2

*n

i

30-|40 81 35 2835 -11,36 129,04 10453,01 40-|50 31 45 1395 -1,36 1,84 57,33 50-|60 36 55 1980 8,64 74,64 2687,38 60-|70 35 65 2275 18,64 347,44 12160,73

Totale 183 8485 25358,47

µ= 8485/183=46,36 sqm(x) = Var x ( ) = 25358,47 183 = 138,57 = 11,77

CV = 11,77

46,36 × 100 = 25,39

(32)

1° Step Calcolare il coefficiente di variazione per le femmine

Classi di

età femmine Valori

centrali x

i

*n

i

x

i

(x

i

-µ)

2

(x

i

-µ)

2

*n

i

30-|40 30 35 1050 -18,52 342,99 10289,71 40-|50 42 45 1890 -8,52 72,59 3048,79 50-|60 36 55 1980 1,48 2,19 78,85 60-|70 75 65 4875 11,48 131,79 9884,28

Totale 183 9795 23301,64

µ= 9795/183=53,52

sqm(x) = Var x ( ) = 23301,64 183 = 127,33 = 11,28

CV = 11,28

53,52 × 100 = 21,07

(33)

Classi di

altezze n. di atleti Frequenze cumulate

170-|175 14 14

175-|180 18 32

180-|185 28 60

185-|190 33 93

190-|195 17 110

195-|200 15 125

Totale 125

Determinare la differenza interquartile della distribuzione riportata in tabella.

Q 1 = 175+(31,25-14)/

18*5=179,8

Q 3 = 190+(93,75-93)/

17*5=190,22

Q 3 - Q 1 =190,22-179,8=

=10,42

(34)

Gli indici sintetici: la variabilità

ü  Scarto quadratico medio, varianza, devianza (nel caso di una distribuzione unitaria semplice, di una distribuzione di

frequenza, di una distribuzione in classi)

ü  Indici di variabilità relativi: coefficiente di variazione ü  Campo di variazione

ü  Differenza interquartile

ü  Differenza semplice media

Riepilogo

Riferimenti

Documenti correlati

Il corso di laurea magistrale in Scienze delle amministrazioni e delle organizzazioni complesse si propone di fare acquisire agli studenti, poi laureati nella classe,

La produzione dell ’ ultima settimana è stata effettuata impiegando un nuovo tipo di materiale sulla cui qualità il responsabile della produzione avanza seri dubbi.

L ’ altezza delle matricole universitarie di sesso maschile può essere considerata una variabile con distribuzione Normale, con media incognita e varianza pari a

La casualità interviene nella selezione delle unità e si ottiene attribuendo ad ogni unità della popolazione una probabilità nota e diversa da zero di essere

Un sistema informativo aziendale deve raccogliere, processare, immagazzinare e distribuire informazione al fine di facilitare i processi di pianificazione, decisione

Il 5% dei pneumatici prodotti dal turno di giorno erano difettosi, mentre la percentuale di prodotti difettosi era pari al 10% di quelli prodotti dal turno di sera e al 20% di

Giuseppe Liotta (Università degli Studi di Palermo) La responsabilità per danni nello sport.

1896/2006 che istituisce un procedimento europeo d'ingiunzione di pagamento stabilisce che l'importo totale delle spese di giudizio di un procedimento europeo d'ingiunzione