comunicazione e delle relazioni
internazionali - a.a. 2013-2014
Gli indici sintetici Tendenza centrale Forma
Variabilità
La scelta dell’indice di tendenza centrale/posizione dipende dal tipo e dalle caratteristiche della distribuzione;
ü
Più che individuare l’indice “migliore in assoluto” (che non esiste), è importante anche valutare le differenze tra le diverse misure, che possono fornire ulteriori, importanti informazioni anche, ad esempio, sulla forma della distribuzione;
ü
Qualche considerazione
Gli indici sintetici Posizione Forma
Variabilità
Volendo comunque definire delle caratteristiche dei diversi indici di tendenza centrale/posizione, possiamo dire che: (Piccolo, 2003)
ü
La moda è utile quando occorre “minimizzare gli scontenti”, e quindi in tutte quelle situazioni in cui il consenso e il numero delle singole unità ha significato per la decisione. In breve, la moda è un indice per governare;
F
La mediana minimizza i costi complessivi ed è resistente ai valori estremi. Quindi, la mediana è un indice per decisioni che implicano costi elevati nei casi estremi;
F
La media aritmetica è il baricentro dei dati e propone, quindi, un valore che equi-ripartisce il fenomeno tra le unità statistiche, pervenendo così a decisioni nelle quali contano, a parità numerica, gli estremi molto più dei valori centrali. Quindi, la media aritmetica è un indice di equilibrio generale.
F
Qualche considerazione
La variabilità di un fenomeno è la sua attitudine ad assumere differenti modalità.
Per comprendere il ruolo centrale della variabilità nell’ambito di problematiche statistiche, esaminiamo un caso concreto….
Le seguenti 3 distribuzioni delle Età hanno tutte Media = Mediana= 25…..
Ma la dispersione attorno al valore 25 risulta differente nei 3 casi!!!!
Il solo uso di indici di posizione non è sufficiente per
discriminare tra situazioni tra loro molto differenziate
Gli indici sintetici
Posizione Forma
Variabilità
La variabilità di un fenomeno è la sua attitudine ad assumere differenti modalità.
ü
Un indice di variabilità è una misura di tale attitudine, e dovrebbe possedere almeno le seguenti caratteristiche:
ü
F E’ nullo se e solo se tutte le unità presentano la stessa modalità del carattere;
F Aumenta all ’ aumentare della diversità tra le unità.
La variabilità può essere misurata ü
Rispetto a un centro (Dispersione)
Come misura delle differenze tra tutte le possibili coppie di unità osservate (Disuguaglianza)
F Ogni indice di variabilità è sempre maggiore o uguale a 0
F Aggiungendo una costante ad una variabile l’indice di variabilità non
deve cambiare.
Gli indici sintetici
Posizione
Indici assoluti
ü
Forma
Variabilità
Indici relativi
ü
Indici
normalizzati
ü
Dipendono dalla natura della variabile che si sta esaminando e sono espressi nella stessa unità di misura della variabile.
Sono svincolati dall ’ unità di misura perché costruiti come rapporti tra indici assoluti o tra indici assoluti e loro valori estremi. Sono, quindi, numeri puri, utili per confrontare fenomeni
omogenei.
Sono particolari indici relativi che variano in un intervallo finito, generalmente in [0, 1] oppure in [-1, +1].
Sono, quindi, di immediata interpretazione.
X
X
La variabilità rispetto a un centro
( i )
i
x − µ
∑ = 0
( i ) 2
i
x − µ
∑
(
i)
2i
x n
µ
∑ −
devianza
varianza
(
i)
2 ii
x − µ ⋅ n
∑
(
i)
2 ii
x n
n µ
− ⋅
∑
Distribuzioni di frequenza
Distribuzioni di frequenza
m =30,4
m =30,4
18 21 22 23 26 28 30 31 32 38 40 42 44
28 29
30 31
32 34
La varianza
Età studenti del Corso
Frequenze assolute
(n
i)
(x
i- µ )n
i(x
i- µ )
2n
i18 2 -5,32 14,13
19 44 -72,95 120,94
20 66 -43,42 28,57
21 32 10,95 3,75
22 18 24,16 32,42
23 13 30,45 71,31
24 9 30,08 100,53
25 6 26,05 113,12
Totale 190 0,00 484,76
Età media 20,6579
( ) (
i)
2 ii
x n
Var X
n µ
− ⋅
= ∑
La varianza
Età studenti del Corso
Frequenze assolute
(n
i)
(x
i- µ )n
i(x
i- µ )
2n
i18 2 -5,32 14,13
19 44 -72,95 120,94
20 66 -43,42 28,57
21 32 10,95 3,75
22 18 24,16 32,42
23 13 30,45 71,31
24 9 30,08 100,53
25 6 26,05 113,12
Totale 190 0,00 484,76
Età media 20,6579
( ) (
i)
2 ii
x n
Var X
n µ
− ⋅
= ∑
Età studenti del Corso
Frequenze assolute
(n
i)
(x
i- µ )n
i(x
i- µ )
2n
i18 2 -5,32 14,13
19 44 -72,95 120,94
20 66 -43,42 28,57
21 32 10,95 3,75
22 18 24,16 32,42
23 13 30,45 71,31
24 9 30,08 100,53
25 6 26,05 113,12
Totale 190 0,00 484,76
Età media 20,6579
( ) ( µ )
σ − ⋅
=
2= ∑
ix
i 2n
iVar X
n
( ) 484,76 190
Var X = = 2,55
Il problema dell ’ unità di misura
Lo Scarto quadratico medio
( ) ( µ )
σ − ⋅
= = ∑
ix
i 2n
iSqm X
n
( ) 2,55
Sqm X
⇒ = = 1,60
La Varianza
e lo Scarto quadratico medio
La Varianza
Lo Scarto quadratico medio
• La varianza è sempre non negativa (perché media di quadrati)
• E ’ un indice assoluto espresso nell ’ unità di misura del fenomeno al quadrato
• Ha come valore minimo 0 (se tutte le unità presentano lo stesso valore che è pari alla media)
• Il massimo può crescere indefinitamente (perché gli scarti possono anche essere estremamente lontani dalla media aritmetica
• È un indice assoluto espresso nella stessa unità di misura del carattere
• Ha come valore minimo 0 (se tutte le unità presentano lo stesso
valore che è pari alla media)
( )
σ
2= M X
2− ⎡ ⎤ ⎣ ⎦ µ
2La Varianza
e lo Scarto quadratico medio
Un metodo alternativo per il calcolo di s 2
Età studenti del Corso
Frequenze assolute
(ni) X2 X2ni
18 2 324 648
19 44 361 15884
20 66 400 26400
21 32 441 14112
22 18 484 8712
23 13 529 6877
24 9 576 5184
25 6 625 3750
190 81567
µ 20,66
Varianza 2,5514
( )
σ
2= M X
2− ⎡ ⎤ ⎣ ⎦ µ
2La Varianza
e lo Scarto quadratico medio
Un metodo alternativo per il calcolo di s 2
Età studenti del Corso
Frequenze assolute
(ni) X2 X2ni
18 2 324 648
19 44 361 15884
20 66 400 26400
21 32 441 14112
22 18 484 8712
23 13 529 6877
24 9 576 5184
25 6 625 3750
190 81567
µ 20,66
Varianza 2,5514
( )
σ
2= M X
2− ⎡ ⎤ ⎣ ⎦ µ
2La Varianza
e lo Scarto quadratico medio
Un metodo alternativo per il calcolo di s 2
Età studenti del Corso
Frequenze assolute
(ni) X2 X2ni
18 2 324 648
19 44 361 15884
20 66 400 26400
21 32 441 14112
22 18 484 8712
23 13 529 6877
24 9 576 5184
25 6 625 3750
190 81567
µ 20,66
Varianza 2,5514
( )
281567 190
M X = = 429,30 µ =
⎡ ⎤ ⎣ ⎦
220,66
2= 426,75
2
429,30 426,75
σ
X= −
= 2,55
Peso
(Kg.) n
45 - 50 4 50 - 55 12 55 - 60 22 60 - 65 40 65 - 70 19 70 - 75 3
100 Mamme
( ) (
i)
2 ii
x n
Sqm X
n µ
− ⋅
= ∑
La Varianza
e lo Scarto quadratico medio
.) Non è definito per m <0
Peso
(Kg.) n
1,5 - 2,0 5 2,0 - 2,5 12 2,5 - 3,0 25 3,0 - 3,5 35 3,5 - 4,0 18 4,0 - 4,5 5
100 Neonati
( ) (
i)
2 ii
x n
Var X
n µ
− ⋅
= ∑
( )
µ X = 60,85
X Y
( ) 31,528
Var X =
( ) 5,615
Sqm X =
( )
µ Y = 3,07
( ) 0,358
Var Y =
( ) 0,598
Sqm Y =
Coefficiente di variazione
CV σ
= µ
( ) 0,092
CV X = CV Y ( ) = 0,195
.) Tende ad “esplodere”per m≈0
Il confronto fra misure di variabilità
Il coefficiente di variazione
.) Non è definito per m <0
CV σ
= µ
.) Tende ad “ esplodere ” per m≈0
.) Confronto tra distribuzioni espresse in diverse unità di misura
.) Confronto tra distribuzioni espresse nella stessa unità di misura ma con valori medi molto
differenti
Altri indici di variabilità
.) Campo di variazione (Range): R x =
max− x
min.) Differenza interquartile: Q 3 − Q 1
.) Differenza semplice media: Δ =
x i − x j
i ≠ j=1
∑ n
n ⋅ n − 1 ( )
.) Campo di variazione (Range): R x =
max− x
min.) Differenza interquartile:
3 1
Q − Q
N.B. il Range può essere influenzato da valori
anomali. E’ preferibile
esaminare la variazione tra
quantili intermedi
.) Differenza semplice media:
Δ =
x
i− x
ji≠ j =1
∑
nn ⋅ n − 1 ( )
È una misura di mutua variabilità e consente di
misurare la diversità tra le singole unità statistiche piuttosto che rispetto ad un ipotetico centro
rappresentativo
Per una
successione di dati
Δ =
x
i− x
jn
in
ji≠ j =1
∑
nn ⋅ n − 1 ( )
Per una distribuzione di frequenza
Min(Δ)=0 Si verifica quando i dati coincidono tra loro (minima mutua variabilità)
Max(Δ)=2µ Si verifica quando (n-1) unità possiedono 0 e
e una sola unità possiede l’ammontare complessivo di x
Dove e come studiare
Esercizio n. 1 – punto 7 Esercizio n.3 – punto e Esercizio n. 5 – punto b Esercizio n. 6 – punto b Esercizio n. 8 – punto b Esercizio n. 10 – punto b Esercizio n. 11 – punto a Esercizio n. 12 – punto a
File “esercizi indici sintetici.pdf”
• Libro di testo: D. Piccolo (2004) – Statistica per le decisioni – Il Mulino.
Cap. 5 (escluso paragrafi 5.4, 5.5, 5.6)
• Libro di testo: S. Borra, A. Di Ciaccio (2008) – Statistica – Metodologie per le scienze economiche e sociali – McGraw-Hill.
Cap. 4 (escluso paragrafi 4.4)
Determinare il campo di variazione del seguente insieme di numeri:
35, 4, 28, 76, 12, 5, 7
Per ottenere il campo di variazione bisogna ordinare in modo crescente la sequenza di numeri
1° Step
4, 5, 7, 12, 28, 35, 76
Fare la differenza tra il numero più grande e il numero più piccolo
2° Step
ω= 76-4= 72 N.B stesso criterio per
modalità divise in classi
Dato il seguente insieme di numeri:
4.5, 6.2, 7.8, 10.4, 15.9 Determinare:
a) La devianza, utilizzando anche la formula semplificata;
b) La varianza;
c) Lo scarto quadratico medio;
d) Il coefficiente di variazione
1° Step
Calcolare il valore medio della distribuzione µ= (4.5+6.2+7.8+10.4+15.9)/5= 8.96
SOLUZIONE PUNTO a
DEV(x) = ( x i − µ )
∑ i 2
Per determinare la devianza è necessario calcolare gli scarti dalla media al quadrato
2° Step
x i x i -µ (x i -µ) 2
4,50 -4,46 19,89
6,20 -2,76 7,62
7,80 -1,16 1,35
10,40 1,44 2,07
15,90 6,94 48,16
0,00 79,09
DEV(x)=79,09
Calcolo della devianza con la formula semplificata
Per applicare la formula semplificata della devianza è necessario calcolare il quadrato delle modalità:
1° Step
X
i(X
i)
24,50 20,25
6,20 38,44
7,80 60,84
10,40 108,16 15,90 252,81 totale 480,50
DEV(x) = ( ) x i
∑ i 2 − n µ 2
Essendo nµ 2 = 5*(8,96) 2 = 401.408
Dev(x)= 480.5-401.408=79.092
SOLUZIONE PUNTO b
Var X ( ) = ( x
i− µ )
∑
i 2n
Var x ( ) = DEV(x) n = 79,09 5 = 15,81
SOLUZIONE PUNTO c
sqm(x) = Var x ( ) = DEV(x) n = 79,09 5 = 15,81 = 3,97
SOLUZIONE PUNTO d
CV = sqm(x)
µ × 100 = σ
µ × 100
sqm(x) = 3,97 µ (x) = 8,96
CV = sqm(x)
µ × 100 =
3,97
8,96 × 100 = 44,39
Data la seguente distribuzione di frequenza:
Determinare:
a) La devianza;
b) La varianza;
c) Lo scarto quadratico medio.
Classi di
altezze n. di atleti 170-|175 14
175-|180 18
180-|185 28
185-|190 33
190-|195 17
195-|200 15
Totale 125
SOLUZIONE PUNTO a
Classi di
altezze n. di
atleti Valori
centrali x
i*n
ix
i