• Non ci sono risultati.

3. INDICI DI POSIZIONE

N/A
N/A
Protected

Academic year: 2021

Condividi "3. INDICI DI POSIZIONE"

Copied!
25
0
0

Testo completo

(1)

23

3. INDICI DI POSIZIONE

3.1 Introduzione

Nello studio delle caratteristiche di una variabile, le cosiddette medie sono particolari indici statistici, detti anche indici di posizione, che risultano di fondamentale importanza perché consentono di descrivere sinteticamente l’insieme dei dati osservati mediante una sola modalità o un unico valore numerico, a seconda che la variabile considerata sia qualitativa o quantitativa.

Gli indici che saranno esaminati nei paragrafi seguenti si suddividono in medie di posizione, determinabili per una variabile di qualsiasi natura, e medie analitiche, che possono essere invece calcolate solo per variabili quantitative, dato che richiedono l’esecuzione di operazioni algebriche.

L’obiettivo che si vuole conseguire con il calcolo degli indici di posizione è la sintesi di tutte le informazioni contenute nei dati originali attraverso una sola determinazione che sia in qualche modo rappresentativa di tutte le rilevazioni effettuate, per cui è evidente che la media di una variabile qualitativa dovrà necessariamente coincidere con una delle modalità assunte dalla variabile, mentre nel caso di una variabile quantitativa la media sarà sempre interna al suo campo di variazione.

(2)

24 3.2 Moda

La prima caratteristica che si nota esaminando una distribuzione di frequenza relativa a una variabile qualitativa o quantitativa discreta è la determinazione (o le determinazioni) a cui è associata la frequenza (assoluta o relativa) più elevata.

Questa determinazione è detta determinazione modale o, più semplicemente, moda. Se esistono più determinazioni a cui è associata la stessa frequenza massima, tutte queste determinazioni rappresentano altrettante mode della distribuzione.

Considerata una variabile qualitativa o quantitativa discreta X che assume k determinazioni diverse e indicata con nj la frequenza assoluta associata alla j-esima determinazione (con j = 1,2, …, k), la moda Mx della variabile X è quella determinazione della variabile per la quale risulta

𝑀𝑥= arg max

1≤𝑗≤𝑘𝑛𝑗 3.2.1

dove arg max sta per argomento del massimo ossia, per il caso in esame, corrisponde all'insieme delle determinazioni della variabile a cui è associata la frequenza massima.

Se la distribuzione è espressa mediante le frequenze relative, anziché mediante le frequenze assolute, la moda corrisponde ovviamente a quella determinazione della X per la quale risulta

𝑀𝑥= arg max

1≤𝑗≤𝑘𝑓𝑗 3.2.2

Dato che l’individuazione della moda si basa solo sui valori assunti dalle frequenze (assolute o relative), risulta evidente che questo indice può essere determinato per una variabile di qualunque tipo.

Per esempio, la moda della variabile considerata nella tabella nella 2.1.1 è "altre attività", nella tabella 2.1.2 è il "diploma di scuola secondaria superiore", nella tabella 2.1.3 è "2 componenti" e nella 2.1.8 è

"prime edizioni".

Le mode appena individuate sulle distribuzioni di frequenza delle variabili considerate sarebbero potute essere individuate anche attraverso l’analisi del grafico corrispondente, dato che in tutti i casi la moda corrisponde alla determinazione a cui è associato il rettangolo o il segmento con l’altezza maggiore (per grafici a colonna o per i diagrammi ad asta) oppure al rettangolo con la base maggiore (per grafici a nastro).

(3)

25

Così, per esempio, la moda della distribuzione rappresentata nelle figure 2.3.2 o 2.3.3 è "industria", la moda della distribuzione rappresentata nella figura 2.3.4 è "sufficiente", la moda della distribuzione rappresentata nella figura 2.3.5 è il valore "2" e nella figura 2.3.6 la moda è “1”.

Ovviamente se in una distribuzione ci sono più determinazioni a cui è associata la stessa frequenza massima, la variabile presenta più mode, mentre non c'è alcuna moda se tutte le frequenze sono uguali fra loro.

Una distribuzione che presenta una sola moda è detta unimodale, mentre è detta plurimodale se presenta più mode. In particolare, se esistono due mode, la distribuzione è detta “bimodale”, se ne esistono tre è detta “trimodale” e così via.

Nel caso di una distribuzione di una variabile continua mediante classi di valori, l’individuazione della moda non può essere effettuata in base ai valori delle frequenze associate a ciascuna classe in quanto, come si è già detto in precedenza, all’aumentare dell’ampiezza della classe tende ad aumentare anche la frequenza associata. Per determinare la moda occorre quindi individuare l’intervallo che, a parità di ampiezza, contiene la frazione maggiore delle osservazioni.

Nelle distribuzioni di variabili continue date mediante classi di valori, è detto modale quell'intervallo che presenta la massima densità di frequenza. Anche in questo caso possono esistere più classi modali, se a più intervalli diversi è associata una stessa densità di frequenza massima.

Nel caso della tabella 2.4.1, per esempio, l'intervallo modale della distribuzione è la classe (160, 165] in corrispondenza della quale si ha il massimo valore del rapporto fra frequenza e ampiezza.

In generale, quindi, considerata una variabile quantitativa continua X i cui valori sono stati suddivisi in k classi e indicata con hj la densità di frequenza associata alla j-esima classe (con j = 1,2, …, k), la classe modale Mx è quell’intervallo per il quale risulta

𝑀𝑥= arg max

1≤𝑗≤𝑘𝑗 3.2.3

Anche in questo caso la determinazione della classe modale può avvenire graficamente, in quanto corrisponde al rettangolo dell’istogramma che presenta la massima altezza. Per esempio, la figura 2.4.1 mostra chiaramente che la moda corrisponde alla classe (160, 165], così come si era rilevato anche dai valori riportati nella tabella 2.4.1.

Se la determinazione della moda è estremamente semplice, va però notato che il suo utilizzo è abbastanza limitato. Dato che la moda non fornisce alcuna informazione ulteriore sulla distribuzione della variabile,

(4)

26

la sua conoscenza non è particolarmente utile se le determinazioni assunte dalla variabile sono piuttosto numerose, specie se la massima frequenza non è sensibilmente più elevata delle frequenze associate alle altre determinazioni.

É inoltre evidente che la determinazione dell'intervallo modale per una variabile quantitativa continua risente di tutte le arbitrarietà della suddivisione in classi che è stata effettuata.

Un pregio della moda è invece la sua “robustezza”, nel senso che questo indice non risente della eventuale presenza di determinazioni molto grandi o molto piccole che potrebbero corrispondere a valori anomali (in inglese, outlier), ossia a determinazioni che si discostano di molto dalle restanti determinazioni assunte dalla variabile.

Nota

In una distribuzione possono essere individuati anche valori modali, detti secondari o locali, che corrispondono a massimi relativi della distribuzione. In questo caso la determinazione della distribuzione a cui è associata la frequenza massima è detta anche moda principale.

Nell’esempio 2.4.1 riportato alla fine del paragrafo 2.4 si ha una moda principale in corrispondenza dell’intervallo [3001, 4000] e una moda secondaria in corrispondenza dell’intervallo [1001, 2000]

(5)

27 3.3 Quantili

Date n osservazioni relative alla variabile quantitativa X si definisce quantile di ordine p (con 0 < p < 1), e si indica con xp, quel particolare valore della variabile per cui la proporzione di osservazioni inferiori o uguali a xp è almeno p (e quindi la proporzione di osservazioni maggiore o uguale a xp è almeno 1-p).

Se, per esempio, per una distribuzione di redditi annui è noto che il quantile di ordine 0.25 è pari a 5 mila euro, questo vuol dire che almeno un quarto delle unità considerate ha un reddito annuo inferiore o uguale a 5 mila euro; se in una distribuzione di stature x0,8 vale 178 centimetri, significa che almeno l’80% delle unità ha una statura inferiore o uguale a 178 centimetri.

Data una sequenza di n osservazioni relative a una variabile quantitativa X, il quantile xp di ordine p è l’osservazione che nella sequenza ordinata occupa il posto corrispondente alla parte intera superiore del prodotto np, indicato con

 

np

Il simbolo

 

np rappresenta quindi la parte intera superiore di np per cui

 

< 1

np np

np .

Esempio 3.3.1

Considerata la seguente sequenza di osservazioni rilevate su 5 piantine di cui si è misurata l’altezza ottenendo i seguenti valori in centimetri

23.4 18.2 21.0 22.7 19.1

si determini il quantile di ordine p = 0.5 della variabile.

In questo caso n = 5, per cui

  

np 50.5

  

2.5 3.

Il quantile di ordine 0.5, x0.5, occupa quindi il terzo posto nella sequenza ordinata

18.2 19.1 21.0 22.7 23.4

per cui risulta x0.5 = x(3 )= 21.

Esempio 3.3.2

Si supponga ora che alle unità dell’esempio precedente si sia aggiunta una nuova piantina, la cui altezza in centimetri è pari a 21.5. Si vuole determinare il quantile di ordine p = 0.5 delle 6 unità statistiche.

In questo caso la sequenza ordinata è la seguente

18.2 19.1 21.0 21.5 22.7 23.4

per cui, dato che n = 6,

  

np 60.5

  

3 3.

Il quantile di ordine 0.5 occupa quindi il terzo posto nella sequenza ordinata per cui risulta ancora x0.5 = x(3 ) = 21.0.

(6)

28

Considerata una generica sequenza, tutti i suoi termini sono evidentemente quantili di un certo ordine della variabile X, ma fra questi alcuni sembrano più indicativi di altri perché fanno riferimento a quei valori di p che corrispondono a quelli di uso più comune e sono considerati, quindi, come altrettanti valori caratteristici della X.

Sono frequentemente utilizzati i quantili x0.25, x0.5 e x0.75 che, per la loro importanza nella descrizione delle caratteristiche della variabile X, hanno un nome particolare e vengono detti quartili.

Il quartile più importante è il secondo, x0.5, comunemente chiamato mediana, perché indica quel particolare valore della variabile tale che almeno la metà delle unità presenta un valore minore o uguale a x0.5 e almeno la metà delle unità presenta un valore maggiore o uguale a x0.5.

Per esempio l’ISTAT fa espressamente riferimento al “reddito mediano” in numerosi studi volti a confrontare la distribuzione del reddito in Italia rispetto a quella di altri Paesi europei, oppure per analizzare condizioni di vita e livello di povertà delle famiglie italiane nei diversi anni.

Altri quantili di uso frequente sono i nove decili x0.1, x0.2, ..., x0.9 e i novantanove centili x0.01, x0.02, ..., x0.99. In questi casi la mediana corrisponde al quinto decile o al cinquantesimo centile.

Esempio 3.3.3

Considerata la seguente sequenza di n=10 valori di una variabile quantitativa continua X 3.20 3.25 2.80 2.96 3.00 3.18 3.12 1.87 1.99 2.02 si determinino i suoi tre quartili.

La sequenza ordinata è

1.87 1.99 2.02 2.80 2.96 3.00 3.12 3.18 3.20 3.25

per cui il primo quartile occupa il posto

  

np 100.25

  

2.5 3, la mediana il posto

  

np 100.5

  

5 5

e il terzo quartile il posto

  

np 100.75

  

7.5 8.

Risulta quindi x0.25 = 2.02 x0.5 = 2.96 x0.75 = 3.18

Esempio 3.3.4

Considerata la seguente sequenza di n=14 valori di una variabile quantitativa discreta X 3 1 5 -2 -3 -5 0 10 -9 20 12 6 -21 8 si determinino i suoi tre quartili.

La sequenza ordinata è

-21 -9 -5 -3 -2 0 1 3 5 6 8 10 12 20

per cui il primo quartile occupa il posto

  

np 140.25

  

3.5 4, la mediana il posto

  

np 140.5

  

7 7

e il terzo quartile il posto

  

np 140.75

  

10.5 11. Risulta quindi x0.25 = -3

x0.5 = 1 x0.75 = 8

(7)

29

Se nella sequenza degli n valori alcuni di questi si presentano più di una volta, l’addensamento delle frequenze in corrispondenza di alcune determinazioni fa sì che uno stesso valore della variabile possa corrispondere a più quantili di ordine diverso.

Se, per esempio, si considera la seguente sequenza ordinata dei voti in statistica ottenuti da 20 studenti

18 18 18 20 20 22 22 23 23 23 23 24 24 24 25 26 27 27 28 30

i tre quartili occupano rispettivamente i posti

200.25

5,

200.5

10 e

200.75

15e sono

quindi dati da x0.25 = 20, x0.5 = 23 e x0.75 = 25. Il valore 20 corrisponde però anche al secondo decile, così come il valore 23 è sia mediana, sia quarto e sesto decile.

Alle medesime conclusioni si giunge ovviamente se si fa riferimento, invece che alla sequenza, alla distribuzione di frequenza corrispondente, per cui il calcolo dei quantili si effettua sempre nello stesso modo.

Nel caso di una distribuzione di frequenza conviene però utilizzare i valori delle frequenze assolute cumulate.

In una distribuzione di frequenza il quantile di ordine p della variabile quantitativa X corrisponde al valore cj a cui è associata la prima frequenza assoluta cumulata Nj maggiore o uguale a

 

np .

Data per esempio la distribuzione dei voti considerati in precedenza Distribuzione dei voti

x Frequenza assoluta Frequenza assoluta cumulata

18 3 3

20 2 5

22 2 7

23 4 11

24 3 14

25 1 15

26 1 16

27 2 18

28 1 19

30 1 20

20

dalle frequenze assolute cumulate contenute nell’ultima colonna della tabella precedente si ottengono gli stessi quartili ottenuti sulla sequenza dei voti.

(8)

30 Esempio 3.3.5

Data la seguente distribuzione di frequenza relativa a una variabile quantitativa discreta X Distribuzione di una variabile X

x Frequenza assoluta

-2 4

-1 6

0 10

1 10

2 12

3 8

50

si determini il valore del secondo, del quinto e del settimo decile.

Le unità esaminate sono 50, per cui i posti occupati dai tre decili richiesti sono rispettivamente il decimo, il venticinquesimo e il trentacinquesimo. Dalle frequenze assolute cumulate riportate nella tabella seguente

Distribuzione di una variabile X

x Frequenza assoluta Frequenza assoluta cumulata

-2 4 4

-1 6 10

0 10 20

1 10 30

2 12 42

3 8 50

50

risulta x0.2 = -1, x0.5 = 1 e x0.7 = 2.

In questa sede, per semplicità, non verrà considerata la determinazione dei quantili per variabili quantitative continue la cui distribuzione è stata sintetizzata in classi di valori, né per variabili qualitative ordinabili. È invece chiaro che non è mai possibile determinare i quantili di variabili qualitative sconnesse, dato che non esiste un ordinamento naturale delle sue modalità.

(9)

31 3.4 Media aritmetica

Un’importante caratteristica di una variabile quantitativa è costituita dal suo valore medio, espressione utilizzata spesso anche nel linguaggio comune dato che, con riferimento a gruppi di persone, si parla abitualmente di reddito medio, voto medio, età media.

Il valore medio rientra fra le medie di tipo analitico, in quanto la sua determinazione richiede operazioni di tipo algebrico sui valori assunti dalla variabile, per cui può essere calcolato esclusivamente per variabili di tipo quantitativo (sia discrete, sia continue).

Il valore medio, calcolato per determinare l'ordine di grandezza del fenomeno nel gruppo considerato, è spesso utilizzato per confrontare in modo sommario la distribuzione di una stessa variabile rilevata su diversi gruppi di unità oppure in tempi diversi. Sono di uso comune, per esempio, espressioni quali "le donne in media vivono più a lungo degli uomini", "i neonati maschi pesano in media più delle femmine",

"la durata media della vita è sensibilmente più elevata di quella del secolo scorso".

L'espressione "valore medio" è piuttosto generica perché in realtà si può fare riferimento a più valori medi che in genere risultano diversi fra di loro. Nel linguaggio comune, però, con il termine media ci si riferisce quasi sempre alla cosiddetta media aritmetica che, fra tutti i possibili valori medi, è senz'altro il più importante, tanto che in statistica, quando si parla di media senza ulteriori specificazioni, ci si riferisce sempre a quest'ultima.

La media aritmetica, la moda e la mediana fanno parte della famiglia dei cosiddetti indici della tendenza centrale, a sottolineare il fatto che tali indici tendono a posizionarsi al centro della distribuzione, ossia tendono a rappresentare l’ordine di grandezza della variabile di interesse.

Considerata la sequenza degli n valori di una variabile quantitativa X, la sua media aritmetica, indicata con il simbolo x o mx, è uguale alla somma di tutti i valori divisa per n.

Utilizzando l’operatore sommatoria, la formula di calcolo della media corrisponde quindi a

n x m

x

n i

i x

1 3.4.1

dove la somma di tutti gli n valori,

n i

xi 1

, che compare al numeratore, corrisponde al cosiddetto ammontare della variabile.

(10)

32

Per esempio, la media della sequenza dei voti in statistica considerata nell’esempio 2.1.3 è uguale a 20.392.

Esempio 3.4.1

La media aritmetica della sequenza successiva, che indica il numero di dipendenti di un gruppo di 10 aziende cooperative,

1 2 3 4 6 8 15 18 20 23

risulta uguale a

10

10 100 10

23 3

2

1     

...

x .

Se si dispone, anziché della sequenza originaria di valori, di una distribuzione di frequenza, la media viene calcolata in modo diverso a seconda che nella prima colonna compaiano i singoli valori della variabile oppure le classi. Se la variabile è discreta e a ogni valore cj è associata la frequenza assoluta nj, la media corrisponde a

n n c

n n c m

x

k

j j j k

j j k

j j j x

1

1

1 , j = 1, 2, ..., k  n, 3.4.2

che è del tutto equivalente alla 3.4.1, perché l'ammontare complessivo della variabile corrisponde alla somma dei prodotti fra ciascun valore e la frequenza corrispondente (ogni valore cj compare infatti nj volte).

Nel caso della tabella 2.1.3, per esempio, il numero medio di componenti delle famiglie italiane formate da non più di 5 componenti si ottiene mediante la 3.4.2 e risulta approssimativamente pari a

. 53 . 21410768 2

1263934 5

...

5900995 2

5409180

1      

x

Se nella distribuzione compaiono le frequenze relative, la media aritmetica è definita dall'espressione

(11)

33

k

j j j

x c f

m x

1

, j = 1, 2, ..., k  n 3.4.3

che equivale sia alla 3.4.2, dato che

, f n c

c n n

n c

x j

k j

j k j

j j k

j j

j

 

 

1 1

1

sia alla 3.4.1, dove a ciascuna xi è associata una frequenza relativa costante, uguale a 1/n.

Infine, se i dati disponibili sono raggruppati in k classi, la media aritmetica può essere calcolata solo in modo approssimato dato che non sono noti con esattezza tutti gli n valori rilevati (e quindi non si conosce l’ammontare esatto della variabile all’interno di ogni singola classe).

In questa situazione si adotta l'ipotesi che i valori contenuti all'interno della j-esima classe siano tutti uguali al suo valore centrale, pari alla semisomma dei suoi estremi.

Considerata la j-esima classe, il suo valore centrale, indicato con il simbolo cj, è quindi pari a

c . cj cj j

2

1

A seconda che si disponga delle frequenze assolute o relative, la media di una distribuzione in classi si calcola quindi mediante l’espressione

, f n c

n c m

x j

k j

j k

j j j

x

 

1 1

ma ovviamente il risultato ottenuto in questo modo è solo un'approssimazione della media vera (ottenibile dagli n valori originali). É chiaro quindi che, se si disponesse di tali valori, la media andrebbe sempre calcolata su questi ultimi e non sulla distribuzione in classi.

In alcuni casi, pur non avendo a disposizione i singoli valori della variabile rilevati sulle singole unità statistiche, si può conoscere l’esatto ammontare della variabile per ciascuna delle classi che compongono la distribuzione (l’ISTAT fornisce spesso questa informazione). In questo caso, ovviamente, il calcolo

(12)

34

della media dovrà essere effettuato considerando questi ammontari esatti, piuttosto che quelli stimati in modo approssimato.

Se invece si dispone dei soli dati in classi, va sottolineato che il valore medio approssimato risulterà più preciso al diminuire dell'ampiezza delle diverse classi, mentre se nella distribuzione compaiono una o più classi aperte, per il calcolo della media sarà necessario approssimare in qualche modo i valori degli estremi, utilizzando altre eventuali informazioni disponibili sulla variabile in esame.

Esempio 3.4.2

La media della distribuzione riportata nella tabella successiva

Classi di valori Frequenza relativa Valore centrale

0 – 5 0.20 2.5

5 – 10 0.16 7.5

10 – 20 0.24 15.0

20 – 50 0.32 35.0

50 – 100 0.08 75.0

1.00

si ottiene dalla somma dei prodotti dei valori centrali per le frequenze relative corrispondenti, ed è uguale a 22.5.

In alcuni casi il calcolo del valore medio di una variabile viene effettuato in modo diverso, attribuendo ai diversi valori assunti dalla variabile un “peso” che serve per misurare l’importanza che si vuole attribuire a ciascuna di esse.

Si supponga, per esempio, che in due diverse occasioni si siano acquistate due diverse quantità (p1 e p2) di uno stesso bene pagando rispettivamente i prezzi x1 e x2. In questo caso l'ammontare complessivo della spesa sostenuta è pari alla somma dei prodotti fra prezzi e quantità

2.

2 1

1 p x p

x   

Per calcolare il prezzo medio che, se fosse risultato identico nelle due occasioni, avrebbe fatto spendere la stessa somma complessiva, non si può fare semplicemente la semisomma dei due prezzi x1 e x2, ma i due prezzi vanno pesati (ossia ponderati) con le quantità corrispondenti (p1 e p2).

Il prezzo medio 𝑥̅ è pari quindi al rapporto fra l’ammontare della spesa complessiva e la quantità totale del bene acquistata, per cui

(13)

35 .

2 1

2 2 1 1

p p

p x p x x

  3.4.4

Il valore così ottenuto è quel prezzo medio che lascia inalterato l’ammontare complessivo della spesa, come risulta subito dall’uguaglianza

p p

x p x p .

x 121122

La 3.4.4 è un esempio di media aritmetica ponderata, ossia di una media dove ogni singolo valore contribuisce alla determinazione dell'ammontare complessivo in maniera proporzionale a un qualche

"peso" associato al valore stesso.

In generale, considerati gli n valori xi della variabile X a cui sono attribuiti rispettivamente i pesi pi, la media ponderata della variabile risulta

.

1 1

n

i i n

i

i i

p p x

x 3.4.5

Un esempio tipico di media ponderata si presenta quando si vuole calcolare il voto medio ottenuto negli esami di profitto di un corso universitario quando ai diversi esami è attribuito un numero di crediti (CFU) variabile. In questo caso la media dei voti deve tenere conto di questa informazione che “pesa”

l’importanza di ciascuno degli esami superati.

Supponiamo per esempio che uno studente abbia ottenuto le votazioni riportate nella prima riga della tabella successiva, mentre nella seconda riga sono riportati i valori dei crediti corrispondenti.

Tabella 3.4.1

Voto e crediti degli esami universitari superati da uno studente Voto 24 26 18 30 27 26

CFU 4 8 12 4 8 4

Il voto medio corrisponde a 24.

40 960 4

8 4 12 8 4

4 26 8 27 4 30 12 18 8 26 4

24  

  x

(14)

36 3.5 Proprietà della media aritmetica

La media aritmetica verifica alcune importanti proprietà che verranno utilizzate anche nei capitoli successivi. Innanzitutto, dato che la media x misura l’ordine di grandezza della variabile X, è necessario che sia interna al campo di variazione della variabile stessa.

- Prima proprietà (proprietà di internalità)

Considerata la sequenza ordinata delle osservazioni x(i) di una variabile quantitativa X, la sua media x risulta sempre compresa all’interno del suo campo di variazione.

Dimostrazione

Data una variabile quantitativa X rilevata su n unità statistiche, si consideri la sequenza ordinata dei valori ordinati in modo non decrescente x   1, x2,...,x n . Per ogni i = 1, 2, ..., n vale la disuguaglianza

 n

i x

x  per cui

   n n

i n n

i

i x x

x n

xn

1 1

1

1 .

In modo analogo, dato che xix 1 per ogni i = 1, 2, ..., n risulta

   1 1

1 1

1

1 x x

x n x n

n i n

i

i 

 

per cui la media è sempre compresa nel campo di variazione Ωx

x   1, xn

della variabile X:

x 1xx n

- Seconda proprietà

L’ammontare complessivo di una variabile quantitativa X rilevata su n unità corrisponde a n volte il valore della sua media aritmetica x, ossia

x n x

n i

i

1 .

(15)

37

In base all’uguaglianza precedente, che non necessita di alcuna dimostrazione perché deriva direttamente dalla definizione 3.4.1, la media aritmetica risulta essere quel particolare valore che, sostituito a ciascuno dei valori effettivamente rilevati, lascia inalterato l'ammontare della variabile. Questa proprietà evidenzia quindi i casi in cui è corretto sintetizzare i dati raccolti mediante la media aritmetica, anziché mediante una media diversa: la media aritmetica è quel particolare valore che “equiripartisce” l’ammontare della variabile fra le n unità.

Per esempio, dato un gruppo di n individui su cui è stata rilevata la variabile reddito, la sua media aritmetica rappresenta quel particolare valore teorico del reddito, uguale per ciascun individuo, che lascia inalterato il reddito complessivo del gruppo.

- Terza proprietà (proprietà di linearità)

La media di una trasformazione lineare corrisponde alla trasformazione lineare della media.

Dimostrazione

Considerata una variabile X di media x e una sua trasformazione lineare del tipo

Y = a + bX 3.5.1

la media della variabile trasformata, corrispondente all’espressione seguente

n

i i

y y

m n y

1

1 ,

può essere scritta nella forma seguente

 

n

i

bxi

n a y

1

1

per cui risulta

x b a n x

b na bx n a n

y n

n i

i n

i i n

i

  

1 1 1

1 1

1 . 3.5.2

(16)

38

Quindi, se di una variabile quantitativa X è nota la sua media x, per ottenere la media della variabile Y, trasformata lineare della X, non è necessario effettuare la trasformazione delle singole osservazioni xi, ma è sufficiente effettuare la trasformazione lineare della x.

Riprendendo l’esempio 1.4.1 considerato nel primo capitolo, si indichi con X la temperatura espressa in gradi Fahrenheit e con Y la temperatura espressa in gradi Celsius. La media della X risulta

4 41 59 50 32

23   

x

mentre, tenuta presente la relazione esistente fra gradi Fahrenheit e gradi Celsius, la temperatura media in gradi centigradi corrisponde a

32

5 9

5  

x

y .

Esempio 3.5.1

Data una variabile X di media x2 si determini la media delle tre variabili trasformate

X 4 2 Y 

X 3 8

W 

X 6 5 Z 

Applicando la 3.5.2 si ottiene

 

2 6 4

2 4

2     

x

y 83x83

 

2 14 wz56x56

 

2 7

Come caso particolare di trasformazione lineare si consideri la variabile

Y = X−𝑥̅ , 3.5.3

che si ottiene dalla 3.5.1 ponendo a = −𝑥̅ e b = 1. La Y, detta variabile scarto, assumerà valori

yi = xi−𝑥̅

che risultano positivi o negativi a seconda che la i-esima osservazione sia rispettivamente maggiore o minore della media 𝑥̅.

(17)

39

Dalla 3.5.2, tenendo presenti le uguaglianze a = −𝑥̅ e b = 1, risulta immediatamente che la media aritmetica 𝑦̅ della variabile scarto Y è sempre pari a zero e, quindi, è pari a zero anche la somma dei suoi n valori.

- Quarta proprietà

Considerata una variabile X di media 𝑥̅, la somma dei quadrati degli scarti della variabile dalla sua media è un minimo.

Dimostrazione

Considerata una variabile quantitativa X e un valore h diverso dalla sua media aritmetica 𝑥̅, si deve dimostrare che vale la seguente disuguaglianza

x x

 

x h

h x

n i

i n

i

i  

 

ogni per

1

2 1

2 . 3.5.4

Se nel termine a destra della disuguaglianza precedente si sottrae e si somma la media aritmetica 𝑥̅ si ottiene

x x x h

n

 

x x

 

x h

 

.

i i n

i

i

1

2 1

2

Sviluppando il quadrato del binomio, risulta

      

   

n

i i n

i n

i i n

i

i

i x x h x x x h x x x h x h x x

x

1 1

2 1

2 1

2

2 2 2 .

dove il doppio prodotto è pari a zero perché corrisponde al prodotto di una costante per la somma della variabile scarto.

Il termine a destra nella disuguaglianza 3.5.4 può essere quindi scomposto nella somma

         

2

1

2 1

2 1

2 1

2

x x x h x x n x h

h x

n i

i n

i n

i i n

i

i

           

3.5.5

(18)

40

della somma dei quadrati degli scarti dalla media più n volte la differenza al quadrato fra la costante arbitraria h e la media aritmetica x. Quest’ultima quantità risulta nulla se e solo se hx ed è quindi dimostrato che la quantità a sinistra della 3.5.4 assume il suo valore minimo quando hx.

Questa proprietà appena dimostrata sottolinea ancora una volta il ruolo di “centralità” della media aritmetica, in quanto la 𝑥̅ minimizza la somma dei quadrati degli scarti e può essere quindi considerato come il valore “più vicino” alle n osservazioni originali.

Nota

Anche la mediana verifica una proprietà analoga a questa, ma riferita alla somma dei valori assoluti degli scarti, anziché ai loro quadrati. La mediana x0.5 di una variabile quantitativa X è infatti quel valore che rende minima la somma dei valori assoluti degli scarti

min x

x

n

i

.

i  

1

5

0 .

In alcune situazioni le n unità statistiche esaminate sono naturalmente suddivise in gruppi (per esempio, le persone esaminate in un’indagine possono essere naturalmente suddivise in maschi e femmine oppure in occupati e disoccupati) e può accadere di conoscere il valore medio della variabile di interesse nei singoli gruppi (per esempio, si potrebbe conoscere il reddito medio per i maschi e per le femmine o l’età media degli occupati e dei disoccupati). In queste situazioni, se è noto il numero delle unità appartenenti ai singoli gruppi, la media della variabile sulle n unità corrisponde alla media delle medie nei gruppi, ponderate con le numerosità corrispondenti.

- Quinta proprietà (proprietà associativa)

Considerate n unità statistiche suddivise in g gruppi distinti, ciascuno di numerosità nh, con n n,

g

h h

1

e indicata con

x

h la media della variabile X all’interno dell’h-esimo gruppo (con h = 1, 2, …, g), la media

x della X su tutte le n unità corrisponde alla media delle singole medie xh ponderate con le nh.

Dimostrazione

Tenendo presente che le n osservazioni relative alla variabile X sono suddivise in g gruppi disgiunti, conviene indicare ogni singola osservazione con due indici, il primo dei quali riporta la posizione occupata da ciascuna osservazione nel gruppo di appartenenza, mentre il secondo riporta l’identificativo

(19)

41

del gruppo. In questo modo il simbolo xih indica l’i-esima osservazione appartenente all’h-esimo gruppo (con i =1, 2, …, nh e h = 1, 2, …, g).

Utilizzando questa notazione, la media generale della variabile X, pari al rapporto fra l’ammontare complessivo della variabile diviso per il numero di unità che la compongono, può essere posta nella forma

n x n

x x

h nh

i ih g

h n

i g

h

ih 



 

 1 1 1 1 3.5.6

dove le quantità nella parentesi tonda corrispondono all’ammontare della variabile in ciascun gruppo, ossia al prodotto della media aritmetica del gruppo per la numerosità del gruppo stesso, ossia

g ..., , , h n

x x h h

n

i ih

h

2 1

1

.

La media aritmetica generale 3.5.6, quindi, può essere anche scritta nella forma equivalente

g

h h hn n x x

1

1 3.5.7

che corrisponde alla media delle medie dei singoli gruppi ponderate per la numerosità dei gruppi stessi.

Esempio 3.5.4

Si consideri un gruppo di 100 laureati di cui 45 di sesso femminile e 55 di sesso maschile. Sapendo che il voto medio di laurea delle studentesse è risultato pari a 103.3 mentre il voto medio degli studenti è risultato pari a 101.1, determinare il voto medio di laurea per l’intero gruppo di laureati.

Il risultato cercato è dato da 10209

100

55 1 101 45 3

103.   .   .

Nota

Si osservi che in alcune situazioni l'ordine di grandezza di un fenomeno va misurato con valori medi diversi dalla media aritmetica. Quest’ultima, infatti, è solo un caso particolare della cosiddetta famiglia delle medie potenziate, il cui generico elemento, indicato con Ms, è detto media potenziata di ordine s. Considerata la serie degli n valori originari, la media potenziata di ordine s assume la forma

(20)

42

n s

i s i

s n

x M

1

1









 < s < +

che è definita per qualsiasi valore di s solo se tutte le xi sono maggiori di zero. La media aritmetica fa ovviamente parte di questa famiglia e si ottiene per s = 1.

(21)

43 3.6 Momenti

Il concetto di media aritmetica è alla base della definizione di un’altra famiglia di indici, frequentemente utilizzati in statistica, che vengono detti momenti.

Data la sequenza delle n osservazioni di una variabile quantitativa X, si definisce momento ordinario (o momento dall’origine) di ordine r (e viene indicato di solito mediante il simbolo mrx o mediante il più semplice simbolo mr, se è evidente che si sta analizzando la variabile X) la media aritmetica delle potenze r-esime delle osservazioni

n

i r i r

rx x

m n m

1

1 , r = 0, 1, 2, ... 3.6.1

Dalla formula precedente i vede subito che il momento di ordine zero è sempre uguale a 1, mentre ponendo r = 1 si ottiene la media aritmetica

. m m xx1

Esempio 3.6.1

Data la seguente sequenza di valori,

0 1 1 3 3 4 il terzo momento dall’origine è pari a

6 20 4 3 3 1 1

0 3 3 3

3      

m

Se i valori rilevati sono organizzati in una distribuzione di frequenza, la determinazione dei momenti di ordine r viene effettuata in modo analogo a quanto visto a proposito della media aritmetica.

Nel caso di una distribuzione di frequenza il momento di ordine r corrisponde alla media aritmetica delle potenze r-esime dei k valori

j k j

rj j

k j

rj

r c n c f

m n

 

1 1

1 , r = 0, 1, 2, ... 3.6.2

(22)

44 Esempio 3.6.2

Data la distribuzione riportata nella tabella seguente

Numero di figli Frequenza relativa

0 0.4

1 0.2

2 0.3

3 0.1

1.0 il secondo momento dall’origine corrisponde a

m2 = 0×0.4+1×0.2+4×0.3+9×0.1=2.3

Per una distribuzione in classi, il valore approssimato del momento di ordine r si ottiene da

j k j

rj j

k j

rj

r c n c f

m n

 

1 1

1 , r = 0, 1, 2, ... 3.6.3

Esempio 3.6.3

Data la distribuzione riportata nella tabella seguente

Classi Frequenza

assoluta

-1  1 5

1  15

5  20

40 il terzo momento dall’origine corrisponde a

m3 ≈ (0×5+33×15+73×20)/40 = 18.625

Oltre ai momenti dall’origine, in statistica spesso si utilizzano anche i momenti centrali, il cui generico elemento di ordine r, indicato con il simbolo mrx, o più brevemente m se è chiaro che ci si riferisce r alla variabile X, assume la forma

 

n

i

r i r

rx

x x

m n m

1

1

, r = 0, 1, 2, ... 3.6.4

se i dati sono costituiti dalla sequenza di n osservazioni.

(23)

45

Per r = 0 il risultato è pari a uno, mentre per r = 1 si ottiene la media della variabile scarto, che è sempre pari a zero.

Nel caso di una distribuzione di frequenza il momento centrale di ordine r corrisponde a

   

j k

j

r j j

k j

r j

r c x n c x f

m n

 

1 1

1 , r = 0, 1, 2, ... 3.6.5

ed infine, per una distribuzione in classi, il valore approssimato del momento centrale di ordine r è dato da

 

k

 

j

j

r j j

k j

r j

r c x n c x f

m n

 

1 1

1 , r = 0, 1, 2, ... 3.6.6

Il momento centrale di ordine r corrisponde alla media aritmetica delle potenze r-esime degli scarti dalla media aritmetica della variabile

Esempio 3.6.4

Data la distribuzione riportata nella tabella dell’esempio 3.6.2, se ne calcoli il secondo momento centrale.

La media aritmetica è pari a

1 1 1 0 3 3 0 2 2 0 1 4 0

0 . . . . .

x        

per cui il secondo momento centrale è

𝑚̅2= (0 − 1.1)2× 0.4 + (1 − 1.1)2× 0.2 + (2 − 1.1)2× 0.3 + (3 − 1.1)2× 0.1 = 1.09

Proprietà

Considerata una variabile X il cui momento centrale di ordine r è dato da mrx, il momento centrale di ordine r di una trasformazione lineare del tipo Y = a + bX corrisponde a mrybrmrx

Dimostrazione

Considerata una variabile X di media 𝑥̅ e momento r-esimo mrx, la variabile trasformata Y data dalla 3.5.1 ha una media pari alla trasformazione lineare della media della X, per cui il momento suo r-esimo può essere scritto nella forma seguente

(24)

46

         

 

r rx

n

i

r r i

n

i

r i n

i

r i

n

i

r i ry

m b x n x

b

x x n b x b a bx n a

y n y

m

1

1 1

1

1

1 1

1

3.6.7

Questo risultato indica che i momenti di ordine r sono invarianti per cambiamenti dell’origine della scala di misura, ma variano al variare dell’unità di misura.

I valori dei momenti centrali possono essere ricavati da quelli dei momenti dall'origine. Facendo riferimento alla sequenza degli n valori originali, per esempio, si dimostra che il secondo momento centrale risulta uguale a

   

12 2 2

2 2 2 2

1 2 1

1 2

1 2 1

1 2 1

2 2

1

2 2

1 2 2 1

1

1 2 1 2

1

m m x m x x m n x

n x x n x

x x

x n x

x x x n x

x n x

m

n i n

i i n

i i

n i n i

i n

i i n

i

i i

n i

i







  

3.6.8

e corrisponde quindi alla differenza fra il secondo momento dall'origine e la media al quadrato o, in altri termini, alla media dei quadrati meno il quadrato della media.

Esempio 3.6.5

Data la distribuzione riportata nella tabella dell’esempio 3.6.2, se ne calcoli il secondo momento centrale mediante il calcolo dei primi due momenti dall’origine.

Risulta

1 1 1 0 3 3 0 2 2 0 1 4 0

0 . . . . .

x        

m2 = 0×0.4+1×0.2+4×0.3+9×0.1=2.3 da cui si ottiene infine

 

11 109 3

2 2

2 2

2 m x . . .

m     

Nota

Per quanto riguarda il terzo e il quarto momento centrale le relazioni con i momenti dall’origine sono invece

14 12 2 1 3 4 4

3 1 1 2 3 3

3 6

4

2 3

m m m m m m m

m m m m m

(25)

47

I momenti centrali di ordine 2, 3 e 4, come si vedrà nel prossimo capitolo, forniscono alcune importanti informazioni su diverse caratteristiche della distribuzione della variabile in esame.

Nota

Tutti i momenti esaminati rientrano nella cosiddetta famiglia dei momenti di ordine r da h, il cui generico termine che indichiamo con il simbolo hmr, nel caso di una sequenza di n osservazioni assume la forma

 

n

i

r i r

h h

m n

1

1 x

, r = 0, 1, 2, ...

da cui, per h = 0, si ottengono le espressioni dei momenti dall'origine, mentre per h = x si ottengono le espressioni dei momenti centrali.

Riferimenti

Documenti correlati

Risolvere una disequazione significa trovare gli intervalli di valori che sostituiti alla incognita rendono la diseguaglianza vera.. Risolvere una

Valutazione La valutazione è effettuata mediante la proposizione di compiti di realtà che permetteranno agli alunni di mobilitare le competenze civili acquisite, si farà

Il tipo intero viene utilizzato per tutte le grandezze che possono essere rappresentate come numeri interi, come per es.: età, numero di figli, ecc.. Campo di variabilità Campo

Priorità degli operatori può essere alterata con le parentesi tonde: vengono valutate per prima le operazioni all’interno delle parentesi tonde più

Il rapporto tra ricerca dei valori di riferimento degli xe- nobiotici ed esposoma pare a noi articolato e complesso. È corretto affermare che c’è un’area di sovrapposizione tra i

Si ritiene di fondamentale importanza continuare le analisi per angoli maggiori di 10°, in modo da trovare il valore dell’ angolo ottimale che meglio relazioni la luce riflessa

5 Box-and-whisker plots delle distanze angolari delle direzioni modali rispetto a Sud (D180) relative alle rondini ML raggruppate in base alle riserve di grasso.. I numeri interni

Tuttavia, questa variabile pu` o essere osservata solo se ` e positiva, poich` e se vale 0 non possiamo sapere se l’insetto studiato fosse effettivamente presente su quella foglia..