• Non ci sono risultati.

Lezione 4 MEDIA ARITMETICA Questo indice di posizione è il più usato

N/A
N/A
Protected

Academic year: 2021

Condividi "Lezione 4 MEDIA ARITMETICA Questo indice di posizione è il più usato"

Copied!
16
0
0

Testo completo

(1)

1

Lezione 4 MEDIA ARITMETICA

Questo indice di posizione è il più usato per ottenere informazioni sull’ordine di grandezza di una variabile quantitativa, tanto che se si parla di media senza aggiungere un aggettivo, si fa riferimento alla media aritmetica.

L’espressione “valore medio” si utilizza anche nel linguaggio comune, per cui si sente parlare di reddito medio, voto medio, età media, così come sono comuni frasi del tipo "le donne in media vivono più degli uomini" o "i neonati maschi pesano in media più delle femmine".

Si tratta di una media di tipo analitico, il cui calcolo richiede operazioni di tipo algebrico e può quindi essere calcolata solo per variabili quantitative.

Insieme alla moda e alla mediana, descritte nella lezione precedente, fa parte dei cosiddetti indici della tendenza centrale, che tendono tutti a posizionarsi al centro della distribuzione, così da dare un’informazione sull’ordine di grandezza della variabile.

La sua formula assume forme diverse a seconda di come sono organizzati i dati raccolti.

1) SEQUENZA DI VALORI

Considerata la sequenza degli n valori

x1, x2, …, xn

rilevati su n unità per una variabile quantitativa X, la sua media, indicata con i simboli equivalenti 𝑚, 𝑚𝑥, 𝑥̅, è data da

(2)

2

𝑚 = 𝑚𝑥 = 𝑥̅ = 1

𝑛∑ 𝑥𝑖

𝑛

𝑖=1

dove la quantità ∑𝑛𝑖=1𝑥𝑖, data dalla somma di tutte le intensità rilevate, è detta ammontare della variabile.

Esempio

Considerata la successiva sequenza di voti ottenuti al liceo da uno studente

6 7 8 7 7 6 9 6

il voto medio risulta pari a 56/8=7

2) DISTRIBUZIONE DI FREQUENZA

Se i dati raccolti sono organizzati in una distribuzione di frequenza, come quella considerata nell’esempio successivo,

X Frequenza assoluta

1 4

2 3

3 2

4 1

10

la media si ottiene sempre dividendo l’ammontare della variabile per il numero di unità considerate, ma il calcolo dell’ammontare si effettua in modo più rapido tenendo presente che ciascun valore cj assunto dalla variabile si presenta nj

volte, per cui

(3)

3

𝑚 = 𝑚𝑥 = 𝑥̅ = 1

10× (1 × 4 + 2 × 3 + 3 × 2 + 4 × 1) = 2

La formula per calcolare la media per una distribuzione di frequenza espressa mediante frequenze assolute è quindi

𝑚 = 𝑚𝑥 = 𝑥̅ = 1

𝑛∑ 𝑐𝑗𝑛𝑗

𝑘

𝑗=1

Se nella distribuzione comparissero le frequenze relative, invece delle frequenze assolute, la media aritmetica si otterrebbe dalla formula seguente

𝑚 = 𝑚𝑥 = 𝑥̅ = ∑ 𝑐𝑗𝑓𝑗

𝑘

𝑗=1

dato che 𝑓𝑗 = 𝑛𝑗

𝑛. ESERCIZIO

Considerata la seguente distribuzione, se ne calcoli la media X Frequenza relativa

-1 0.1

0 0.2

1 0.5

2 0.2

1.0 Applicando la formula precedente si ottiene

𝑥̅ = −1 × 0.1 + 0 × 0.2 + 1 × 0.5 + 2 × 0.2 = 0.8

(4)

4

3) DISTRIBUZIONE IN CLASSI

Quando la distribuzione è espressa mediante classi di valori, non si conosce la vera distribuzione della variabile all’interno di ciascuna classe, per cui la media può essere calcolata solo in modo approssimato.

Considerata per esempio la distribuzione seguente

Classi di valori Frequenza relativa

-1 – 1 0.1

1 – 4 0.4

4 – 7 0.4

7 – 9 0.1

1.0

Si può solo affermare che il 10% delle unità presenta un valore della variabile compreso fra (-1, 1], il 40% un valore compreso fra (1, 4] e così via.

Per poter calcolare la media occorre sostituire a ciascun intervallo un singolo valore che rappresenti nel miglior modo possibile l’intervallo stesso e la soluzione più naturale consiste nello scegliere il suo valore centrale, ottenuto sommando gli estremi dell’intervallo e dividendo il risultato per due.

Per calcolare la media per l’esempio precedente si considera quindi la tabella successiva, che nella prima colonna contiene i valori centrali delle diverse classi.

Valore centrale Frequenza relativa

0.0 0.1

2.5 0.4

5.5 0.4

8.0 0.1

1.0

(5)

5

La media adesso può essere calcolata nel modo visto in precedenza e risulta 𝑥̅ = 0 × 0.1 + 2.5 × 0.4 + 5.5 × 0.4 + 8 × 0.1 = 4

In generale, indicando con 𝑐̅𝑗 il valore centrale della generica classe, le formule per calcolare la media per una distribuzione espressa mediante frequenze assolute o relative sono quindi

𝑚 = 𝑚𝑥 = 𝑥̅ = 1

𝑛∑ 𝑐̅𝑗𝑛𝑗

𝑘

𝑗=1

𝑚 = 𝑚𝑥 = 𝑥̅ = ∑ 𝑐̅𝑗𝑓𝑗

𝑘

𝑗=1

ESERCIZIO

Si calcoli la media sulla distribuzione successiva Classi di valori densità -3 – -1 0.05 -1 – 1 0.15 1 – 5 0.10 5 – 10 0.04

Occorre determinare le frequenze relative e i valori centrali delle classi Valore centrale Frequenza relativa

-2.0 0.1

0.0 0.3

3.0 0.4

7.5 0.2

1.0 𝑥̅ = −2 × 0.1 + 0 × 0.3 + 3 × 0.4 + 7.5 × 0.2 = 2.5

(6)

6

MEDIA PONDERATA

In alcuni casi il calcolo della media va effettuato attribuendo un certo “peso” ai valori della variabile. Questo peso serve per misurare l’importanza che si vuole attribuire a ciascun valore.

Un esempio tipico di media ponderata si ha quando si vuole calcolare il voto medio per esami universitari a cui sono associati un numero di CFU variabile.

Esempio

Se si considerano i voti seguenti

Voto 24 26 28 CFU 4 4 8

La media dei voti ponderati con i crediti corrisponde a

𝑚𝑥 = 𝑥̅ = 1

16(24 × 4 + 26 × 4 + 28 × 8)=26.5

dove, come si vede, l’ammontare della variabile va diviso per la somma dei pesi (e non per il numero di esami).

Dati gli n valori xi della variabile X a cui sono attribuiti rispettivamente i pesi pi, la formula generica della media ponderata risulta

𝑚𝑥 = ∑𝑛𝑖=1𝑥𝑖 × 𝑝𝑖

𝑛𝑖=1𝑝𝑖

(7)

7

PROPRIETÀ DELLA MEDIA ARITMETICA

- Prima proprietà (proprietà di internalità)

Considerata la sequenza ordinata delle osservazioni x(i) di X, la media 𝑥̅ è sempre interna all’intervallo (o campo) di variazione Ω𝑥 = [𝑥(1), 𝑥(𝑛) ].

Questo vuol dire che il risultato della media non può mai essere minore della più piccola intensità rilevata, né maggiore dell’intensità più grande.

Dimostrazione

Per ogni i = 1, 2, ..., n vale la disuguaglianza 𝑥𝑖 ≤ 𝑥(𝑛) per cui, effettuando la media su ciascun termine della disuguaglianza, si ottiene

1 𝑛∑ 𝑥𝑖

𝑛

𝑖=1

≤ 1

𝑛∑ 𝑥(𝑛)

𝑛

𝑖=1

Il primo termine corrisponde alla media della X, il secondo è la media di una costante, che corrisponde alla costante stessa, per cui risulta

𝑥̅ ≤ 𝑥(𝑛)

In modo analogo, dalla disuguaglianza 𝑥𝑖 ≥ 𝑥(1) per ogni i = 1, 2, ..., n risulta 1

𝑛∑ 𝑥𝑖

𝑛

𝑖=1

≥ 1

𝑛∑ 𝑥(1)

𝑛

𝑖=1

Il primo termine corrisponde sempre alla media della X, il secondo è sempre la media di una costante, per cui si ottiene

𝑥̅ ≥ 𝑥(1)

Risulta quindi verificata la seguente disuguaglianza 𝑥(1) ≤ 𝑥̅ ≤ 𝑥(𝑛)

(8)

8

- Seconda proprietà

L’ammontare complessivo di una variabile quantitativa X rilevata su n unità corrisponde a n volte la sua media, ossia, in simboli

∑ 𝑥𝑖

𝑛

𝑖=1

= 𝑛𝑥̅

Questa uguaglianza non necessita di alcuna dimostrazione, dato che deriva direttamente dalla formula della media.

In base a questa proprietà si può concludere che la media aritmetica di una variabile è quel particolare valore che, sostituito a ciascuna delle osservazioni effettivamente rilevate, lascia inalterato l'ammontare della variabile ossia, in altri termini, “equiripartisce” l’ammontare della variabile fra le n unità.

Il reddito medio rappresenta quel reddito, uguale per ciascuno, che lascia inalterato il reddito complessivo.

- Terza proprietà (proprietà di linearità)

La media di una trasformazione lineare corrisponde alla trasformazione lineare della media.

Data la sequenza delle n osservazioni xi (per i =1, 2, …, n) di una variabile X, sia 𝑥̅ la sua media. Effettuando una trasformazione lineare della X, del tipo

Y = a + bX la media della Y risulta uguale a 𝑦̅ = 𝑎 + 𝑏𝑥̅.

(9)

9

Per dimostrare di questa proprietà si parte dalla definizione di media della Y e si effettuano le opportune sostituzioni, tenendo presente che dalla relazione lineare esistente fra X e Y risulta che i singoli valori di Y sono una trasformazione lineare dei valori assunti dalla X, ossia

𝑦𝑖 = 𝑎 + 𝑏𝑥𝑖 per ogni i =1, 2, …, n

Dimostrazione

La media della variabile Y corrisponde, per definizione, a 𝑦̅ = 1

𝑛∑ 𝑦𝑖

𝑛

𝑖=1

Sostituendo al posto della generica 𝑦𝑖 la sua espressione in funzione di X si ha 𝑦̅ = 1

𝑛∑(𝑎 + 𝑏𝑥𝑖)

𝑛

𝑖=1

Aprendo la parentesi si ha

𝑦̅ = 1 𝑛∑ 𝑎

𝑛

𝑖=1

+𝑏

𝑛∑ 𝑥𝑖

𝑛

𝑖=1

dove la costante b è stata portata fuori dalla sommatoria.

Il primo termine a destra del segno di uguaglianza è la media di una costante, mentre il secondo corrisponde al prodotto fra la costante b e la media della X, per cui risulta

𝑦̅ = 𝑎 + 𝑏𝑥̅

(10)

10

Esercizi

1) Se la media di n temperature misurate in gradi fahrenheit (F) è risultata pari a 41, la temperatura media espressa in gradi centigradi (C) si ottiene tenendo presente la relazione esistente fra le due scale di misura

𝐶 = 5

9(𝐹 − 32)

La temperatura media in gradi centigradi 𝑐̅ si ottiene quindi dalla temperatura media in gradi fahrenheit 𝑓̅ mediante la seguente espressione

𝑐̅ =5

9(𝑓̅ − 32) = 5

2) Considerata la cosiddetta variabile scarto, data dalla differenza fra la variabile e la sua media, se ne calcoli il valore medio.

Si tratta di calcolare la media della seguente trasformazione lineare Y = X−𝑥̅

che è quindi un caso particolare della generica trasformazione lineare Y = a + bX

ottenuta ponendo a = −𝑥̅ e b = 1.

Si può quindi utilizzare il risultato generale appena dimostrato 𝑦̅ = 𝑎 + 𝑏𝑥̅

sempre effettuando le medesime sostituzioni, per cui

𝑦̅ = 𝑎 + 𝑏𝑥̅ = −𝑥̅ + 1 × 𝑥̅ = −𝑥̅ + 𝑥̅ = 0

La media della variabile scarto è sempre uguale a zero (e, quindi, è pari a zero anche la somma dei suoi n valori). La variabile scarto assume valori

𝑦𝑖 = 𝑥𝑖 − 𝑥̅

che risultano positivi o negativi a seconda che la i-esima osservazione sia maggiore o minore di 𝑥̅.

(11)

11

- Quarta proprietà

Considerata la sequenza delle n osservazioni xi (per i =1, 2, …, n) relativa a una variabile X di media 𝑥̅, la somma dei quadrati degli scarti dalla media è un minimo.

Questo significa che, se si calcolasse la somma dei quadrati degli scarti da un valore diverso dalla media, si otterrebbe un risultato sempre maggiore.

L’importanza di questa proprietà sarà più chiara quando si passerà a studiare la variabilità di una variabile e, più in particolare, la sua varianza.

Questa dimostrazione si effettua utilizzando un paio di “trucchi”, comuni in molte dimostrazioni, che consistono

1) nel sommare e nel sottrarre una stessa quantità 2) nell’ottenere un binomio per calcolarne il quadrato

Dimostrazione

Considerato un valore c ≠ 𝑥̅, si deve dimostrare che vale la seguente disuguaglianza

∑(𝑥𝑖 − 𝑥̅)2

𝑛

𝑖=1

≤ ∑(𝑥𝑖 − 𝑐)2

𝑛

𝑖=1

Considerato il termine a destra del segno di disuguaglianza, si aggiunge e si sottrae all’interno della parentesi tonda la media di X ottenendo

∑(𝑥𝑖 − 𝑐)2

𝑛

𝑖=1

= ∑(𝑥𝑖 − 𝑥̅ + 𝑥̅ − 𝑐)2

𝑛

𝑖=1

A questo punto si utilizzano delle parentesi per ottenere un binomio, ossia

(12)

12

∑(𝑥𝑖 − 𝑐)2

𝑛

𝑖=1

= ∑[(𝑥𝑖 − 𝑥̅) + (𝑥̅ − 𝑐)]2

𝑛

𝑖=1

Sviluppando il quadrato del binomio si ottiene

∑(𝑥𝑖 − 𝑐)2

𝑛

𝑖=1

= ∑[(𝑥𝑖 − 𝑥̅)2 + (𝑥̅ − 𝑐)2+ 2(𝑥𝑖 − 𝑥̅)(𝑥̅ − 𝑐)]

𝑛

𝑖=1

e, distribuendo la somma, risulta

∑(𝑥𝑖 − 𝑐)2

𝑛

𝑖=1

= ∑(𝑥𝑖 − 𝑥̅)2+ ∑(𝑥̅ − 𝑐)2+ 2 ∑(𝑥𝑖 − 𝑥̅)(𝑥̅ − 𝑐)

𝑛

𝑖=1 𝑛

𝑖=1 𝑛

𝑖=1

dove la quantità (𝑥̅ − 𝑐) è una costante rispetto alla sommatoria per cui si può scrivere

Adesso è sufficiente esaminare i diversi termini ottenuti:

- la quantità che compare nel rettangolo azzurro corrisponde alla somma dei quadrati dalla media

- la quantità che compare nel rettangolo giallo corrisponde alla somma della costante (𝑥̅ − 𝑐) elevata al quadrato, ossia a 𝑛(𝑥̅ − 𝑐)2 che è sempre ≥0

- la quantità riportata nel rettangolo rosso corrisponde al prodotto della costante 2(𝑥̅ − 𝑐) per la somma della variabile scarto che, come si è visto nel corso di questa lezione, è sempre pari a zero.

(13)

13

Concludendo: la disuguaglianza da cui si è partiti può essere scritta come indicato di seguito

∑(𝑥𝑖 − 𝑥̅)2

𝑛

𝑖=1

≤ ∑(𝑥𝑖 − 𝑥̅)2

𝑛

𝑖=1

+ 𝑛(𝑥̅ − 𝑐)2

e risulta chiaro che il termine a sinistra è sempre minore del termine a destra, a meno che la costante c sia esattamente uguale alla media 𝑥̅

- Quinta proprietà (proprietà associativa)

Considerate n unità statistiche suddivise in g gruppi distinti per i quali è noto il valore della media e il numero delle unità che li compongono, la media generale 𝑥̅ della variabile X corrisponde alla media delle medie dei gruppi, ponderate con le numerosità corrispondenti.

In alcune circostanze reali le n unità statistiche possono essere suddivise in g gruppi distinti (come nel caso di maschi e femmine o suddividendo le persone in occupate e disoccupate o se si distinguono i lavoratori a seconda del settore di attività economica).

Per esempio: considerato l’ultimo appello di statistica, si supponga di conoscere il numero di studenti che hanno superato l’esame a seconda del sesso, il voto medio ottenuto dalle le studentesse e il voto medio ottenuto dagli studenti. In questo caso il voto medio generale in statistica corrisponde alla media dei due voti medi ponderata con le numerosità dei due sessi.

(14)

14

Per questa dimostrazione risulta utile individuare ciascuna osservazione mediante due diversi indici:

- uno per indicare il gruppo di appartenenza

- un altro per indicare la posizione dell’osservazione all’interno del gruppo a cui appartiene

Dimostrazione

Per questa dimostrazione è conveniente indicizzare le n osservazioni relative alla variabile quantitativa X mediante due indici: nella generica 𝑥𝑖ℎ la lettera h indica che tale osservazione appartiene all’h-esimo gruppo, mentre la lettera i indica che si tratta della i-esima osservazione di quel gruppo.

Gli estremi dei due indici risultano perciò i seguenti:

h = 1, 2, …, g (dove g è il numero totale dei gruppi)

i =1, 2, …, nh (dove nh è la numerosità complessiva dell’h-esimo gruppo)

La media generale 𝑥̅ della X corrisponde all’ammontare complessivo della variabile calcolato sommando tutte le n osservazioni e per poter sommare tutte le osservazioni occorre considerare una doppia sommatoria, una per l’indice i e una per l’indice h.

Si ha cioè

𝑥̅ = 1

𝑛∑ ∑ 𝑥𝑖ℎ

𝑔

ℎ=1 𝑛

𝑖=1

Si possono scambiare le due sommatorie, per cui

(15)

15

𝑥̅ = 1

𝑛∑ ∑ 𝑥𝑖ℎ

𝑛

𝑖=1 𝑔

ℎ=1

dove la quantità

∑ 𝑥𝑖ℎ

𝑛

𝑖=1

corrisponde alla somma di tutte le osservazioni nell’h-esimo gruppo, ossia all’ammontare della variabile all’interno dell’h-esimo gruppo.

Dato che l’ammontare della variabile corrisponde al prodotto della media per la numerosità (come si è visto nel corso di questa lezione), se si indica con 𝑥̅ la media della X nell’h-esimo gruppo, risulta

∑ 𝑥𝑖ℎ

𝑛

𝑖=1

= 𝑥̅𝑛

Vale quindi la seguente uguaglianza

𝑥̅ = 1

𝑛∑ ∑ 𝑥𝑖ℎ

𝑔

ℎ=1 𝑛

𝑖=1

= 1

𝑛∑ 𝑥̅𝑛

𝑔

ℎ=1

che corrisponde alla media ponderata delle medie 𝑥̅ dei g gruppi, in cui i pesi corrispondono alla numerosità dei gruppi stessi, dato che

∑ 𝑛

𝑔

ℎ=1

= 𝑛

(16)

16

Esercizio

Su un gruppo di 1000 impiegati di un’azienda 400 sono donne e 600 sono uomini. Sapendo che il salario medio delle donne è pari a 1750 euro mentre il salario medio degli uomini è 1950, determinare il salario medio di tutti gli impiegati.

Il risultato cercato è (1750×400+1950×600)/1000=1870

Riferimenti

Documenti correlati

1,6 punti: risposta corretta, soluzione migliore ma senza una buona proprietà di linguaggio o senza una buona esposizione.. 1,4 punti: risposta corretta ma non la

Gli anni novanta: tra continuazione della tradizione e rinnovamento 16 2.2.. La visione della cultura del consumatore

[r]

Un uso scorretto del computer, infatti, può mettere a rischio la vostra salute, provocando disturbi agli occhi, alle spalle, alla schiena, al collo, ai polsi …?. Lo avreste

Ogni traccia rappresenta il movimento di una stella, le tracce hanno lunghezza diversa perché le stelle si muovono apparentemente lungo orbite circolari che hanno diametri diversi:

Anche in questo caso, come è già successo per l’istogramma e per il grafico della distribuzione di frequenze cumulate, nel caso di un carattere discreto in classi con un gran numero

Noi ci occuperemo principalmente della media aritmetica, poi cercheremo di capire anche i concetti che stanno alla base delle altre medie algebriche.... Media

Tuttavia la media aritmetica si può calcolare anche nel caso in cui la somma a numeratore non avesse un significato concreto, come avviene ad esempio per il carattere