• Non ci sono risultati.

Corso diAnalisi Statistica per le ImpreseSintesi della distribuzione di un carattere: indici di posizioneProf. L. Neria.a. 2015-2016

N/A
N/A
Protected

Academic year: 2021

Condividi "Corso diAnalisi Statistica per le ImpreseSintesi della distribuzione di un carattere: indici di posizioneProf. L. Neria.a. 2015-2016"

Copied!
28
0
0

Testo completo

(1)

Corso di

Analisi Statistica per le Imprese

Sintesi della distribuzione di un carattere: indici di

posizione

Prof. L. Neri

a.a. 2015-2016

(2)

Indice di tendenza centrale:

la media aritmetica

Si può calcolare solo per variabili quantitative È una media analitica cioè è funzione di tutti i valori

della distribuzione

E’ il punto di equilibrio o baricentro della distribuzione

E’ l’indice più intuitivo per sintetizzare un insieme di valori

2

(3)

Calcolo della media dei ricavi

• Conoscendo i ricavi dei 9 punti

vendita dell’azienda, posso calcolare il ricavo medio, un unico valore

rappresentativo dell’intero insieme

• Si sommano i ricavi di tutti i punti

vendita e il risultato si divide per il

numero delle osservazioni (n=9)

(4)

Calcolo della media

Punti vendit

a

Ricavi

1 350

2 200

3 600

4 500

5 270

6 180

7 205

8 340

9 280

Somma dei ricavi (Intensità totale del

carattere) = 350 + 200 + 600 + 500 + 270 + 180 + 205 + 340 + 280 = 2925

Media dei ricavi = 2925:9=325

L’intera torta

rappresenta la somma dei ricavi di tutti i

punti vendita La singola fetta

rappresenta la media dei ricavi

Σ=2925

4

(5)

Formula della media

• Dati n valori osservati x

1

, x

2

,…, x

n

di un carattere quantitativo X

n

1

i i

n 2

1

a

x

n ) 1

x ...

x x

n ( x 1

Media = 325

100 200 300 400 500 600 700

(6)

Effetto dei valori estremi

Se il valore estremo fosse 800 invece di 600 la media aumenterebbe

(il punto di equilibrio si sposta verso destra)

100 200 300 400 500 600 700 800

Media = 347,22

La media aritmetica risente fortemente dei valori estremi

6

(7)

Media di una distribuzione di frequenza

Addetti (valori xj)

Numero punti vendita

(frequenze nj)

3 2

4 1

6 3

7 1

10 2

xj*nj

3*2=6 4*1=4 6*3=18

7*1=7 10*2=20

11 , 9 6

55

1

1

1

n n x n

n x x

K j

j j K

j j K j

j j

K

1

j

n

j

n 9

55 n

x

j

K 1

j j

 

(8)

Media di una distribuzione di frequenza con classi di valori

Classi di superficie (in ettari)

Numero aziende

(nj)

0-1 120

1-2 160

2-3 220

3-5 212

5-10 205

10-20 110

20-40 65

40-80 21

Fonte: Borra-Di Ciaccio, pag. 71 Valore

centrale classi (cj)

0,5 1,5 2,5

4 7,5

15 30 60

cj*nj

60 240 550 848 1537,5

1650 1950 1260

K

1

j

n

j

1113

n

K

c n 8095 , 5

1

j j j

27 , 1113 7

5 , 8095

1

n n c x

K j

j j a

La superficie media di una azienda agricola è di 7,27 ettari

8

(9)

Media ponderata

• Uno studente ha sostenuto i seguenti

esami del I anno del corso di laurea di EA.

• Come calcola la media dei voti?

N. Esame voto cfu

1 Economia Aziendale 27 9

2 Ist. diritto pubblico 22 6

3 Metodi di matematica applicata 25 9

4 Macroeconomia 20 6

5 Ragioneria 28 9

(10)

Media ponderata: calcolo

Esame N. voto (x

i

)

cfu (p

i

)

voto*cfu (x

i

*p

i

)

1 27 9 243

2 22 6 132

3 25 9 225

4 20 6 120

5 28 9 252

n

1

i

p

i

39 

n

1

i

x

i

p

i

972

92 , 39 24

972 p

p x

x

n

1

i i

n

1

i i i

a

  

Il voto medio (su 39 cfu) è pari a 24,92

10

(11)

Media ponderata

i due voti più bassi pesano di meno nel calcolo della media perché sono due esami da 6 cfu

Media ponderata = 24,92

18 19 20 21 22 23 24 25 26 27 28 29 30

(12)

Mediana

12

E’ un indice di posizione

•Può essere calcolata per caratteri che siano almeno ordinabili (qualitativi su scala ordinale o quantitativi)

•E’ un indice indicato per distribuzioni che presentano valori estremi (molto grandi o molto piccoli).

•E’ un particolare quantile (2° quartile, 50°

percentile)

(13)

Mediana

• È il valore che occupa la posizione

centrale nell’insieme ordinato di tutti i valori x

min

x

 1

x

 2

... x

 n

x

max

X(1) Me X(n)

Tra x(1) e Me è contenuto il 50%

dei valori

Tra Me e x(n) è

contenuto il restante

50% dei valori

(14)

Mediana da una distribuzione di frequenza (con le freq. rel. cum.)

Sulla colonna delle frequenze relative cumulate si individua la prima Fj che è uguale o maggiore di 0,5

Addetti (xj)

Numero punti vendita

(nj)

Frequenze cumulate

Nj

3 2 2

4 1 3

6 3 6

7 1 7

10 2 9

Il corrispondente valore x

j

è la mediana della distribuzione

Mediana=6

Frequenze rel cum.

Fj 0,22 0,33 0,67 0,78 1,00

14

(15)

Mediana di una distribuzione di frequenza con classi di valori

Classi di superficie (in ettari)

Numero aziende

(nj)

0-1 120

1-2 160

2-3 220

3-5 212

5-10 205

10-20 110

20-40 65

Oltre 40 21

Freq.

cum.

(Nj)

Freq. rel.

cum.

(Fj)

120 0,108 280 0,252 500 0,449 712 0,640 917 0,824 1027 0,923 1092 0,981 1113 1,000

(16)

16

La scelta tra media e mediana

Fonte: Walter Kramer (2009), Le bugie della statistica, Nimesis

(17)

Quartili

• Sono 3 indici di posizione, Q

1

Q

2

e Q

3

 1  2  n max

min

x x ... x x

x     

X(1) Q2=Me X(n)

Tra x

(1)

e Q

1

è

contenuto il 25% dei valori (più bassi)

Tra Q

3

e x

(n)

è

contenuto il 25% dei valori (i più alti)

Q1 Q3

Tra Q

1

e Q

2

è

contenuto il 25%

dei valori

Tra Q

2

e Q

3

è

contenuto il 25%

dei valori

(18)

Primo quartile Q 1

• Q1 Primo quartile: è preceduto dal 25% dei termini (e seguito dal 75%)

• Q

1

è il primo valore x

i

in corrispondenza del quale la frequenza cumulata relativa

25 , 0 F

j

18

(19)

Terzo quartile Q 3

• Q3 Terzo quartile: è preceduto dal 75% dei termini (e seguito dal 25%)

• Q3 è il primo valore xi in corrispondenza del quale la frequenza cumulata relativa

75

,

0

F

j

(20)

Calcolo dei quartili

Ricavi

350 200 600 500 270 180 205 340 280

205 x

Q1(3)

350 x

Q3(7)

Il 25% dei punti vendita con i ricavi più bassi registrano ricavi che non superano 205 mila euro

Per essere nel 25% dei punti vendita con i ricavi più alti si devono superare 350 mila euro di ricavi

Ricavi (valori ordinati)

Freq.

cum. rel.

X(1)=180 1/9=0,11 X(2)=200 2/9=0,22 X(3)=205 3/9=0,33 X(4)=270 4/9=0,44 X(5)=280 5/9=0,56 X(6)=340 6/9=0,67 X(7)=350 7/9=0,78 X(8)=500 8/9=0,89 X(9)=600 9/9=1

La prima Fi ad essere maggiore o uguale a 0,25 è la terza

La prima Fi ad essere maggiore o uguale a 0,75 è la settima

20

(21)

Percentili

Sono quei valori che dividono la distribuzione in cento parti di uguale numerosità

Mediana=50-esimo percentile Q3= 75-esimo percentile

P10 = decimo percentile: lascia alla sua sinistra il 10% dei valori

P90 = novantesimo percentile: lascia alla sua

destra il 10% dei valori

(22)

Moda

• È un indice di posizione

• Può essere calcolata per qualsiasi tipo di carattere

• E’ la modalità più frequente

• In una distribuzione di frequenza con classi di valori: è la modalità con più alta densità di frequenza

22

(23)

Moda di un insieme di valori

Punti

vendita Genere respons.

1 maschio

2 maschio

3 femmina

4 femmina

5 maschio

6 maschio

7 maschio

8 femmina

9 femmina

La modalità del carattere

“Genere del responsabile”

che si ripete più volte (5 volte ) è “maschio”

La maggioranza dei punti vendita ha come

responsabile un uomo

Moda=“maschio”

(24)

Moda di una distribuzione di frequenza

Addetti (valori distinti)

Numero punti vendita

(frequenze)

3 2

4 1

6 3

7 1

10 2

La frequenza maggiore è 3

La modalità del carattere “Numero di addetti”

cui è associata la frequenza maggiore è 6

La maggioranza dei punti vendita ha un numero di addetti pari a 6

Moda=6

24

(25)

Moda di una distribuzione di frequenza con classi di valori

La classe modale è 2-3

Classi di superficie (in ettari)

Numero aziende

(nj)

0-1 120

1-2 160

2-3 220

3-5 212

5-10 205

10-20 110

20-40 65

40-80 21

Ampiezza classe

(aj)

Densità di freq

(dj)

1 120

1 160

1 220

2 106

5 41

10 11

20 3,25

40 0,525

In presenza di

classi di ampiezza diversa,

la classe modale è quella che ha la densità di

frequenza

maggiore

(26)

Moda

• Può non esistere

• Può non essere unica

• Può essere una modalità “poco rappresentativa” del fenomeno

26

(27)

La scelta tra media, moda e

mediana

Fonte: Magnello e Van Loon (2011), La statistica a fumetti, Raffaello Cortina Editore

(28)

Calcolo dei valori medi in base al tipo di carattere

Caratteri

Quantitativi Qualitativi

ordinati Qualitativi sconnessi

Media 

Mediana  

Moda   

28

Riferimenti

Documenti correlati

 sono ugualmente simmetrici (o ugualmente asimmetrici) rispetto al valore medio?.. 3) Qui sotto sono riportati i grafici delle funzioni di distribuzione cumulata del peso in

(tenendo costante il valore delle altre variabili) si legge dal valore del coefficiente della variabile BOLLETTA. In questo caso la media mensile di utilizzo del cellulare subisce un

L’area di ogni rettangolo deve essere uguale (o proporzionale) alla frequenza di ciascuna classe di valori in modo che l’area. complessiva di tutti i rettangoli sia uguale (o

→ Il carattere assume un’unica modalità (tutte le unità del collettivo presentano quella modalità). • Eterogeneità massima

In generale il livello di confidenza è indicato con (1-)% dove  è la probabilità che si trova nelle code della distribuzione, al di fuori dell’intervallo

L’area di ogni rettangolo deve essere uguale (o proporzionale) alla frequenza di ciascuna classe di valori in modo che l’area. complessiva di tutti i rettangoli sia uguale (o

Sono state condotte in Sardegna indagini preliminari sulla nematofauna presente in alcuni vivai forestali che da ricerche precedenti avevano pre- sentato, con una

Il loro assetto strutturale può sintetizzarsi in una successione di deboli ondulazioni ad ampie e blande anticlinali e sinclinali, in parte interrotte da una