• Non ci sono risultati.

Lezione 3 - Distribuzioni di frequenze

N/A
N/A
Protected

Academic year: 2021

Condividi "Lezione 3 - Distribuzioni di frequenze"

Copied!
83
0
0

Testo completo

(1)

3

Distribuzioni di frequenze

(2)

Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze

Distribuzioni di frequenze

La distribuzione di frequenze di un carattere è una tabella che mostra in modo efficace e sintetico i risultati delle operazioni di classificazione e conteggio delle unità della popolazione.

A seconda del tipo di carattere, se ne

possono effettuare diverse elaborazioni e

rappresentazioni.

(3)

Distribuzioni di frequenze per caratteri qualitativi

Se il carattere analizzato è qualitativo, solitamente è semplice elencare le modalità che esso assume nel collettivo di riferimento e quindi contare quante unità statistiche presentano ciascuna modalità.

Otteniamo in questo modo la

distribuzione di frequenze assolute.

(4)

Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze

Distribuzioni di frequenze per caratteri qualitativi

Carattere A Frequenze assolute

a

1

n

1

... ...

a

i

n

i

... ...

a

p

n

p

Totale N

 p

1

i

n

i

N

(5)

Distribuzioni di frequenze per caratteri qualitativi

 p

1

i

n

i

N

Zona ni

DOC 169

DOCG 49

IGT 65

Totale 283

Facendo riferimento al nostro dataset di

283 vini, abbiamo la seguente

distribuzione di frequenze assolute del

carattere Zona.

(6)

Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze

Distribuzioni di frequenze per caratteri qualitativi

Per mettere in evidenza il “peso” della singola modalità sul totale possiamo calcolare la distribuzione di frequenze relative, dividendo ciascuna frequenza assoluta per il totale.

p

1

i i

i i

f 1

N

f n

(7)

Distribuzioni di frequenze per caratteri qualitativi

Carattere A Frequenze

assolute Frequenze relative

a

1

n

1

f

1

=n

1

/N

... ... ...

a

i

n

i

f

i

=n

i

/N

... ... ...

a

p

n

p

f

p

=n

p

/N

Totale N 1

(8)

Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze

Distribuzioni di frequenze per caratteri qualitativi

Moltiplicando le frequenze relative per 100 si ottiene la distribuzione di frequenze percentuali.

Zona ni fi fi%

DOC 169 0.597 59.7%

DOCG 49 0.173 17.3%

IGT 65 0.230 23.0%

Totale 283 1.000 100.0%

(9)

Distribuzioni di frequenze per caratteri qualitativi

• Le distribuzioni di frequenze percentuali risultano di facile interpretazione.

• Possono essere sempre calcolate, purchè N sia sufficientemente elevato (con N molto basso, potrebbe non avere molto senso...).

• E’ obbligatorio utilizzarle se si vogliono

fare confronti tra collettivi di diversa

numerosità.

(10)

Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze

Distribuzioni di frequenze per caratteri qualitativi

Supponiamo ad esempio di voler confrontare la distribuzione delle zone di produzione dei vini di Veneto e Toscana.

Il confronto non è immediato perchè tra i nostri 283 vini ve ne sono 47 provenienti dalla Toscana e solo 26 dal Veneto.

Zona Toscana Veneto

DOC 8 16

DOCG 30 0

IGT 9 10

Totale 47 26

(11)

Distribuzioni di frequenze per caratteri qualitativi

Però con le frequenze percentuali possiamo ottenere l’informazione cercata.

Zona Toscana Veneto Toscana Veneto

DOC 8 16 17,0% 61,5%

DOCG 30 0 63,8% 0,0%

IGT 9 10 19,1% 38,5%

Totale 47 26 100,0% 100,0%

(12)

Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze

Distribuzioni di frequenze per caratteri qualitativi

Le distribuzioni di frequenze si possono

sintetizzare graficamente utilizzando

grafici a torta o grafici a barre.

(13)

Distribuzioni di frequenze per caratteri qualitativi

Le distribuzioni di frequenze si possono sintetizzare graficamente utilizzando grafici a torta o grafici a barre.

17,0%

61,5%

63,8% 19,1%

38,5%

0% 20% 40% 60% 80% 100%

Toscana Veneto

DOC DOCG IGT

(14)

Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze

Distribuzioni di frequenze per caratteri quantitativi

Per i caratteri quantitativi discreti, se il carattere assume un numero limitato di valori diversi, si possono ripetere le stesse considerazioni fatte per i caratteri qualitativi.

Premi ni fi fi%

0 254 0.898 89.8%

1 20 0.071 7.1%

2 9 0.032 3.2%

Totale 283 1.000 100.0%

(15)

Distribuzioni di frequenze per caratteri quantitativi

In questo caso la rappresentazione grafica

più appropriata è il grafico a bastoncini.

(16)

Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze

Distribuzioni di frequenze per caratteri quantitativi

Se invece il carattere quantitativo discreto assume un numero più elevato di valori diversi, normalmente si usa effettuare la suddivisione in classi.

Numero di trattori

posseduti dall'azienda ni

1 - 5 10

6 - 9 35

10 - 15 13

16 - 19 4

Totale aziende 62

(17)

Distribuzioni di frequenze per caratteri quantitativi

Inevitabilmente il raggruppamento dei

soggetti all’interno delle classi comporta

una perdita di informazione.

(18)

Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze

Distribuzioni di frequenze per caratteri quantitativi

So che 4 aziende hanno un numero di trattori tra 16 e 19, ma non so esattamente quante ne hanno 16, quante 17, ....

Numero di trattori

posseduti dall'azienda ni

1 - 5 10

6 - 9 35

10 - 15 13

16 - 19 4

Totale aziende 62

(19)

Distribuzioni di frequenze per caratteri quantitativi

In questo caso per rappresentare il grafico a bastoncini dobbiamo dapprima scorporare le classi.

Per farlo, poichè non sappiamo come sono distribuiti i soggetti all’interno delle classi, abbiamo bisogno di un’ipotesi semplificatrice.

Ipotizziamo l’uniforme distribuzione dei

soggetti nelle classi.

(20)

Distribuzioni di frequenze per caratteri quantitativi

Numero di trattori

posseduti dall'azienda ni

1 2

2 2

3 2

4 2

5 2

6 8.75

7 8.75

8 8.75

9 8.75

10 2.1667

11 2.1667

12 2.1667

13 2.1667

14 2.1667

15 2.1667

16 1

17 1

18 1

19 1

Totale aziende 62

Freq. assoluta intervallo

Num. modalità in intervallo = 10 5 = 2

(21)

Distribuzioni di frequenze per caratteri quantitativi

Con i caratteri quantitativi continui, generalmente accade che ogni soggetto presenti un valore differente, quindi non ha senso fare una tabella che elenchi tutti i valori rilevati nel dataset.

Bisogna quindi sempre procedere alla

preliminare suddivisione in classi.

(22)

Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze

Distribuzioni di frequenze per caratteri quantitativi

Prendiamo ad esempio il carattere chimico Chim5 (SO

2

totale - mg/l).

SO2 totale (mg/l)

Chim5 79 30 94 75 53 103

49 49 54 . . . .

Salvo piccole

eccezioni, ogni unità

statistica assume un

valore diverso

(23)

Distribuzioni di frequenze per caratteri quantitativi

Gli estremi delle classi vengono definiti dal ricercatore, secondo quelli che sono gli interessi dell’analisi. Poi possono essere modificati. Nel nostro caso supponiamo di essere interessati in prima istanza al raggruppamento

20 |- 40 mg/l 40 |- 80 mg/l 80 |- 100 mg/l 100 |- 120 mg/l 120 |- 150 mg/l

Il simbolo |- indica

quale dei due estremi è

incluso nella classe

(24)

Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze

Distribuzioni di frequenze per caratteri quantitativi

Per ottenere la distribuzione di frequenze del carattere quantitativo continuo Chim5 contiamo dunque quante unità statistiche appartengono a ciascuna classe.

Chim5 ni fi fi%

20 |- 40 mg/l 15 0.053 5.3%

40 |- 80 mg/l 150 0.530 53.0%

80 |- 100 mg/l 76 0.269 26.9%

100 |- 120 mg/l 32 0.113 11.3%

120 |- 150 mg/l 10 0.035 3.5%

Totale 283 1.000 100.0%

(25)

Distribuzioni di frequenze per caratteri quantitativi

Chim5 ni fi fi%

20 |- 40 mg/l 15 0.053 5.3%

40 |- 60 mg/l 59 0.208 20.8%

60 |- 80 mg/l 91 0.322 32.2%

80 |- 100 mg/l 76 0.269 26.9%

100 |- 150 mg/l 42 0.148 14.8%

Totale 283 1.000 100.0%

Se desideriamo maggiori informazioni

riguardo la classe 40 |- 80, che accorpa un

più del 50% dei soggetti, possiamo

decidere di cambiare la suddivisione.

(26)

Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze

Distribuzioni di frequenze per caratteri quantitativi

Chim5 ni fi fi%

20 |- 40 mg/l 15 0.053 5.3%

40 |- 60 mg/l 59 0.208 20.8%

60 |- 80 mg/l 91 0.322 32.2%

80 |- 100 mg/l 76 0.269 26.9%

100 |- 150 mg/l 42 0.148 14.8%

Totale 283 1.000 100.0%

Chim5 ni fi fi%

20 |- 40 mg/l 15 0.053 5.3%

40 |- 80 mg/l 150 0.530 53.0%

80 |- 100 mg/l 76 0.269 26.9%

100 |- 120 mg/l 32 0.113 11.3%

120 |- 150 mg/l 10 0.035 3.5%

Totale 283 1.000 100.0%

(27)

Distribuzioni di frequenze per caratteri quantitativi

La rappresentazione grafica delle distribuzioni di caratteri quantitativi continui raggruppati in classi è l’istogramma.

Per tracciare un istogramma dobbiamo

tenere conto del fatto che le classi possono

avere ampiezza diversa.

(28)

Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze

Distribuzioni di frequenze per caratteri quantitativi

Ad esempio, una classe potrebbe avere una frequenza molto alta non perchè i soggetti sono particolarmente concentrati su quei valori, ma semplicemente perchè è molto ampia.

Una classe meno ampia, a cui fosse

associata la stessa frequenza, avrebbe una

maggiore concentrazione di soggetti al suo

interno.

(29)

Distribuzioni di frequenze per caratteri quantitativi

Quindi sarebbe un errore rappresentare un istogramma utilizzando le frequenze, assolute o relative.

Detta D

i

l’ampiezza della classe i-esima, dobbiamo calcolare le cosiddette frequenze specifiche

i i i

ns n

 D

(30)

Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze

Distribuzioni di frequenze per caratteri quantitativi

Le frequenze specifiche indicano la densità dei soggetti all’interno della classe

Chim5 ni D i nsi

20 | - 40 mg/l 15 20 0.75

40 | - 80 mg/l 150 40 3.75

80 |- 100 mg/l 76 20 3.80

100 | - 120 mg/l 32 20 1.60

120 | - 150 mg/l 10 30 0.33

Totale 283

(31)

Distribuzioni di frequenze per caratteri quantitativi

Le frequenze specifiche indicano la densità dei soggetti all’interno della classe

Chim5 ni D i nsi

20 | - 40 mg/l 15 20 0.75

40 | - 80 mg/l 150 40 3.75

80 |- 100 mg/l 76 20 3.80

100 | - 120 mg/l 32 20 1.60

120 | - 150 mg/l 10 30 0.33

Totale 283

(32)

Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze

Distribuzioni di frequenze per caratteri quantitativi

L’istogramma riporta sull’asse orizzontale i

valori che può assumere il carattere e su

quello verticale le frequenze specifiche.

(33)

Distribuzioni di frequenze per caratteri quantitativi

Chim5 ni Di nsi

20 |- 40 mg/l 15 20 0.75

40 |- 80 mg/l 150 40 3.75

80 |- 100 mg/l 76 20 3.80

100 |- 120 mg/l 32 20 1.60

120 |- 150 mg/l 10 30 0.33

Totale 283

(34)

Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze

Distribuzioni di frequenze per caratteri quantitativi

Attenzione: se non avessimo calcolato le frequenze specifiche avremmo sopravvalutato l’importanza della classe 40 |- 80

!!!!

(35)

Distribuzioni di frequenze

per caratteri quantitativi

(36)

Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze

Distribuzioni di frequenze

per caratteri quantitativi

(37)

Aggiustamento al continuo dei caratteri quantitativi discreti

L’istogramma può essere utilizzato anche per i caratteri quantitativi discreti raggruppati in classi, quando il numero di valori assunti dal carattere è molto elevato.

Numero di bottiglie

vendute al giorno ni

1 - 20 26

21 - 30 211

31 - 40 103

41 - 60 25

Totale giorni 365

(38)

Aggiustamento al continuo dei caratteri quantitativi discreti

In questo caso il diagramma a bastoncini è piuttosto laborioso

Numero di bottiglie vendute al giorno ni

1 1.3

2 1.3

3 1.3

4 1.3

5 1.3

6 1.3

7 1.3

8 1.3

9 1.3

10 1.3

11 1.3

12 1.3

13 1.3

14 1.3

15 1.3

16 1.3

17 1.3

18 1.3

19 1.3

20 1.3

21 21.1

22 21.1

23 21.1

24 21.1

25 21.1

26 21.1

27 21.1

28 21.1

29 21.1

30 21.1

31 10.3

32 10.3

33 10.3

34 10.3

35 10.3

36 10.3

37 10.3

38 10.3

39 10.3

40 10.3

41 1.3

42 1.3

43 1.3

44 1.3

45 1.3

46 1.3

47 1.3

48 1.3

49 1.3

50 1.3

51 1.3

52 1.3

53 1.3

54 1.3

55 1.3

56 1.3

57 1.3

58 1.3

59 1.3

60 1.3

Totale giorni 365

Numero di bottiglie

vendute al giorno ni

1 1.3

2 1.3

3 1.3

4 1.3

5 1.3

6 1.3

. .

. .

. .

56 1.3

57 1.3

58 1.3

59 1.3

60 1.3

Totale giorni 365

(39)

Aggiustamento al continuo dei caratteri quantitativi discreti

In questo caso il diagramma a bastoncini è

piuttosto laborioso

(40)

Aggiustamento al continuo dei caratteri quantitativi discreti

Poichè il carattere ha un gran numero di modalità, possiamo effettuare il cosiddetto

«aggiustamento al continuo», che consiste nel rendere continue le classi del carattere discreto.

Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze

Numero di bottiglie

vendute al giorno ni

1 - 20 26

21 - 30 211

31 - 40 103

41 - 60 25

Totale giorni 365

Numero di bottiglie

vendute al giorno ni

1 |- 21 26

21 |- 31 211

31 |- 41 103

41 |- 61 25

Totale giorni 365

(41)

Aggiustamento al continuo dei caratteri quantitativi discreti

A questo punto possiamo calcolare le

frequenze specifiche e disegnare

l’istogramma, che risulta essere una buona

approssimazione del diagramma a

bastoncini rappresentato prima.

(42)

Aggiustamento al continuo dei caratteri quantitativi discreti

Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze

(43)

Distribuzioni di frequenze

per caratteri quantitativi

(44)

Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze

Distribuzioni di frequenze per caratteri quantitativi

dal Gazzettino di Treviso: Cronaca di Montebelluna Oltre 60 da 41 a 60 da 26 a 40 da 20 a 25 … da 7 a 11 …

Le classi hanno ampiezza diversa !!!!!

Ampiezza: 15 (26 |- 41)

Ampiezza: 5

(7 |- 12)

(45)

Distribuzioni di frequenze

per caratteri quantitativi

(46)

Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze

Distribuzioni di frequenze per caratteri quantitativi

Se le classi hanno tutte la stessa ampiezza, l’istogramma può essere rappresentato indifferentemente utilizzando le frequenze (assolute o relative) o le frequenze specifiche.

In questo caso è lecito utilizzare anche una

rappresentazione alternativa, il poligono di

frequenza.

(47)

Distribuzioni di frequenze per caratteri quantitativi

Esaminiamo il caso del carattere Prezzo.

Prezzo ni

1 |- 3 € 37

3 |- 5 € 100

5 |- 7 € 62

7 |- 9 € 39

9 |- 11 € 15

11 |- 13 € 14

13 |- 15 € 12

15 |- 17 € 3

17 |- 19 € 1

Totale 283

(48)

Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze

Distribuzioni di frequenze per caratteri quantitativi

Possiamo sovrapporre all’istogramma il

poligono di frequenza.

(49)

Distribuzioni di frequenze per caratteri quantitativi

Possiamo sovrapporre all’istogramma il

poligono di frequenza.

(50)

Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze

Distribuzioni di frequenze

per caratteri quantitativi

(51)

Distribuzioni di frequenze per caratteri quantitativi

Se le classi sono di uguale ampiezza, l’area dell’istogramma e quella del poligono di frequenza sono approssimativamente uguali.

Ciò non avviene nel caso di classi di

ampiezza differente. Quindi in questo caso

conviene evitare di utilizzare questa

rappresentazione.

(52)

Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze

Distribuzioni di frequenze per caratteri quantitativi

L’analisi della forma della distribuzione e il confronto tra distribuzioni rilevate in situazioni diverse offrono spesso utili informazioni sul fenomeno considerato.

In queste analisi sono spesso impiegati i concetti di:

• baricentro

• variabilità

• asimmetria

(53)

Distribuzioni di frequenze per caratteri quantitativi

L’analisi della forma della distribuzione e il confronto tra distribuzioni rilevate in situazioni diverse offrono spesso utili informazioni sul fenomeno considerato.

In queste analisi sono spesso impiegati i concetti di:

• baricentro

• variabilità

• asimmetria

(54)

Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze

Distribuzioni di frequenze per caratteri quantitativi

BARICENTRO

Le due distribuzioni

sono «centrate» su

valori differenti

(55)

Distribuzioni di frequenze per caratteri quantitativi

VARIABILITÀ

Una delle due distribuzioni

assume una gamma

di valori più ampia

(56)

Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze

Distribuzioni di frequenze per caratteri quantitativi

SIMMETRIA

Una delle due

distribuzioni è

asimmetrica

(57)

Distribuzioni di frequenze per caratteri quantitativi

Nelle prossime lezioni vedremo che queste caratteristiche, che ora abbiamo compreso intuitivamente da analisi grafiche, possono essere sintetizzate attraverso indici statistici

• baricentro → indici di posizione

• variabilità → indici di variabilità

• asimmetria → indici di simmetria

(58)

Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze

Distribuzioni di

frequenze cumulate

Per i caratteri espressi in scala almeno ordinale (cioè quelli con modalità ordinate:

caratteri qualitativi ordinali e caratteri quantitativi) si possono calcolare le distribuzioni di frequenze cumulate.

 

-  

i

j

j i

i

i n n n n n

N

1 1

2

1 ...

 

-  

i

j

j i

i

i f f f f f

F

1 1

2

1 ...

(59)

Distribuzioni di

frequenze cumulate

Chim5 ni Ni

20 |- 40 mg/l 15 15

40 |- 80 mg/l 150 165 =15 + 150

80 |- 100 mg/l 76 241 =165 + 76

100 |- 120 mg/l 32 273 =241 + 32 120 |- 150 mg/l 10 283 =273 + 10

Totale 283

(60)

Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze

Distribuzioni di

frequenze cumulate

Chim5 ni Ni

20 |- 40 mg/l 15 15

40 |- 80 mg/l 150 165 =15 + 150

80 |- 100 mg/l 76 241 =165 + 76

100 |- 120 mg/l 32 273 =241 + 32 120 |- 150 mg/l 10 283 =273 + 10

Totale 283

(61)

Distribuzioni di

frequenze cumulate

Chim5 fi Fi

20 |- 40 mg/l 0.053 0.053

40 |- 80 mg/l 0.530 0.583 =0.053 + 0.530 80 |- 100 mg/l 0.269 0.852 =0.583 + 0.269 100 |- 120 mg/l 0.113 0.965 =0.852 + 0.113 120 |- 150 mg/l 0.035 1.000 =0.965 + 0.035

Totale 1.000

(62)

Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze

Distribuzioni di

frequenze cumulate

Chim5 fi Fi

20 |- 40 mg/l 0.053 0.053

40 |- 80 mg/l 0.530 0.583 =0.053 + 0.530 80 |- 100 mg/l 0.269 0.852 =0.583 + 0.269 100 |- 120 mg/l 0.113 0.965 =0.852 + 0.113 120 |- 150 mg/l 0.035 1.000 =0.965 + 0.035

Totale 1.000

Fi%

5.3%

58.3%

85.2%

96.5%

100.0%

(63)

Distribuzioni di

frequenze cumulate

La rappresentazione grafica delle frequenze cumulate per un carattere discreto è un diagramma a gradini.

Premi ni fi Fi

0 254 0.898 0.898

1 20 0.071 0.968

2 9 0.032 1.000

Totale 283 1.000

(64)

Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze

Distribuzioni di

frequenze cumulate

Se il carattere discreto è raggruppato in classi, si procede come visto in precedenza, dapprima scorporando la distribuzione.

Numero di trattori

posseduti dall'azienda ni

1 - 5 10

6 - 9 35

10 - 15 13

16 - 19 4

Totale aziende 62

(65)

Distribuzioni di

frequenze cumulate

Numero di trattori

posseduti dall'azienda ni Fi

1 2 0.032258

2 2 0.064516

3 2 0.096774

4 2 0.129032

5 2 0.16129

6 8.75 0.302419

7 8.75 0.443548

8 8.75 0.584677

9 8.75 0.725806

10 2.1667 0.760753

11 2.1667 0.795699

12 2.1667 0.830645

13 2.1667 0.865591

14 2.1667 0.900538

15 2.1667 0.935484

16 1 0.951613

17 1 0.967742

18 1 0.983871

(66)

Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze

Distribuzioni di

frequenze cumulate

Per rappresentare graficamente le frequenze cumulate di un carattere continuo raggruppato i classi prima si disegna un diagramma a gradini, poi i gradini vengono congiunti ad evidenziare l’aumento graduale delle frequenze cumulate all’interno della classe (ipotesi di equispaziatura dei soggetti nelle classi).

L’altezza di ogni gradino è data dalla

frequenza relativa della classe corrispondente.

(67)

Distribuzioni di

frequenze cumulate

Chim5 fi Fi

20 |- 40 mg/l 0.053 0.053 40 |- 80 mg/l 0.530 0.583 80 |- 100 mg/l 0.269 0.852 100 |- 120 mg/l 0.113 0.965 120 |- 150 mg/l 0.035 1.000

Totale 1.000

(68)

Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze

Distribuzioni di

frequenze cumulate

Chim5 fi Fi

20 |- 40 mg/l 0.053 0.053 40 |- 80 mg/l 0.530 0.583 80 |- 100 mg/l 0.269 0.852 100 |- 120 mg/l 0.113 0.965 120 |- 150 mg/l 0.035 1.000

Totale 1.000

f2= 0.530

f3= 0.269

(69)

Distribuzioni di

frequenze cumulate

Utilizzando la distribuzione di frequenze

cumulata, possiamo rispondere a domande

del tipo «Qual è il valore di Chim5 tale per

cui il 40% dei vini ha un valore inferiore ad

esso?».

(70)

Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze

Distribuzioni di

frequenze cumulate

L’unica cosa che sappiamo con certezza è che il valore cercato sta nella classe 40 |- 80. Il punto preciso non lo possiamo conoscere perché non sappiamo come sono distribuiti i valori all’interno della classe.

Chim5 fi Fi

20 |- 40 mg/l 0.053 0.053 40 |- 80 mg/l 0.530 0.583 80 |- 100 mg/l 0.269 0.852 100 |- 120 mg/l 0.113 0.965 120 |- 150 mg/l 0.035 1.000

Totale 1.000

(71)

Distribuzioni di

frequenze cumulate

Però possiamo calcolare un valore approssimato sotto l’ipotesi che le unità siano equispaziate all’interno della classe.

Si utilizza il metodo dell’interpolazione.

Chim5 fi Fi

20 |- 40 mg/l 0.053 0.053 40 |- 80 mg/l 0.530 0.583 80 |- 100 mg/l 0.269 0.852 100 |- 120 mg/l 0.113 0.965 120 |- 150 mg/l 0.035 1.000

Totale 1.000

(72)

Prof.ssa Paola Zuccolotto - Statistica - Medie

Distribuzioni di

frequenze cumulate

40 80

150 unità all’interno della classe

....

Dire che le unità sono equispaziate, significa ipotizzare che le 150 unità si distribuiscano

in modo uniforme nella classe, con

intervallini tutti di uguale ampiezza

(73)

Distribuzioni di

frequenze cumulate

?

(74)

Chim5 fi Fi 20 |- 40 mg/l 0.053 0.053 40 |- 80 mg/l 0.530 0.583 80 |- 100 mg/l 0.269 0.852 100 |- 120 mg/l 0.113 0.965 120 |- 150 mg/l 0.035 1.000

Totale 1.000

Distribuzioni di

frequenze cumulate

Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze

Valore Frequenza cumulata Estremo inferiore della classe

40 0.053

Valore cercato

40 + x 0.4

Estremo superiore della classe

80 0.583

(75)

Distribuzioni di

frequenze cumulate

0.053 0.583

0.4

40 80

x

40+x

(76)

Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze

Distribuzioni di

frequenze cumulate

Valore Frequenza cumulata Estremo inferiore della classe

40 0.053

Valore cercato

40 + x 0.4

Estremo superiore della classe

80 0.583

Impostamo ora una semplice proporzione:

(80-40):(40+x -40)=(0.583-0.053):(0.4-0.053) 40:x=0.530:0.347

   

(77)

Distribuzioni di

frequenze cumulate

Valore Frequenza cumulata Estremo inferiore della classe

40 0.053

Valore cercato

40 + x 0.4

Estremo superiore della classe

80 0.583 x=40∙0.347/0.530

x=26.1887

(78)

Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze

Distribuzioni di

frequenze cumulate

Valore Frequenza cumulata Estremo inferiore della classe

40 0.053

Valore cercato

40 + x 0.4

Estremo superiore della classe

80 0.583 Il valore cercato è pari a

40 + x = 40 + 26.1887 = 66.1887.

(79)

Distribuzioni di

frequenze cumulate

Questo grafico, come è accaduto per

l’istogramma, si può utilizzare anche per i

caratteri discreti, quando presentano un

gran numero di modalità, per evitare di

dover fare un grafico a gradini troppo

laborioso.

(80)

Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze

Distribuzioni di

frequenze cumulate

Numero di bottiglie

vendute al giorno ni

1 - 20 26

21 - 30 211

31 - 40 103

41 - 60 25

Totale giorni 365

Numero di bottiglie

vendute al giorno ni Fi

1 1.3 0.003562

2 1.3 0.007123

3 1.3 0.010685

4 1.3 0.014247

5 1.3 0.017808

6 1.3 0.02137

7 1.3 0.024932

8 1.3 0.028493

9 1.3 0.032055

10 1.3 0.035616

11 1.3 0.039178

12 1.3 0.04274

13 1.3 0.046301

14 1.3 0.049863

15 1.3 0.053425

16 1.3 0.056986

17 1.3 0.060548

18 1.3 0.06411

19 1.3 0.067671

20 1.3 0.071233

21 21.1 0.129041

22 21.1 0.186849

23 21.1 0.244658

24 21.1 0.302466

25 21.1 0.360274

26 21.1 0.418082

27 21.1 0.47589

28 21.1 0.533699

29 21.1 0.591507

30 21.1 0.649315

31 10.3 0.677534

32 10.3 0.705753

33 10.3 0.733973

34 10.3 0.762192

35 10.3 0.790411

36 10.3 0.81863

37 10.3 0.846849

38 10.3 0.875068

39 10.3 0.903288

40 10.3 0.931507

41 1.3 0.934932

42 1.3 0.938356

43 1.3 0.941781

44 1.3 0.945205

45 1.3 0.94863

46 1.3 0.952055

47 1.3 0.955479

48 1.3 0.958904

49 1.3 0.962329

50 1.3 0.965753

51 1.3 0.969178

52 1.3 0.972603

53 1.3 0.976027

54 1.3 0.979452

55 1.3 0.982877

56 1.3 0.986301

57 1.3 0.989726

58 1.3 0.993151

59 1.3 0.996575

60 1.3 1

Totale giorni 365

Numero di bottiglie

vendute al giorno ni Fi

1 1.3 0.003562

2 1.3 0.007123

3 1.3 0.010685

4 1.3 0.014247

5 1.3 0.017808

6 1.3 0.02137

. . .

. . .

. . .

56 1.3 0.986301

57 1.3 0.989726

58 1.3 0.993151

59 1.3 0.996575

60 1.3 1

Totale giorni 365

(81)

Distribuzioni di

frequenze cumulate

(82)

Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze

Distribuzioni di

frequenze cumulate

Numero di bottiglie

vendute al giorno ni

1 - 20 26

21 - 30 211

31 - 40 103

41 - 60 25

Totale giorni 365

Numero di bottiglie

vendute al giorno ni

1 |- 21 26

21 |- 31 211

31 |- 41 103

41 |- 61 25

Totale giorni 365

Per poter utilizzare la tecnica dei caratteri

continui dobbiamo procedere dapprima

all’aggiustamento al continuo del carattere

discreto.

(83)

Distribuzioni di

frequenze cumulate

Numero di bottiglie

vendute al giorno ni Fi

1 |- 21 26 0.0712

21 |- 31 211 0.6493

31 |- 41 103 0.9315

41 |- 61 25 1

Totale giorni 365

Riferimenti

Documenti correlati

"Fu così che cominciai a capire che non si parla solamente per parlare, per dire ‘ho fatto questo’ ‘ho fatto quello’ ‘ho mangiato e bevuto’, ma si parla per

Come tale il metodo FREQUENZE ARMONICHE si pone come riequilibrio delle funzioni del tronco encefalico nelle disfunzioni funzionale ed organica.. Antonio Librale,

La tecnica consiste nel provocare l’abbassamento immediato del livello piezometrico per mezzo della rimozione veloce di un certo volume da un pozzo di studio e nel registrare

In corrispondenza del ponte (triangolo rosso), posto in località San Martino, esiste una stazione di misura delle portate. Sarà quindi possibile usare il metodo di stima

- il diagramma corrisponde al numero di dati ricadenti in ciascuna classe diviso per n (stima della densità di probabilità delle x).. Sovrapporre al diagramma delle

tuzionalizzati nelle RSA lombarde, con età assimilata a quella della domanda stimata (dati forniti in Regione Lombardia, 2001), le tavole italiane di sopravvivenza (1992),

Al corso di nuoto organizzato per il mese di luglio nella piscina di Gaggio Montano si sono iscritti 25 ragazzi. c) Calcola la media aritmetica, trova la moda e la mediana dei dati.

[r]