3
Distribuzioni di frequenze
Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze
Distribuzioni di frequenze
La distribuzione di frequenze di un carattere è una tabella che mostra in modo efficace e sintetico i risultati delle operazioni di classificazione e conteggio delle unità della popolazione.
A seconda del tipo di carattere, se ne
possono effettuare diverse elaborazioni e
rappresentazioni.
Distribuzioni di frequenze per caratteri qualitativi
Se il carattere analizzato è qualitativo, solitamente è semplice elencare le modalità che esso assume nel collettivo di riferimento e quindi contare quante unità statistiche presentano ciascuna modalità.
Otteniamo in questo modo la
distribuzione di frequenze assolute.
Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze
Distribuzioni di frequenze per caratteri qualitativi
Carattere A Frequenze assolute
a
1n
1... ...
a
in
i... ...
a
pn
pTotale N
p
1
i
n
iN
Distribuzioni di frequenze per caratteri qualitativi
p
1
i
n
iN
Zona ni
DOC 169
DOCG 49
IGT 65
Totale 283
Facendo riferimento al nostro dataset di
283 vini, abbiamo la seguente
distribuzione di frequenze assolute del
carattere Zona.
Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze
Distribuzioni di frequenze per caratteri qualitativi
Per mettere in evidenza il “peso” della singola modalità sul totale possiamo calcolare la distribuzione di frequenze relative, dividendo ciascuna frequenza assoluta per il totale.
p1
i i
i i
f 1
N
f n
Distribuzioni di frequenze per caratteri qualitativi
Carattere A Frequenze
assolute Frequenze relative
a
1n
1f
1=n
1/N
... ... ...
a
in
if
i=n
i/N
... ... ...
a
pn
pf
p=n
p/N
Totale N 1
Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze
Distribuzioni di frequenze per caratteri qualitativi
Moltiplicando le frequenze relative per 100 si ottiene la distribuzione di frequenze percentuali.
Zona ni fi fi%
DOC 169 0.597 59.7%
DOCG 49 0.173 17.3%
IGT 65 0.230 23.0%
Totale 283 1.000 100.0%
Distribuzioni di frequenze per caratteri qualitativi
• Le distribuzioni di frequenze percentuali risultano di facile interpretazione.
• Possono essere sempre calcolate, purchè N sia sufficientemente elevato (con N molto basso, potrebbe non avere molto senso...).
• E’ obbligatorio utilizzarle se si vogliono
fare confronti tra collettivi di diversa
numerosità.
Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze
Distribuzioni di frequenze per caratteri qualitativi
Supponiamo ad esempio di voler confrontare la distribuzione delle zone di produzione dei vini di Veneto e Toscana.
Il confronto non è immediato perchè tra i nostri 283 vini ve ne sono 47 provenienti dalla Toscana e solo 26 dal Veneto.
Zona Toscana Veneto
DOC 8 16
DOCG 30 0
IGT 9 10
Totale 47 26
Distribuzioni di frequenze per caratteri qualitativi
Però con le frequenze percentuali possiamo ottenere l’informazione cercata.
Zona Toscana Veneto Toscana Veneto
DOC 8 16 17,0% 61,5%
DOCG 30 0 63,8% 0,0%
IGT 9 10 19,1% 38,5%
Totale 47 26 100,0% 100,0%
Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze
Distribuzioni di frequenze per caratteri qualitativi
Le distribuzioni di frequenze si possono
sintetizzare graficamente utilizzando
grafici a torta o grafici a barre.
Distribuzioni di frequenze per caratteri qualitativi
Le distribuzioni di frequenze si possono sintetizzare graficamente utilizzando grafici a torta o grafici a barre.
17,0%
61,5%
63,8% 19,1%
38,5%
0% 20% 40% 60% 80% 100%
Toscana Veneto
DOC DOCG IGT
Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze
Distribuzioni di frequenze per caratteri quantitativi
Per i caratteri quantitativi discreti, se il carattere assume un numero limitato di valori diversi, si possono ripetere le stesse considerazioni fatte per i caratteri qualitativi.
Premi ni fi fi%
0 254 0.898 89.8%
1 20 0.071 7.1%
2 9 0.032 3.2%
Totale 283 1.000 100.0%
Distribuzioni di frequenze per caratteri quantitativi
In questo caso la rappresentazione grafica
più appropriata è il grafico a bastoncini.
Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze
Distribuzioni di frequenze per caratteri quantitativi
Se invece il carattere quantitativo discreto assume un numero più elevato di valori diversi, normalmente si usa effettuare la suddivisione in classi.
Numero di trattori
posseduti dall'azienda ni
1 - 5 10
6 - 9 35
10 - 15 13
16 - 19 4
Totale aziende 62
Distribuzioni di frequenze per caratteri quantitativi
Inevitabilmente il raggruppamento dei
soggetti all’interno delle classi comporta
una perdita di informazione.
Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze
Distribuzioni di frequenze per caratteri quantitativi
So che 4 aziende hanno un numero di trattori tra 16 e 19, ma non so esattamente quante ne hanno 16, quante 17, ....
Numero di trattori
posseduti dall'azienda ni
1 - 5 10
6 - 9 35
10 - 15 13
16 - 19 4
Totale aziende 62
Distribuzioni di frequenze per caratteri quantitativi
In questo caso per rappresentare il grafico a bastoncini dobbiamo dapprima scorporare le classi.
Per farlo, poichè non sappiamo come sono distribuiti i soggetti all’interno delle classi, abbiamo bisogno di un’ipotesi semplificatrice.
Ipotizziamo l’uniforme distribuzione dei
soggetti nelle classi.
Distribuzioni di frequenze per caratteri quantitativi
Numero di trattori
posseduti dall'azienda ni
1 2
2 2
3 2
4 2
5 2
6 8.75
7 8.75
8 8.75
9 8.75
10 2.1667
11 2.1667
12 2.1667
13 2.1667
14 2.1667
15 2.1667
16 1
17 1
18 1
19 1
Totale aziende 62
Freq. assoluta intervallo
Num. modalità in intervallo = 10 5 = 2
Distribuzioni di frequenze per caratteri quantitativi
Con i caratteri quantitativi continui, generalmente accade che ogni soggetto presenti un valore differente, quindi non ha senso fare una tabella che elenchi tutti i valori rilevati nel dataset.
Bisogna quindi sempre procedere alla
preliminare suddivisione in classi.
Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze
Distribuzioni di frequenze per caratteri quantitativi
Prendiamo ad esempio il carattere chimico Chim5 (SO
2totale - mg/l).
SO2 totale (mg/l)
Chim5 79 30 94 75 53 103
49 49 54 . . . .
Salvo piccole
eccezioni, ogni unità
statistica assume un
valore diverso
Distribuzioni di frequenze per caratteri quantitativi
Gli estremi delle classi vengono definiti dal ricercatore, secondo quelli che sono gli interessi dell’analisi. Poi possono essere modificati. Nel nostro caso supponiamo di essere interessati in prima istanza al raggruppamento
20 |- 40 mg/l 40 |- 80 mg/l 80 |- 100 mg/l 100 |- 120 mg/l 120 |- 150 mg/l
Il simbolo |- indica
quale dei due estremi è
incluso nella classe
Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze
Distribuzioni di frequenze per caratteri quantitativi
Per ottenere la distribuzione di frequenze del carattere quantitativo continuo Chim5 contiamo dunque quante unità statistiche appartengono a ciascuna classe.
Chim5 ni fi fi%
20 |- 40 mg/l 15 0.053 5.3%
40 |- 80 mg/l 150 0.530 53.0%
80 |- 100 mg/l 76 0.269 26.9%
100 |- 120 mg/l 32 0.113 11.3%
120 |- 150 mg/l 10 0.035 3.5%
Totale 283 1.000 100.0%
Distribuzioni di frequenze per caratteri quantitativi
Chim5 ni fi fi%
20 |- 40 mg/l 15 0.053 5.3%
40 |- 60 mg/l 59 0.208 20.8%
60 |- 80 mg/l 91 0.322 32.2%
80 |- 100 mg/l 76 0.269 26.9%
100 |- 150 mg/l 42 0.148 14.8%
Totale 283 1.000 100.0%
Se desideriamo maggiori informazioni
riguardo la classe 40 |- 80, che accorpa un
più del 50% dei soggetti, possiamo
decidere di cambiare la suddivisione.
Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze
Distribuzioni di frequenze per caratteri quantitativi
Chim5 ni fi fi%
20 |- 40 mg/l 15 0.053 5.3%
40 |- 60 mg/l 59 0.208 20.8%
60 |- 80 mg/l 91 0.322 32.2%
80 |- 100 mg/l 76 0.269 26.9%
100 |- 150 mg/l 42 0.148 14.8%
Totale 283 1.000 100.0%
Chim5 ni fi fi%
20 |- 40 mg/l 15 0.053 5.3%
40 |- 80 mg/l 150 0.530 53.0%
80 |- 100 mg/l 76 0.269 26.9%
100 |- 120 mg/l 32 0.113 11.3%
120 |- 150 mg/l 10 0.035 3.5%
Totale 283 1.000 100.0%
Distribuzioni di frequenze per caratteri quantitativi
La rappresentazione grafica delle distribuzioni di caratteri quantitativi continui raggruppati in classi è l’istogramma.
Per tracciare un istogramma dobbiamo
tenere conto del fatto che le classi possono
avere ampiezza diversa.
Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze
Distribuzioni di frequenze per caratteri quantitativi
Ad esempio, una classe potrebbe avere una frequenza molto alta non perchè i soggetti sono particolarmente concentrati su quei valori, ma semplicemente perchè è molto ampia.
Una classe meno ampia, a cui fosse
associata la stessa frequenza, avrebbe una
maggiore concentrazione di soggetti al suo
interno.
Distribuzioni di frequenze per caratteri quantitativi
Quindi sarebbe un errore rappresentare un istogramma utilizzando le frequenze, assolute o relative.
Detta D
il’ampiezza della classe i-esima, dobbiamo calcolare le cosiddette frequenze specifiche
i i i
ns n
D
Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze
Distribuzioni di frequenze per caratteri quantitativi
Le frequenze specifiche indicano la densità dei soggetti all’interno della classe
Chim5 ni D i nsi
20 | - 40 mg/l 15 20 0.75
40 | - 80 mg/l 150 40 3.75
80 |- 100 mg/l 76 20 3.80
100 | - 120 mg/l 32 20 1.60
120 | - 150 mg/l 10 30 0.33
Totale 283
Distribuzioni di frequenze per caratteri quantitativi
Le frequenze specifiche indicano la densità dei soggetti all’interno della classe
Chim5 ni D i nsi
20 | - 40 mg/l 15 20 0.75
40 | - 80 mg/l 150 40 3.75
80 |- 100 mg/l 76 20 3.80
100 | - 120 mg/l 32 20 1.60
120 | - 150 mg/l 10 30 0.33
Totale 283
Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze
Distribuzioni di frequenze per caratteri quantitativi
L’istogramma riporta sull’asse orizzontale i
valori che può assumere il carattere e su
quello verticale le frequenze specifiche.
Distribuzioni di frequenze per caratteri quantitativi
Chim5 ni Di nsi
20 |- 40 mg/l 15 20 0.75
40 |- 80 mg/l 150 40 3.75
80 |- 100 mg/l 76 20 3.80
100 |- 120 mg/l 32 20 1.60
120 |- 150 mg/l 10 30 0.33
Totale 283
Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze
Distribuzioni di frequenze per caratteri quantitativi
Attenzione: se non avessimo calcolato le frequenze specifiche avremmo sopravvalutato l’importanza della classe 40 |- 80
!!!!
Distribuzioni di frequenze
per caratteri quantitativi
Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze
Distribuzioni di frequenze
per caratteri quantitativi
Aggiustamento al continuo dei caratteri quantitativi discreti
L’istogramma può essere utilizzato anche per i caratteri quantitativi discreti raggruppati in classi, quando il numero di valori assunti dal carattere è molto elevato.
Numero di bottiglie
vendute al giorno ni
1 - 20 26
21 - 30 211
31 - 40 103
41 - 60 25
Totale giorni 365
Aggiustamento al continuo dei caratteri quantitativi discreti
In questo caso il diagramma a bastoncini è piuttosto laborioso
Numero di bottiglie vendute al giorno ni
1 1.3
2 1.3
3 1.3
4 1.3
5 1.3
6 1.3
7 1.3
8 1.3
9 1.3
10 1.3
11 1.3
12 1.3
13 1.3
14 1.3
15 1.3
16 1.3
17 1.3
18 1.3
19 1.3
20 1.3
21 21.1
22 21.1
23 21.1
24 21.1
25 21.1
26 21.1
27 21.1
28 21.1
29 21.1
30 21.1
31 10.3
32 10.3
33 10.3
34 10.3
35 10.3
36 10.3
37 10.3
38 10.3
39 10.3
40 10.3
41 1.3
42 1.3
43 1.3
44 1.3
45 1.3
46 1.3
47 1.3
48 1.3
49 1.3
50 1.3
51 1.3
52 1.3
53 1.3
54 1.3
55 1.3
56 1.3
57 1.3
58 1.3
59 1.3
60 1.3
Totale giorni 365
Numero di bottiglie
vendute al giorno ni
1 1.3
2 1.3
3 1.3
4 1.3
5 1.3
6 1.3
. .
. .
. .
56 1.3
57 1.3
58 1.3
59 1.3
60 1.3
Totale giorni 365
Aggiustamento al continuo dei caratteri quantitativi discreti
In questo caso il diagramma a bastoncini è
piuttosto laborioso
Aggiustamento al continuo dei caratteri quantitativi discreti
Poichè il carattere ha un gran numero di modalità, possiamo effettuare il cosiddetto
«aggiustamento al continuo», che consiste nel rendere continue le classi del carattere discreto.
Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze
Numero di bottiglie
vendute al giorno ni
1 - 20 26
21 - 30 211
31 - 40 103
41 - 60 25
Totale giorni 365
Numero di bottiglie
vendute al giorno ni
1 |- 21 26
21 |- 31 211
31 |- 41 103
41 |- 61 25
Totale giorni 365
Aggiustamento al continuo dei caratteri quantitativi discreti
A questo punto possiamo calcolare le
frequenze specifiche e disegnare
l’istogramma, che risulta essere una buona
approssimazione del diagramma a
bastoncini rappresentato prima.
Aggiustamento al continuo dei caratteri quantitativi discreti
Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze
Distribuzioni di frequenze
per caratteri quantitativi
Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze
Distribuzioni di frequenze per caratteri quantitativi
dal Gazzettino di Treviso: Cronaca di Montebelluna Oltre 60 da 41 a 60 da 26 a 40 da 20 a 25 … da 7 a 11 …
Le classi hanno ampiezza diversa !!!!!
Ampiezza: 15 (26 |- 41)
Ampiezza: 5
(7 |- 12)
Distribuzioni di frequenze
per caratteri quantitativi
Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze
Distribuzioni di frequenze per caratteri quantitativi
Se le classi hanno tutte la stessa ampiezza, l’istogramma può essere rappresentato indifferentemente utilizzando le frequenze (assolute o relative) o le frequenze specifiche.
In questo caso è lecito utilizzare anche una
rappresentazione alternativa, il poligono di
frequenza.
Distribuzioni di frequenze per caratteri quantitativi
Esaminiamo il caso del carattere Prezzo.
Prezzo ni
1 |- 3 € 37
3 |- 5 € 100
5 |- 7 € 62
7 |- 9 € 39
9 |- 11 € 15
11 |- 13 € 14
13 |- 15 € 12
15 |- 17 € 3
17 |- 19 € 1
Totale 283
Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze
Distribuzioni di frequenze per caratteri quantitativi
Possiamo sovrapporre all’istogramma il
poligono di frequenza.
Distribuzioni di frequenze per caratteri quantitativi
Possiamo sovrapporre all’istogramma il
poligono di frequenza.
Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze
Distribuzioni di frequenze
per caratteri quantitativi
Distribuzioni di frequenze per caratteri quantitativi
Se le classi sono di uguale ampiezza, l’area dell’istogramma e quella del poligono di frequenza sono approssimativamente uguali.
Ciò non avviene nel caso di classi di
ampiezza differente. Quindi in questo caso
conviene evitare di utilizzare questa
rappresentazione.
Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze
Distribuzioni di frequenze per caratteri quantitativi
L’analisi della forma della distribuzione e il confronto tra distribuzioni rilevate in situazioni diverse offrono spesso utili informazioni sul fenomeno considerato.
In queste analisi sono spesso impiegati i concetti di:
• baricentro
• variabilità
• asimmetria
Distribuzioni di frequenze per caratteri quantitativi
L’analisi della forma della distribuzione e il confronto tra distribuzioni rilevate in situazioni diverse offrono spesso utili informazioni sul fenomeno considerato.
In queste analisi sono spesso impiegati i concetti di:
• baricentro
• variabilità
• asimmetria
Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze
Distribuzioni di frequenze per caratteri quantitativi
BARICENTRO
Le due distribuzioni
sono «centrate» su
valori differenti
Distribuzioni di frequenze per caratteri quantitativi
VARIABILITÀ
Una delle due distribuzioni
assume una gamma
di valori più ampia
Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze
Distribuzioni di frequenze per caratteri quantitativi
SIMMETRIA
Una delle due
distribuzioni è
asimmetrica
Distribuzioni di frequenze per caratteri quantitativi
Nelle prossime lezioni vedremo che queste caratteristiche, che ora abbiamo compreso intuitivamente da analisi grafiche, possono essere sintetizzate attraverso indici statistici
• baricentro → indici di posizione
• variabilità → indici di variabilità
• asimmetria → indici di simmetria
Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze
Distribuzioni di
frequenze cumulate
Per i caratteri espressi in scala almeno ordinale (cioè quelli con modalità ordinate:
caratteri qualitativi ordinali e caratteri quantitativi) si possono calcolare le distribuzioni di frequenze cumulate.
-
i
j
j i
i
i n n n n n
N
1 1
2
1 ...
-
i
j
j i
i
i f f f f f
F
1 1
2
1 ...
Distribuzioni di
frequenze cumulate
Chim5 ni Ni
20 |- 40 mg/l 15 15
40 |- 80 mg/l 150 165 =15 + 150
80 |- 100 mg/l 76 241 =165 + 76
100 |- 120 mg/l 32 273 =241 + 32 120 |- 150 mg/l 10 283 =273 + 10
Totale 283
Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze
Distribuzioni di
frequenze cumulate
Chim5 ni Ni
20 |- 40 mg/l 15 15
40 |- 80 mg/l 150 165 =15 + 150
80 |- 100 mg/l 76 241 =165 + 76
100 |- 120 mg/l 32 273 =241 + 32 120 |- 150 mg/l 10 283 =273 + 10
Totale 283
Distribuzioni di
frequenze cumulate
Chim5 fi Fi
20 |- 40 mg/l 0.053 0.053
40 |- 80 mg/l 0.530 0.583 =0.053 + 0.530 80 |- 100 mg/l 0.269 0.852 =0.583 + 0.269 100 |- 120 mg/l 0.113 0.965 =0.852 + 0.113 120 |- 150 mg/l 0.035 1.000 =0.965 + 0.035
Totale 1.000
Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze
Distribuzioni di
frequenze cumulate
Chim5 fi Fi
20 |- 40 mg/l 0.053 0.053
40 |- 80 mg/l 0.530 0.583 =0.053 + 0.530 80 |- 100 mg/l 0.269 0.852 =0.583 + 0.269 100 |- 120 mg/l 0.113 0.965 =0.852 + 0.113 120 |- 150 mg/l 0.035 1.000 =0.965 + 0.035
Totale 1.000
Fi%
5.3%
58.3%
85.2%
96.5%
100.0%
Distribuzioni di
frequenze cumulate
La rappresentazione grafica delle frequenze cumulate per un carattere discreto è un diagramma a gradini.
Premi ni fi Fi
0 254 0.898 0.898
1 20 0.071 0.968
2 9 0.032 1.000
Totale 283 1.000
Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze
Distribuzioni di
frequenze cumulate
Se il carattere discreto è raggruppato in classi, si procede come visto in precedenza, dapprima scorporando la distribuzione.
Numero di trattori
posseduti dall'azienda ni
1 - 5 10
6 - 9 35
10 - 15 13
16 - 19 4
Totale aziende 62
Distribuzioni di
frequenze cumulate
Numero di trattori
posseduti dall'azienda ni Fi
1 2 0.032258
2 2 0.064516
3 2 0.096774
4 2 0.129032
5 2 0.16129
6 8.75 0.302419
7 8.75 0.443548
8 8.75 0.584677
9 8.75 0.725806
10 2.1667 0.760753
11 2.1667 0.795699
12 2.1667 0.830645
13 2.1667 0.865591
14 2.1667 0.900538
15 2.1667 0.935484
16 1 0.951613
17 1 0.967742
18 1 0.983871
Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze
Distribuzioni di
frequenze cumulate
Per rappresentare graficamente le frequenze cumulate di un carattere continuo raggruppato i classi prima si disegna un diagramma a gradini, poi i gradini vengono congiunti ad evidenziare l’aumento graduale delle frequenze cumulate all’interno della classe (ipotesi di equispaziatura dei soggetti nelle classi).
L’altezza di ogni gradino è data dalla
frequenza relativa della classe corrispondente.
Distribuzioni di
frequenze cumulate
Chim5 fi Fi
20 |- 40 mg/l 0.053 0.053 40 |- 80 mg/l 0.530 0.583 80 |- 100 mg/l 0.269 0.852 100 |- 120 mg/l 0.113 0.965 120 |- 150 mg/l 0.035 1.000
Totale 1.000
Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze
Distribuzioni di
frequenze cumulate
Chim5 fi Fi
20 |- 40 mg/l 0.053 0.053 40 |- 80 mg/l 0.530 0.583 80 |- 100 mg/l 0.269 0.852 100 |- 120 mg/l 0.113 0.965 120 |- 150 mg/l 0.035 1.000
Totale 1.000
f2= 0.530
f3= 0.269
Distribuzioni di
frequenze cumulate
Utilizzando la distribuzione di frequenze
cumulata, possiamo rispondere a domande
del tipo «Qual è il valore di Chim5 tale per
cui il 40% dei vini ha un valore inferiore ad
esso?».
Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze
Distribuzioni di
frequenze cumulate
L’unica cosa che sappiamo con certezza è che il valore cercato sta nella classe 40 |- 80. Il punto preciso non lo possiamo conoscere perché non sappiamo come sono distribuiti i valori all’interno della classe.
Chim5 fi Fi
20 |- 40 mg/l 0.053 0.053 40 |- 80 mg/l 0.530 0.583 80 |- 100 mg/l 0.269 0.852 100 |- 120 mg/l 0.113 0.965 120 |- 150 mg/l 0.035 1.000
Totale 1.000
Distribuzioni di
frequenze cumulate
Però possiamo calcolare un valore approssimato sotto l’ipotesi che le unità siano equispaziate all’interno della classe.
Si utilizza il metodo dell’interpolazione.
Chim5 fi Fi
20 |- 40 mg/l 0.053 0.053 40 |- 80 mg/l 0.530 0.583 80 |- 100 mg/l 0.269 0.852 100 |- 120 mg/l 0.113 0.965 120 |- 150 mg/l 0.035 1.000
Totale 1.000
Prof.ssa Paola Zuccolotto - Statistica - Medie
Distribuzioni di
frequenze cumulate
40 80
150 unità all’interno della classe
....
Dire che le unità sono equispaziate, significa ipotizzare che le 150 unità si distribuiscano
in modo uniforme nella classe, con
intervallini tutti di uguale ampiezza
Distribuzioni di
frequenze cumulate
?
Chim5 fi Fi 20 |- 40 mg/l 0.053 0.053 40 |- 80 mg/l 0.530 0.583 80 |- 100 mg/l 0.269 0.852 100 |- 120 mg/l 0.113 0.965 120 |- 150 mg/l 0.035 1.000
Totale 1.000
Distribuzioni di
frequenze cumulate
Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze
Valore Frequenza cumulata Estremo inferiore della classe
40 0.053
Valore cercato
40 + x 0.4
Estremo superiore della classe
80 0.583
Distribuzioni di
frequenze cumulate
0.053 0.583
0.4
40 80
x
40+x
Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze
Distribuzioni di
frequenze cumulate
Valore Frequenza cumulata Estremo inferiore della classe
40 0.053
Valore cercato
40 + x 0.4
Estremo superiore della classe
80 0.583
Impostamo ora una semplice proporzione:
(80-40):(40+x -40)=(0.583-0.053):(0.4-0.053) 40:x=0.530:0.347
Distribuzioni di
frequenze cumulate
Valore Frequenza cumulata Estremo inferiore della classe
40 0.053
Valore cercato
40 + x 0.4
Estremo superiore della classe
80 0.583 x=40∙0.347/0.530
x=26.1887
Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze
Distribuzioni di
frequenze cumulate
Valore Frequenza cumulata Estremo inferiore della classe
40 0.053
Valore cercato
40 + x 0.4
Estremo superiore della classe
80 0.583 Il valore cercato è pari a
40 + x = 40 + 26.1887 = 66.1887.
Distribuzioni di
frequenze cumulate
Questo grafico, come è accaduto per
l’istogramma, si può utilizzare anche per i
caratteri discreti, quando presentano un
gran numero di modalità, per evitare di
dover fare un grafico a gradini troppo
laborioso.
Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze
Distribuzioni di
frequenze cumulate
Numero di bottiglie
vendute al giorno ni
1 - 20 26
21 - 30 211
31 - 40 103
41 - 60 25
Totale giorni 365
Numero di bottiglie
vendute al giorno ni Fi
1 1.3 0.003562
2 1.3 0.007123
3 1.3 0.010685
4 1.3 0.014247
5 1.3 0.017808
6 1.3 0.02137
7 1.3 0.024932
8 1.3 0.028493
9 1.3 0.032055
10 1.3 0.035616
11 1.3 0.039178
12 1.3 0.04274
13 1.3 0.046301
14 1.3 0.049863
15 1.3 0.053425
16 1.3 0.056986
17 1.3 0.060548
18 1.3 0.06411
19 1.3 0.067671
20 1.3 0.071233
21 21.1 0.129041
22 21.1 0.186849
23 21.1 0.244658
24 21.1 0.302466
25 21.1 0.360274
26 21.1 0.418082
27 21.1 0.47589
28 21.1 0.533699
29 21.1 0.591507
30 21.1 0.649315
31 10.3 0.677534
32 10.3 0.705753
33 10.3 0.733973
34 10.3 0.762192
35 10.3 0.790411
36 10.3 0.81863
37 10.3 0.846849
38 10.3 0.875068
39 10.3 0.903288
40 10.3 0.931507
41 1.3 0.934932
42 1.3 0.938356
43 1.3 0.941781
44 1.3 0.945205
45 1.3 0.94863
46 1.3 0.952055
47 1.3 0.955479
48 1.3 0.958904
49 1.3 0.962329
50 1.3 0.965753
51 1.3 0.969178
52 1.3 0.972603
53 1.3 0.976027
54 1.3 0.979452
55 1.3 0.982877
56 1.3 0.986301
57 1.3 0.989726
58 1.3 0.993151
59 1.3 0.996575
60 1.3 1
Totale giorni 365
Numero di bottiglie
vendute al giorno ni Fi
1 1.3 0.003562
2 1.3 0.007123
3 1.3 0.010685
4 1.3 0.014247
5 1.3 0.017808
6 1.3 0.02137
. . .
. . .
. . .
56 1.3 0.986301
57 1.3 0.989726
58 1.3 0.993151
59 1.3 0.996575
60 1.3 1
Totale giorni 365
Distribuzioni di
frequenze cumulate
Prof.ssa Paola Zuccolotto - Statistica - Distribuzioni di frequenze
Distribuzioni di
frequenze cumulate
Numero di bottiglie
vendute al giorno ni
1 - 20 26
21 - 30 211
31 - 40 103
41 - 60 25
Totale giorni 365
Numero di bottiglie
vendute al giorno ni
1 |- 21 26
21 |- 31 211
31 |- 41 103
41 |- 61 25
Totale giorni 365
Per poter utilizzare la tecnica dei caratteri
continui dobbiamo procedere dapprima
all’aggiustamento al continuo del carattere
discreto.
Distribuzioni di
frequenze cumulate
Numero di bottiglie
vendute al giorno ni Fi
1 |- 21 26 0.0712
21 |- 31 211 0.6493
31 |- 41 103 0.9315
41 |- 61 25 1
Totale giorni 365