• Non ci sono risultati.

ESPLORAZIONE DEI DATI (parte 2)

N/A
N/A
Protected

Academic year: 2022

Condividi "ESPLORAZIONE DEI DATI (parte 2)"

Copied!
32
0
0

Testo completo

(1)

ESPLORAZIONE DEI DATI (parte 2)

(2)

Distribuzione in classi: variabili quantitative

Nel caso di variabili numeriche continue, per costruire la distribuzione di frequenza, o distribuzione in classi, abbi- amo bisogno di individuare delle classi, ossia degli inter- valli di valori.

Per costruire una tabella di frequenza per variabili quanti- tative dunque:

• Suddividiamo l’intervallo di variazione della variabile in sottointervalli (classi)

• Contiamo il numero di osservazioni che cadono all’interno di ogni intervallo

(3)

Distribuzione in classi: variabili quantitative

Nel caso di variabili numeriche continue, per costruire la distribuzione di frequenza, o distribuzione in classi, abbi- amo bisogno di individuare delle classi, ossia degli inter- valli di valori.

Per costruire una tabella di frequenza per variabili quanti- tative dunque:

• Suddividiamo l’intervallo di variazione della variabile in sottointervalli (classi)

• Contiamo il numero di osservazioni che cadono all’interno di ogni intervallo

(4)

Distribuzione in classi: variabili quantitative

Nel caso di variabili numeriche continue, per costruire la distribuzione di frequenza, o distribuzione in classi, abbi- amo bisogno di individuare delle classi, ossia degli inter- valli di valori.

Per costruire una tabella di frequenza per variabili quanti- tative dunque:

• Suddividiamo l’intervallo di variazione della variabile in sottointervalli (classi)

• Contiamo il numero di osservazioni che cadono all’interno di ogni intervallo

(5)

Distribuzione in classi: variabili quantitative

Nel caso di variabili numeriche continue, per costruire la distribuzione di frequenza, o distribuzione in classi, abbi- amo bisogno di individuare delle classi, ossia degli inter- valli di valori.

Per costruire una tabella di frequenza per variabili quanti- tative dunque:

• Suddividiamo l’intervallo di variazione della variabile in sottointervalli (classi)

• Contiamo il numero di osservazioni che cadono all’interno di ogni intervallo

(6)

Distribuzione in classi

Contenuto sodio ni fi pi

[0, 39] 1 0.056 5.6%

[40, 79] 2 0.11 11%

[80, 119] 1 0.056 5.6%

[120, 159] 4 0.222 22.2%

[160, 199] 5 0.278 27.8%

[200, 239] 5 0.278 27.8%

Totale 18 1 100

Table:Distribuzione in classi per il contenuto in sodio in 18

(7)

Distribuzione in classi:esercizio

Le seguenti quantità rappresentano, in parti per milione (ppm), la componente di nitrogeno rilevata in 60 campioni di terreno.

3.6 3.2 3.3 3.6 2.7 3.4 4.5 3.3 2.8 5.4 6.1 3.4 2.9 2.7 4.1 4.7 5.1 4.7 3.2 3.6 5.1 2.6 3.6 3.8 3.8 3.1 3.7 5.5 3.2 3.7 4.2 4.5 4.3 3.7 3.6 3.9 3.5 4.4 2.8 3.3 3.9 4.4 5.1 4.6 3.4 2.6 4.5 3.1 2.5 3.1 3.7 3.4 4.1 2.7 5.7 3.5 4.7 4.4 4.4 5.0

(8)

Grafici: variabili quantitative

Nel caso di variabili numeriche per costruire la distribuzione di frequenza, o distribuzione in classi, abbiamo bisogno di individuare delle classi, ossia degli intervalli di valori.

Per costruire una tabella di frequenza per variabili quanti- tative dunque:

Istogramma: è un grafico che utilizza dei rettangoli per visualizzare graficamente le frequenze assolute o le frequenze relative di una variabile quentitativa continua.

Boxplot: è un grafico che permette di rappresentare la forma della distribuzione dei dati.

(9)

Grafici: variabili quantitative

Nel caso di variabili numeriche per costruire la distribuzione di frequenza, o distribuzione in classi, abbiamo bisogno di individuare delle classi, ossia degli intervalli di valori.

Per costruire una tabella di frequenza per variabili quanti- tative dunque:

Istogramma: è un grafico che utilizza dei rettangoli per visualizzare graficamente le frequenze assolute o le frequenze relative di una variabile quentitativa continua.

Boxplot: è un grafico che permette di rappresentare la forma della distribuzione dei dati.

(10)

Grafici: variabili quantitative

Nel caso di variabili numeriche per costruire la distribuzione di frequenza, o distribuzione in classi, abbiamo bisogno di individuare delle classi, ossia degli intervalli di valori.

Per costruire una tabella di frequenza per variabili quanti- tative dunque:

Istogramma: è un grafico che utilizza dei rettangoli per visualizzare graficamente le frequenze assolute o le frequenze relative di una variabile quentitativa continua.

Boxplot: è un grafico che permette di rappresentare la forma della distribuzione dei dati.

(11)

Grafici: variabili quantitative

Nel caso di variabili numeriche per costruire la distribuzione di frequenza, o distribuzione in classi, abbiamo bisogno di individuare delle classi, ossia degli intervalli di valori.

Per costruire una tabella di frequenza per variabili quanti- tative dunque:

Istogramma: è un grafico che utilizza dei rettangoli per visualizzare graficamente le frequenze assolute o le frequenze relative di una variabile quentitativa continua.

Boxplot: è un grafico che permette di rappresentare la forma della distribuzione dei dati.

(12)

Istogramma

(13)

Costruire un istogramma

• Dividi l’intervallo dei valori osservati in sottointervalli di uguale ampiezza.

• Costruisci la tabella delle frequenze per classi.

• Sull’asse delle ascisse, etichetta con il valore corrispondente gli estremi di ciascun intervallo.

• Per ogni classe, disegna un rettangolo alto come la frequenza (o la percentuale) il cui valore sarà riportato sull’asse delle ordinate.

(14)

Costruire un istogramma

• Dividi l’intervallo dei valori osservati in sottointervalli di uguale ampiezza.

• Costruisci la tabella delle frequenze per classi.

• Sull’asse delle ascisse, etichetta con il valore corrispondente gli estremi di ciascun intervallo.

• Per ogni classe, disegna un rettangolo alto come la frequenza (o la percentuale) il cui valore sarà riportato sull’asse delle ordinate.

(15)

Costruire un istogramma

• Dividi l’intervallo dei valori osservati in sottointervalli di uguale ampiezza.

• Costruisci la tabella delle frequenze per classi.

• Sull’asse delle ascisse, etichetta con il valore corrispondente gli estremi di ciascun intervallo.

• Per ogni classe, disegna un rettangolo alto come la frequenza (o la percentuale) il cui valore sarà riportato sull’asse delle ordinate.

(16)

Costruire un istogramma

• Dividi l’intervallo dei valori osservati in sottointervalli di uguale ampiezza.

• Costruisci la tabella delle frequenze per classi.

• Sull’asse delle ascisse, etichetta con il valore corrispondente gli estremi di ciascun intervallo.

• Per ogni classe, disegna un rettangolo alto come la frequenza (o la percentuale) il cui valore sarà riportato sull’asse delle ordinate.

(17)

Costruire un istogramma

Come si determina l’ampiezza degli intervalli per diseg- nare un istogramma?

Si può usare la seguente regola:

w=Ampiezza intervallo = Valore massimo − Valore minimo Numero di classi

• La scelta del numero di classi è lasciata all’esperienza dello scienziato. L’istogramma deve essere non troppo segmentato nè a blocchi troppo grossi. È preferibile scegliere almeno 5 classi ma meno di 20.

• Gli intervalli non devono mai sovrapporsi.

• Arrotondare per eccesso l’ampiezza delle classi e mai per difetto, in modo da evitare buchi nell’istogramma.

(18)

Costruire un istogramma

Come si determina l’ampiezza degli intervalli per diseg- nare un istogramma?

Si può usare la seguente regola:

w=Ampiezza intervallo = Valore massimo − Valore minimo Numero di classi

• La scelta del numero di classi è lasciata all’esperienza dello scienziato. L’istogramma deve essere non troppo segmentato nè a blocchi troppo grossi. È preferibile scegliere almeno 5 classi ma meno di 20.

• Gli intervalli non devono mai sovrapporsi.

• Arrotondare per eccesso l’ampiezza delle classi e mai per difetto, in modo da evitare buchi nell’istogramma.

(19)

Costruire un istogramma

Come si determina l’ampiezza degli intervalli per diseg- nare un istogramma?

Si può usare la seguente regola:

w=Ampiezza intervallo = Valore massimo − Valore minimo Numero di classi

• La scelta del numero di classi è lasciata all’esperienza dello scienziato. L’istogramma deve essere non troppo segmentato nè a blocchi troppo grossi. È preferibile scegliere almeno 5 classi ma meno di 20.

• Gli intervalli non devono mai sovrapporsi.

• Arrotondare per eccesso l’ampiezza delle classi e mai per difetto, in modo da evitare buchi nell’istogramma.

(20)

Costruire un istogramma

Come si determina l’ampiezza degli intervalli per diseg- nare un istogramma?

Si può usare la seguente regola:

w=Ampiezza intervallo = Valore massimo − Valore minimo Numero di classi

• La scelta del numero di classi è lasciata all’esperienza dello scienziato. L’istogramma deve essere non troppo segmentato nè a blocchi troppo grossi. È preferibile scegliere almeno 5 classi ma meno di 20.

• Arrotondare per eccesso l’ampiezza delle classi e mai per difetto, in modo da evitare buchi nell’istogramma.

(21)

Costruire un istogramma

Come si determina l’ampiezza degli intervalli per diseg- nare un istogramma?

Si può usare la seguente regola:

w=Ampiezza intervallo = Valore massimo − Valore minimo Numero di classi

• La scelta del numero di classi è lasciata all’esperienza dello scienziato. L’istogramma deve essere non troppo segmentato nè a blocchi troppo grossi. È preferibile scegliere almeno 5 classi ma meno di 20.

• Gli intervalli non devono mai sovrapporsi.

(22)

Distribuzione in classi:esercizio

Riprendiamo l’esercizio precedente.

Le seguenti quantità rappresentano, in parti per milione (ppm), la componente di nitrogeno rilevata in 60 campioni di terreno.

3.6 3.2 3.3 3.6 2.7 3.4 4.5 3.3 2.8 5.4 6.1 3.4 2.9 2.7 4.1 4.7 5.1 4.7 3.2 3.6 5.1 2.6 3.6 3.8 3.8 3.1 3.7 5.5 3.2 3.7 4.2 4.5 4.3 3.7 3.6 3.9 3.5 4.4 2.8 3.3 3.9 4.4 5.1 4.6 3.4 2.6 4.5 3.1 2.5 3.1

(23)

Costruire un istogramma

Se gli intervalli in un istogramma hanno ampiezze diverse tra loro, l’altezza dei rettangoli sarà determinata in modo che l’area del rettangolo sia pari alla frequenza della classe stessa:

frequenza = base × altezza da cui

altezza =frequenza base .

Si parla in questo caso di densità di frequenza.

(24)

Costruire un istogramma

Se gli intervalli in un istogramma hanno ampiezze diverse tra loro, l’altezza dei rettangoli sarà determinata in modo che l’area del rettangolo sia pari alla frequenza della classe stessa:

frequenza = base × altezza

da cui

altezza =frequenza base .

Si parla in questo caso di densità di frequenza.

(25)

Costruire un istogramma

Se gli intervalli in un istogramma hanno ampiezze diverse tra loro, l’altezza dei rettangoli sarà determinata in modo che l’area del rettangolo sia pari alla frequenza della classe stessa:

frequenza = base × altezza da cui

altezza =frequenza base .

Si parla in questo caso di densità di frequenza.

(26)

Costruire un istogramma

Se gli intervalli in un istogramma hanno ampiezze diverse tra loro, l’altezza dei rettangoli sarà determinata in modo che l’area del rettangolo sia pari alla frequenza della classe stessa:

frequenza = base × altezza da cui

altezza =frequenza base .

(27)

Costruire un istogramma

Il supervisore di uno stabilimento ha registrato il tempo (in sec- ondi) impiegato dai dipendenti per completare un particolare la- voro. I dati sono riassunti come segue:

Tempo Secondi [30, 40) [40,50) [50, 60) [60, 80) [80, 100) [100, 150)

Numero dipendenti 10 15 20 30 24 20

Disegnare l’istogramma.

Istogramma delle frequenze assolute

tempo

frequenze assolute

40 60 80 100 120 140

051015202530

Istogramma delle densita di frequenza

tempo

densita di frequenza

40 60 80 100 120 140

0.0000.0050.0100.015

(28)

Costruire un istogramma

Il supervisore di uno stabilimento ha registrato il tempo (in sec- ondi) impiegato dai dipendenti per completare un particolare la- voro. I dati sono riassunti come segue:

Tempo Secondi [30, 40) [40,50) [50, 60) [60, 80) [80, 100) [100, 150)

Numero dipendenti 10 15 20 30 24 20

Disegnare l’istogramma.

Istogramma delle frequenze assolute

15202530

Istogramma delle densita di frequenza

tempo

densita di frequenza

40 60 80 100 120 140

0.0000.0050.0100.015

(29)

Costruire un istogramma

Il supervisore di uno stabilimento ha registrato il tempo (in sec- ondi) impiegato dai dipendenti per completare un particolare la- voro. I dati sono riassunti come segue:

Tempo Secondi [30, 40) [40,50) [50, 60) [60, 80) [80, 100) [100, 150)

Numero dipendenti 10 15 20 30 24 20

Disegnare l’istogramma.

Istogramma delle frequenze assolute

frequenze assolute51015202530

Istogramma delle densita di frequenza

tempo

densita di frequenza

40 60 80 100 120 140

0.0000.0050.0100.015

(30)

Costruire un istogramma

Il supervisore di uno stabilimento ha registrato il tempo (in sec- ondi) impiegato dai dipendenti per completare un particolare la- voro. I dati sono riassunti come segue:

Tempo Secondi [30, 40) [40,50) [50, 60) [60, 80) [80, 100) [100, 150)

Numero dipendenti 10 15 20 30 24 20

Disegnare l’istogramma.

Istogramma delle frequenze assolute

15202530

Istogramma delle densita di frequenza

0.0100.015

(31)

Diagramma a bastoncini

Per variabil quantitative discrete, non ha senso costruire un istogramma con rettangoli adiacenti. Si utilizza un grafico ad aste in cui ad ogni valore corrisponde un’asta lunga quanto la frequenza osservata per quel valore.

Figure:Si considera il numero di insetti trattati con un pesticida

(32)

Esercizio

Riprendiamo l’esercizio della lezione precedente

In un inventario del legname, è stato registrato il numero di alberi in ogni area di controllo. Le registrazioni rilevate sono le seguenti:

5 6 5 5 4 5 4 5 3 6 4 5 6 2 7

2 3 5 5 6 7 8 2 3 4 5 6 4 3 2.

Rappresentare i dati graficamente a partire dalle tabelle di

Riferimenti

Documenti correlati

Se X ` e una variabile aleatoria continua, la probabilit` a che X assuma un certo valore x fissato ` e in generale zero, quindi non ha senso definire una distribuzione di probabilit`

L’occorrenza di un nuovo evento puo’ essere considerato un esperimento tipo Bernoulli che genera solo due eventi incompatibili, tipo successo – insuccesso. (1-p) = probabilità di

Questo risultato vale in generale: se il tempo che trascorre tra ciascun evento e il succes- sivo è dato da variabili aleatorie esponenziali indipendenti, tutte di parametro λ

Per calcolare il tempo di attesa medio tra una denuncia e la successiva (sempre di assicurati diversi, cioè senza considerare eventuali denunce multiple fatte da uno stesso

L'analisi riguarda gli aggregati "personale stabile" (personale con rapporto di lavoro a tempo indeterminato comprensivo dei dirigenti a tempo determinato che

• Con la mediana il gruppo dei dati viene suddiviso in 2 parti uguali: tra il minimo e la Mediana si trova il 50% delle osservazioni e tra la Mediana ed il. massimo si trova

Una macchina ha una vita media prima di subire guasti di 6 anni (ipotizzare una distribuzione esponenziale). Un acquirente compera 10 macchine di questo tipo e vuole sapere qual è la

Un acquirente compera 12 macchine di questo tipo e vuole sapere qual è la probabilità che al massimo una di esse si guasti entro 2 anni. Dopo 5 anni, quanto è il numero di