• Non ci sono risultati.

Antonio Azzollini antonio.azzollini@unibas.it Statistica

N/A
N/A
Protected

Academic year: 2021

Condividi "Antonio Azzollini antonio.azzollini@unibas.it Statistica"

Copied!
51
0
0

Testo completo

(1)

Statistica

Antonio Azzollini

antonio.azzollini@unibas.it

Anno accademico 2019/2020

Dipartimento di Matematica, Informatica ed Economia (DiMIE) Dipartimento di Matematica, Informatica ed Economia (DiMIE)

(2)

Le medie

La mediana

Esempio. L’età di un campione di 5 studenti è: 21,25,19, 20, 22.

👇

Campione ordinato: 19, 20, 21, 22, 25.

La mediana è

👇

M = 21

M

di un insieme di dati (ordinato) è il suo valore centrale È una statistica robusta perché non risente di eventuali valori anomali.

La mediana

(3)

Le medie

Esempio. L’altezza in centimetri di 4 giocatori di basket è: 186, 189, 190, 185.

👇

La mediana è… 185, 186, ?, 189, 190.

Una possibile scelta è porre

M = 186 +189

2 = 187,5

Più in generale…

La mediana

(4)

Le medie

La mediana

x

1

, x

2

, …, x

n rappresenta l’insieme di dati, il campione casuale deve

essere ordinato: .

Poi si determina il rango per la mediana:

r = n +1 ( ) × 0,5

x

( )1

≤ x

( )2

≤! ≤ x

( )n

.

Il rango

( ) j

di un elemento

x

i appartenente ad un campione indica che questo occupa la

j

-esima posizione quando il campione è ordinato.

.

(5)

Le medie

La mediana

x

1

, x

2

, …, x

n rappresenta l’insieme di dati, il campione casuale deve

essere ordinato: .

Poi si determina il rango per la mediana:

r = n +1 ( ) × 0,5

x

( )1

≤ x

( )2

≤! ≤ x

( )n

.

Se

n

è dispari il rango sarà un numero intero e si pone

M = x

( )r .

.

Il rango

( ) j

di un elemento

x

i appartenente ad un campione indica che questo occupa la

j

-esima posizione quando il campione è ordinato.

(6)

Le medie

La mediana

x

1

, x

2

, …, x

n rappresenta l’insieme di dati, il campione casuale deve

essere ordinato: .

Poi si determina il rango per la mediana:

r = n +1 ( ) × 0,5

x

( )1

≤ x

( )2

≤! ≤ x

( )n

.

Se

n

è dispari il rango sarà un numero intero e si pone

M = x

( )r

Se

n

è pari il rango è

n

2 + 0,5

e si pone

Il rango

( ) j

di un elemento

x

i appartenente ad un campione indica che questo occupa la

j

-esima posizione quando il campione è ordinato.

. .

(7)

Le medie

La mediana

x

1

, x

2

, …, x

n rappresenta l’insieme di dati, il campione casuale deve

essere ordinato: .

Poi si determina il rango per la mediana:

r = n +1 ( ) × 0,5

x

( )1

≤ x

( )2

≤! ≤ x

( )n

.

Se

n

è dispari il rango sarà un numero intero e si pone

M = x

( )r

Se

n

è pari il rango è

n

2 + 0,5

e si pone

M = x

n

2

⎝⎜

⎠⎟

+ x

n

2+1

⎝⎜

⎠⎟

− x

n

2

⎝⎜

⎠⎟

⎝ ⎜ ⎞

⎠ ⎟ × 0,5

Così facendo ritroviamo il secondo esempio:

185;186;187,5;189;190

Il rango

( ) j

di un elemento

x

i appartenente ad un campione indica che questo occupa la

j

-esima posizione quando il campione è ordinato.

M = x

n

2

⎝⎜

⎠⎟

+ x

n

2+1

⎝⎜

⎠⎟

− x

n

2

⎝⎜

⎠⎟

⎝ ⎜ ⎞

⎠ ⎟ × 0,5 M = x

n

2

⎝⎜

⎠⎟

+ x

n

2+1

⎝⎜

⎠⎟

− x

n

2

⎝⎜

⎠⎟

⎝ ⎜ ⎞

⎠ ⎟ × 0,5

. .

.

(8)

Le medie

La mediana per distribuzioni di frequenze

#Stanze #Appartamenti Frequenze cumulate

1 300 300

2 500 800

3 2.000 2.800

4 3.000 5.800

5 150 5.950

6 100 6.050

7 300 6.350

Il rango è

r = n +1 ( ) × 0,5 = 6.351

2 = 3.175,5

.

(9)

Le medie

La mediana per distribuzioni di frequenze

#Stanze #Appartamenti Frequenze cumulate

1 300 300

2 500 800

3 2.000 2.800

4 3.000 5.800

5 150 5.950

6 100 6.050

7 300 6.350

Il rango è

r = n +1 ( ) × 0,5 = 6.351

2 = 3.175,5

L’elemento di posizione

3.175

è

4

, come pure l’elemento di posizione

3.176

. Pertanto possiamo porre

M = 4

.

.

1,1,...,1 2,2,...,2 3,3,...,3 4,4,...,4

300 volte 500 volte 2000 volte 3000 volte 800 2800

300 5800

(10)

Colore dei


capelli N° di persone

Neri 10

Castani 6

Rossi 1

Biondi 5

Totale 22

Le medie

La moda

È l’elemento che compare più spesso nel campione.

#Stanze #Appartamenti

1 300

2 500

3 2.000

4 3.000

5 150

6 100

7 300

Moda

Moda

👉

👈

(11)

Le medie

La moda

Una distribuzione si dice unimodale se ammette un solo valore modale, bimodale se ne ammette due (ossia se esistono due valori che compaiono entrambi con la frequenza massima), trimodale se ne ammette tre e multimodale se ne ammette più di tre.

Unimodale Bimodale

(12)

Le medie

La moda

Quando si ha a che fare con classi di modalità, la moda è il punto medio della classe con frequenza più elevata.

In questo caso il valore della moda è 3.200.

Peso in grammi Neonati 1.800-2.200 10 2.200-2.600 32 2.600-3.000 120 3.000-3.400 254 3.400-3.800 134 3.800-4.200 40 4.200-4.600 10

👈

(13)

Poligono di frequenza

L’area sottesa dall’istogramma delle densità delle frequenze relative (e dal poligono delle delle densità di frequenze) è uguale a 1.

(14)

Simmetria

Un poligono delle densità di frequenze simmetrico ha questa forma:

moda = media = mediana

coda sinistra coda destra

(15)

Un poligono delle densità di frequenze è asimmetrico quando ha una di queste forme:

moda mediana

media

coda destra coda sinistra

Simmetria

moda = media = mediana

coda sinistra coda destra

Un poligono delle densità di frequenze simmetrico ha questa forma:

(16)

Simmetria

Modalità Frequenza

1 1

2 2

3 3

4 4

5 5

6 6

7 7

Modalità Frequenza

1 7

2 6

3 5

4 4

5 3

6 2

7 1

Media = 5 Moda = 7

Media = 3 Moda = 1

media − mediana

Possibile indice: ?

(17)

Simmetria

r = n +1

( )

× 0,5 = 29

2 = 14,5

La mediana si trova fra l’elemento di posizione 14 e quello di posizione 15

(18)

Simmetria

Modalità Frequenza Frequenza
 cumulata

1 1 1

2 2 3

3 3 6

4 4 10

5 5 15

6 6 21

7 7 28

r = n +1

( )

× 0,5 = 29

2 = 14,5

La mediana si trova fra l’elemento di posizione 14 e quello di posizione 15

x

14

= x

15

= 5 ⇒ M = 5

👈

mediana

(19)

Simmetria

Modalità Frequenza Frequenza
 cumulata

1 1 1

2 2 3

3 3 6

4 4 10

5 5 15

6 6 21

7 7 28

r = n +1

( )

× 0,5 = 29

2 = 14,5

La mediana si trova fra l’elemento di posizione 14 e quello di posizione 15

x

14

= x

15

= 5 ⇒ M = 5

👈

mediana

r = n +1

( )

× 0,5 = 29

2 = 14,5

La mediana si trova fra l’elemento di posizione 14 e quello di posizione 15

(20)

Simmetria

Modalità Frequenza Frequenza
 cumulata

1 1 1

2 2 3

3 3 6

4 4 10

5 5 15

6 6 21

7 7 28

Modalità Frequenza Frequenza
 cumulata

1 7 7

2 6 13

3 5 18

4 4 22

5 3 25

6 2 27

7 1 28

r = n +1

( )

× 0,5 = 29

2 = 14,5

La mediana si trova fra l’elemento di posizione 14 e quello di posizione 15

x

14

= x

15

= 5 ⇒ M = 5

👈

mediana

r = n +1

( )

× 0,5 = 29

2 = 14,5

La mediana si trova fra l’elemento di posizione 14 e quello di posizione 15

x

14

= x

15

= 3 ⇒ M = 3

mediana

👉

(21)

Simmetria

Modalità Frequenza Frequenza
 cumulata

1 1 1

2 2 3

3 3 6

4 4 10

5 5 15

6 6 21

7 7 28

Modalità Frequenza Frequenza
 cumulata

1 7 7

2 6 13

3 5 18

4 4 22

5 3 25

6 2 27

7 1 28

r = n +1

( )

× 0,5 = 29

2 = 14,5

La mediana si trova fra l’elemento di posizione 14 e quello di posizione 15

x

14

= x

15

= 5 ⇒ M = 5

👈

mediana

r = n +1

( )

× 0,5 = 29

2 = 14,5

La mediana si trova fra l’elemento di posizione 14 e quello di posizione 15

x

14

= x

15

= 3 ⇒ M = 3

mediana

👉

In entrambi i casi: media - mediana =0!

(22)

Simmetria

Asimmetria: A = max− M

( )

− M − min

( )

Introduciamo come indice di asimmetria la quantità A così definita

Dove max individua il valore massimo della modalità e min quello minimo

(23)

Simmetria

Asimmetria: A = max− M

( )

− M − min

( )

Introduciamo come indice di asimmetria la quantità A così definita

Modalità Frequenza Frequenza
 cumulata

1 1 1

2 2 3

3 3 6

4 4 10

5 5 15

6 6 21

7 7 28

A = 7 − 5

( )

− 5 −1

( )

= −2

asimmetria negativa

Dove max individua il valore massimo della modalità e min quello minimo

(24)

Simmetria

Asimmetria: A = max− M

( )

− M − min

( )

Introduciamo come indice di asimmetria la quantità A così definita

Modalità Frequenza Frequenza
 cumulata

1 1 1

2 2 3

3 3 6

4 4 10

5 5 15

6 6 21

7 7 28

A = 7 − 5

( )

− 5 −1

( )

= −2

asimmetria negativa

Dove max individua il valore massimo della modalità e min quello minimo

Modalità Frequenza Frequenza
 cumulata

1 7 7

2 6 13

3 5 18

4 4 22

5 3 25

6 2 27

7 1 28

A = 7 − 3

( )

− 3−1

( )

= 2

asimmetria positiva

(25)

Quartili

Il primo quartile è quel valore che lascia a sinistra il 25% dei dati.

Il primo quartile può appartenere al campione casuale oppure no.

(26)

Quartili

Il primo quartile è quel valore che lascia a sinistra il 25% dei dati.

Il primo quartile può appartenere al campione casuale oppure no.

Mostriamo con un esempio come si determina Esempio. L’età per un campione di 5 studenti è

1° passo: Il campione va ordinato:

19,20,21,22,25

21,25,19,20,22

(27)

Quartili

Il primo quartile è quel valore che lascia a sinistra il 25% dei dati.

Il primo quartile può appartenere al campione casuale oppure no.

Mostriamo con un esempio come si determina Esempio. L’età per un campione di 5 studenti è

1° passo: Il campione va ordinato:

Dunque il primo quartile

19,20,21,22,25

21,25,19,20,22

Q1

si colloca fra l’elemento di posizione 1 e quello posizione 2.

2° passo: Determinare il rango (la posizione) per il primo quartile:

(n +1) × 0,25 = 1,5

.

(28)

Quartili

Il primo quartile è quel valore che lascia a sinistra il 25% dei dati.

Il primo quartile può appartenere al campione casuale oppure no.

Mostriamo con un esempio come si determina Esempio. L’età per un campione di 5 studenti è

1° passo: Il campione va ordinato:

Dunque il primo quartile

19,20,21,22,25

21,25,19,20,22

Q1

si colloca fra l’elemento di posizione 1 e quello posizione 2.

2° passo: Determinare il rango (la posizione) per il primo quartile:

(n +1) × 0,25 = 1,5

.

I decimali nel numero trovato mi servono per stabilire l'esatto valore del primo quartile come stabilito nel...

(29)

Quartili

Il primo quartile è quel valore che lascia a sinistra il 25% dei dati.

Il primo quartile può appartenere al campione casuale oppure no.

Mostriamo con un esempio come si determina Esempio. L’età per un campione di 5 studenti è

1° passo: Il campione va ordinato:

Dunque il primo quartile

19,20,21,22,25

21,25,19,20,22

Q1

si colloca fra l’elemento di posizione 1 e quello posizione 2.

19, Q1 ,20,21,22,25 👉 Q1 = 19 + 20 −19 (

.

) × 0,5 = 19,5

2° passo: Determinare il rango (la posizione) per il primo quartile:

(n +1) × 0,25 = 1,5

.

I decimali nel numero trovato mi servono per stabilire l'esatto valore del primo quartile come stabilito nel...

3° passo:

1,5 - 1

(30)

Quartili

Il primo quartile è quel valore che lascia a sinistra il 25% dei dati.

Il primo quartile può appartenere al campione casuale oppure no.

Vediamo un altro esempio.

(31)

Quartili

Il primo quartile è quel valore che lascia a sinistra il 25% dei dati.

Il primo quartile può appartenere al campione casuale oppure no.

Esempio. L’altezza di 4 giocatori di basket è

186,189,190,185

In questo caso il primo quartile è

185, Q1 ,186,189,190

Determinare il rango per il primo quartile:

(

n +1

)

× 0,25 = 1,25

Q1 Q1 = 185 × 186 −185 = 185 × 186 −185 ( ( ) ) × 0,25 = × 0,25 = 185,25 185,25

Vediamo un altro esempio.

185, ( n +1 Q1 ,186,189,190 ) × 0,25 = 1,25

(32)

Quartili

Il terzo quartile è quel valore che lascia a sinistra il 75% dei dati.

Il terzo quartile può appartenere al campione casuale oppure no.

(33)

Quartili

Il terzo quartile è quel valore che lascia a sinistra il 75% dei dati.

Il terzo quartile può appartenere al campione casuale oppure no.

Esempio. L’età per un campione di 5 studenti è Il campione va ordinato:

Determinare il rango per il terzo quartile:

(

n +1

)

× 0,75 = 4,5 Il terzo quartile

19,20,21,22,25

21,25,19,20,22

Q3

si colloca fra l’elemento di posizione 4 e quello di

posizione 5

👉 19,20,21,22, Q3 ,25 👉 Q3 = 22 + 25 − 22 (

.

) × 0,5 = 23,5 .

(34)

Quartili

Il terzo quartile è quel valore che lascia a sinistra il 75% dei dati.

Il terzo quartile può appartenere al campione casuale oppure no.

Esempio. L’età per un campione di 5 studenti è Il campione va ordinato:

Determinare il rango per il terzo quartile:

(

n +1

)

× 0,75 = 4,5 Il terzo quartile

19,20,21,22,25

21,25,19,20,22

Q3

si colloca fra l’elemento di posizione 4 e quello di

posizione 5

👉 19,20,21,22, Q3 ,25 👉 Q3 = 22 + 25 − 22 (

.

) × 0,5 = 23,5 .

Esempio. L’altezza di 4 giocatori di basket è

186,189,190,185

.

In questo caso il terzo quartile è

185,186,189, Q3 ,190

Determinare il rango per il terzo quartile:

(

n +1

)

× 0,75 = 3,75

Q3 = 189 + 190 −189 ( ) × 0,75 = 189, 75

.

(35)

Box-plot

(36)

Box-plot

Il Box-plot (o diagramma a scatola e baffi) è un diagramma che fornisce una rappresentazione grafica della distribuzione dei dati, evidenziando dove cade la maggioranza dei valori, e di quei valori che differiscono di parecchio dalla norma, cosiddetti dati anomali.

(37)

Box-plot

Il Box-plot (o diagramma a scatola e baffi) è un diagramma che fornisce una rappresentazione grafica della distribuzione dei dati, evidenziando dove cade la maggioranza dei valori, e di quei valori che differiscono di parecchio dalla norma, cosiddetti dati anomali.

I capisaldi nella rappresentazione di un box-plot sono

(38)

Box-plot

Il Box-plot (o diagramma a scatola e baffi) è un diagramma che fornisce una rappresentazione grafica della distribuzione dei dati, evidenziando dove cade la maggioranza dei valori, e di quei valori che differiscono di parecchio dalla norma, cosiddetti dati anomali.

Q0 = min( )

Q1 = 1° quartile

Q2 = mediana o 2° quartile

Q3 = 3° quartile;

Q4 = max( )

IQR = Q3 - Q1 = campo di variazione interquartile I capisaldi nella rappresentazione di un box-plot sono

x

1

, x

2

, …, x

n

x

1

, x

2

, …, x

n

(39)

Box-plot

Il Box-plot (o diagramma a scatola e baffi) è un diagramma che fornisce una rappresentazione grafica della distribuzione dei dati, evidenziando dove cade la maggioranza dei valori, e di quei valori che differiscono di parecchio dalla norma, cosiddetti dati anomali.

Q0 = min( )

Q1 = 1° quartile

Q2 = mediana o 2° quartile

Q3 = 3° quartile;

Q4 = max( )

IQR = Q3 - Q1 = campo di variazione interquartile I capisaldi nella rappresentazione di un box-plot sono

x

1

, x

2

, …, x

n

x

1

, x

2

, …, x

n

IQR = Q3 - Q1 = campo di variazione interquartile.

Introduciamo infine il numero

(40)

Box-plot

10,3; 12,9; 12,9; 13,5; 13,7; 14,0; 14,2; 15,0; 15,4; 15,7;

16,6; 17,1; 17,4; 17,8; 18,3; 18,3; 18,6; 18,9; 19,7; 20,3;

20,7; 20,8; 21,4; 23,0; 23,2; 23,7; 26,1; 27,1; 29,8; 33,8.

(41)

Box-plot

10,3; 12,9; 12,9; 13,5; 13,7; 14,0; 14,2; 15,0; 15,4; 15,7;

16,6; 17,1; 17,4; 17,8; 18,3; 18,3; 18,6; 18,9; 19,7; 20,3;

20,7; 20,8; 21,4; 23,0; 23,2; 23,7; 26,1; 27,1; 29,8; 33,8.

Primo quartile:

(

30 +1

)

× 0,25 = 7,75 Si colloca fra le posizioni 7 e 8

Il suo valore è fra

14,2 15

e

14,2 + 15 −14,2 ( ) × 0,75 = 14,8

ed è pari a.

(42)

Box-plot

10,3; 12,9; 12,9; 13,5; 13,7; 14,0; 14,2; 15,0; 15,4; 15,7;

16,6; 17,1; 17,4; 17,8; 18,3; 18,3; 18,6; 18,9; 19,7; 20,3;

20,7; 20,8; 21,4; 23,0; 23,2; 23,7; 26,1; 27,1; 29,8; 33,8.

Mediana:

(

30 +1

)

× 0,5 = 15,5

Si colloca fra le posizioni 15 e 16 Punto medio fra

ossia

18, 3 18, 3

e

18, 3

.

Primo quartile:

(

30 +1

)

× 0,25 = 7,75 Si colloca fra le posizioni 7 e 8

Il suo valore è fra

14,2 + 15 −14,2 ( 14,2

e

) 15 × 0,75 = 14,8

ed è pari a.

(43)

Box-plot

10,3; 12,9; 12,9; 13,5; 13,7; 14,0; 14,2; 15,0; 15,4; 15,7;

16,6; 17,1; 17,4; 17,8; 18,3; 18,3; 18,6; 18,9; 19,7; 20,3;

20,7; 20,8; 21,4; 23,0; 23,2; 23,7; 26,1; 27,1; 29,8; 33,8.

Mediana:

(

30 +1

)

× 0,5 = 15,5

Si colloca fra le posizioni 15 e 16 Punto medio fra

ossia

Terzo quartile:

(

30 +1

)

× 0,75 = 23,25 Si colloca fra le posizioni 23 e 24

Il suo valore è fra

18, 3 18, 3

e

18, 3

.

21, 4 + 23− 21,4 ( 21, 4 23

e

) × 0,25 = 21,8

. ed è pari a Primo quartile:

(

30 +1

)

× 0,25 = 7,75 Si colloca fra le posizioni 7 e 8

Il suo valore è fra

14,2 + 15 −14,2 ( 14,2

e

) 15 × 0,75 = 14,8

ed è pari a.

(44)

Box-plot

10,3; 12,9; 12,9; 13,5; 13,7; 14,0; 14,2; 15,0; 15,4; 15,7;

16,6; 17,1; 17,4; 17,8; 18,3; 18,3; 18,6; 18,9; 19,7; 20,3;

20,7; 20,8; 21,4; 23,0; 23,2; 23,7; 26,1; 27,1; 29,8; 33,8.

Mediana:

(

30 +1

)

× 0,5 = 15,5

Si colloca fra le posizioni 15 e 16 Punto medio fra

ossia

Terzo quartile:

(

30 +1

)

× 0,75 = 23,25 Si colloca fra le posizioni 23 e 24

Il suo valore è fra

18, 3 18, 3

e

18, 3

.

21, 4 + 23− 21,4 ( 21, 4 23

e

) × 0,25 = 21,8

.

Box plot ore di studio

10 30 25

20 15 ed è pari a

Primo quartile:

(

30 +1

)

× 0,25 = 7,75 Si colloca fra le posizioni 7 e 8

Il suo valore è fra

14,2 + 15 −14,2 ( 14,2

e

) 15 × 0,75 = 14,8

ed è pari a.

(45)

Box-plot

10,3; 12,9; 12,9; 13,5; 13,7; 14,0; 14,2; 15,0; 15,4; 15,7;

16,6; 17,1; 17,4; 17,8; 18,3; 18,3; 18,6; 18,9; 19,7; 20,3;

20,7; 20,8; 21,4; 23,0; 23,2; 23,7; 26,1; 27,1; 29,8; 33,8.

Mediana:

(

30 +1

)

× 0,5 = 15,5

Si colloca fra le posizioni 15 e 16 Punto medio fra

ossia

Terzo quartile:

(

30 +1

)

× 0,75 = 23,25 Si colloca fra le posizioni 23 e 24

Il suo valore è fra

18, 3 18, 3

e

18, 3

.

21, 4 + 23− 21,4 ( 21, 4 23

e

) × 0,25 = 21,8

.

Box plot ore di studio

10 30 25

20

15 Q1 ed è pari a

Primo quartile:

(

30 +1

)

× 0,25 = 7,75 Si colloca fra le posizioni 7 e 8

Il suo valore è fra

14,2 + 15 −14,2 ( 14,2

e

) 15 × 0,75 = 14,8

ed è pari a.

(46)

Box-plot

10,3; 12,9; 12,9; 13,5; 13,7; 14,0; 14,2; 15,0; 15,4; 15,7;

16,6; 17,1; 17,4; 17,8; 18,3; 18,3; 18,6; 18,9; 19,7; 20,3;

20,7; 20,8; 21,4; 23,0; 23,2; 23,7; 26,1; 27,1; 29,8; 33,8.

Mediana:

(

30 +1

)

× 0,5 = 15,5

Si colloca fra le posizioni 15 e 16 Punto medio fra

ossia

Terzo quartile:

(

30 +1

)

× 0,75 = 23,25 Si colloca fra le posizioni 23 e 24

Il suo valore è fra

18, 3 18, 3

e

18, 3

.

21, 4 + 23− 21,4 ( 21, 4 23

e

) × 0,25 = 21,8

.

Box plot ore di studio

10 30 25

20 15

Q2

ed è pari a Primo quartile:

(

30 +1

)

× 0,25 = 7,75 Si colloca fra le posizioni 7 e 8

Il suo valore è fra

14,2 + 15 −14,2 ( 14,2

e

) 15 × 0,75 = 14,8

ed è pari a.

(47)

Box-plot

10,3; 12,9; 12,9; 13,5; 13,7; 14,0; 14,2; 15,0; 15,4; 15,7;

16,6; 17,1; 17,4; 17,8; 18,3; 18,3; 18,6; 18,9; 19,7; 20,3;

20,7; 20,8; 21,4; 23,0; 23,2; 23,7; 26,1; 27,1; 29,8; 33,8.

Mediana:

(

30 +1

)

× 0,5 = 15,5

Si colloca fra le posizioni 15 e 16 Punto medio fra

ossia

Terzo quartile:

(

30 +1

)

× 0,75 = 23,25 Si colloca fra le posizioni 23 e 24

Il suo valore è fra

18, 3 18, 3

e

18, 3

.

21, 4 + 23− 21,4 ( 21, 4 23

e

) × 0,25 = 21,8

.

Box plot ore di studio

10 30 25

20 15 ed è pari a

Q3 Primo quartile:

(

30 +1

)

× 0,25 = 7,75

Si colloca fra le posizioni 7 e 8 Il suo valore è fra

14,2 + 15 −14,2 ( 14,2

e

) 15 × 0,75 = 14,8

ed è pari a.

(48)

Dopo aver disegnato la "scatola" ora disegniamo i "baffi"

La lunghezza di ciascun baffo "non supera" il valore convenzionale 1,5 × Q3− Q1

( )

Q3

− Q1 = 7

quindi

1,5 × 7 = 10,5

Si confronta il valore del minimo con il valore

Q1−10,5 = 14,6 −10,5 = 4,1

Poiché

min = 10,3 > 4,1

allora il baffo inferiore è collocato in corrispondenza del minimo.

Box-plot

Box plot ore di studio

10 30 25

20 15 e se ne prende il più grande.

14,2 + 15 −14,2 ( )

Q1

× 0,75 = 14,8

−10,5 = 14,6 −10,5 = 4,1

min = 10,3 > 4,1 min = 10,3 > 4,1

min = 10,3 > 4,1

min = 10,3 > 4,1

(49)

Dopo aver disegnato la "scatola" ora disegniamo i "baffi"

La lunghezza di ciascun baffo "non supera" il valore convenzionale 1,5 × Q3− Q1

( )

Q3

− Q1 = 7

quindi

1,5 × 7 = 10,5

Si confronta il valore del massimo con il valore

Q3+10,5 = 22,6 +10,5 = 33,1

Poiché

max = 33,8 > 33,1

allora

il baffo superiore è collocato in corrispondenza di .

Box-plot

Box plot ore di studio

10 30 25

20 15 e se ne prende il più piccolo.

Q3+10,5 = 22,6 +10,5 = 33,1Q3+10,5 = 22,6 +10,5 = 33,1

max = 33,8 > 33,1 max

Q3

= 33,8 > 33,1

+10,5 = 22,6 +10,5 = 33,1

min = 10,3 > 4,1 max

Q3

= 33,8 > 33,1

+10,5 = 22,6 +10,5 = 33,1

min = 10,3 > 4,1

max

Q3

= 33,8 > 33,1

+10,5 = 22,6 +10,5 = 33,1

min = 10,3 > 4,1

(50)

Un valore del campione casuale “troppo distante” dal resto del campione casuale si dice outlier o valore anomalo. Più precisamente un outlier è un dato che si trova al di sopra del baffo superiore o al di sotto del baffo inferiore del box-plot

Poiché max = 33,8 > 33,1

allora 33,8 è un outlier. Esso si

Box-plot

Box plot ore di studio

10 30 25

20

disegna con un punto.

15

max Q3 = 33,8 > 33,1 +10,5 = 22,6 +10,5 = 33,1 min = 10,3 > 4,1

35

(51)

Box-plot

10,3; 12,9; 12,9; 13,5; 13,7; 14,0; 14,2; 15,0; 15,4; 15,7;

16,6; 17,1; 17,4; 17,8; 18,3; 18,3; 18,6; 18,9; 19,7; 20,3;

20,7; 20,8; 21,4; 23,0; 23,2; 23,7; 26,1; 27,1; 29,8; 33,8.

Dataset ore di studio

Box plot ore di studio

10 30 25

20 15

35

Riferimenti

Documenti correlati

Le medie e le deviazioni standard delle quotazioni giornaliere dei titoli azionari Indesit & De Longhi nell’arco del 2006 sono state:. Indesit: media = 9,89; deviazione standard

non solo la variazione intervenuta fra il tempo base e quello attuale, ma anche…. … la variazione a breve fra

Lo stesso indice di concentrazione può essere utilizzato per classi di modalità scegliendo come valori di riferimento i centri delle classi al posto delle

Se un carattere non ha alcuna influenza sull’altro—e viceversa—allora si dice che i due caratteri sono indipendenti...

Il Box-plot (o diagramma a scatola e baffi) è un diagramma che fornisce una rappresentazione grafica della distribuzione dei dati, evidenziando dove cade

come indice centrale, considerando la deviazione standard come indice di dispersione dei dati, ci si pone la questione di stabilire a priori una stima della percentuale di dati che

Le medie e le deviazioni standard delle quotazioni giornaliere dei titoli azonari Indesit & De Longhi nell’arco del 2006 sono state:.. Indesit: media = 9,89; deviazione standard

SOLUZIONE DEL PROGETTO ER IN FORMATO TESTUALE IN FORMATO TESTUALE (COME RICHIESTO PER ESAME ONLINE BASI DI DATI A.A.. di TRIBUNALE