Statistica
Antonio Azzollini
antonio.azzollini@unibas.it
Anno accademico 2019/2020
Dipartimento di Matematica, Informatica ed Economia (DiMIE) Dipartimento di Matematica, Informatica ed Economia (DiMIE)
Le medie
La mediana
Esempio. L’età di un campione di 5 studenti è: 21,25,19, 20, 22.
👇
Campione ordinato: 19, 20, 21, 22, 25.
La mediana è
👇
M = 21
M
di un insieme di dati (ordinato) è il suo valore centrale È una statistica robusta perché non risente di eventuali valori anomali.La mediana
Le medie
Esempio. L’altezza in centimetri di 4 giocatori di basket è: 186, 189, 190, 185.
👇
La mediana è… 185, 186, ?, 189, 190.
Una possibile scelta è porre
M = 186 +189
2 = 187,5
Più in generale…
La mediana
Le medie
La mediana
x
1, x
2, …, x
n rappresenta l’insieme di dati, il campione casuale deveessere ordinato: .
Poi si determina il rango per la mediana:
r = n +1 ( ) × 0,5
x
( )1≤ x
( )2≤! ≤ x
( )n.
Il rango
( ) j
di un elementox
i appartenente ad un campione indica che questo occupa laj
-esima posizione quando il campione è ordinato..
Le medie
La mediana
x
1, x
2, …, x
n rappresenta l’insieme di dati, il campione casuale deveessere ordinato: .
Poi si determina il rango per la mediana:
r = n +1 ( ) × 0,5
x
( )1≤ x
( )2≤! ≤ x
( )n.
Se
n
è dispari il rango sarà un numero intero e si poneM = x
( )r ..
Il rango
( ) j
di un elementox
i appartenente ad un campione indica che questo occupa laj
-esima posizione quando il campione è ordinato.Le medie
La mediana
x
1, x
2, …, x
n rappresenta l’insieme di dati, il campione casuale deveessere ordinato: .
Poi si determina il rango per la mediana:
r = n +1 ( ) × 0,5
x
( )1≤ x
( )2≤! ≤ x
( )n.
Se
n
è dispari il rango sarà un numero intero e si poneM = x
( )rSe
n
è pari il rango èn
2 + 0,5
e si poneIl rango
( ) j
di un elementox
i appartenente ad un campione indica che questo occupa laj
-esima posizione quando il campione è ordinato.. .
Le medie
La mediana
x
1, x
2, …, x
n rappresenta l’insieme di dati, il campione casuale deveessere ordinato: .
Poi si determina il rango per la mediana:
r = n +1 ( ) × 0,5
x
( )1≤ x
( )2≤! ≤ x
( )n.
Se
n
è dispari il rango sarà un numero intero e si poneM = x
( )rSe
n
è pari il rango èn
2 + 0,5
e si poneM = x
n2
⎛⎝⎜ ⎞
⎠⎟
+ x
n2+1
⎛⎝⎜ ⎞
⎠⎟
− x
n2
⎛⎝⎜ ⎞
⎠⎟
⎛
⎝ ⎜ ⎞
⎠ ⎟ × 0,5
Così facendo ritroviamo il secondo esempio:
185;186;187,5;189;190
Il rango
( ) j
di un elementox
i appartenente ad un campione indica che questo occupa laj
-esima posizione quando il campione è ordinato.M = x
n2
⎛⎝⎜ ⎞
⎠⎟
+ x
n2+1
⎛⎝⎜ ⎞
⎠⎟
− x
n2
⎛⎝⎜ ⎞
⎠⎟
⎛
⎝ ⎜ ⎞
⎠ ⎟ × 0,5 M = x
n2
⎛⎝⎜ ⎞
⎠⎟
+ x
n2+1
⎛⎝⎜ ⎞
⎠⎟
− x
n2
⎛⎝⎜ ⎞
⎠⎟
⎛
⎝ ⎜ ⎞
⎠ ⎟ × 0,5
. .
.
Le medie
La mediana per distribuzioni di frequenze
#Stanze #Appartamenti Frequenze cumulate
1 300 300
2 500 800
3 2.000 2.800
4 3.000 5.800
5 150 5.950
6 100 6.050
7 300 6.350
Il rango è
r = n +1 ( ) × 0,5 = 6.351
2 = 3.175,5
.Le medie
La mediana per distribuzioni di frequenze
#Stanze #Appartamenti Frequenze cumulate
1 300 300
2 500 800
3 2.000 2.800
4 3.000 5.800
5 150 5.950
6 100 6.050
7 300 6.350
Il rango è
r = n +1 ( ) × 0,5 = 6.351
2 = 3.175,5
L’elemento di posizione
3.175
è4
, come pure l’elemento di posizione3.176
. Pertanto possiamo porreM = 4
..
1,1,...,1 2,2,...,2 3,3,...,3 4,4,...,4
300 volte 500 volte 2000 volte 3000 volte 800 2800
300 5800
Colore dei
capelli N° di persone
Neri 10
Castani 6
Rossi 1
Biondi 5
Totale 22
Le medie
La moda
È l’elemento che compare più spesso nel campione.
#Stanze #Appartamenti
1 300
2 500
3 2.000
4 3.000
5 150
6 100
7 300
Moda
Moda
👉
👈
Le medie
La moda
Una distribuzione si dice unimodale se ammette un solo valore modale, bimodale se ne ammette due (ossia se esistono due valori che compaiono entrambi con la frequenza massima), trimodale se ne ammette tre e multimodale se ne ammette più di tre.
Unimodale Bimodale
Le medie
La moda
Quando si ha a che fare con classi di modalità, la moda è il punto medio della classe con frequenza più elevata.
In questo caso il valore della moda è 3.200.
Peso in grammi Neonati 1.800-2.200 10 2.200-2.600 32 2.600-3.000 120 3.000-3.400 254 3.400-3.800 134 3.800-4.200 40 4.200-4.600 10
👈
Poligono di frequenza
L’area sottesa dall’istogramma delle densità delle frequenze relative (e dal poligono delle delle densità di frequenze) è uguale a 1.
Simmetria
Un poligono delle densità di frequenze simmetrico ha questa forma:
moda = media = mediana
coda sinistra coda destra
Un poligono delle densità di frequenze è asimmetrico quando ha una di queste forme:
moda mediana
media
coda destra coda sinistra
Simmetria
moda = media = mediana
coda sinistra coda destra
Un poligono delle densità di frequenze simmetrico ha questa forma:
Simmetria
Modalità Frequenza
1 1
2 2
3 3
4 4
5 5
6 6
7 7
Modalità Frequenza
1 7
2 6
3 5
4 4
5 3
6 2
7 1
Media = 5 Moda = 7
Media = 3 Moda = 1
media − mediana
Possibile indice: ?
Simmetria
r = n +1
( )
× 0,5 = 292 = 14,5
La mediana si trova fra l’elemento di posizione 14 e quello di posizione 15
Simmetria
Modalità Frequenza Frequenza cumulata
1 1 1
2 2 3
3 3 6
4 4 10
5 5 15
6 6 21
7 7 28
r = n +1
( )
× 0,5 = 292 = 14,5
La mediana si trova fra l’elemento di posizione 14 e quello di posizione 15
x
14= x
15= 5 ⇒ M = 5
👈
medianaSimmetria
Modalità Frequenza Frequenza cumulata
1 1 1
2 2 3
3 3 6
4 4 10
5 5 15
6 6 21
7 7 28
r = n +1
( )
× 0,5 = 292 = 14,5
La mediana si trova fra l’elemento di posizione 14 e quello di posizione 15
x
14= x
15= 5 ⇒ M = 5
👈
medianar = n +1
( )
× 0,5 = 292 = 14,5
La mediana si trova fra l’elemento di posizione 14 e quello di posizione 15
Simmetria
Modalità Frequenza Frequenza cumulata
1 1 1
2 2 3
3 3 6
4 4 10
5 5 15
6 6 21
7 7 28
Modalità Frequenza Frequenza cumulata
1 7 7
2 6 13
3 5 18
4 4 22
5 3 25
6 2 27
7 1 28
r = n +1
( )
× 0,5 = 292 = 14,5
La mediana si trova fra l’elemento di posizione 14 e quello di posizione 15
x
14= x
15= 5 ⇒ M = 5
👈
medianar = n +1
( )
× 0,5 = 292 = 14,5
La mediana si trova fra l’elemento di posizione 14 e quello di posizione 15
x
14= x
15= 3 ⇒ M = 3
mediana
👉
Simmetria
Modalità Frequenza Frequenza cumulata
1 1 1
2 2 3
3 3 6
4 4 10
5 5 15
6 6 21
7 7 28
Modalità Frequenza Frequenza cumulata
1 7 7
2 6 13
3 5 18
4 4 22
5 3 25
6 2 27
7 1 28
r = n +1
( )
× 0,5 = 292 = 14,5
La mediana si trova fra l’elemento di posizione 14 e quello di posizione 15
x
14= x
15= 5 ⇒ M = 5
👈
medianar = n +1
( )
× 0,5 = 292 = 14,5
La mediana si trova fra l’elemento di posizione 14 e quello di posizione 15
x
14= x
15= 3 ⇒ M = 3
mediana
👉
In entrambi i casi: media - mediana =0!
Simmetria
Asimmetria: A = max− M
( )
− M − min( )
Introduciamo come indice di asimmetria la quantità A così definita
Dove max individua il valore massimo della modalità e min quello minimo
Simmetria
Asimmetria: A = max− M
( )
− M − min( )
Introduciamo come indice di asimmetria la quantità A così definita
Modalità Frequenza Frequenza cumulata
1 1 1
2 2 3
3 3 6
4 4 10
5 5 15
6 6 21
7 7 28
A = 7 − 5
( )
− 5 −1( )
= −2asimmetria negativa
Dove max individua il valore massimo della modalità e min quello minimo
Simmetria
Asimmetria: A = max− M
( )
− M − min( )
Introduciamo come indice di asimmetria la quantità A così definita
Modalità Frequenza Frequenza cumulata
1 1 1
2 2 3
3 3 6
4 4 10
5 5 15
6 6 21
7 7 28
A = 7 − 5
( )
− 5 −1( )
= −2asimmetria negativa
Dove max individua il valore massimo della modalità e min quello minimo
Modalità Frequenza Frequenza cumulata
1 7 7
2 6 13
3 5 18
4 4 22
5 3 25
6 2 27
7 1 28
A = 7 − 3
( )
− 3−1( )
= 2asimmetria positiva
Quartili
Il primo quartile è quel valore che lascia a sinistra il 25% dei dati.
Il primo quartile può appartenere al campione casuale oppure no.
Quartili
Il primo quartile è quel valore che lascia a sinistra il 25% dei dati.
Il primo quartile può appartenere al campione casuale oppure no.
Mostriamo con un esempio come si determina Esempio. L’età per un campione di 5 studenti è
1° passo: Il campione va ordinato:
19,20,21,22,25
21,25,19,20,22
Quartili
Il primo quartile è quel valore che lascia a sinistra il 25% dei dati.
Il primo quartile può appartenere al campione casuale oppure no.
Mostriamo con un esempio come si determina Esempio. L’età per un campione di 5 studenti è
1° passo: Il campione va ordinato:
Dunque il primo quartile
19,20,21,22,25
21,25,19,20,22
Q1
si colloca fra l’elemento di posizione 1 e quello posizione 2.2° passo: Determinare il rango (la posizione) per il primo quartile:
(n +1) × 0,25 = 1,5
.
Quartili
Il primo quartile è quel valore che lascia a sinistra il 25% dei dati.
Il primo quartile può appartenere al campione casuale oppure no.
Mostriamo con un esempio come si determina Esempio. L’età per un campione di 5 studenti è
1° passo: Il campione va ordinato:
Dunque il primo quartile
19,20,21,22,25
21,25,19,20,22
Q1
si colloca fra l’elemento di posizione 1 e quello posizione 2.2° passo: Determinare il rango (la posizione) per il primo quartile:
(n +1) × 0,25 = 1,5
.
I decimali nel numero trovato mi servono per stabilire l'esatto valore del primo quartile come stabilito nel...
Quartili
Il primo quartile è quel valore che lascia a sinistra il 25% dei dati.
Il primo quartile può appartenere al campione casuale oppure no.
Mostriamo con un esempio come si determina Esempio. L’età per un campione di 5 studenti è
1° passo: Il campione va ordinato:
Dunque il primo quartile
19,20,21,22,25
21,25,19,20,22
Q1
si colloca fra l’elemento di posizione 1 e quello posizione 2.19, Q1 ,20,21,22,25 👉 Q1 = 19 + 20 −19 (
.) × 0,5 = 19,5
2° passo: Determinare il rango (la posizione) per il primo quartile:
(n +1) × 0,25 = 1,5
.
I decimali nel numero trovato mi servono per stabilire l'esatto valore del primo quartile come stabilito nel...
3° passo:
1,5 - 1
Quartili
Il primo quartile è quel valore che lascia a sinistra il 25% dei dati.
Il primo quartile può appartenere al campione casuale oppure no.
Vediamo un altro esempio.
Quartili
Il primo quartile è quel valore che lascia a sinistra il 25% dei dati.
Il primo quartile può appartenere al campione casuale oppure no.
Esempio. L’altezza di 4 giocatori di basket è
186,189,190,185
In questo caso il primo quartile è
185, Q1 ,186,189,190
Determinare il rango per il primo quartile:
(
n +1)
× 0,25 = 1,25Q1 Q1 = 185 × 186 −185 = 185 × 186 −185 ( ( ) ) × 0,25 = × 0,25 = 185,25 185,25
Vediamo un altro esempio.
185, ( n +1 Q1 ,186,189,190 ) × 0,25 = 1,25
Quartili
Il terzo quartile è quel valore che lascia a sinistra il 75% dei dati.
Il terzo quartile può appartenere al campione casuale oppure no.
Quartili
Il terzo quartile è quel valore che lascia a sinistra il 75% dei dati.
Il terzo quartile può appartenere al campione casuale oppure no.
Esempio. L’età per un campione di 5 studenti è Il campione va ordinato:
Determinare il rango per il terzo quartile:
(
n +1)
× 0,75 = 4,5 Il terzo quartile19,20,21,22,25
21,25,19,20,22
Q3
si colloca fra l’elemento di posizione 4 e quello diposizione 5
👉 19,20,21,22, Q3 ,25 👉 Q3 = 22 + 25 − 22 (
.) × 0,5 = 23,5 .
Quartili
Il terzo quartile è quel valore che lascia a sinistra il 75% dei dati.
Il terzo quartile può appartenere al campione casuale oppure no.
Esempio. L’età per un campione di 5 studenti è Il campione va ordinato:
Determinare il rango per il terzo quartile:
(
n +1)
× 0,75 = 4,5 Il terzo quartile19,20,21,22,25
21,25,19,20,22
Q3
si colloca fra l’elemento di posizione 4 e quello diposizione 5
👉 19,20,21,22, Q3 ,25 👉 Q3 = 22 + 25 − 22 (
.) × 0,5 = 23,5 .
Esempio. L’altezza di 4 giocatori di basket è
186,189,190,185
.In questo caso il terzo quartile è
185,186,189, Q3 ,190
Determinare il rango per il terzo quartile:
(
n +1)
× 0,75 = 3,75Q3 = 189 + 190 −189 ( ) × 0,75 = 189, 75
.Box-plot
Box-plot
Il Box-plot (o diagramma a scatola e baffi) è un diagramma che fornisce una rappresentazione grafica della distribuzione dei dati, evidenziando dove cade la maggioranza dei valori, e di quei valori che differiscono di parecchio dalla norma, cosiddetti dati anomali.
Box-plot
Il Box-plot (o diagramma a scatola e baffi) è un diagramma che fornisce una rappresentazione grafica della distribuzione dei dati, evidenziando dove cade la maggioranza dei valori, e di quei valori che differiscono di parecchio dalla norma, cosiddetti dati anomali.
I capisaldi nella rappresentazione di un box-plot sono
Box-plot
Il Box-plot (o diagramma a scatola e baffi) è un diagramma che fornisce una rappresentazione grafica della distribuzione dei dati, evidenziando dove cade la maggioranza dei valori, e di quei valori che differiscono di parecchio dalla norma, cosiddetti dati anomali.
• Q0 = min( )
• Q1 = 1° quartile
• Q2 = mediana o 2° quartile
• Q3 = 3° quartile;
• Q4 = max( )
IQR = Q3 - Q1 = campo di variazione interquartile I capisaldi nella rappresentazione di un box-plot sono
x
1, x
2, …, x
nx
1, x
2, …, x
nBox-plot
Il Box-plot (o diagramma a scatola e baffi) è un diagramma che fornisce una rappresentazione grafica della distribuzione dei dati, evidenziando dove cade la maggioranza dei valori, e di quei valori che differiscono di parecchio dalla norma, cosiddetti dati anomali.
• Q0 = min( )
• Q1 = 1° quartile
• Q2 = mediana o 2° quartile
• Q3 = 3° quartile;
• Q4 = max( )
IQR = Q3 - Q1 = campo di variazione interquartile I capisaldi nella rappresentazione di un box-plot sono
x
1, x
2, …, x
nx
1, x
2, …, x
nIQR = Q3 - Q1 = campo di variazione interquartile.
Introduciamo infine il numero
Box-plot
10,3; 12,9; 12,9; 13,5; 13,7; 14,0; 14,2; 15,0; 15,4; 15,7;
16,6; 17,1; 17,4; 17,8; 18,3; 18,3; 18,6; 18,9; 19,7; 20,3;
20,7; 20,8; 21,4; 23,0; 23,2; 23,7; 26,1; 27,1; 29,8; 33,8.
Box-plot
10,3; 12,9; 12,9; 13,5; 13,7; 14,0; 14,2; 15,0; 15,4; 15,7;
16,6; 17,1; 17,4; 17,8; 18,3; 18,3; 18,6; 18,9; 19,7; 20,3;
20,7; 20,8; 21,4; 23,0; 23,2; 23,7; 26,1; 27,1; 29,8; 33,8.
Primo quartile:
(
30 +1)
× 0,25 = 7,75 Si colloca fra le posizioni 7 e 8Il suo valore è fra
14,2 15
e14,2 + 15 −14,2 ( ) × 0,75 = 14,8
ed è pari a.Box-plot
10,3; 12,9; 12,9; 13,5; 13,7; 14,0; 14,2; 15,0; 15,4; 15,7;
16,6; 17,1; 17,4; 17,8; 18,3; 18,3; 18,6; 18,9; 19,7; 20,3;
20,7; 20,8; 21,4; 23,0; 23,2; 23,7; 26,1; 27,1; 29,8; 33,8.
Mediana:
(
30 +1)
× 0,5 = 15,5Si colloca fra le posizioni 15 e 16 Punto medio fra
ossia
18, 3 18, 3
e18, 3
.Primo quartile:
(
30 +1)
× 0,25 = 7,75 Si colloca fra le posizioni 7 e 8Il suo valore è fra
14,2 + 15 −14,2 ( 14,2
e) 15 × 0,75 = 14,8
ed è pari a.Box-plot
10,3; 12,9; 12,9; 13,5; 13,7; 14,0; 14,2; 15,0; 15,4; 15,7;
16,6; 17,1; 17,4; 17,8; 18,3; 18,3; 18,6; 18,9; 19,7; 20,3;
20,7; 20,8; 21,4; 23,0; 23,2; 23,7; 26,1; 27,1; 29,8; 33,8.
Mediana:
(
30 +1)
× 0,5 = 15,5Si colloca fra le posizioni 15 e 16 Punto medio fra
ossia
Terzo quartile:
(
30 +1)
× 0,75 = 23,25 Si colloca fra le posizioni 23 e 24Il suo valore è fra
18, 3 18, 3
e18, 3
.21, 4 + 23− 21,4 ( 21, 4 23
e) × 0,25 = 21,8
. ed è pari a Primo quartile:
(
30 +1)
× 0,25 = 7,75 Si colloca fra le posizioni 7 e 8Il suo valore è fra
14,2 + 15 −14,2 ( 14,2
e) 15 × 0,75 = 14,8
ed è pari a.Box-plot
10,3; 12,9; 12,9; 13,5; 13,7; 14,0; 14,2; 15,0; 15,4; 15,7;
16,6; 17,1; 17,4; 17,8; 18,3; 18,3; 18,6; 18,9; 19,7; 20,3;
20,7; 20,8; 21,4; 23,0; 23,2; 23,7; 26,1; 27,1; 29,8; 33,8.
Mediana:
(
30 +1)
× 0,5 = 15,5Si colloca fra le posizioni 15 e 16 Punto medio fra
ossia
Terzo quartile:
(
30 +1)
× 0,75 = 23,25 Si colloca fra le posizioni 23 e 24Il suo valore è fra
18, 3 18, 3
e18, 3
.21, 4 + 23− 21,4 ( 21, 4 23
e) × 0,25 = 21,8
.
Box plot ore di studio
10 30 25
20 15 ed è pari a
Primo quartile:
(
30 +1)
× 0,25 = 7,75 Si colloca fra le posizioni 7 e 8Il suo valore è fra
14,2 + 15 −14,2 ( 14,2
e) 15 × 0,75 = 14,8
ed è pari a.Box-plot
10,3; 12,9; 12,9; 13,5; 13,7; 14,0; 14,2; 15,0; 15,4; 15,7;
16,6; 17,1; 17,4; 17,8; 18,3; 18,3; 18,6; 18,9; 19,7; 20,3;
20,7; 20,8; 21,4; 23,0; 23,2; 23,7; 26,1; 27,1; 29,8; 33,8.
Mediana:
(
30 +1)
× 0,5 = 15,5Si colloca fra le posizioni 15 e 16 Punto medio fra
ossia
Terzo quartile:
(
30 +1)
× 0,75 = 23,25 Si colloca fra le posizioni 23 e 24Il suo valore è fra
18, 3 18, 3
e18, 3
.21, 4 + 23− 21,4 ( 21, 4 23
e) × 0,25 = 21,8
.
Box plot ore di studio
10 30 25
20
15 • Q1 ed è pari a
Primo quartile:
(
30 +1)
× 0,25 = 7,75 Si colloca fra le posizioni 7 e 8Il suo valore è fra
14,2 + 15 −14,2 ( 14,2
e) 15 × 0,75 = 14,8
ed è pari a.Box-plot
10,3; 12,9; 12,9; 13,5; 13,7; 14,0; 14,2; 15,0; 15,4; 15,7;
16,6; 17,1; 17,4; 17,8; 18,3; 18,3; 18,6; 18,9; 19,7; 20,3;
20,7; 20,8; 21,4; 23,0; 23,2; 23,7; 26,1; 27,1; 29,8; 33,8.
Mediana:
(
30 +1)
× 0,5 = 15,5Si colloca fra le posizioni 15 e 16 Punto medio fra
ossia
Terzo quartile:
(
30 +1)
× 0,75 = 23,25 Si colloca fra le posizioni 23 e 24Il suo valore è fra
18, 3 18, 3
e18, 3
.21, 4 + 23− 21,4 ( 21, 4 23
e) × 0,25 = 21,8
.
Box plot ore di studio
10 30 25
20 15
• Q2
ed è pari a Primo quartile:
(
30 +1)
× 0,25 = 7,75 Si colloca fra le posizioni 7 e 8Il suo valore è fra
14,2 + 15 −14,2 ( 14,2
e) 15 × 0,75 = 14,8
ed è pari a.Box-plot
10,3; 12,9; 12,9; 13,5; 13,7; 14,0; 14,2; 15,0; 15,4; 15,7;
16,6; 17,1; 17,4; 17,8; 18,3; 18,3; 18,6; 18,9; 19,7; 20,3;
20,7; 20,8; 21,4; 23,0; 23,2; 23,7; 26,1; 27,1; 29,8; 33,8.
Mediana:
(
30 +1)
× 0,5 = 15,5Si colloca fra le posizioni 15 e 16 Punto medio fra
ossia
Terzo quartile:
(
30 +1)
× 0,75 = 23,25 Si colloca fra le posizioni 23 e 24Il suo valore è fra
18, 3 18, 3
e18, 3
.21, 4 + 23− 21,4 ( 21, 4 23
e) × 0,25 = 21,8
.
Box plot ore di studio
10 30 25
20 15 ed è pari a
• Q3 Primo quartile:
(
30 +1)
× 0,25 = 7,75Si colloca fra le posizioni 7 e 8 Il suo valore è fra
14,2 + 15 −14,2 ( 14,2
e) 15 × 0,75 = 14,8
ed è pari a.Dopo aver disegnato la "scatola" ora disegniamo i "baffi"
La lunghezza di ciascun baffo "non supera" il valore convenzionale 1,5 × Q3− Q1
( )
Q3
− Q1 = 7
quindi1,5 × 7 = 10,5
Si confronta il valore del minimo con il valoreQ1−10,5 = 14,6 −10,5 = 4,1
Poiché
min = 10,3 > 4,1
allora il baffo inferiore è collocato in corrispondenza del minimo.Box-plot
Box plot ore di studio
10 30 25
20 15 e se ne prende il più grande.
14,2 + 15 −14,2 ( )
Q1× 0,75 = 14,8
−10,5 = 14,6 −10,5 = 4,1min = 10,3 > 4,1 min = 10,3 > 4,1
min = 10,3 > 4,1
min = 10,3 > 4,1
Dopo aver disegnato la "scatola" ora disegniamo i "baffi"
La lunghezza di ciascun baffo "non supera" il valore convenzionale 1,5 × Q3− Q1
( )
Q3
− Q1 = 7
quindi1,5 × 7 = 10,5
Si confronta il valore del massimo con il valore
Q3+10,5 = 22,6 +10,5 = 33,1
Poiché
max = 33,8 > 33,1
allorail baffo superiore è collocato in corrispondenza di .
Box-plot
Box plot ore di studio
10 30 25
20 15 e se ne prende il più piccolo.
Q3+10,5 = 22,6 +10,5 = 33,1Q3+10,5 = 22,6 +10,5 = 33,1
max = 33,8 > 33,1 max
Q3= 33,8 > 33,1
+10,5 = 22,6 +10,5 = 33,1min = 10,3 > 4,1 max
Q3= 33,8 > 33,1
+10,5 = 22,6 +10,5 = 33,1min = 10,3 > 4,1
max
Q3= 33,8 > 33,1
+10,5 = 22,6 +10,5 = 33,1min = 10,3 > 4,1
Un valore del campione casuale “troppo distante” dal resto del campione casuale si dice outlier o valore anomalo. Più precisamente un outlier è un dato che si trova al di sopra del baffo superiore o al di sotto del baffo inferiore del box-plot
Poiché max = 33,8 > 33,1
allora 33,8 è un outlier. Esso si
Box-plot
Box plot ore di studio
10 30 25
20
disegna con un punto.
15max Q3 = 33,8 > 33,1 +10,5 = 22,6 +10,5 = 33,1 min = 10,3 > 4,1
35
Box-plot
10,3; 12,9; 12,9; 13,5; 13,7; 14,0; 14,2; 15,0; 15,4; 15,7;
16,6; 17,1; 17,4; 17,8; 18,3; 18,3; 18,6; 18,9; 19,7; 20,3;
20,7; 20,8; 21,4; 23,0; 23,2; 23,7; 26,1; 27,1; 29,8; 33,8.
Dataset ore di studio
Box plot ore di studio
10 30 25
20 15
35