1
Esercizio 1
Considerata la seguente distribuzione relativa allo sport principale praticato da 500 ragazzi e ragazze
Sport Frequenza assoluta
Basket 62
Calcio 182
Danza 28
Nuoto 75
Pallavolo 95
Tennis 58
500
si determini la distribuzione espressa mediante le frequenze relative, si costruisca il corrispondente grafico a nastri e si determini, se possibile: a) la moda, b) la mediana, c) la media
Soluzione
Sport Frequenza assoluta
Basket 0.124
Calcio 0.364
Danza 0.056
Nuoto 0.150
Pallavolo 0.190
Tennis 0.116
1.000
a) La moda è la modalità “calcio”, come si nota anche dal grafico, mentre gli altri indici non possono essere calcolati per la natura della variabile
0 0,05 0,1 0,15 0,2 0,25 0,3 0,35 0,4
Danza Tennis Basket Nuoto Pallavolo Calcio
frequenza relativa
sport
2
Esercizio 2
Considerata la seguente sequenza di modalità relative a una variabile qualitativa ordinabile
A B B C D A A B A A B B C B C D si determini:
a) la distribuzione di frequenza espressa mediante frequenze assolute e relative e le corrispondenti frequenze cumulate (sia assolute sia relative), b) si disegni il grafico a barre utilizzando le frequenze assolute,
c) si individui la moda Soluzione
a)
X Freq. ass. Freq. rel. Freq. ass. cum. Freq. rel. cum.
A 5 0.3125 5 0.3125
B 6 0.3750 11 0.6875
C 3 0.1875 14 0.8750
D 2 0.1250 16 1.0000
16 1.0000 b)
c) La moda corrisponde a B
3
Esercizio 3
Considerata la sequenza dei valori della variabile “numero di smartphone”
rilevata su 4 famiglie
3 4 1 4
si determini: a) la moda, b) la mediana, c) la media, d) la varianza Soluzione
a) La moda è 4
b) Una volta ordinata la serie dall’intensità più piccola alla più grande 1 3 4 4
si determina il posto della mediana che risulta pari a ⌈4 × 0.5⌉ = 2 per cui x0.5=3 c)
𝑥̅ = 3 + 4 + 1 + 4
4 = 3
d) Il momento ordinario del secondo ordine è pari a 𝑚2 = 9 + 16 + 1 + 16
4 = 10.5
per cui la varianza risulta
𝑠2 = 10.5 − 32 = 1.5
4
Esercizio 4
Data la seguente sequenza di intensità relative a una variabile quantitativa discreta
-2 -1 0 0 2 5 0 -1
a) si determini la distribuzione di frequenza e si disegni il grafico ad aste corrispondente utilizzando le frequenze relative
Si calcoli inoltre:
b) la media,
c) l’ampiezza del campo di variazione, d) il primo quartile,
e) la varianza.
Soluzione
a) La distribuzione di frequenza risulta
X Frequenza assoluta Frequenza relativa
-2 1 0.125
-1 2 0.250
0 3 0.375
2 1 0.125
5 1 0.125
8 1.000
mentre il grafico corrispondente assume la forma riportata nella figura successiva
5
b) La media è pari a
𝑥̅ = −2 − 1 × 2 + 2 + 5
8 = 0.375
c) L’ampiezza del campo di variazione è dato da 5-(-2) =7
d) Il primo quartile occupa il posto ⌈8 × 0.25⌉ = 2 per cui corrisponde all’intensità -1
e) Il momento ordinario del secondo ordine è pari a
𝑚2 = 4 + 1 × 2 + 4 + 25
8 = 4.375
per cui la varianza risulta
𝑠2 = 4.375 − 0.3752 =4.234375
0 0,05 0,1 0,15 0,2 0,25 0,3 0,35 0,4
-3 -2 -1 0 1 2 3 4 5 6
frequenza relativa
X
6
Esercizio 5
Data la sequenza di intensità relative a una variabile quantitativa continua 1.6 0.4 1.4 1.1 -0.1 0.2 0.6 0.9 -1.6 -0.5
1.3 0.0 -0.2 0.9 0.3 0.1 -0.8 1.9 1.4 -0.5 a) si determini la distribuzione di frequenza nelle classi
(-2 − 0], (0 − 1], (1 − 2]
calcolando sia le frequenze assolute sia le frequenze relative b) si disegni l’istogramma.
Sulla distribuzione in classi si calcoli: c) la classe modale, d) la media, e) la deviazione standard, f) l’indice 𝑎3 di asimmetria
Soluzione
a) La distribuzione in classi è riportata nella tabella successiva X Frequenza assoluta Frequenza relativa
-2 − 0 7 0.35
0 − 1 7 0.35
1 − 2 6 0.30
20 1.00
b) Per disegnare l’istogramma occorre calcolare la densità di frequenza associata a ciascuna classe. I suoi valori sono riportati nella tabella successiva
X Densità -2 − 0 0.175 0 − 1 0.350 1 − 2 0.300
7
c) La classe modale è la seconda: (0, 1], in quanto è questa la classe a cui è associata la densità di frequenza massima
d) La media è data da
𝑥̅ = −1 × 0.35 + 0.5 × 0.35 + 1.5 × 0.3 = 0.275 e) Il secondo momento ordinario corrisponde a
𝑚2 = 1 × 0.35 + 0.25 × 0.35 + 2.25 × 0.3 = 1.1125 La varianza è pari quindi a 1.1125-0.2752 = 1.036875
La deviazione standard, approssimata a 6 cifre decimali, risulta 𝑠 =1.018271
f) Per calcolare l’indice di asimmetria conviene calcolare gli scarti elevati al cubo e poi farne la media. La tabella successiva riporta gli elementi utili ai fini del calcolo
0 0,05 0,1 0,15 0,2 0,25 0,3 0,35 0,4
-3 -2 -1 0 1 2 3
densità
X
8
Valori centrali Scarti Scarti al cubo Frequenza relativa
-1 -1.275 -2.072672 0.35
0 0.225 0.011391 0.35 1 1.225 1.838266 0.30 1.00
Dai dati riportati nella tabella precedente si ottiene
𝑚̅3 = −2.072672 × 0.35 + 0.011391 × 0.35 + 1.838266 × 0.3 =
= −0.169969 Per cui l’indice di asimmetria è pari a
𝑎3 =−0.169969
1.0182713 ≈ −0.16098
La distribuzione presenta quindi una lieve asimmetria negativa, come si nota anche dalla forma dell’istogramma
9
Esercizio 6
Considerate 50 unità statistiche su cui la variabile di interesse X presenta la distribuzione riportata nella tabella seguente
Determinazioni Frequenza relativa
0 0.2
1 0.5
2 0.3
si determini: a) la moda, b) i tre quartili, c) la media, d) la deviazione standard
Soluzione a) la moda è 1
c) la media è pari a 𝑥̅ = 0×0.2 + 1×0.5 + 2×0.3 = 1.1
d) il momento ordinario di ordine 2 risulta m2 = 1×0.5 + 22×0.3 = 1.7 per cui la varianza è pari a 𝑠𝑥2 = 1.7 – 1.12 = 0.49 e 𝑠𝑥 = 0.7
b) Per determinare i quartili è necessario calcolare le frequenze assolute cumulate. Dai dati della tabella si ottiene
Determinazioni Frequenza assoluta Frequenza assoluta cumulata
0 0.2×50=10 10
1 0.5×50=25 35
2 0.3×50=15 50
x0.25 occupa il posto ⌈50 × 0.25⌉ = ⌈12.5⌉=13 per cui x0.25=1 x0.5 occupa il posto ⌈50 × 0.5⌉ = ⌈25⌉=25 per cui x0.5=1 x0.75 occupa il posto ⌈50 × 0.75⌉ = ⌈37.5⌉=38 per cui x0.75=2
10
Esercizio 7
Date le seguenti informazioni relative a una variabile continua X Classi Frequenza
-3 − -1 15 -1 − 1 15 1 – 5 20 50
Se ne disegni l’istogramma e si calcoli: a) la classe modale, b) la media, c) il momento ordinario di ordine 2, d) la varianza, e) il coefficiente di variazione Soluzione
Per il calcolo della moda e per disegnare l’istogramma occorre calcolare la densità associata a ciascuna classe, ottenendo i valori riportati nell’ultima colonna della tabella successiva
Classi Frequenza relativa
densità
-3 − -1 0.3 0.15
-1 − 1 0.3 0.15
1 – 5 0.4 0.10
1.0 Dalla tabella risulta che
a) Esistono due classi modali: (-3, -1] e (-1, 1]
L’istogramma assume la forma riportata nella figura successiva
11
b) La media risulta
𝑥̅ = −2 × 15 + 0 × 15 + 3 × 20
50 = 0.6
c) Il momento ordinario di ordine 2 è pari a
𝑚2 =4 × 15 + 0 × 15 + 9 × 20
50 = 4.8
d) La varianza è data quindi da
𝑠2 = 4.8 − 0.62 = 4.44
e) Il CV non può essere calcolato perché la variabile assume valori negativi
0 0,05 0,1 0,15 0,2
-4 -3 -2 -1 0 1 2 3 4 5 6
densità
X
12
Esercizio 8
Considerata la seguente sequenza di valori, -1 -2 -2 3 4 0 0 1
si determini: a) la moda, b) i tre quartili, c) il rango interquartile, d) la media, e) la varianza
Soluzione
La sequenza ordinata è
-2 -2 -1 0 0 1 3 4
a) esistono due mode che corrispondono ai valori -2 e 0 b) x0.25 occupa il posto ⌈8 × 0.25⌉ = ⌈2⌉=2 per cui x0.25=-2
x0.5 occupa il posto ⌈8 × 0.5⌉ = ⌈4⌉=4 per cui x0.5=0 x0.75 occupa il posto ⌈8 × 0.75⌉ = ⌈6⌉=6 per cui x0.75=1 c) Il rango interquartile è Wx = 1-(-2) = 3
d) La media è data da
𝑥̅ = −2 × 2 − 1 + 1 + 3 + 4
8 =3
8 = 0.375 e) Il secondo momento dall’origine è pari a
𝑚2 =4 × 2 + 1 × 2 + 9 + 16
8 = 35
8 = 4.375 per cui la varianza è uguale a
𝑠2 =35 8 − 9
64 = 4.234375
13
Esercizio 9
Data la seguente distribuzione in classi relativa a una variabile continua X Classi Frequenza assoluta cumulata
-5 − -3 4
-3 − -1 6
-1 – 3 10
si rappresenti graficamente tale distribuzione e si determini: a) la classe modale, b) la media, c) il secondo momento centrale.
Soluzione
Occorre innanzitutto calcolare le frequenze assolute e le densità, che assumono i valori contenuti nella seconda e terza colonna della tabella successiva
Classi Frequenza assoluta Frequenza relativa densità
-5 − -3 4 0.4 0.2
-3 − -1 2 0.2 0.1
-1 – 3 4 0.4 0.1
10 1.0
L’istogramma assume la forma riportata nella figura successiva
0 0,05 0,1 0,15 0,2 0,25
-6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6
densità
X
14
a) La classe modale corrisponde all’intervallo (-5, -3]
b) La media è pari a
𝑥̅ = −4 × 0.4 − 2 × 0.2 + 1 × 0.4 = −1.6 c) Il secondo momento dall’origine è uguale a
𝑚2 = 16 × 0.4 + 4 × 0.2 + 1 × 0.4 = 7.6 Per cui il secondo momento centrale (ossia la varianza) risulta
𝑚̅2 = 𝑠2 = 7.6 − (−1.6)2 = 5.04
15
Esercizio 10
I dipendenti di un’azienda commerciale risultano distribuiti come riportato nelle prime due colonne della tabella successiva. La terza colonna riporta invece lo stipendio medio pro-capite lordo annuo
Frequenza assoluta Stipendio medio annuo (in euro)
Dirigente 1 53000
Capo Ufficio 3 32500
Impiegato 14 28200
Operaio 27 23300
Manovale 30 15800
Per la variabile stipendio medio annuo si vuole calcolare: a) la moda, b) i tre quartili, c) la media
Soluzione
a) La moda della variabile stipendio medio annuo è 15800, in quanto è questo il valore a cui è associata la frequenza massima
b) Per determinare i tre quartili occorre ordinare i valori della variabile e calcolare le frequenze cumulate corrispondenti
Stipendio medio annuo (in euro)
Frequenza assoluta Frequenza assoluta cumulata
15800 30 30
23300 27 57
28200 14 71
32500 3 74
53000 1 75
I posti dei tre quartili risultano rispettivamente uguali a 19, 38 e 57, per cui risulta x0.25=15800, x0.5=23300, x0.75=23300
c) La media, infine, risulta 𝑥̅ = 1
75× (15800 × 30 + 23300 × 27 + ⋯ ) = 21978. 6̅
16
Esercizio 11
Data la seguente sequenza di osservazioni relativa a una variabile quantitativa discreta X
-1 0 1 2 -3 -2 4 3 1 5
si determini: 1) la moda, 2) la mediana, 3) la media, 4) l’ampiezza del campo di variazione, 5) la differenza interquartile, 6) la varianza, 7) il coefficiente di variazione.
Si disegni inoltre il boxplot Soluzione
La sequenza ordinata risulta
-3 -2 -1 0 1 1 2 3 4 5 1) La moda corrisponde all’intensità 1
2) La mediana occupa il 5°posto, per cui x0.5=1 3) 𝑥̅=1
4) L’ampiezza del campo di variazione è 5-(-3)=8
5) Il terzo quartile occupa l’8°posto, per cui x0.75=3 Il primo quartile occupa il 3°posto, per cui x0.25=-1
La differenza interquartile è quindi pari a x0.75-x0.25= Wx =4
6) Il momento ordinario del secondo ordine risulta 𝑚2𝑥 = 7, per cui la varianza è 𝑠𝑥2 =6
7) Il CV non può essere calcolato perché la variabile assume valori negativi
Il rettangolo che compone il boxplot ha la base inferiore in corrispondenza di x0.25=-1 e la base superiore in corrispondenza di x0.75=3
17
Il VAI corrisponde alla più piccola osservazione ≥ x0.25−Wx = −1−1.5×4 = −7 Quindi il VAI è pari a -3
Il VAS corrisponde alla più grande osservazione ≤ x0.75 + Wx = +1.5×4 = 9 Quindi il VAS è pari a 5
Il boxplot assume quindi la forma seguente, in cui il simbolo corrispondente al rombo indica la media aritmetica (che coincide con la mediana)
18
Esercizio 12
Data la sequenza di osservazioni dell’esercizio precedente si consideri la variabile Y=4 - 2X e se ne determini: 1) la moda, 2) la mediana, 3) la media, 4) l’ampiezza del campo di variazione, 5) il rango interquartile, 6) la varianza.
Sapendo inoltre che per la variabile X risulta 𝑎3𝑥 = 0 e 𝑎4𝑥 = 1.96̅ si determini 7) l’indice di asimmetria 𝑎3𝑦, 8) l’indice di curtosi 𝑎4𝑦 per la variabile Y.
Soluzione
La sequenza ordinata della variabile Y risulta
-6 -4 -2 0 2 2 4 6 8 10
1) La moda è 2
2) La mediana occupa il 5° posto, per cui y0.5=2 3) la media è 𝑦̅= 4 - 2𝑥̅ = 2
4) L’ampiezza del campo di variazione corrisponde alla differenza 10-(-6)=16 5) Il terzo quartile occupa l’8° posto, per cui y0.75=6;
mentre il primo quartile occupa il 3° posto, per cui y0.25=-2;
La differenza interquartile (o rango interquartile) è y0.75-y0.25=8 6) La varianza è 𝑠𝑦2 = (−2)2𝑠𝑥2 =24
7) In base alla proprietà di una trasformazione lineare, tenendo presente che Y=4 - 2X, per cui il segno di b è negativo, l’indice di asimmetria per la Y risulta
𝑎3𝑦 = −𝑎3𝑥 = 0
8) In base alla proprietà di una trasformazione lineare risulta 𝑎4𝑦 = 𝑎4𝑥 per qualsiasi valore di 𝑎 e di b (con b≠0), per cui
𝑎4𝑦 = 𝑎4𝑥 = 1.96̅
19
Esercizio 13
Date le seguenti distribuzioni delle età dei dipendenti di una cooperativa classificati per sesso
Maschi Femmine
Età ni Età ni
19 2 18 1
20 6 25 2
21 3 26 2
22 1 28 2
23 1 29 1
25 1 30 2
28 1 31 3
30 1 32 1
35 1 33 2
37 1 16
18
disegnare i due boxplot corrispondenti
Soluzione
Conviene calcolare le frequenze assolute cumulate
Maschi Femmine
Età ni Ni Età ni Ni
19 2 2 18 1 1
20 6 8 25 2 3
21 3 11 26 2 5
22 1 12 28 2 7
23 1 13 29 1 8
25 1 14 30 2 10
28 1 15 31 3 13
30 1 16 32 1 14
35 1 17 33 2 16
37 1 18 16
18
20
Maschi:
I posti occupati dai 3 quartili sono, nell’ordine, il 5°, il 9° e il 14°
Per cui risulta x0.25= 20, x0.5= 21, x0.75= 25.
Per il calcolo dei valori adiacenti, risulta
x0.25 − Wx = 20 – 1.5×(25-20) = 12.5, x0.75 + Wx = 25 + 1.5×(25-20) = 32.5, VAI = 19 in quanto è la più piccola osservazione ≥ 12.5 VAS = 30 in quanto è la più grande osservazione ≤ 32.5
Femmine:
I posti occupati dai 3 quartili sono, nell’ordine, il 4°, l’8° e il 12°
Per cui risulta x0.25= 26, x0.5= 29, x0.75= 31.
Per il calcolo dei valori adiacenti, risulta
x0.25 − Wx = 26 – 1.5×(31-26) = 18.5, x0.75 + Wx = 31 + 1.5×(31-26) = 38.5, VAI = 25 in quanto è la più piccola osservazione ≥ 18.5 VAS = 33 in quanto è la più grande osservazione ≤ 38.5
I due boxplot assumono la forma indicata nel grafico successivo, dal quale si nota che
- l’ordine di grandezza dell’età è minore per gli individui di sesso maschile - la variabilità dell’età è più o meno la stessa per entrambi i sessi
- nei maschi l’età mostra un’asimmetria positiva e nelle femmine un’asimmetria negativa.
21
- Nei maschi sono presenti due valori anomali che corrispondono agli individui di età più elevata, mentre nelle femmine c’è un solo valore anomalo che corrisponde all’unità con la minore età