QUADERNO 3 B I.T.E. – 2019/2020
QUADERNO n.4 Capitolo 9: Statistica INTRODUZIONE
La statistica è la scienza che si occupa di interpretare i fenomeni collettivi attraverso raccolte di dati. Possiamo distinguere due diversi approcci:
Statistica descrittiva Statistica inferenziale Raccogliamo i dati di tutta la popolazione
Rappresentiamo i dati in modo sintetico Interpretiamo i dati
Raccogliamo i dati di una parte di popolazione Rappresentiamo i dati in modo sintetico Interpretiamo i dati cercando di dedurre delle conclusioni generali.
Occorre valutare anche un margine di errore.
Le basi della statistica sono anche argomento del primo bienno delle medie superiori, quindi le prime definizioni vanno intese come richiami.
DEFINIZIONI (richiamo)
Si dice unità statistica un singolo soggetto su cui vogliamo indagare.
Si dice popolazione l'insieme delle unità statistiche.
Si dice carattere la caratteristica oggetto della nostra indagine.
Il carattere può presentarsi in due modalità: quantitativo se espresso tramite un numero o qualitativo se espresso attraverso una parola.
Il carattere quantitativo si dice variabile statistica continua se il numero ottenuto è il risultato di una misurazione; si dice variabile statistica discreta se il numero ottenuto è il risultato di un conteggio.
Si dice frequenza assoluta il numero di volte in cui si presenta una certa modalità.
Si dice frequenza relativa il rapporto tra la frequenza assoluta e il totale delle unità statistiche.
Si dice frequenza cumulata la somma della frequenza di un certa modalità e delle sue precedenti (le modalità in questo caso devono avere un ordine)
Si dice distribuzione di frequenza l'insieme delle coppie ordinate (modalità; frequenza).
DEFINIZIONI (richiamo)
Si dice distribuzione semplice una distribuzione che interessa un solo carattere.
Si dice serie statistica una tabella
Modalità qualitativa Frequenza assoluta Frequenza relativa Si dice seriazione statistica una tabella
Modalità quantitativa Frequenza assoluta Frequenza relativa
Si dice istogramma una rappresentazione grafica della serie statistica in cui ad ogni modalità è assegnato un rettangolo con base fissata e altezza pari (proporzionale) alla frequenza.
Si dice ortogramma una rappresentazione grafica della serie statistica in cui ad ogni modalità è assegnato un rettangolo con altezza fissata e base pari (proporzionale) alla frequenza.
Si dice areogramma una rappresentazione grafica della serie statistica in cui ad ogni modalità è assegnata una porzione di area
Si dice ideogramma una rappresentazione grafica della serie statistica in cui ad ogni modalità è assegnata un'icona diversamente dimensionata o ripetuta a seconda della frequenza.
OSSERVAZIONE
Nelle definizioni sopra, per non appesantire troppo il discorso si è parlato sempre di istogramma, ortogramma, areogramma, ideogramma che rappresentano serie statistiche. Ovviamente possono rappresentare anche seriazioni statistiche.
OSSERVAZIONE
Parlando di istogramma e ortogramma si dà per scontato che la base si disegni con una linea orizzontale (ascisse) e l'altezza con una linea verticale (ordinate).
Parlando di areogramma, il più diffuso è il cosiddetto “grafico a torta”.
DEFINIZIONE
Si dice serie storica una tabella in cui oltre alle modalità e alle frequenze sia inserito anche un dato temporale.
OSSERVAZIONE
In genere le serie storiche vengono rappresentate graficamente col classico grafico cartesiano.
DEFINIZIONE
Si dice indice statistico un numero che intende esprimere una informazione sintetica circa un gruppo di dati.
L'indice statistico si dice indice di posizione se si tratta di un valore rappresentativo del gruppo di dati.
L'indice statistico si dice indice di variabilità se si tratta di un valore rappresentativo dell'errore che si commette sostituendo tutti i dati reali con il valore medio.
L'indice di posizione si dice media di calcolo (o analitica) se il valore ottenuto con un certo calcolo lascia invariata una certa quantità caratteristica del gruppo di dati.
L'indice di posizione si dice media di posizione (o lasca) se il valore medio si ottiene osservando l'ordine e/o la ricorrenza dei singoli dati.
DEFINIZIONE
Dati n numeri x1; x2; ... xn si dice media aritmetica M il numero che, sostituito ai numeri dati, ne lascia inalterata la somma.
M =
∑
i=1 nxi n
OSSERVAZIONE
Tutti gli studenti sanno benissimo cos'è la media aritmetica.
DEFINIZIONE
Dati n numeri x1; x2; ... xn a ciascuno dei quali sia assegnato un peso p1; p2;... ; pn si dice media aritmetica ponderata (o pesata) M il numero
M = ∑
i=1 n
p
ix
i∑
i=1 np
iOSSERVAZIONE
Si pensi al baricentro di un'asta con pesi diversi.
DEFINIZIONE
Dati n numeri x1; x2;... xn si dice media geometrica M il numero che sostituito ai numeri di partenza ne lascia invariato il prodotto.
M = √
n∏
i=1nx
iOSSERVAZIONE Perché “geometrica”?
La media aritmetica è il valore centrale di una progressione aritmetica (basata sull'addizione) con un numero dispari di elementi.
La media geometrica è il valore centrale di una progressione geometrica (con varie applicazioni geometriche) con un numero dispari di elementi.
OSSERVAZIONE
Si può anche definire la versione “ponderata” della media geometrica, ma questo va oltre gli scopi di questo corso.
DEFINIZIONE
Dati n numeri x1; x2; ... xn si dice media armonica M il numero che sostituito ai numeri di partenza lascia invariata la somma dei rispettivi reciproci.
M = n
∑
i=1n
1
x
iOSSERVAZIONE
L'aggettivo “armonico” è legato (un po' alla lontana) alle lunghezze d'onda degli armonici della musica (in questa sede è un po' complicato da spiegare).
DEFINIZIONE
Dati n numeri x1; x2; ... xn si dice media quadratica M il numero che sostituito ai numeri di
partenza lascia invariata la somma dei rispettivi quadrati.
M = √ ∑
i=1nn x
i2OSSERVAZIONE
La media quadratica è utile quando abbiamo dati numerici con segno negativo o positivo (come per esempio le temperature) ma ci occorrono delle valutazioni in valore assoluto. Ne vedremo un'applicazione proprio nei nostri studi.
OSSERVAZIONE
Fino ad ora abbiamo definito delle medie di calcolo, o analitiche che dir si voglia. Adesso invece andremo a definire delle medie di posizione, o lasche, che dir si voglia.
DEFINIZIONE
Dati n numeri x1; x2; ... xn ordinati si dice mediana M
• se n è dispari, il numero che occupa la posizione centrale;
• se n è pari, la media aritmetica dei due numeri nelle posizioni centrali DEFINIZIONE
Dati n numeri x1; x2; ... xn si dice moda M il numero che ha la frequenza massima.
OSSERVAZIONE
In un gruppo di dati potrebbero esserci anche più mode a pari merito.
OSSERVAZIONE Riepiloghiamo fino a qui:
Indici di posizione
Medie di calcolo (analitiche) Medie di posizione (lasche) Media aritmetica
Media geometrica Media armonica Media quadratica (semplici o ponderate)
Mediana Moda
DEFINIZIONE
Dati n numeri x1; x2; ... xn , sia M la loro media aritmetica, xmax il valore massimo e xmin il valore minimo:
• si dice campo di variazione il numero
Δ=
xmax−x
min• si dice scarto semplice il numero Si
= ∣
M −xi∣
• si dice scarto semplice medio la media aritmetica degli scarti semplici;
• si dice scarto quadratico medio o deviazione standard la media quadratica degli scarti semplici;
• si dice varianza il quadrato della deviazione standard.
OSSERVAZIONE
Si può anche scrivere direttamente la formula dello scarto semplice medio:
S=
∑
i=1 n∣ x
i−M ∣
n
Così come si può scrivere direttamente la formula dello scarto quadratico medio (o deviazione standard):
σ= √ ∑
i=1n( x n
i−M )
2Come pure si può scrivere direttamente la formula della varianza:
σ
2=
∑
i=1 n( x
i−M )
2n
OSSERVAZIONE
In alcuni casi, per snellire lo studio statistico, si preferisce usare la varianza al posto della deviazione standard in modo da risparmiarci il calcolo delle radici quadrate.
OSSERVAZIONE Riepiloghiamo di nuovo:
Indici di posizione Indici di variabilità
Medie di calcolo (analitiche)
Medie di posizione (lasche)
Campo di variazione Scarto semplice medio
Varianza
Scarto quadratico medio (deviazione standard) Media aritmetica
Media geometrica Media armonica Media quadratica (semplici o ponderate)
Mediana Moda
ESERCIZIO n.1 pag.407
Completa la seguente tabella sulla produzione di 800 scooter suddivisi in 4 modelli.
Tipo di scooter (modalità) Quantità (frequenza assoluta) Percentuale (frequenza relativa)
Alfabeta 200 25 %
XY 120 15 %
Tuono 320 40 %
S50 160 20 %
Per trovare la quantità degli Alfabeta si può calcolare
800−120−320−160=200
o alternativamente si può calcolare800× 25
100 = 200
. Per le frequenze relativa basta calcolare le percentuali:120
800 ×100=15 ; 320
800 ×100=40 ; 160
800 ×100=20
ESERCIZIO n.2 pag.407_a: il numero 170 rappresenta la quantità di mini car prodotte in un giorno.
_b: in totale vengono prodotte in un giorno
170+250+15+65=500
automobili. Le frequenze relative sono:170
500 ×100=34 ; 250
500 ×100=50 ; 15
500 ×100=3 ; 65
500 ×100=13
Mini car City car SUV Station Wagon
34 % 50 % 3 % 13 %
_c: nella produzione giornaliera Mini Car e City Car costituiscono l'84 % del totale. Abbiamo semplicemente calcolato
50+34=84
ESERCIZIO n.3 pag.407
Completa la tabella relativa alle mete scelte da 180 clienti di un'agenzia di viaggi.
Destinazione Frequenza assoluta Frequenza relativa
Europa 90 50 %
Asia 18 10 %
Africa 18 10 %
America 45 25 %
Oceania 9 5 %
Per quanto riguarda le frequenze relative mancanti:
90
180 ×100=50 ; 18
180 ×100=10 ; 9
180 ×100=5
Per quanto riguarda le frequenze assoluta mancanti: quella dell'Asia posso copiarla da quella dell'Africa, quella dell'America è la metà di quella dell'Europa.
Ma se preferite fare i conti senza pensiero alcuno, potete calcolare:
180× 10
100 =18 ;180× 25 100 =45
ESERCIZIO 4 pag. 407 (vero/falso)_a Vero ( si può eseguire l'addizione in modo veloce: (80+20)+(75+35)+90 ) _b Vero (ma di poco, il 7% corrisponde a
7×3=21
)Prduzione giornaliera
Automobili
Mini Car City Car SUV
Station Wagon
_c Vero (
90+80=170>150
)_d Vero (1 su 4, ovvero il 25%, ovvero 75) ESERCIZIO n.5 pag.407
_a: Gli alunni che praticano il calcio sono
30×3=90
._b: Il 5 % ovvero
5
100 = 0,05
._c: Occorre sommare le percentuali di nuoto e atletica:
20+10=30
, abbiamo già visto sopra che il 30% corrisponde a 90 alunni.ESERCIZIO n.6 pag.407
_a: il numero 165,5 rappresenta l'altezza media degli uomini alla visita di leva del 1928.
_b: l'altezza media è aumentata di
174,6−162,6=12,0
cm.ESERCIZIO n.7 pag.407 _a:
_b: Nel mese di luglio c'è stato il maggior numero di ore di sole (343), nel mese di gennaio il minimo (52).
_c: Scorrendo velocemente le variazioni tra un mese e l'altro osserviamo che:
gennaio/febbraio: aumentano febbraio/marzo:
111−92=19
marzo/aprile: aumentano aprile/maggio: aumentano maggio/giugno: aumentano giugno /luglio: aumentano luglio/agosto:
343−312=31
agosto/settembre:
312−228=84
settembre/ottobre:
228−91=137
ottobre /novembre:
91−80=11
novembre/dicembre: aumentano
gen feb mar apr mag giu lug ago set ott nov dic
0 50 100 150 200 250 300 350 400
Dunque la diminuzione più consistente è quella tra settembre e ottobre, con 137 ore in meno.
ESERCIZIO n.8 pag.408 _a:
Temperatura Numero giornate Frequenza relativa Freq. rel. cumulata
26 2 6,45 % 6,45 %
27 4 12,90 % 19,35 %
28 9 29,03 % 48,39 %
29 12 38,71 % 87,10 %
30 4 12,90 % 100 %
_b:
_c:
_26 _27 _28 _29 _30
ESERCIZIO n.9 pag.408 _a:
_b:
_c:
La percentuale dei risultati insufficienti è
5+20+15=40
.voti frequenza
_3 1
_4 4
_5 3
_6 5
_7 2
_8 4
_9 1
voti frequenza freq.rel.%
_3 1 5
_4 4 20
_5 3 15
_6 5 25
_7 2 10
_8 4 20
_9 1 5
Totale: 20
_3 _4 _5 _6 _7 _8 _9
0 1 2 3 4 5 6
ESERCIZIO n.10 pag.408 _a:
_b: sono andati al cinema non più di 4 volte:
1+3+6+5=15
appassionati._c: il 23,33 % è andato al cinema almeno 7 volte:
10+10+3,33=23,33
. ESERCIZIO n.11 pag.409volte frequenza freq.rel.%
_1 1 3,3333333333
_2 3 10
_3 6 20
_4 5 16,666666667
_5 4 13,333333333
_6 4 13,333333333
_7 3 10
_8 3 10
_9 1 3,3333333333
Totale: 30
età persone freq.rel.%
0-18 54 18
18-30 84 28
30-50 90 30
50-70 48 16
70-100 24 8
Totale: 300
0-18 18-30 30-50 50-70 70-100
ESERCIZIO pag.416 n.54
Il numero di addetti alla vendita di 50 imprese industriali ha la seguente distribuzione:
Numero di addetti alla vendita Numero di imprese industriali
0-4 4
4-8 12
8-12 16
12-16 14
16-20 4
Rappresenta i dati con un istogramma.
Determina il campo di variazione, lo scarto semplice medio e la deviazione standard usando il valore centrale di ogni classe.
Risposte:
Riporto l'istogramma realizzato con il foglio elettronico di openoffice.org
Per quanto riguarda la seconda parte delle richieste, non è esplicitata la natura della media aritmetica a cui fare riferimento, anche se la precisazione di “usando il valore centrale di ogni classe” ci permette di intuire che dobbiamo fare riferimento alla media dei numeri di addetti per ciascuna impresa piuttosto che quella delle imprese per addetto. (A pensarci bene, la seconda opzione avrebbe anche poco senso se supponiamo ragionevolmente che un addetto alla vendita lavori per una sola impresa.)
Dunque, nell'ottica di considerare la distribuzione degli addetti alla vendita sulle imprese il dato più alto è 20 e quello più basso è 0, dunque il campo di variazione è 20.
0-4 4-8 8-12 12-16 16-20
0 2 4 6 8 10 12 14 16 18
Inoltre, seguendo il suggerimento di usare il valore centrale per ogni classe, riscriviamo la tabella di distribuzione in questo modo:
Numero di addetti alla vendita Numero di imprese industriali
2 4
6 12
10 16
14 14
18 4
Abbiamo sostituito ogni classe con il suo valore centrale, ovvero la media aritmetica degli estremi.
Calcoliamo adesso la media aritmetica del numero di addetti per ogni impresa:
M = 2×4+6×12+10×16+14×14+18×4
4+12+16+14+4 =10,16
Calcoliamo poi gli scarti, ovvero il valore assoluto della differenza tra il singolo dato e M. Nella tabella realizzata con il foglio elettronico di openoffice.org potete vedere la colonna degli scarti in corrispondenza dei dati di partenza e anche la colonna degli scarti quadratici (gli scarti al quadrato).
Sempre tramite foglio elettronico è possibile calcolare lo scarto semplice medio S, ovvero la media aritmetica degli scarti:
S =(10,16−2)×4+(10,16−6)×12+(10,16−10)×16+(14−10,16)×14+(18−10,16)×4
4+12+16+14+4 =3,4048
La varianza V è la media aritmetica degli scarti quadratici:
V =(10,16−2)2×4+(10,16−6)2×12+(10,16−10)2×16+(14−10,16)2×14+(18−10,16)2×4
4+12+16+14+4 =18,5344
Lo scarto quadratico medio s, detto anche deviazione standard è la radice quadrata della varianza.
σ= √ 18,5344≈4,31
Numero di addetti alla vendita Numero di imprese industriali Scarti Scarti quadratici
2 4 8,16 66,5856
6 12 4,16 17,3056
10 16 0,16 0,0256
14 14 3,84 14,7456
18 4 7,84 61,4656
Media aritmetica: 10,16 Scarto semplice medio: 3,4048
Varianza 18,5344 Deviazione standard 4,3051596951