• Non ci sono risultati.

QUADERNO 3 B I.T.E. – 2019/2020QUADERNO n.4Capitolo 9: StatisticaINTRODUZIONELa

N/A
N/A
Protected

Academic year: 2021

Condividi "QUADERNO 3 B I.T.E. – 2019/2020QUADERNO n.4Capitolo 9: StatisticaINTRODUZIONELa"

Copied!
12
0
0

Testo completo

(1)

QUADERNO 3 B I.T.E. – 2019/2020

QUADERNO n.4 Capitolo 9: Statistica INTRODUZIONE

La statistica è la scienza che si occupa di interpretare i fenomeni collettivi attraverso raccolte di dati. Possiamo distinguere due diversi approcci:

Statistica descrittiva Statistica inferenziale Raccogliamo i dati di tutta la popolazione

Rappresentiamo i dati in modo sintetico Interpretiamo i dati

Raccogliamo i dati di una parte di popolazione Rappresentiamo i dati in modo sintetico Interpretiamo i dati cercando di dedurre delle conclusioni generali.

Occorre valutare anche un margine di errore.

Le basi della statistica sono anche argomento del primo bienno delle medie superiori, quindi le prime definizioni vanno intese come richiami.

DEFINIZIONI (richiamo)

Si dice unità statistica un singolo soggetto su cui vogliamo indagare.

Si dice popolazione l'insieme delle unità statistiche.

Si dice carattere la caratteristica oggetto della nostra indagine.

Il carattere può presentarsi in due modalità: quantitativo se espresso tramite un numero o qualitativo se espresso attraverso una parola.

Il carattere quantitativo si dice variabile statistica continua se il numero ottenuto è il risultato di una misurazione; si dice variabile statistica discreta se il numero ottenuto è il risultato di un conteggio.

Si dice frequenza assoluta il numero di volte in cui si presenta una certa modalità.

Si dice frequenza relativa il rapporto tra la frequenza assoluta e il totale delle unità statistiche.

Si dice frequenza cumulata la somma della frequenza di un certa modalità e delle sue precedenti (le modalità in questo caso devono avere un ordine)

Si dice distribuzione di frequenza l'insieme delle coppie ordinate (modalità; frequenza).

DEFINIZIONI (richiamo)

Si dice distribuzione semplice una distribuzione che interessa un solo carattere.

Si dice serie statistica una tabella

Modalità qualitativa Frequenza assoluta Frequenza relativa Si dice seriazione statistica una tabella

Modalità quantitativa Frequenza assoluta Frequenza relativa

Si dice istogramma una rappresentazione grafica della serie statistica in cui ad ogni modalità è assegnato un rettangolo con base fissata e altezza pari (proporzionale) alla frequenza.

Si dice ortogramma una rappresentazione grafica della serie statistica in cui ad ogni modalità è assegnato un rettangolo con altezza fissata e base pari (proporzionale) alla frequenza.

Si dice areogramma una rappresentazione grafica della serie statistica in cui ad ogni modalità è assegnata una porzione di area

Si dice ideogramma una rappresentazione grafica della serie statistica in cui ad ogni modalità è assegnata un'icona diversamente dimensionata o ripetuta a seconda della frequenza.

(2)

OSSERVAZIONE

Nelle definizioni sopra, per non appesantire troppo il discorso si è parlato sempre di istogramma, ortogramma, areogramma, ideogramma che rappresentano serie statistiche. Ovviamente possono rappresentare anche seriazioni statistiche.

OSSERVAZIONE

Parlando di istogramma e ortogramma si dà per scontato che la base si disegni con una linea orizzontale (ascisse) e l'altezza con una linea verticale (ordinate).

Parlando di areogramma, il più diffuso è il cosiddetto “grafico a torta”.

DEFINIZIONE

Si dice serie storica una tabella in cui oltre alle modalità e alle frequenze sia inserito anche un dato temporale.

OSSERVAZIONE

In genere le serie storiche vengono rappresentate graficamente col classico grafico cartesiano.

DEFINIZIONE

Si dice indice statistico un numero che intende esprimere una informazione sintetica circa un gruppo di dati.

L'indice statistico si dice indice di posizione se si tratta di un valore rappresentativo del gruppo di dati.

L'indice statistico si dice indice di variabilità se si tratta di un valore rappresentativo dell'errore che si commette sostituendo tutti i dati reali con il valore medio.

L'indice di posizione si dice media di calcolo (o analitica) se il valore ottenuto con un certo calcolo lascia invariata una certa quantità caratteristica del gruppo di dati.

L'indice di posizione si dice media di posizione (o lasca) se il valore medio si ottiene osservando l'ordine e/o la ricorrenza dei singoli dati.

DEFINIZIONE

Dati n numeri x1; x2; ... xn si dice media aritmetica M il numero che, sostituito ai numeri dati, ne lascia inalterata la somma.

M =

i=1 n

xi n

OSSERVAZIONE

Tutti gli studenti sanno benissimo cos'è la media aritmetica.

DEFINIZIONE

Dati n numeri x1; x2; ... xn a ciascuno dei quali sia assegnato un peso p1; p2;... ; pn si dice media aritmetica ponderata (o pesata) M il numero

M =

i=1 n

p

i

x

i

i=1 n

p

i

(3)

OSSERVAZIONE

Si pensi al baricentro di un'asta con pesi diversi.

DEFINIZIONE

Dati n numeri x1; x2;... xn si dice media geometrica M il numero che sostituito ai numeri di partenza ne lascia invariato il prodotto.

M =

n

i=1n

x

i

OSSERVAZIONE Perché “geometrica”?

La media aritmetica è il valore centrale di una progressione aritmetica (basata sull'addizione) con un numero dispari di elementi.

La media geometrica è il valore centrale di una progressione geometrica (con varie applicazioni geometriche) con un numero dispari di elementi.

OSSERVAZIONE

Si può anche definire la versione “ponderata” della media geometrica, ma questo va oltre gli scopi di questo corso.

DEFINIZIONE

Dati n numeri x1; x2; ... xn si dice media armonica M il numero che sostituito ai numeri di partenza lascia invariata la somma dei rispettivi reciproci.

M = n

i=1

n

1

x

i

OSSERVAZIONE

L'aggettivo “armonico” è legato (un po' alla lontana) alle lunghezze d'onda degli armonici della musica (in questa sede è un po' complicato da spiegare).

DEFINIZIONE

Dati n numeri x1; x2; ... xn si dice media quadratica M il numero che sostituito ai numeri di

partenza lascia invariata la somma dei rispettivi quadrati.

M =

i=1n

n x

i2

OSSERVAZIONE

La media quadratica è utile quando abbiamo dati numerici con segno negativo o positivo (come per esempio le temperature) ma ci occorrono delle valutazioni in valore assoluto. Ne vedremo un'applicazione proprio nei nostri studi.

OSSERVAZIONE

Fino ad ora abbiamo definito delle medie di calcolo, o analitiche che dir si voglia. Adesso invece andremo a definire delle medie di posizione, o lasche, che dir si voglia.

(4)

DEFINIZIONE

Dati n numeri x1; x2; ... xn ordinati si dice mediana M

se n è dispari, il numero che occupa la posizione centrale;

se n è pari, la media aritmetica dei due numeri nelle posizioni centrali DEFINIZIONE

Dati n numeri x1; x2; ... xn si dice moda M il numero che ha la frequenza massima.

OSSERVAZIONE

In un gruppo di dati potrebbero esserci anche più mode a pari merito.

OSSERVAZIONE Riepiloghiamo fino a qui:

Indici di posizione

Medie di calcolo (analitiche) Medie di posizione (lasche) Media aritmetica

Media geometrica Media armonica Media quadratica (semplici o ponderate)

Mediana Moda

DEFINIZIONE

Dati n numeri x1; x2; ... xn , sia M la loro media aritmetica, xmax il valore massimo e xmin il valore minimo:

si dice campo di variazione il numero

Δ=

xmax

−x

min

si dice scarto semplice il numero Si

= ∣

M −xi

si dice scarto semplice medio la media aritmetica degli scarti semplici;

si dice scarto quadratico medio o deviazione standard la media quadratica degli scarti semplici;

si dice varianza il quadrato della deviazione standard.

OSSERVAZIONE

Si può anche scrivere direttamente la formula dello scarto semplice medio:

S=

i=1 n

x

i

−M ∣

n

Così come si può scrivere direttamente la formula dello scarto quadratico medio (o deviazione standard):

σ= √

i=1n

( x n

i

−M )

2

(5)

Come pure si può scrivere direttamente la formula della varianza:

σ

2

=

i=1 n

( x

i

−M )

2

n

OSSERVAZIONE

In alcuni casi, per snellire lo studio statistico, si preferisce usare la varianza al posto della deviazione standard in modo da risparmiarci il calcolo delle radici quadrate.

OSSERVAZIONE Riepiloghiamo di nuovo:

Indici di posizione Indici di variabilità

Medie di calcolo (analitiche)

Medie di posizione (lasche)

Campo di variazione Scarto semplice medio

Varianza

Scarto quadratico medio (deviazione standard) Media aritmetica

Media geometrica Media armonica Media quadratica (semplici o ponderate)

Mediana Moda

ESERCIZIO n.1 pag.407

Completa la seguente tabella sulla produzione di 800 scooter suddivisi in 4 modelli.

Tipo di scooter (modalità) Quantità (frequenza assoluta) Percentuale (frequenza relativa)

Alfabeta 200 25 %

XY 120 15 %

Tuono 320 40 %

S50 160 20 %

Per trovare la quantità degli Alfabeta si può calcolare

800−120−320−160=200

o alternativamente si può calcolare

800× 25

100 = 200

. Per le frequenze relativa basta calcolare le percentuali:

120

800 ×100=15 ; 320

800 ×100=40 ; 160

800 ×100=20

ESERCIZIO n.2 pag.407

_a: il numero 170 rappresenta la quantità di mini car prodotte in un giorno.

_b: in totale vengono prodotte in un giorno

170+250+15+65=500

automobili. Le frequenze relative sono:

170

500 ×100=34 ; 250

500 ×100=50 ; 15

500 ×100=3 ; 65

500 ×100=13

Mini car City car SUV Station Wagon

34 % 50 % 3 % 13 %

(6)

_c: nella produzione giornaliera Mini Car e City Car costituiscono l'84 % del totale. Abbiamo semplicemente calcolato

50+34=84

ESERCIZIO n.3 pag.407

Completa la tabella relativa alle mete scelte da 180 clienti di un'agenzia di viaggi.

Destinazione Frequenza assoluta Frequenza relativa

Europa 90 50 %

Asia 18 10 %

Africa 18 10 %

America 45 25 %

Oceania 9 5 %

Per quanto riguarda le frequenze relative mancanti:

90

180 ×100=50 ; 18

180 ×100=10 ; 9

180 ×100=5

Per quanto riguarda le frequenze assoluta mancanti: quella dell'Asia posso copiarla da quella dell'Africa, quella dell'America è la metà di quella dell'Europa.

Ma se preferite fare i conti senza pensiero alcuno, potete calcolare:

180× 10

100 =18 ;180× 25 100 =45

ESERCIZIO 4 pag. 407 (vero/falso)

_a Vero ( si può eseguire l'addizione in modo veloce: (80+20)+(75+35)+90 ) _b Vero (ma di poco, il 7% corrisponde a

7×3=21

)

Prduzione giornaliera

Automobili

Mini Car City Car SUV

Station Wagon

(7)

_c Vero (

90+80=170>150

)

_d Vero (1 su 4, ovvero il 25%, ovvero 75) ESERCIZIO n.5 pag.407

_a: Gli alunni che praticano il calcio sono

30×3=90

.

_b: Il 5 % ovvero

5

100 = 0,05

.

_c: Occorre sommare le percentuali di nuoto e atletica:

20+10=30

, abbiamo già visto sopra che il 30% corrisponde a 90 alunni.

ESERCIZIO n.6 pag.407

_a: il numero 165,5 rappresenta l'altezza media degli uomini alla visita di leva del 1928.

_b: l'altezza media è aumentata di

174,6−162,6=12,0

cm.

ESERCIZIO n.7 pag.407 _a:

_b: Nel mese di luglio c'è stato il maggior numero di ore di sole (343), nel mese di gennaio il minimo (52).

_c: Scorrendo velocemente le variazioni tra un mese e l'altro osserviamo che:

gennaio/febbraio: aumentano febbraio/marzo:

111−92=19

marzo/aprile: aumentano aprile/maggio: aumentano maggio/giugno: aumentano giugno /luglio: aumentano luglio/agosto:

343−312=31

agosto/settembre:

312−228=84

settembre/ottobre:

228−91=137

ottobre /novembre:

91−80=11

novembre/dicembre: aumentano

gen feb mar apr mag giu lug ago set ott nov dic

0 50 100 150 200 250 300 350 400

(8)

Dunque la diminuzione più consistente è quella tra settembre e ottobre, con 137 ore in meno.

ESERCIZIO n.8 pag.408 _a:

Temperatura Numero giornate Frequenza relativa Freq. rel. cumulata

26 2 6,45 % 6,45 %

27 4 12,90 % 19,35 %

28 9 29,03 % 48,39 %

29 12 38,71 % 87,10 %

30 4 12,90 % 100 %

_b:

_c:

_26 _27 _28 _29 _30

(9)

ESERCIZIO n.9 pag.408 _a:

_b:

_c:

La percentuale dei risultati insufficienti è

5+20+15=40

.

voti frequenza

_3 1

_4 4

_5 3

_6 5

_7 2

_8 4

_9 1

voti frequenza freq.rel.%

_3 1 5

_4 4 20

_5 3 15

_6 5 25

_7 2 10

_8 4 20

_9 1 5

Totale: 20

_3 _4 _5 _6 _7 _8 _9

0 1 2 3 4 5 6

(10)

ESERCIZIO n.10 pag.408 _a:

_b: sono andati al cinema non più di 4 volte:

1+3+6+5=15

appassionati.

_c: il 23,33 % è andato al cinema almeno 7 volte:

10+10+3,33=23,33

. ESERCIZIO n.11 pag.409

volte frequenza freq.rel.%

_1 1 3,3333333333

_2 3 10

_3 6 20

_4 5 16,666666667

_5 4 13,333333333

_6 4 13,333333333

_7 3 10

_8 3 10

_9 1 3,3333333333

Totale: 30

età persone freq.rel.%

0-18 54 18

18-30 84 28

30-50 90 30

50-70 48 16

70-100 24 8

Totale: 300

0-18 18-30 30-50 50-70 70-100

(11)

ESERCIZIO pag.416 n.54

Il numero di addetti alla vendita di 50 imprese industriali ha la seguente distribuzione:

Numero di addetti alla vendita Numero di imprese industriali

0-4 4

4-8 12

8-12 16

12-16 14

16-20 4

Rappresenta i dati con un istogramma.

Determina il campo di variazione, lo scarto semplice medio e la deviazione standard usando il valore centrale di ogni classe.

Risposte:

Riporto l'istogramma realizzato con il foglio elettronico di openoffice.org

Per quanto riguarda la seconda parte delle richieste, non è esplicitata la natura della media aritmetica a cui fare riferimento, anche se la precisazione di “usando il valore centrale di ogni classe” ci permette di intuire che dobbiamo fare riferimento alla media dei numeri di addetti per ciascuna impresa piuttosto che quella delle imprese per addetto. (A pensarci bene, la seconda opzione avrebbe anche poco senso se supponiamo ragionevolmente che un addetto alla vendita lavori per una sola impresa.)

Dunque, nell'ottica di considerare la distribuzione degli addetti alla vendita sulle imprese il dato più alto è 20 e quello più basso è 0, dunque il campo di variazione è 20.

0-4 4-8 8-12 12-16 16-20

0 2 4 6 8 10 12 14 16 18

(12)

Inoltre, seguendo il suggerimento di usare il valore centrale per ogni classe, riscriviamo la tabella di distribuzione in questo modo:

Numero di addetti alla vendita Numero di imprese industriali

2 4

6 12

10 16

14 14

18 4

Abbiamo sostituito ogni classe con il suo valore centrale, ovvero la media aritmetica degli estremi.

Calcoliamo adesso la media aritmetica del numero di addetti per ogni impresa:

M = 2×4+6×12+10×16+14×14+18×4

4+12+16+14+4 =10,16

Calcoliamo poi gli scarti, ovvero il valore assoluto della differenza tra il singolo dato e M. Nella tabella realizzata con il foglio elettronico di openoffice.org potete vedere la colonna degli scarti in corrispondenza dei dati di partenza e anche la colonna degli scarti quadratici (gli scarti al quadrato).

Sempre tramite foglio elettronico è possibile calcolare lo scarto semplice medio S, ovvero la media aritmetica degli scarti:

S =(10,16−2)×4+(10,16−6)×12+(10,16−10)×16+(14−10,16)×14+(18−10,16)×4

4+12+16+14+4 =3,4048

La varianza V è la media aritmetica degli scarti quadratici:

V =(10,16−2)2×4+(10,16−6)2×12+(10,16−10)2×16+(14−10,16)2×14+(18−10,16)2×4

4+12+16+14+4 =18,5344

Lo scarto quadratico medio s, detto anche deviazione standard è la radice quadrata della varianza.

σ= √ 18,5344≈4,31

Numero di addetti alla vendita Numero di imprese industriali Scarti Scarti quadratici

2 4 8,16 66,5856

6 12 4,16 17,3056

10 16 0,16 0,0256

14 14 3,84 14,7456

18 4 7,84 61,4656

Media aritmetica: 10,16 Scarto semplice medio: 3,4048

Varianza 18,5344 Deviazione standard 4,3051596951

Riferimenti

Documenti correlati

Da questa scrittura notiamo l'equivalenza con l'equazione x+1=3 che è un'equazione di primo grado che sappiamo risolvere facilmente. La soluzione richiesta è

Per quanto riguarda i grafici (a) e (b) dobbiamo fare un discorso più articolato: infatti osserviamo che il dominio della relazione descritta dal grafico non è tutto ℝ ma soltanto

Si dice variabile o parametro un valore numerico che può assumere uno qualsiasi di un certo insieme di valori.. L'insieme dei numeri che può assumere una variabile è in relazione ad

• In questo contesto, l’espressione integrare una funzione significa determinare il suo integrale indefinito (e ciò equivale a trovare una primitiva della

Numero indice complesso che misura la variazione dei prezzi dei beni e servizi nazionali acquistati dal consumatore medio (variazione del livello generale dei prezzi al consumo);.

considerare contemporaneamente le variazioni dei prezzi di più beni costruendo numeri indici complessi. Numeri

The attempts have been geared, inter alia, towards: encouraging foreign investment in India through its emigrants; extending voting rights to a certain category of emigrants;

drata, ricavato nello spessore della lastra, è presente in corrispondenza dell’acroterio destro (cm 2x3x3 circa), mentre la perdita di gran parte del sini- stro impedisce