• Non ci sono risultati.

Materiali e Risorse

N/A
N/A
Protected

Academic year: 2021

Condividi "Materiali e Risorse"

Copied!
110
0
0

Testo completo

(1)

Selezione di esercizi proposti durante le esercitazioni

dei corsi di Statistica tenute presso

la Facolt`

a di Economia dell’Universit`

a di Salerno

(2)
(3)

1 Statistica Descrittiva 4

1.1 Distribuzioni di frequenza e rappresentazioni grafiche . . . 4

1.2 Indici statistici descrittivi . . . 10

1.3 Concentrazione . . . 20

1.4 Distribuzioni Doppie . . . 25

1.5 Numeri Indici . . . 35

1.6 Interpolazione . . . 41

1.7 Esercizi Proposti . . . 47

2 Calcolo delle Probabilit`a 51 2.1 Calcolo delle probabilit`a . . . 51

2.2 Variabili Casuali Discrete . . . 59

2.3 Variabili Casuali Continue . . . 65

2.4 Esercizi Proposti . . . 72

3 Inferenza Statistica 76 3.1 Stime puntuali . . . 76

3.2 Test delle ipotesi . . . 79

3.3 Intervalli di confidenza . . . 87

3.4 Esercizi Proposti . . . 89

4 Il Modello di Regressione 92 4.1 Modello di Regressione Lineare Semplice . . . 92

(4)

Statistica Descrittiva

1.1

Distribuzioni di frequenza e rappresentazioni grafiche

Esercizio 1

La societ`a Gamma s.p.a., dopo aver effettuato una ricerca di personale qualificato per coprire la posizione di responsabile delle relazioni con l’estero, ha ricevuto 20 curriculum vitae da cittadini sia italiani che stranieri. Alcune informazioni, ritenute particolarmente rilevanti dalla societ`a, sono sintetizzate nella seguente tabella:

Livello minimo

unit`a genere et`a cittadinanza di reddito mensile Anni di esperienza desiderato lavorativa 1 M 28 italiana 2.3 2 2 M 34 inglese 1.6 8 3 F 46 belga 1.2 21 4 M 26 spagnola 0.9 1 5 F 37 italiana 2.1 15 6 F 29 spagnola 1.6 3 7 M 51 francese 1.8 28 8 F 31 belga 1.4 5 9 F 39 italiana 1.2 13 10 M 43 italiana 2.8 20 11 F 58 italiana 3.4 32 12 F 44 inglese 2.7 23 13 F 25 francese 1.6 1 14 M 23 spagnola 1.2 0 15 F 52 italiana 1.1 29 16 F 42 tedesca 2.5 18 17 F 48 francese 2 19 18 F 33 italiana 1.7 7 19 M 38 tedesca 2.1 12 20 M 46 italiana 3.2 23

(5)

1. Definire quali sono le l’unit`a statistiche oggetto di rilevazione. 2. Identificare quali sono le variabili e le mutabili osservate.

3. Costruire, per tutte le variabili e mutabili, le corrispondenti distribuzioni di frequenza (per le variabili continue costruire distribuzioni di frequenza con quattro classi di modalit`a di uguale ampiezza).

4. `E possibile calcolare le frequenze relative cumulate per tutte le variabili e mutabili oppure `e necessario che si disponga solo di dati quantitativi?

2

Soluzione

1. Le unit`a statistiche della rilevazione sono gli individui rispondenti alla ricerca di personale qualificato effettuata dalla societ`a Gamma.

2. Le mutabili sono: genere e cittadinanza; le variabili sono: et`a, livello minimo di reddito mensile desiderato, anni di esperienza lavorativa.

3. Le distribuzioni di frequenza delle due mutabili sono:

Genere xi ni M 8 F 12 Totale 20 Cittadinanza xi ni italiana 8 inglese 2 belga 2 spagnola 3 francese 3 tedesca 2 Totale 20

Per le restanti variabili et`a, livello minimo di reddito mensile desiderato ed anni di esperienza lavorativa, sono costruite tre distribuzioni di frequenza con quattro classi di modalit`a. In particolare, dopo aver calcolato l’ampiezza della classe per le tre variabili:

h = max(x) − min(x) 4 si ottiene: Et`a (h = 8.75) classi ni 23| − |31.75 6 31.75 − |40.5 5 40.50 − |49.25 6 49.25 − |58 3 Totale 20

Livello min. reddito (h = 0.625)

classi ni 0.9| − |1.525 6 1.525 − |2.15 8 2.15 − |2.775 3 2.775 − |3.4 3 Totale 20 Anni esperienza (h = 8) classi ni 0| − |8 8 8 − |16 3 16 − |24 6 24 − |32 3 Totale 20

(6)

4. Le frequenze relative cumulate possono essere calcolate sia quando si hanno in esame le variabili che le mutabili in quanto hanno ad oggetto le sole frequenze.



Esercizio 2

Utilizzando le distribuzioni di frequenza costruite nell’esercizio 1 per le variabili et`a, livello minimo

di reddito mensile desiderato e per la mutabile cittadinanza:

1. Calcolare le rispettive frequenze relative e frequenze relative cumulate. 2. Valutare se pi`u del 70% delle unit`a statistiche ha un’et`a inferiore a 40 anni.

3. Valutare se almeno il 20% accetterebbe l’impiego qualora gli venisse offerto un reddito mensile pari a 1525Euro.

4. `E possibile affermare che pi`u del 30% dei curriculum ricevuti proviene da candidati inglesi?

2

Soluzione

1. Le frequenze relative e relative cumulate delle tre distribuzioni sono:

Et`a classi ni fi Fi 23| − |31.75 6 0.3 0.3 31.75 − |40.5 5 0.25 0.55 40.50 − |49.25 6 0.3 0.85 49.25 − |58 3 0.15 1 Totale 20

Livello minimo di reddito

classi ni fi Fi 0.9| − |1.525 6 0.3 0.3 1.525 − |2.15 8 0.4 0.7 2.15 − |2.775 3 0.15 0.85 2.775 − |3.4 3 0.15 1 Totale 20 Cittadinanza xi ni fi Fi italiana 8 0.4 0.4 inglese 2 0.1 0.5 belga 2 0.1 0.6 spagnola 3 0.15 0.75 francese 3 0.15 0.9 tedesca 2 0.1 1 Totale 20

2. Dalla distribzione di frequenza Et`a, si osserva che in corrispondenza della classe 31.75 − |40.5

la frequenza relativa cumulata Fi = 0.55, ovvero il 55% delle unit`a statistiche ha un’et`a

≤ 40.5 anni. Quindi dalla verifica risulta che meno del 70% delle unit`a statistiche ha un’et`a inferiore a 40 anni e quindi l’affermazione `e falsa.

(7)

3. Dalla prima frequenza relativa cumulata della distribuzione Livello minimo di reddito si osserva che il 30% accetterebbe l’impiego con un reddito ≤ 1525Euro. Quindi `e possibile solo affermare che pi`u del 20% accoglierebbe la proposta di impiego se venisse offerto un reddito ≤ 1525Euro mentre non si `e in grado di individuare la percentuale di coloro che accetterebbero l’impiego con un reddito minimo pari a 1525Euro.

4. L’affermazione `e falsa in quanto, osservando le frequenze relative della distribuzione

Cittadi-nanza, solo il 10% dei curriculum ricevuti proviene da candidati di cittadinanza inglese.



Esercizio 3

Utilizzando i dati e le distribuzioni di frequenza dell’Esercizio 1:

1. Rappresentare graficamente i caratteri Cittadinanza e Livello minimo di reddito desiderato utilizzando rispettivamente un diagramma a nastri ed un istogramma di frequenze.

2. Rappresentare la funzione di ripartizione della variabile Livello minimo di reddito desiderato

2

Soluzione

1. Il diagramma a nastri della mutabile Cittadinanza `e rappresentato nel seguente grafico:

italiana inglese belga spagnola francese tedesca cittadinanza 0 2 4 6 8 n

Figura 1.1: Diagramma a nastri della mutabile Cittadinanza

mentre per rappresentare l’istogramma della variabile Livello minimo di reddito desiderato `e necessario il preliminare calcolo dell’intensit`a associata a ciascuna classe:

hi= ni

(xi− xi−1)

i = 1, . . . , k con k il numero di classi, ed i cui valori sono riportati in tabella:

(8)

Livello minimo di reddito classi ni hi 0.9| − |1.525 6 9.6 1.525 − |2.15 8 12.8 2.15 − |2.775 3 4.8 2.775 − |3.4 3 4.8

La rappresentazione grafica dell’istogramma `e quindi:

0.900 1.525 2.150 2.775 3.400 reddito 0 2 4 6 8 12.8 9.6 6.4 hi 3.2

Figura 1.2: Istogramma della variabile Livello minimo di reddito

2. La funzione di ripartizione richiede l’utilizzo delle informazioni contenute nella distribuzione di frequenze Livello minimo di reddito di cui all’esercizio 2, da cui segue la rappresentazione:

0 1 2 3 4 reddito 0.0 0.2 0.4 0.6 0.8 1.0 Fi

Figura 1.3: Funzione di ripartizione empirica della variabile Livello minimo di reddito



Esercizio 4

La societ`a Stat s.p.a. ha effettuato un’indagine su una popolazione di 15 famiglie sulle quali ha rilevato tre caratteri: la zona di residenza, il reddito medio mensile familiare ed il numero di componenti in et`a lavorativa, i cui dati sono riportati nella Tabella 1.2.

(9)

1. Costruire le distribuzioni di frequenza dei tre caratteri osservati (si costruisca la distribuzione della variabile RM con quattro classi di modalit`a di uguale ampiezza).

2. Rappresentare graficamente le variabili RM ed NL.

Reddito medio N. componenti in et`a Unit`a Residenza (×1000Euro) lavorativa

(Res) (RM) (NL) 1 Nord 4.25 2 2 Centro 1.78 1 3 Nord 10.5 3 4 Sud 6.11 3 5 Sud 3.56 2 6 Centro 8.3 4 7 Sud 1.52 1 8 Nord 2.3 0 9 Centro 1.5 1 10 Nord 4.3 2 11 Sud 1.65 0 12 Sud 3.33 2 13 Centro 1.4 1 14 Sud 6.04 4 15 Nord 7.89 3

Tabella 1.2: Dati relativi alla zona di residenza, al reddito medio mensile familiare ed al numero di componenti in et`a lavorativa di 15 famiglie intervistate

2

Soluzione

1. Le tre distribuzioni richieste per le variabili in esame sono le seguenti:

Residenza xi ni Nord 5 Centro 4 Sud 6 Totale 15 Reddito medio (h = 2.275) classi ni 1.4| − |3.675 8 3.675 − |5.95 2 5.95 − |8.225 3 8.225 − |10.5 2 Totale 15 N. et`a lavorativa xi ni 0 2 1 4 2 4 3 3 4 2 Totale 15

2. Le rappresentazioni grafiche opportune per i dati in esame sono il diagramma a nastri per la variabile NL e l’istogramma per la variabile RM presentate in Figura 1.4.

(10)

0 1 2 3 4 NL 0 1 2 3 4 ni 1.400 3.675 5.950 8.225 10.500 RM 0 2 4 6 8 3.52 2.64 0.88 hi 1.76

Figura 1.4: Diagramma a nastri della variabile NL ed istogramma della variabile RM



1.2

Indici statistici descrittivi

Esercizio 5

Utilizzando le distribuzioni di frequenza costruite nell’esercizio 1: 1. Calcolare la media di tutte le variabili quantitative.

2. L’et`a media delle unit`a statistiche `e maggiore di 30?

3. La media degli Anni di esperienza lavorativa maturata dalle unit`a statistiche `e almeno pari a 10?

4. Calcolare il valore mediano del Livello minimo di reddito mensile desiderato. 5. Calcolare la mediana dell’Et`a delle unit`a statistiche.

6. Calcolare la moda della variabile Anni di esperienza lavorativa

7. Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis-tribuzione di frequenze con 4 classi di modalit`a di differente ampiezza:

classi ni

0| − |9 8 9 − |17 3 17 − |23 6 23 − |32 3

definire la classe modale e calcolare la moda.

(11)

Soluzione

1. Il calcolo delle medie delle distribuzioni di frequenza in classi richiede il preliminare calcolo del valore centrale di ciascuna classe come riportato nel seguito:

Et`a classi ni ci ci× ni 23| − |31.75 6 27.375 164.250 31.75 − |40.5 5 36.125 180.625 40.50 − |49.25 6 44.875 269.250 49.25 − |58 3 53.625 160.875 Totale 20 775 µ = 1 N k P i=1 ci× ni= 38.75

Livello minimo di reddito

classi ni ci ci× ni 0.9| − |1.525 6 1.213 7.278 1.525 − |2.15 8 1.838 14.704 2.15 − |2.775 3 2.463 7.389 2.775 − |3.4 3 3.088 9.264 Totale 20 38.635 µ = 1 N k P i=1 ci× ni= 1.932

Anni di esperienza lavorativa

classi ni ci ci× ni 0| − |8 8 4 32 8 − |16 3 12 36 16 − |24 6 20 120 24 − |32 3 28 84 Totale 20 272 µ = N1 k P i=1 ci× ni= 13.6

2. La media dell’Et`a delle unit`a statistiche `e pari a 38.750, quindi risulta maggiore di 30. 3. Il numero di Anni di esperienza lavorativa `e pari a 13.6 quindi supera gli almeno 10 anni

richiesti dal quesito.

4. Il valore della mediana del Livello minimo di reddito `e approssimato utilizzando la seguente formula:

M e ≈ xi−1+ (xi− xi−1)0.5 − FF i−1 i− Fi−1

Quindi identificata la classe mediana, xi−1− |xi : Fi ≥ 0.5, data da 1.525 − |2.15, il valore

approssimato della mediana `e:

M e ≈ 1.525 + (2.15 − 1.525)0.5 − 0.3

0.7 − 0.3 = 1.837

5. Per il calcolo della mediana della variabile Et`a valgono le stesse considerazioni fatte al punto

precedente, quindi:

M e ≈ 31.75 + (40.5 − 31.75) 0.5 − 0.3

(12)

6. La moda della variabile Anni di esperienza lavorativa `e pari al valore centrale della classe modale 0| − |8, ovvero Mo = 4

7. Per individuare la classe modale in presenza di classi di diversa ampiezza, `e necessario cal-colare l’intensit`a associata a ciascuna classe xi−1− |xi, data da:

hi= ni

(xi− xi−1)

i = 1, . . . , k quindi

Anni di esperienza lavorativa

classi ni hi 0| − |9 8 0.89 9 − |17 3 0.38 17 − |23 6 1.00 23 − |32 3 0.33 Totale 20

da cui emerge che la classe modale `e 17 − |23 perch`e ad essa `e associata la massima intensit`a, ed il valore approssimato della moda `e:

M o ≈ (xi−i2+ xi) =17 + 23 2 = 20



Esercizio 6

Utilizzando i dati in Tabella 1.1 relativi alla variabile Livello minimo di reddito e la corrispondente distribuzione di frequenze nell’esercizio 1:

1. Calcolare i quartili della variabile in esame. 2. Rappresentarne il box-plot.

3. Sono presenti valori eccezionali nei dati?

4. Assumendo che la societ`a Gamma s.p.a. in occasione di un’altra ricerca di personale qualifi-cato abbia rilevato i seguenti livelli minimi di reddito desiderati da ulteriori 20 candidati:

V2 : 4.4 5.2 2.9 2.9 2.9 4.1 1.5 2.9 2.9 0.7 4.8 1.5 2.9 1.5 3.4 5.9 0.7 5.9 8.7 2.9

Rappresentare i box-plot paralleli della variabile Livello minimo di reddito desiderato in Tabella 1.1 (V 1) e della nuova variabile riportata (V 2).

(13)

Soluzione

1. Il calcolo dei quartili in presenza di una distribuzione di frequenze per classi di modalit`a richiede nuovamente l’impiego di formule di approssimazione:

Q1≈ xi−1+ (xi− xi−1)0.25 − FF i−1 i− Fi−1

Q3≈ xi−1+ (xi− xi−1)0.75 − FF i−1 i− Fi−1

Segue quindi che i quartili richiesti assumono i seguenti valori:

Q1= 1.421 Q2≡ Me = 1.837 Q3= 2.358

2. La rappresentazione grafica, mediante box-plot, della variabile Livello minimo di reddito

desiderato richiede l’impiego dei quartili appena calcolati e di ulteriori informazioni riportate

nel seguito:

min(x) = 0.9 max(x) = 3.4

h1= Q1− 1.5(Q3− Q1) = 0.015 H2= Q3+ 1.5(Q3− Q1) = 3.763

da cui segue il grafico in Figura 1.5.

Figura 1.5: Box plot del Reddito Desiderato

3. Dal grafico in Figura 1.5 emerge che non sono presenti valori eccezionali nella serie osservata, infatti h1< min(x) ed H2> max(x).

4. La rappresentazione mediante box-plot paralleli delle due variabili richiede il preliminare calcolo dei quartili e dei valori cardine della variabile V 2, nonch`e la conoscenza del minimo

(14)

e del massimo valore assunto da V 2 come gi`a fatto in precedenza per V 1. Tali valori sono pari a:

min(x) = 0.7 Q1= 2.21 Q2= M e = 2.9 Q3= 4.6 max(x) = 8.7 h1= −1.38 H2= 8.19

mentre la rappresentazione grafica richiesta `e presentata in Figura 1.6.

Emerge immediatamente che V 2 presenta un valore eccezionale, contrassegnato con un as-terisco, in corrispondenza del livello di reddito desiderato 8.7.

Figura 1.6: Box plot paralleli di V1 e V2



Esercizio 7

Utilizzando i dati in tabella 1.1:

1. Calcolare la varianza della variabile Livello minimo di reddito desiderato avvalendosi della distribuzione di frequenze precedentemente costruita per tale variabile nell’esercizio 1. 2. Calcolare la varianza della serie di dati Anni di esperienza lavorativa

3. Utilizzando la serie di dati della variabile Et`a, calcolare la varianza dell’et`a delle prime 10 unit`a statistiche. In seguito, calcolare la varianza delle successive 10 ed ultime unit`a statistiche.

4. La variabilit`a dell’et`a delle prime 10 unit`a statistiche `e maggiore della variabilit`a dell’et`a delle ultime 10 unit`a?

5. Se si standardizza la variabile Livello minimo di reddito desiderato, quale valore assumono la media e la varianza?

6. `E possibile affermare che la mutabile cittadinanza ha un’elevata eterogeneit`a?

(15)

Soluzione

1. Il calcolo della varianza della variabile Livello minimo di reddito `e effettuato ricorrendo alla seguente formula: σ2= 1 N k X i=1 (ci− µ)2ni= µ2− µ2 con µ2= 1 N k X i=1 c2ini

A tale scopo `e costruita la tabella che segue:

Livello minimo di reddito

classi ni ci c2i × ni 0.9| − |1.525 6 1.213 8.828 1.525 − |2.15 8 1.838 27.026 2.15 − |2.775 3 2.463 18.199 2.775 − |3.4 3 3.088 28.607 Totale 20 82.660

da cui emerge che µ2= 4.133 mentre la varianza `e pari a σ2= 4.133 − (1.932)2= 0.4.

2. La varianza della serie di dati Anni di esperienza lavorativa `e calcolata con:

σ2= 1 N N X i=1 (xi− µ)2= 100.2

3. Utilizzando la serie di dati Et`a, segue che la varianza della prima sottoserie data da:

28 34 46 26 37 29 51 31 39 43 `e pari a σ2

1= 62.44 mentre la seconda sottoserie:

58 44 25 23 52 42 48 33 38 46 ha varianza σ2

2 = 114.69

4. L’affermazione `e falsa in quanto la variabilit`a della seconda sottoserie `e maggiore della va-riabilit`a della prima sottoserie risultando σ2

2> σ21.

5. La media della variabile Livello minimo di reddito desiderato standardizzata `e pari a 0 mentre la varianza `e 1.

6. L’eterogeneit`a della mutabile cittadinanza `e possibile misurarla con l’indice di mutabilit`a del Gini o con l’indice di entropia di Shannon, rispettivamente pari a:

M Gr= k k − 1 " 1 − k X i=1 fi2 # Hr= − k X i=1 filog(fi) log(k)

(16)

con k il numero di modalit`a per il cui calcolo si utilizzano le informazioni nella seguente tabella: Cittadinanza xi ni fi fi2 log(fi) filog(fi) italiana 8 0.4 0.16 -0.40 -0.16 inglese 2 0.1 0.01 -1.00 -0.10 belga 2 0.1 0.01 -1.00 -0.10 spagnola 3 0.15 0.02 -0.82 -0.12 francese 3 0.15 0.02 -0.82 -0.12 tedesca 2 0.1 0.01 -1.00 -0.10 Totale 20 0.23 -0.70

da cui segue che l’indice di mutabilit`a del Gini `e: M Gr=65(1 − 0.23) = 0.924

mentre l’indice di entropia di Shannon `e: Hr=log(6)0.70 = 0.90

Dai risultati precedenti `e possibile affermare che il fenomeno presenta elevata eterogeneit`a. 

Esercizio 8

Utilizzando i dati in Tabella 1.1:

1. Misurare l’asimmetria della variabile Livello minimo di reddito desiderato avvalendosi della corrispondente distribuzione di frequenze.

2. Osservando i box plots in Figura 1.5: le due variabili V 1 e V 2 presentano uguale asimmetria e variabilit`a?

3. La distribuzione della variabile Livello minimo di reddito desiderato pu`o dirsi leptocurtica?

2

Soluzione

1. L’asimmetria della distribuzione della variabile Livello minimo di reddito desiderato `e possi-bile misurarla con indici robusti e non robusti. Qualora si preferiscano questi ultimi ci si pu`o avvalere dell’indice di asimmetria di Fisher:

γ1= 1 N σ3 k X i=1 (xi− µ)3ni

mentre un esempio di indice robusto `e la differenza interquartile:

DIr=

(Q3− Q2) − (Q2− Q1)

(17)

Il calcolo di γ1 richiede l’utilizzo dei dati nella tabella che segue:

Livello minimo di reddito

classi ni ci (ci− µ)3× ni 0.9| − |1.525 6 1.213 -2.23 1.525 − |2.15 8 1.838 -0.007 2.15 − |2.775 3 2.463 0.449 2.775 − |3.4 3 3.088 4.634 Totale 20 2.846

ed inoltre risultando, dall’esercizio n. 7, che √σ2 =0.4 = 0.632, segue che: γ 1 = 2.846

20×0.6323 = 0.564.

Il calcolo della differenza interquartile richiede l’utilizzo dei quartili calcolati in precedenza e quindi DIr= (2.358−1.837)−(1.837−1.421)(2.358−1.837)+(1.837−1.421) = 0.112.

2. L’esame dei box-plots evidenzia come la variabile V 2 presenta maggiore variabilit`a, misurata in termini di differenza tra quartili, rispetto alla V 1 mentre entrambe mostrano asimmetria positiva come `e immediatamente valutato dall’ osservazione della posizione della mediana nei box rappresentati.

3. Per poter rispondere al quesito `e necessario calcolare l’indice di curtosi:

γ2= 1 N σ4 k X i=1 (xi− µ)4ni− 3

dove, da calcoli precedenti, µ = 1.931 e σ = 0.634.

Per rendere pi`u agevole il calcolo di γ2, pu`o essere utile avvalersi dei dati nella seguente

tabella:

Livello minimo di reddito

classi ni ci (ci− µ)4× ni 0.9| − |1.525 6 1.213 1.603 1.525 − |2.15 8 1.838 0.001 2.15 − |2.775 3 2.463 0.239 2.775 − |3.4 3 3.088 5.357 Totale 20 7.2

da cui segue che: γ2= 20×0.6347.2 4 − 3 = −0.744

Dai risultati ottenuti `e possibile affermare che la distribuzione della variabile Livello minimo

di reddito non `e leptocurtica ma bens`ı platicurtica in quanto l’indice di curtosi γ2 `e pari a

-0.744. Quindi l’affermazione `e falsa.

(18)

Esercizio 9

La societ`a Stat di cui all’esercizio 4 desidera fornire al committente dell’indagine maggiori dettagli descrittivi sui dati presentati in Tabella 1.2, a tale scopo:

1. Calcolare la media e la varianza delle variabili RM ed NL utilizzando le distribuzioni di frequenza precedentemente costruite.

2. Rappresentare il box plot della variabile RM e commentarlo opportunamente

3. Assumendo che per particolari incentivi governativi il reddito mensile medio familiare subisce la seguente trasformazione lineare:

RMN = 0.3 + 1.15 × RM

calcolare la media e la varianza di RMN.

4. Misurare l’asimmetria e la curtosi della variabile RM utilizzando indici non robusti. 5. Misurare l’eterogeneit`a della variabile Res.

2

Soluzione

1. Il calcolo della media e della varianza delle due variabili `e effettuato utilizzando i dati in tabella: Reddito medio - RM classi ni ci ci× ni c2i × ni 1.4| − |3.675 8 2.538 20.304 51.528 3.675 − |5.95 2 4.813 9.626 46.330 5.95 − |8.225 3 7.088 21.264 150.720 8.225 − |10.5 2 9.363 18.726 175.332 Totale 15 69.920 423.910 N. et`a lavorativa - NL xi ni xi× ni x2i × ni 0 2 0 0 1 4 4 4 2 4 8 16 3 3 9 27 4 2 8 32 Totale 15 29 79

Da cui segue che le medie sono pari a: µRM = 1 N k X i=1 ci× ni= 4.66 µN L= 1 N N X i=1 xi× ni= 1.93

mentre le varianze sono: σRM2 = µ2RM−µ

2

RM = 28.261−4.6612= 6.536 σN L2 = µ2N L−µ

2

N L= 5.267−1.9333= 1.536

2. Il grafico richiesto `e riportato in Figura 1.7 da cui emerge l’assenza di valori eccezionali nella variabile di interesse. Inoltre, tenuto conto della posizione delle mediana nel box, `e chiaramente visibile la presenza di asimmetria positiva nei dati.

(19)

Figura 1.7: Box plot della variabile RM

3. Per la soluzione del presente quesito `e necessario utilizzare alcune note regole sulle trasformate lineari di variabili. In particolare si dimostra che data la trasformata lineare y = a + bx con media e varianza di x note e rispettivamente indicate con µxe σ2x, la media e la varianza di

y sono calcolare con:

µy= a + bµx σy2= b2σx2

Quindi nel caso in esame, poich`e `e noto che µRM = 4.661 e σRM2 = 6.536, allora:

µRMN = 0.3 + 1.15 × µRM = 5.660 σ

2

RMN = 1.15

2

× σ2RM = 8.644

4. Per la misura dell’asimmetria e della curtosi della variabile RM mediante indici non robusti γ1 e γ2, si utilizzano i dati della corrispondente distribuzione di frequenze alla quale si

ag-giungono alcune colonne:

Reddito medio - RM classi ni ci ci× ni (ci− µ)3× ni (ci− µ)4× ni 1.4| − |3.675 8 2.538 20.304 -76.549 162.514 3.675 − |5.95 2 4.813 9.626 0.007 0.001 5.95 − |8.225 3 7.088 21.264 42.887 104.088 8.225 − |10.5 2 9.363 18.726 207.911 977.598 Totale 15 69.913 174.256 1244.201

Dalle elaborazioni precedenti risulta inoltre che la media e lo scarto quadratico medio della variabile RM sono rispettivamente µRM = 4.661 e σRM = 2.557, quindi:

γ1=

174.256

15 × 2.5573 = 0.695 γ2=

1244.201

(20)

5. La misura dell’eterogeniet`a `e effettuata in questo caso con l’indice di mutabilit`a del Gini M Gr= k k − 1 1 − k X i=1 fi2 !

per il cui calcolo si utilizzano i dati nella seguente tabella:

Residenza xi ni fi fi2 Nord 5 0.33 0.11 Centro 4 0.27 0.07 Sud 6 0.40 0.16 Totale 15 0.34

Quindi l’indice relativo M Gr = 0.987 ed evidenzia la presenza di elevata eterogeniet`a nella

mutabile osservata.



1.3

Concentrazione

Esercizio 10

Utilizzando i dati della variabile Livello minimo di reddito nell’esercizio 1 e la corrispondente distribuzione di frequenze:

1. Misurarne la concentrazione e rappresentare la corrispondente curva di Lorenz. 2. `E possibile affermare che il Livello minimo di reddito `e equidistribuito?

2

Soluzione

1. La misura della concentrazione del livello minimo di reddito tramite la distribuzione per classi di modalit`a precedentemente costruita richiede il calcolo del rapporto di concentrazione:

R = 1 − k X i=1 (pi− pi−1)(qi+ qi−1) con pi=N1 i P j=1 nj e qi= N µ1 i P j=1 cjnj per i = 1, 2, . . . , k.

Ricordando che la media del livello minimo di reddito `e pari a µ = 1.932 (esercizio 5), segue che il denominatore delle qi`e N · µ =

k

P

(21)

Utilizzando le formule precedenti, si passa al calcolo delle pi e delle qi, come riportato in

tabella, e dei termini della sommatoria del rapporto di concentrazione.

Livello minimo di reddito

classi ni ci ci· ni pi qi pi− pi−1= fi qi+ qi−1 (qi+ qi−1)fi

0.9| − |1.525 6 1.213 7.278 0.300 0.188 0.30 0.188 0.056 1.525 − |2.15 8 1.838 14.704 0.700 0.569 0.40 0.757 0.303 2.15 − |2.775 3 2.463 7.389 0.850 0.760 0.15 1.329 0.199 2.775 − |3.4 3 3.088 9.264 1 1 0.15 1.760 0.264

Totale 20 38.635 0.822

Segue quindi che R = 1 − 0.822 = 0.178, ovvero il fenomeno presenta bassa concentrazione. Impiegando i dati in tabella `e possibile rappresentare la curva di Lorenz (Figura 1.8) che d`a evidenza grafica dei risultati numerici riportati.

Figura 1.8: Curva di Lorenz

2. I dati osservati immediatamente escludono la possibilit`a che il livello minimo di reddito sia equidistribuito in quanto la condizione teorica che deve verificarsi in questa circostanza `e che:

x1= x2= ... = xN = µ

Quindi l’affermazione `e falsa.



Esercizio 11

`

E stata misurata la quantit`a di nitrati (in mg) contenuta in un litro di 10 tipologie di acque com-mercializzate da un punto vendita, ottenendo i seguenti dati:

(22)

1. Misurare la concentrazione dei nitrati delle acque analizzate e rappresentare la spezzata di Lorenz.

2. Pu`o affermarsi che la concentrazione dei nitrati delle acque analizzate `e elevata?

2

Soluzione

1. La misura della concentrazione della serie di dati in esame richiede il preliminare ordinamento, in modo non decrescente, dei dati ed il calcolo dell’indice di concentrazione del Gini:

Rg= N −1 P i=1 (pi− qi) N −1 P i=1 pi con pi= i N e qi= 1 N µ i X j=1 xj

A tale scopo si costruisce la seguente tabella:

i x(i) pi qi (pi− qi) 1 11 0.1 0.047 0.053 2 15 0.2 0.111 0.089 3 17 0.3 0.184 0.116 4 18 0.4 0.261 0.139 5 19 0.5 0.343 0.157 6 21 0.6 0.433 0.167 7 28 0.7 0.553 0.147 8 29 0.8 0.677 0.123 9 34 0.9 0.823 0.077 10 41 1 1 Totale 233

da cui emerge che N µ =

N

P

i=1

xi = 233 mentre l’indice di concentrazione del Gini `e Rg = 1.068

4.5 = 0.237.

La spezzata di Lorenz del fenomeno in esame, che assume la caratteristica forma a gradini, `e rappresentata in Figura 1.9.

2. Dai risultati del precedente quesito (indice del Gini) `e possibile osservare che i nitrati delle acque analizzate sono poco concentrati quindi nessuna delle acque in esame presenta un livello di nitrati molto pi`u elevato rispetto alle altre.



Esercizio 12

La societ`a Stat, utilizzando i dati in Tabella 1.2, vuole fornire alcuni dettagli sulla concentrazione dei redditi delle 15 famiglie intervistate.

(23)

Figura 1.9: Spezzata di Lorenz

1. Misurare la concentrazione dei redditi medi (RM) e rappresentare la corrispondente curva di Lorenz (a tale scopo impiegare la distribuzione di frequenze per classi della variabile RM costruita in precedenza);

2. Il reddito medio presenta maggiore concentrazione al Nord o al Sud?

2

Soluzione

1. La misura della concentrazione della variabile RM richiede il calcolo del rapporto di concen-trazione. A tal fine, come gi`a precedentemente descritto nell’esercizio 10, si utilizzano i dati nella tabella seguente:

Reddito medio - RM

classi ni ci ci× ni pi qi pi− pi−1= fi qi− qi−1 (qi− qi−1)fi

1.4| − |3.675 8 2.538 20.304 0.533 0.290 0.533 0.290 0.155 3.675 − |5.95 2 4.813 9.626 0.666 0.428 0.133 0.718 0.095 5.95 − |8.225 3 7.088 21.264 0.866 6 0.732 0.200 1.160 0.232 8.225 − |10.5 2 9.363 18.726 1 1 0.133 1.732 0.230

Totale 15 69.920 0.712

da cui segue che il rapporto di concentrazione R = 1 − 0.712 = 0.288.

La curva di Lorenz associata al fenomeno `e rappresentata in Figura 1.10 e conferma, anche graficamente, la contenuta concentrazione del reddito medio tra le famiglie intervistate.

(24)

Figura 1.10: Curva di Lorenz

2. Per poter rispondere al quesito proposto `e necessario misurare la concentrazione del reddito medio delle famiglie residenti al Nord ed al Sud costruendo quindi opportune serie di dati estratte dalla Tabella 1.2 mediante le quali calcolare l’indice di concentrazione del Gini.

NORD i x(i) pi qi pi− qi 1 2.30 0.2 0.079 0.121 2 4.25 0.4 0.224 0.176 3 4.30 0.6 0.371 0.229 4 7.89 0.8 0.641 0.159 5 10.50 1 1 Totale 29.24 0.685 SUD i x(i) pi qi pi− qi 1 1.52 0.167 0.068 0.099 2 1.65 0.333 0.142 0.191 3 3.33 0.500 0.292 0.208 4 3.56 0.667 0.452 0.215 5 6.04 0.833 0.724 0.109 6 6.11 1 0.999 Totale 22.21 0.822

da cui segue che l’indice di concentrazione del Gini delle due sottopopolazioni `e rispettiva-mente:

Rg,N ORD =0.685

2.0 = 0.343 Rg,SUD= 0.822

2.5 = 0.329

quindi la concentrazione dei redditi delle famiglie del Nord e del Sud intervistate `e simile. 

(25)

1.4

Distribuzioni Doppie

Esercizio 13

Utilizzando le serie di dati in Tabella 1.1:

1. Costruire una distribuzione di frequenze doppia per le variabili Genere e Cittadinanza. 2. La presenza di mutabili nella tabella precedentemente costruita, rende impossibile la misura

dell’intensit`a del legame associativo? Motivare la risposta.

3. Costruire una distribuzione di frequenze doppia per le variabili Livello minimo di reddito ed Anni di esperienza utilizzando, per ambo le variabili, 4 classi di modalit`a della stessa ampiezza.

2

Soluzione

1. La distribuzione di frequenze richiesta `e la seguente:

Cittadinanza

Genere belga francese inglese italiana spagnola tedesca

F 2 2 1 5 1 1 12

M 0 1 1 3 2 1 8

2 3 2 8 3 2 20

2. L’intensit`a del legame associativo `e misurato con l’indice di Cramer Φ2. Esso per costruzione

richiede il solo utilizzo delle frequenze della distribuzione e quindi `e possibile calcolarlo sia quando nella distribuzione doppia si hanno ad oggetto mutabili che variabili.

3. La distribuzione di frequenze doppia delle variabili Livello minimo di reddito ed Anni di

esperienza `e: Anni di esperienza Reddito minimo 0| − |8 8 − |16 16 − |24 24 − |32 0.9| − |1.525 3 1 1 1 6 1.525 − |2.15 4 2 1 1 8 2.15 − |2.775 1 0 2 0 3 2.775 − |3.4 0 0 2 1 3 8 3 6 3 20 

Esercizio 14

Avvalendosi della distribuzione doppia delle variabili Livello minimo di reddito ed Anni di

(26)

1. `E possibile affermare che tra le variabili Livello minimo di reddito ed Anni di esperienza esiste un legame lineare negativo? Perch´e?

2. Misurare l’intensit`a del legame associativo tra le variabili Livello minimo di reddito ed Anni

di esperienza.

3. Misurare la forza del legame lineare tra le variabili Livello minimo di reddito ed Anni di

esperienza.

2

Soluzione

1. `E possibile valutare la presenza di un legame lineare negativo calcolando la covarianza tra le variabili Livello minimo di reddito ed Anni di esperienza. A tale scopo, essendo gi`a note le medie delle variabili marginali della distribuzione doppia precedentemente costruita, `e utile avvalersi della seguente forma per la covarianza:

σxy= µxy− µxµy

dove µx e µy sono le medie delle variabili marginali e µxy= N1 h P i=1 k P j=1 xiyjnij.

Per il calcolo di µxyrisulta inoltre necessario calcolare i valori centrali delle classi di modalit`a

delle due variabili che sono quindi aggiunti alla precedente tabella:

Anni di esperienza 0| − |8 8 − |16 16 − |24 24 − |32 Reddito minimo ci 4 12 20 28 0.9| − |1.525 1.213 3 1 1 1 6 1.525 − |2.15 1.838 4 2 1 1 8 2.15 − |2.775 2.463 1 0 2 0 3 2.775 − |3.4 3.088 0 0 2 1 3 8 3 6 3 20

da cui segue che: µxy= 1

20(14.556 + 14.556 + 24.260 + 33.964 + 29.408 + 44.112 + 36.760 + 51.464 + 9.852 + 98.520+ +123.520 + 86.464) = 28.372

dove ad esempio il primo termine della sommatoria `e c1x× c1y× n11= 1.213 × 4 × 3 = 14.556

ed alla stessa maniera si calcolano i restanti termini. Il valore della covarianza `e quindi pari a:

σxy= 28.372 − 1.932 × 13.6 = 2.097

La covarianza cos`ı calcolata `e positiva, quindi le variabili Livello minimo di reddito ed Anni

di esperienza presentano un legame lineare positivo. Quindi si conclude che l’affermazione

(27)

2. La misura dell’intensit`a del legame associativo richiede il calcolo dell’indice di Cramer Φ2. A

tale scopo si calcola prima l’indice di Pizzetti-Pearson:

χ2= h X i=i k X j=1 (nij− n∗ij)2 n∗ ij e successivamente: Φ2= χ2 N [min(h, k) − 1]

L’indice di Pizzetti-Pearson richiede il preliminare calcolo delle frequenze teoriche n∗ ij = ni.×n.j

N con i = 1, . . . , h e j = 1, . . . , k per le quali `e utile costrure la seguente tabella:

Anni di esperienza Reddito minimo 0| − |8 8 − |16 16 − |24 24 − |32 0.9| − |1.525 2.40 0.90 1.80 0.90 6 1.525 − |2.15 3.20 1.20 2.40 1.20 8 2.15 − |2.775 1.20 0.45 0.90 0.45 3 2.775 − |3.4 1.20 0.45 0.90 0.45 3 8 3 6 3 20

da cui segue che i termini della sommatoria dell’indice χ2 sono:

χ2 = 0.150 + 0.011 + 0.356 + 0.011 + 0.200 + 0.533 + 0.817 + 0.033 + 0.033 + 0.450 + 1.344 + 0.450 +

+1.200 + 0.450 + 1.344 + 0.672 = 8.054 dove ad esempio il primo termine `e (n11−n∗11)

2

n∗

11 =

(3−2.40)2

2.40 = 0.150 e cos`ı via i restanti.

L’indice di Cramer `e infine pari a Φ2 = 8.054

20×3 = 0.134 da cui emerge che le due variabili

presentano un debole legame associativo.

3. La misura della forza del legame lineare `e fornita dall’indice di correlazione per la cui costruzione `e richiesto l’utilizzo di alcuni indici gi`a calcolati in precedenza, dati dalla co-varianza tra le due variabili e dai rispettivi scarti quadratici medi.

Dal primo quesito del presente esercizio risulta che la covarianza tra le variabili Livello minimo

di reddito ed Anni di esperienza `e σxy= 2.097, mentre dall’esercizio 7 la varianza del Livello

minimo di reddito `e σ2

x= 0.4 e quindi σx= 0.632. Resta quindi da calcolare la varianza della

variabile Anni di esperienza per la quale si utilizza la distribuzione di frequenze costruita per tale variabile nell’esercizio 1 alla quale sono aggiunte alcune colonne necessare per il calcolo dei momenti della variabile:

(28)

Anni di esperienza classi ni ci ci× ni c2i × ni 0| − |8 8 4 32 128 8 − |16 3 12 36 432 16 − |24 6 20 120 2400 24 − |32 3 28 84 2352 Totale 20 272 5312

Dai dati in tabella si deriva che:

µy= 272 20 = 13.6 µ2y= 5312 20 = 265.6 σ 2 y = 256.6−13.62= 80.64 e quindi σy = 8.98

Utilizzando gli indici statistici opportunamente calcolati, l’indice di correlazione `e:

ρxy= 2.097

0.632 × 8.98 = 0.369

quindi le due variabili presentano un legame lineare positivo piuttosto debole.



Esercizio 15

Utilizzando i dati in Tabella 1.2:

1. Costruire la distribuzione di frequenze doppia per le variabili RM ed Res (utilizzando per la variabile RM quattro classi di modalit`a di uguale ampiezza).

2. Misurare l’intensit`a del legame associativo tra le variabili RM e Res.

2

Soluzione

1. La distribuzione di frequenze doppia delle variabili RM e Res `e:

Res

RM Nord Centro Sud 1.4| − |3.675 1 3 4 8 3.675 − |5.95 2 0 0 2 5.95 − |8.225 1 0 2 3 8.225 − |10.5 1 1 0 2

(29)

2. Come visto nell’esercizio precedente la misura del legame associativo richiede il preliminare calcolo dell’indice di Pizzetti-Pearson χ2 e la sua successiva normalizzazione data dall’indice

Φ2. A tale scopo si costruisce la seguente tabella delle frequenze teoriche:

Res

RM Nord Centro Sud 1.4| − |3.675 2.667 2.133 3.200 8 3.675 − |5.95 0.667 0.533 0.800 2 5.95 − |8.225 0.667 0.533 0.800 3 8.225 − |10.5 1 1 0 2

5 4 6 15

da cui segue che l’indice χ2 `e:

χ2 = h X i=i k X j=1 (nij− n∗ij)2 n∗ ij = = 1.042 + 0.352 + 0.2 + 2.6640.533 + 0.8 + 0.8 + 0.533 + 0.166 + 0.409 + 0.8 = 8.30 e quindi: Φ2 = χ2 N [min(h,k)−1] = 8.30

15×2 = 0.277, ovvero le le due variabili hanno un debole

legame associativo.



Esercizio 16

Utilizzando nuovamente i dati in Tabella 1.2:

1. Costruire per le variabili RM e NL una distribuzione di frequenze doppia (utilizzando per la variabile RM quattro classi di modalit`a della stessa ampiezza e per la variabile NL due classi di modalit`a di pari ampiezza).

2. Misurare la forza del legame lineare tra RM ed NL impiegando la distribuzione di frequenze doppia costruita nel precedente quesito.

3. Misurare la covarianza tra la variabile NL ed RMN precedentemente definita con la

trasfro-mata lineare:

RMN = 0.3 + 1.15 × RM

4. Quale valore assume la correlazione tra RMN ed N L?

5. Calcolare la covarianza tra le variabili RM ed NL impiegando le due corrispondenti serie di dati.

(30)

Soluzione

1. La distribuzione di frequenze doppia delle variabili RM ed N L `e:

RM 0| − |2 2 − |4 1.4| − |3.675 8 0 8 3.675 − |5.95 2 0 2 5.95 − |8.225 0 3 3 8.225 − |10.5 0 2 2 10 5 15

2. Per misurare della forza del legame lineare `e possibile avvalersi di alcune informazioni gi`a disponibili in precedenti quesiti. Infatti ricordando che:

ρRM,N L=

σRM,N L

σRMσN L

dove σRM,N L= µRM,N L− µRMµN L , dai risultati nell’esercizio 9 segue che:

µRM = 4.66 σRM = 2.557

La media e la varianza della variabile marginale N L sono calcolate agevolmente utilizzando la tabella che segue:

NL classi ci ni ci× ni c2i × ni 0| − |2 1 10 10 10 2 − |4 3 5 15 45 Totale 15 25 55 e quindi µN L= 1.667, µ2N L= 3.667, σN L2 = 0.888 e σN L= 0.942.

Resta ora da calcolare il momento misto µRM,N L = 151 4 P i=1 2 P j=1

xiyinij per il quale sono

ne-cessari i valori centrali delle classi delle due variabili, ci, riportati in tabella:

0| − |2 2 − |4 RM ci 1 3 1.4| − |3.675 2.538 8 0 8 3.675 − |5.95 4.813 2 0 2 5.95 − |8.225 7.088 0 3 3 8.225 − |10.5 9.363 0 2 2 10 5 15

(31)

Segue quindi che:

µRM,N L =

1

15(20.304 + 9.626 + 63.792 + 56.178) = 9.993 mentre la covarianza `e: σRM,N L= 2.225.

Dai risultati precedenti il valore della correlazione `e:

ρRM,N L=

2.225

2.557 × 0.942= 0.923

che evidenzia la presenza di forte legame lineare positivo tra le due variabili.

3. L’impiego di alcune note regole sulle trasformate lineari agevola il calcolo della covarianza tra le variabili N L ed RMN. In particolare ricordando che date due trasformate lineari, U e

V :

V = a + bX U = c + dY la loro covarianza `e:

σU,V = bd · σX,Y

l’utilizzo di quest’ultima regola rende immediato il calcolo della covarianza richiesta. Infatti:

σRMN,N L= 1.15 · σRM,N L= 2.556

4. La correlazione tra le variabili RMN ed N L `e invariata rispetto alla correlazione tra RM ed

N L in quanto, utilizzando ancora una volta alcune regole sulle trasformate lineari:

ρRMN,N L=

1.15

|1.15|ρRM,N L = 0.923

5. `E noto che il calcolo degli indici statistici mediante l’utilizzo delle distribuzioni di frequenza per classi rende il risultato conseguito approssimato rispetto a quello ottenuto dall’impiego delle serie di dati. Per tale motivo si ripetono i calcoli della misura della correlazione tra le variabili RM ed N L avvalendosi delle corrispondenti serie di dati in Tabella 1.2.

In particolare i momenti delle due variabili sono calcolati utilizzando i dati nella tabella che segue da cui si deriva che:

µRM = 4.295 µN L= 1.933 µRM,N L = 11.196 σRM,N L= 2.894

(32)

i RM N L RM × NL 1 4.25 2 8.50 2 1.78 1 1.78 3 10.5 3 31.50 4 6.11 3 18.33 5 3.56 2 7.12 6 8.3 4 33.20 7 1.52 1 1.52 8 2.3 0 0.00 9 1.5 1 1.50 10 4.3 2 8.60 11 1.65 0 0.00 12 3.33 2 6.66 13 1.4 1 1.40 14 6.04 4 24.16 15 7.89 3 23.67 Totale 64.43 29 167.94

Esercizio 17

Si consideri la seguente distribuzione di frequenze doppia nella quale sono presi in esame il numero di clienti di 100 aziende (NC) e l’ammontare delle spese di rappresentanza (SR):

NC SR 10 − |20 20 − |30 30 − |40 40 − |50 50 − |60 60 − |70 1 − |3.5 10 8 3 6 12 2 3.5 − |6 0 4 2 4 1 0 6 − |8.5 1 5 3 7 11 3 8.5 − |11 3 0 2 4 0 9

1. Calcolare le medie delle sei distribuzioni condizionate SR|NC.

2. `E possibile affermare che le distribuzioni condizionate derivate al punto precedente sono in-dipendenti in media?

3. Misurare la connessione tra le due variabili SR ed N C.

4. Dai risultati precedenti, `e possibile affermare che N C ha una forte influenza su SR?

2

Soluzione

1. Il calcolo delle medie condizionate richiede l’utilizzo delle informazioni nella tabella proposta che sono integrate con le frequenze marginali ed i valori centrali delle classi di modalit`a delle due variabili:

(33)

NC SR 10 − |20 20 − |30 30 − |40 40 − |50 50 − |60 60 − |70 ci 15 25 35 45 55 65 1 − |3.5 2.250 10 8 3 6 12 2 41 3.5 − |6 4.750 0 4 2 4 1 0 11 6 − |8.5 7.250 1 5 3 7 11 3 30 8.5 − |11 9.750 3 0 2 4 0 9 18 14 17 10 21 24 14 100

2. Le medie delle sei distribuzioni condizionate SR|NC sono quindi cos`ı calcolate: SR|NC = 15 ni ci× ni 2.250 10 22.50 4.750 0 0.00 7.250 1 7.25 9.750 3 29.25 Totale 14 59 µSR|NC=15= 4.214 SR|NC = 25 ni ci× ni 2.250 8 18 4.750 4 19 7.250 5 36.25 9.750 0 0 Totale 17 73.25 µSR|NC=25= 4.309 SR|NC = 35 ni ci× ni 2.250 3 6.75 4.750 2 9.50 7.250 3 21.75 9.750 2 19.50 Totale 10 57.5 µSR|NC=35= 5.75 SR|NC = 45 ni ci× ni 2.250 6 13.50 4.750 4 19.00 7.250 7 50.75 9.750 4 39.00 Totale 21 122.25 µSR|NC=45= 5.821 SR|NC = 55 ni ci× ni 2.250 12 27.00 4.750 1 4.75 7.250 11 79.75 9.750 0 0.00 Totale 24 111.5 µSR|NC=55= 4.646 SR|NC = 65 ni ci× ni 2.250 2 4.50 4.750 0 0.00 7.250 3 21.75 9.750 9 87.75 Totale 14 114 µSR|NC=65= 8.143

3. Il carattere SR non `e indipendente in media da NC in quanto le medie condizionate di SR|NC sono differenti tra di loro ed a loro volta sono differenti dalla media della variabile marginale SR, quindi la condizione di indipendenza in media data da:

µx|y1= µx|y2= ... = µx|yh = µx

non `e soddisfatta.

4. La misura della connessione `e effettuata mediante l’indice ηx|y = r

var(µx|yj)

var(x) (dove x ed y

corrispondono rispettivamente ad SR ed N C). Dalla formula appena proposta emerge la ne-cessit`a di calcolare la varianza delle medie condizionate e la varianza della variabile marginale SR. A tale scopo si utilizzano le medie delle distribuzioni condizionate del precedente quesito e la loro varianza `e calcolata con:

var(µx|yj) = 1 N h X j=1 (µx|yj − µx) 2n .j

(34)

dove risulta necessario calcolare prima la media della marginale SR e successivamente si ottiene la varianza delle medie condizionate.

`

E noto dalla teoria che µx = E[µx|yj] quindi (ed `e possibile verificarlo empiricamente) `e

indifferente calcolare la media di SR utilizzando la distribuzione marginale SR dalla tabella doppia costruita nel primo quesito, oppure ottenerla come media delle medie condizionate delle distribuzioni SR|NC. Infatti nel primo caso si ha che:

SR ci ni ci× ni 1 − |3.5 2.250 41 92.25 3.5 − |6 4.750 11 52.25 6 − |8.5 7.250 30 217.50 8.5 − |11 9.750 18 175.50 Totale 100 537.50

e quindi µSR= 5.375, mentre nel secondo caso:

µSR|NC n.j µSR|NC× n.j 4.214 14 58.996 4.309 17 73.253 5.75 10 57.500 5.821 21 122.241 4.646 24 111.504 8.143 14 114.002 Totale 100 537.496

la cui media `e ancora pari a 5.375.

Le varianze della variabile marginale SR e delle medie condizionate µSR|NC sono invece ottenute con: SR ci ni c2i× ni 1 − |3.5 2.250 41 207.563 3.5 − |6 4.750 11 248.188 6 − |8.5 7.250 30 1576.875 8.5 − |11 9.750 18 1711.125 Totale 100 3743.751 µSR|NC n.j (µSR|NC− µSR)2× n.j 4.214 14 18.871 4.309 17 19.318 5.75 10 1.406 5.821 21 4.177 4.646 24 12.755 8.143 14 107.266 Totale 100 163.793

da cui segue che il momento secondo della variabile marginale SR `e µ2SR = 37.438 e quindi

la varianza `e σ2

SR = 37.438 − (5.375)2= 8.547 mentre la varianza delle medie condizionate

(35)

L’indice di connessione diventa quindi:

ηSR|NC=r 1.638

8.547 = 0.438

5. Il risultato conseguito con l’indice di connessione permette di affermare che SR `e dipendente in media da N C ma tale influenza non `e forte.



1.5

Numeri Indici

Esercizio 18

Il proprietario di un hotel chiede al suo consulente contabile alcune informazioni sulle spese sostenute per l’acquisto di quattro beni negli ultimi 5 anni. A tale scopo gli fornisce alcuni dati relativi al costo medio unitario (in Euro) ed al numero di unit`a di beni acquistati nei 5 anni di riferimento:

Televisori Condizionatori Frigo Bar Impianti Stereo

Anni prezzo quantit`a prezzo quantit`a prezzo quantit`a prezzo quantit`a ( ×100) ( ×100) ( ×100) ( ×100) 1999 2.5 2 4 3 2.8 10 2.6 11 2000 2.7 7 4.8 6 3.1 2 2.9 5 2001 2.8 6 5.2 1 3.3 4 3.6 4 2002 3.1 15 4.9 4 3.5 1 2.8 3 2003 2.9 9 4.2 7 3.4 3 2.5 6

Il proprietario dell’hotel, allo scopo di avere dati di sintesi, chiede: 1. La serie dei numeri indici a base fissa 2001 dei prezzi dei Televisori 2. La serie dei numeri indici a base mobile dei prezzi dei Televisori

3. Le serie dei numeri indici di Laspeyres e di Paasches con anno base 2000.

2

Soluzione

1. La costruzione della serie dei numeri indici a base fissa 2001 dei prezzi dei Televisori `e effettuata utilizzando i seguenti rapporti:

01It=

pt

p01 t = 1999, . . . , 2003

(36)

Anno 1999 2000 2001 2002 2003

01It 0.893 0.964 1.00 1.107 1.036

2. La serie dei numeri indici a base mobile `e invece costruita con:

t−1It= pt

pt−1 t = 1999, . . . , 2003

e quindi:

Anno 1999 2000 2001 2002 2003

t−1It - 1.080 1.037 1.107 0.935

3. I numeri indici di Laspeyres e Paasches con anno base 2000 sono calcolati utlizzando le seguenti formule: 00ItL= k P i=1 pt,iq00,i k P i=1 p00,iq00,i 00ItP = k P i=1 pt,iqt,i k P i=1 p00,iqt,i t = 1999, . . . , 2003

pertanto le corrispondenti serie sono calcolate utilizzando i dati nella seguente tabella dove sono prima calcolati i singoli termini della sommatoria e successivamente `e calcolato l’indice.

Numeri indici di Laspeyres

Televisori Condizionatori Frigo Bar Impianti Stereo Indice di Laspeyres

Anni pt× q0 pt× q0 pt× q0 pt× q0 k P i=1 ptiq00,i 00ItL 1999 17.5 24 5.6 13 60.1 0.879 2000 18.9 28.8 6.2 14.5 68.4 1.000 2001 19.6 31.2 6.6 18 75.4 1.102 2002 21.7 29.4 7 14 72.1 1.054 2003 20.3 25.2 6.8 12.5 64.8 0.947

In maniera simile `e costruita la serie dei numeri indici di Paasches che, a differenza del’indice di Laspeyres, richiede maggiori calcoli come evidenziato dalle seguenti tabelle.

(37)

Numeratori dei numeri indici di Paasches

Televisori Condizionatori Frigo Bar Impianti Stereo

Anni pt× qt pt× qt pt× qt pt× qt k P i=1 ptiqt,i 1999 5 12 28 28.6 73.6 2000 18.9 28.8 6.2 14.5 68.4 2001 16.8 5.2 13.2 14.4 49.6 2002 46.5 19.6 3.5 8.4 78 2003 26.1 29.4 10.2 15 80.7

Denominatori dei numeri indici di Paasches

Televisori Condizionatori Frigo Bar Impianti Stereo

Anni p0× qt p0× qt p0× qt p0× qt k P i=1 p0iqt,i 1999 5.4 14.4 31 31.9 82.7 2000 18.9 8.8 6.2 14.5 68.4 2001 16.2 4.8 12.4 11.6 45 2002 40.5 19.2 3.1 8.7 71.5 2003 24.3 33.6 9.3 17.4 84.6

e quindi la serie dei numeri indici di Paasches `e:

Anno 1999 2000 2001 2002 2003

00ItP 0.890 1.000 1.102 1.091 0.954



Esercizio 19

Un gruppo di consumatori ha rilevato mensilmente i prezzi (in Euro) e le quantit`a di 4 beni di prima necessit`a da loro acquistati in un semestre:

Bene A Bene B Bene C Bene D

Mesi prezzo quantit`a prezzo quantit`a prezzo quantit`a prezzo quantit`a Gennaio 1.6 10 3.7 15 0.7 21 7.8 12 Febbraio 1.9 14 3.9 12 1.1 26 8.2 15 Marzo 2.3 11 4.5 18 1.3 23 8.4 9 Aprile 2.1 16 4.2 11 1.6 28 8.5 13 Maggio 2.2 9 4.4 16 1.9 24 8.1 12 Giugno 2.4 8 4.8 10 2.1 31 8.8 9

1. Calcolare la serie dei numeri indici, a base fissa Marzo, dei prezzi del bene B.

2. Utilizzando quest’ultima serie, effettuare uno slittamento di base riportando i numeri indici alla base Gennaio

(38)

3. Dai risultati del precedente quesito, `e vero che il prezzo del Bene B ha subito un decremento nel mese di Giugno rispetto a Gennaio? Commentare la risposta.

4. Calcolare la serie dei numeri indici a base mobile dei prezzi del bene C.

5. Osservando quest’ultima serie di numeri indici, i prezzi del bene C hanno subito decrementi nel breve periodo?

6. Utilizzando la serie dei numeri indici a base mobile, costruire la serie dei numeri indici a base fissa Febbraio.

2

Soluzione

1. La serie dei numeri indici a base fissa Marzo dei prezzi del bene A `e generata come segue:

MarzoIt=

pt

pMarzo

t = Gennaio, . . . , Giugno quindi la serie completa `e pari a:

Mese Gennaio Febbraio Marzo Aprile Maggio Giugno

MarzoIt 0.822 0.867 1.000 0.933 0.978 1.067

2. Per effettuare lo slittamento di base richiesto per la serie MarzoIt, si utilizza la seguente

formula:

GennaioIt= Marzo

It MarzoIGennaio

t = Gennaio, . . . , Giugno

dove il denominatore rimane costante ed `e pari a MarzoIGennaio = 0.822 mentre la serie

completa dei numeri indici generata da tale cambiamento di base `e:

Mese Gennaio Febbraio Marzo Aprile Maggio Giugno

MarzoIt 1.000 1.054 1.216 1.135 1.189 1.297

3. L’affermazione `e falsa in quantoGennaioIGiugno = 1.297, ovvero il bene in esame presenta

un numero indice maggiore di uno e quindi nel mese di giugno il prezzo del bene B risulta maggiore del prezzo osservato nel mese di Gennaio. In particolare tale incremento `e stato del 29.7%.

4. La serie dei numeri indici a base mobile per il bene C `e generata, come visto in precedenza, con: t−1It= pt pt−1 t = Gennaio, . . . , Giugno da cui si ottiene:

(39)

Mese Gennaio Febbraio Marzo Aprile Maggio Giugno

t−1It - 1.571 1.182 1.231 1.188 1.105

5. Dalla serie dei numeri indici a base mobile si osserva che in tutti i mesi oggetto di rilevazione vi `e stato un incremento dei prezzi rispetto al mese immediatamente precedente. Tale incre-mento `e piuttosto marcato tra i mesi di Gennaio e Febbraio (in cui i prezzi si sono accresciuti del 57, 1%) e meno elevato tra il mese di Maggio e Giugno in cui l’incremento `e del 10, 5%. 6. Per generare la serie dei numeri indici a base fissa del bene C partendo da quelli a base

mobile, si utilizza la seguente relazione:

1It=1I2·2I3· ... ·t−2It−1·t−1It

Nel caso in esame `e richiesto di costruire una serie dei numeri indici la cui base fissa non coincide con il primo mese di rilevazione, come prevede invece la formula presentata, quindi si rende necessario prima costruire la serie dei numeri indici a base fissa Gennaio e successiva-mente, mediante un cambio di base, generare la serie dei numeri indici a base fissa Febbraio. Quindi si ottiene che le due serie da generare sono le seguenti:

Mese Gennaio Febbraio Marzo Aprile Maggio Giugno

GennaioIt 1.000 1.571 1.857 2.286 2.714 3.000 F ebbraioIt 0.636 1.000 1.182 1.455 1.727 1.909

dove i numeri indici a base fissa Gennaio sono calcolati con:

GennaioIF ebbraio=GennaioIF ebbraio= 1.571

GennaioIMarzo=GennaioIF ebbraio·F ebbraioIMarzo= 1.571 · 1.182 = 1.857

GennaioIAprile=GennaioIF ebbraio·F ebbraioIMarzo·MarzoIAprile= 1.571 · 1.182 · 1.231 = 2.286

e cos `ı via.

mentre il successivo slittamento di base necessario per generare la serie dei numeri indici con base Febbraio `e ottenuto dividendo GennaioIt con il valore di GennaioIF ebbraio = 1.571 (per

t= Gennaio,...,Giugno).



Esercizio 20

Utilizzando i dati dell’esercizio precedente:

1. Costruire la serie dei numeri indici composti di Laspeyres con base Aprile per i 4 beni in esame.

2. Osservando i risultati del precedente quesito, il paniere dei quattro beni esaminati dai con-sumatori ha subito incrementi nei prezzi tra il mese di Aprile ed il mese di Maggio? 3. Costruire la serie dei numeri indici composti di Paasches con base Aprile per i 4 beni in

esame.

(40)

Soluzione

1. Come nell’esercizio 18, la costruzione della serie dei numeri indice di Laspeyres pu`o essere semplificata utilizzando la seguente tabella:

Numeri indici di Laspeyres

Bene A Bene B Bene C Bene D Indice di Laspeyres

Mesi pt× qAprile pt× qAprile pt× qAprile pt× qAprile k

P

i=1

pt,iqAprile,i AprileItL

Gennaio 25.6 40.7 19.6 101.4 187.3 0.797 Febbraio 30.4 42.9 30.8 106.6 210.7 0.896 Marzo 36.8 49.5 36.4 109.2 231.9 0.986 Aprile 33.6 46.2 44.8 110.5 235.1 1.000 Maggio 35.2 48.4 53.2 105.3 242.1 1.030 Giugno 38.4 52.8 58.8 114.4 264.4 1.125

in cui nell’ultima colonna `e presente la serie richiesta.

2. La serie dei numeri indici di Laspeyres evidenzia che il paniere dei beni esaminati ha subito un incremento del 3% tra il mese di Aprile ed il mese di Maggio e quindi l’effermazione `e vera.

3. Anche la soluzione del presente quesito segue gli stessi passi dell’esercizio 18. In particolare `e calcolato il numeratore ed il denominatore dell’indice di Laspeyres e quindi si passa alla costruzione degli opportuni rapporti.

Nella seguente tabella sono riportati in maniera pi`u sintetica rispetto all’esercizio precedente i risultati:

Numeri indici di Paasches

Mesi Pk i=1 pt,iqt,i k P i=1

p0,iqt,i Indice di Paasches

Gennaio 179.8 219.6 0.819 Febbraio 225 248.9 0.904 Marzo 211.8 212 0.999 Aprile 235.1 235.1 1.000 Maggio 233 226.5 1.029 Giugno 211.5 184.9 1.144 

(41)

1.6

Interpolazione

Esercizio 21

La societ`a Gamma s.p.a. utilizzando i dati in tabella 1.1 vuole valutare se un modello di interpo-lazione lineare sia in grado di descrivere la reinterpo-lazione esistente tra le variabili Livello minimo di

reddito mensile desiderato (RM) ed Anni di esperienza lavorativa(AL). A tale scopo:

1. Rappresentare graficamente le coppie di valori (AL,RM)

2. Osservando la nuvola di punti, `e possibile affermare che tra le due variabili esiste un legame lineare positivo?

3. Stimare i parametri del modello di interpolazione lineare:

RM = a + bAL + e

4. Utilizzando il modello di interpolazione stimato, a quale livello minimo di reddito ambirebbe un individuo con 30 anni di esperienza lavorativa?

5. Se la variabile RM aumenta del 40%, le stime del modello di interpolazione restano immutate o cambiano?

6. Se cambiano, riscrivere il nuovo modello di interpolazione stimando i parametri facendo uso delle regole delle trasformate lineari.

2

Soluzione

1. La rappresentazione grafica delle coppie di valori (AL, RM ) `e fornita dal diagramma scatter in Figura 1.11

(42)

2. La nuvola di punti del grafico evidenzia un legame lineare positivo tra le due variabili. Infatti, ad eccezione di qualche punto, tutte le coppie di valori possono essere ben interpolate da un retta crescente.

3. La stima dei parametri a e b del modello di interpolazione lineare `e ottenuta con:

ˆ

a = ¯Y − ˆb ¯X ˆb = SXY S2

X

dove Y = RM ed X = AL

Si rende quindi necessario calcolare la covarianza tra le due variabili in esame, la varianza della variabile indipendente AL e le medie di ambo le variabili.

In particolare la covarianza e la varianza sono calcolate rispettivamente con: SXY = mXY − ¯X · ¯Y SX2 = m2X − ¯X

2

A tal fine si fa uso dei dati in tabella:

unit`a RM AL RM × AL AL2 1 2.3 2 4.6 4 2 1.6 8 12.8 64 3 1.2 21 25.2 441 4 0.9 1 0.9 1 5 2.1 15 31.5 225 6 1.6 3 4.8 9 7 1.8 28 50.4 784 8 1.4 5 7.0 25 9 1.2 13 15.6 169 10 2.8 20 56.0 400 11 3.4 32 108.8 1024 12 2.7 23 62.1 529 13 1.6 1 1.6 1 14 1.2 0 0.0 0 15 1.1 29 31.9 841 16 2.5 18 45.0 324 17 2 19 38.0 361 18 1.7 7 11.9 49 19 2.1 12 25.2 144 20 3.2 23 73.6 529 Totale 38.40 280 606.9 5924

Segue quindi che le medie delle due variabili sono ¯X = 280

20 = 14 e ¯Y = 38.4

20 = 1.92, il momento

misto ¨E mXY = 606.920 = 30.345 mentre il momento secondo di AL `e m2X =

5924

20 = 296.2.

Si ottiene cos`ı che:

(43)

Quindi le stime dei parametri sono: ˆb = 3.465

100.2 = 0.035 ˆa = 1.92 − 0.035 × 14 = 1.43 ed il modello di interpolazione lineare stimato `e:

ˆ

RMi= 1.43 + 0.035 × ALi i = 1, 2, . . . , 20

4. Assumendo che il modello di interpolazione lineare descrive correttamente il fenomeno oggetto di studio, un individuo con 30 anni di esperienza (ovvero AL = 30) desidera il seguente livello di reddito:

RM = 1.43 + 0.035 · 30 = 2.48

5. L’incremento del 40% di RM, come atteso, non lascia immutate le stime del modello di interpolazione. Questo risultato emerge con evidenza se si osserva che tale variazione modifica alcuni indici precedentemente calcolati.

Infatti la nuova variabile `e RM′= RM + 0.40 × RM ovvero RM= 1.40 × RM e quindi si

ottiene, utilizzando le regole delle trasformate lineari, che: la media di RM′ RM′= 1.40RM = 1.40 × 1.92 = 2.688 la varianza di RM′ SRM2 ′ = 1.402· SRM2 = 0.949 la covarianza tra AL ed RM’ SAL,RM′= 1.40 · SAL,RM = 4.851

che quindi differiscono dai valori precedenti.

6. Utilizzando i risultati del precedente quesito `e immediato stimare i parametri del modello di interpolazione lineare:

RM′= a + b × AL + e Infatti i parametri stimati a e b diventano:

ˆb =SAL,RM′

S2 AL

=4.851

100.2 = 0.048 ˆa = RM′− ˆb · AL = 2.688 − 0.048 × 14 = 2.016 e quindi il modello stimato `e:

ˆ

RM′i= 2.016 + 0.048 × ALi i = 1, . . . , 20

(44)

Esercizio 22

Utilizzando i risultati dell’esercizio precedente relativi al modello di interpolazione RM = a+bAL+

e:

1. Valutare la bont`a di accostamento del modello ai dati utilizzando l’indice R2.

2. `E vero che il modello stimato spiega almeno il 30% della variabilit`a totale? 3. Effettuare l’analisi grafica dei residui e commentare i risultati.

2

Soluzione

1. La verifica della bont`a di accostamento del modello ai dati `e effettuato mediante il calcolo dell’indice R2: R2=S 2 ˆ Y S2 Y dove S2 ˆ

Y `e la varianza dei valori interpolati ( ˆRM ) ed S 2

Y `e la varianza della variabile

dipen-dente (RM ). A tale scopo si costruisce un’altra tabella, ad integrazione della precedipen-dente:

unit`a RM AL RMˆ RMˆ 2 RM2 1 2.3 2 1.500 2.250 5.29 2 1.6 8 1.710 2.924 2.56 3 1.2 21 2.165 4.687 1.44 4 0.9 1 1.465 2.146 0.81 5 2.1 15 1.955 3.822 4.41 6 1.6 3 1.535 2.356 2.56 7 1.8 28 2.410 5.808 3.24 8 1.4 5 1.605 2.576 1.96 9 1.2 13 1.885 3.553 1.44 10 2.8 20 2.130 4.537 7.84 11 3.4 32 2.550 6.503 11.56 12 2.7 23 2.235 4.995 7.29 13 1.6 1 1.465 2.146 2.56 14 1.2 0 1.430 2.045 1.44 15 1.1 29 2.445 5.978 1.21 16 2.5 18 2.060 4.244 6.25 17 2 19 2.095 4.389 4.00 18 1.7 7 1.675 2.806 2.89 19 2.1 12 1.850 3.423 4.41 20 3.2 23 2.235 4.995 10.24 Totale 38.40 280 38.40 76.183 83.400

(45)

dove i valori interpolati ˆRMi (i = 1, . . . , 20) sono ottenuti con: ˆ RM1= 1.43 + 0.035 × 2 = 1.50 ˆ RM2= 1.43 + 0.035 × 8 = 1.71 ˆ RM3= 1.43 + 0.035 × 21 = 2.165 . . .

Dai risultati in tabella `e possibile calcolare la media di ˆRM che, come dimostrato dai risultati teorici, coincide con la media di RM :

ˆ

RM = 38.4 20 = 1.92

mentre il momento secondo m2RMˆ =

76.183

20 = 3.809. Segue cos`ı che la varianza dei valori

interpolati `e:

S2RMˆ = 3.809 − 1.92

2= 0.123

mentre la varianza dei valori osservati RM `e:

S2RM =

83.4 20 − 1.92

2= 0.484

Si ottiene infine che:

R2= 0.123

0.484 = 0.254

2. Dal valore calcolato dell’indice R2 si osserva che il modello interpolato spiega il 25.4% della

variabilit`a totale del fenomeno, quindi l’affermazione `e falsa.

3. Per effettuare l’analisi grafica dei residui si rende necessario calcolare i residui stimati ˆei =

RMi− ˆRMi, i = 1, 2, . . . , 20, come presentato in Tabella 1.3.

L’analisi grafica dei residui `e poi effettuata rappresentando graficamente le coppie di valori (i, ˆei) in Figura 1.12 ed (ˆei, ˆei−1) in Figura 1.13.

(46)

unit`a RM AL RMˆ ˆei 1 2.3 2 1.500 0.800 2 1.6 8 1.710 -0.110 3 1.2 21 2.165 -0.965 4 0.9 1 1.465 -0.565 5 2.1 15 1.955 0.145 6 1.6 3 1.535 0.065 7 1.8 28 2.410 -0.610 8 1.4 5 1.605 -0.205 9 1.2 13 1.885 -0.685 10 2.8 20 2.130 0.670 11 3.4 32 2.550 0.850 12 2.7 23 2.235 0.465 13 1.6 1 1.465 0.135 14 1.2 0 1.430 -0.230 15 1.1 29 2.445 -1.345 16 2.5 18 2.060 0.440 17 2 19 2.095 -0.095 18 1.7 7 1.675 0.025 19 2.1 12 1.850 0.250 20 3.2 23 2.235 0.965 Totale 38.40 280 38.40

Tabella 1.3: Calcolo dei residui stimati del modello di interpolazione

Nella Figura 1.12 si osserva che i punti rappresentati mostrano ancora un andamento cre-scente. Ci`o lascia ipotizzare che il modello esaminato non sia stato in grado di cogliere tutta la dinamica che lega le due variabili in esame e quindi che il modello di interpolazione li-neare sia stato in grado di spiegare solo parzialmente la relazione esistente tra RM ed AL. Questo risultato `e invece meno evidente nel grafico successivo (Figura 1.13). Questo fornisce un’ulteriore conferma di quanto osservato a seguito del calcolo dell’indice R2 il cui valore

aveva gi`a evidenziato i limiti del modello adattato.

(47)

Figura 1.12: Analisi dei residui: diagramma scatter delle coppie di valori (i, ˆei)

Figura 1.13: Analisi dei residui: diagramma scatter delle coppie di valori (ˆei, ˆei−1)

1.7

Esercizi Proposti

Esercizio 1

La societ`a AMCO s.p.a. ha rilevato nel mese di maggio 2005 il numero di pezzi difettosi (PD) prodotti da 15 macchine ed i costi di manutenzione (CM)(×1000Euro) per ciascuna di esse (i dati sono presentati nella Tabella 1.4).

1. Costruire le distribuzioni di frequenza delle due variabili (per la variabile CM usare 4 classi di modalit`a di uguale ampiezza).

2. `E vero che il 10% delle macchine ha prodotto non pi`u di 3 pezzi difettosi nel mese di riferi-mento? (utilizzare le frequenze relative cumulate per rispondere al quesito)

3. `E possibile affermare che i costi di manutenzione delle macchine sono stati inferiori a 5000Euro per il 20% dei macchinari in esame? (utilizzare le frequenze relative cumulate per rispondere al quesito)

(48)

macchina n. Pezzi Difettosi (P D) Costi di Manutenzione (CM ) 1 12 13,03 2 13 5,07 3 4 7,57 4 3 32,24 5 2 20,38 6 14 16,69 7 1 33 8 7 22,18 9 2 13,2 10 7 5,13 11 2 5,76 12 13 14,4 13 9 1,87 14 9 1 15 10 3,72

Tabella 1.4: Numero di pezzi difettosi (PD) e costi di manutenzione (CM) delle 15 macchine della AMCO s.p.a.

4. Rappresentare graficamente la variabile PD. 5. Rappresentare graficamente la variabile CM. 6. Calcolare la media della serie di dati PD.

7. Calcolare la media della variabile CM utilizzando i dati della corrispondente distribuzione di frequenze.

8. Calcolare la mediana ed i quartili di PD. 9. Rappresentare il box-plot della variabile CM.

10. Calcolare la varianza ed il coefficiente di variazione di CM.

11. Se i costi di manutenzione diminuiscono del 5%, calcolare le media e la varianza della nuova variabile:

CM′= 0.95CM

12. Misurare l’asimmetria di CM avvalendosi di un indice robusto. 13. Misurare la curtosi di CM.

2

Esercizio 2

(49)

1. Se i pezzi in uscita dalla filiera sono contrassegnati con D=”difettoso”, PD=”parzialmente difettoso” e ND=”non difettoso” ed i contrassegni sui 20 pezzi sono i seguenti:

D, N D, P D, D, N D, N D, P D, D, P D, N D, N D, N D, P D, N D, P D, N D, N D, D, P D, N D

misurare l’etergeneit`a della mutabile in oggetto dopo aver costruito l’opportuna distribuzione di frequenza.

2. misurare la concentrazione di P D avvalendosi della corrispondente distribuzione di frequenza 3. misurare la concentrazione di CM avvalendosi della corrispondente distribuzione di

fre-quenza.

4. se i costi di manutenzione crescono del 5%, la concentrazione della variabile CM rimane immutata?

5. un blocco delle macchine, dovuto all’interruzione dell’erogazione di energia elettrica, comporta un incremento di 5 unit`a di pezzi difettosi per ciascuna delle 15 macchine. Verificare che la concentrazione del fenomeno in esame resta immutata.

2

Esercizio 3

La societ`a A.M.C.O. s.p.a. rileva per le 15 macchine in esame, il numero di operai (N O) impegnati su ciascuna di esse e desidera confrontare quest’informazione con i costi di manutenzione sostenuti mediante la seguente distribuzione doppia:

CM\NO 1 2 3 1| − |9 1 3 0 9 − |17 1 2 2 17 − |25 0 1 0 25 − |33 0 2 3

1. Calcolare la media delle due variabili marginali.

2. Calcolare la varianza della variabile condizionata CM |NO = 2. 3. Le due variabili sono tra loro indipendenti?

4. Misurare la forza del legame associativo tra CM ed NO. 5. Calcolare la covarianza tra CM ed NO.

6. Se CM decresce del 5% la covarianza calcolata al precedente quesito rimane inalterata? 7. Misurare la forza del legame lineare tra le due variabili CM ed NO e commentare il risultato.

(50)

Esercizio 4

La societ`a A.M.C.O. s.p.a. dal 1998 al 2003 ha acquistato, per lo svolgimento delle proprie attivit`a produttive, quattro beni (Alfa, Beta, Gamma e Delta) dei quali ha registrato ogni anno le quantit`a ed il prezzo unitario (in Euro).

Bene Alfa Bene Beta Bene Gamma Bene Delta

prezzo quantit`a prezzo quantit`a prezzo quantit`a prezzo quantit`a

1998 11.4 3 7 6 12.03 1 11.99 1 1999 10.5 14 9.5 11 12.18 2 13.65 1 2000 12.96 5 14.47 9 14.6 5 15.42 4 2001 11.5 3 14.09 4 11.31 6 16.73 3 2002 14.71 11 14.53 14 12.58 9 15.08 3 2003 13.6 1 13.8 11 10.24 9 16.03 9

1. Costruire per i prezzi del Bene Alfa la serie dei numeri indici a base fissa 1999. 2. Utilizzando la serie del quesito precedente, cambiare la base fissa da 1999 a 2002. 3. Costruire la serie dei numeri indici a base mobile dei prezzi del Bene Beta.

4. Utilizzando quest’ultima costruire la corrispondente serie dei numeri indici a base fissa 1998. 5. Costruire la serie dei numeri indici di Paasches per i 4 beni in esame con base 2000. 6. Costruire la serie dei numeri indici di Laspeyres per i 4 beni in esame con base 2000.

Figura

Tabella 1.1: Dati raccolti su 20 candidati a seguito di una ricerca di personale qualificato
Figura 1.1: Diagramma a nastri della mutabile Cittadinanza
Figura 1.3: Funzione di ripartizione empirica della variabile Livello minimo di reddito
Tabella 1.2: Dati relativi alla zona di residenza, al reddito medio mensile familiare ed al numero di componenti in et`a lavorativa di 15 famiglie intervistate
+7

Riferimenti

Documenti correlati

[r]

Come si è notato la strategia che si usa per trovare massimi e minimi per funzioni di più variabili è la stessa che nel caso di una variabile - trovare i punti stazionari e

In particolare si sono esaminati il numero di moduli superati al primo anno ed il voto medio conseguito alla fine dell’anno accademico. I dati sono stati raccolti in una tabella

Assegnato uno spazio di probabilità (S, A, P[.]) si definisce variabile casuale X una funzione avente come dominio lo spazio dei campioni (S) e come codominio la retta realex.

Allo stesso modo, le linee di livello di una funzione di due variabili z=f(x;y) sono la rappresentazione di tutti i punti della superficie che hanno la stessa quota (quindi z=k dove

Come sappiamo, in una data prova non si può conoscere quale valore assumerà la nostra variabile casuale; ma se conosciamo tutti i possibili valori che la nostra variabile

• si ha un fading alla Rice in presenza di un termine dominante (in genere cammino LOS, o cammino LOS + cammino riflesso sul terreno) e numerosi cammini che &#34;perturbano&#34;

f(x,y)= costante definisca una curva di livello dotata di derivate. continue in (x 0 ,y