• Non ci sono risultati.

Intervalli di confidenza

Nel documento Materiali e Risorse (pagine 87-110)

Esercizio 15

Un’azienda ha commissionato ad una societ`a di software la riprogettazione del proprio sito web. Dopo che quest’ultimo `e stato messo on-line vuole studiare gli effetti del rinnovo esaminando il numero di contatti giornaliero al sito. Sotto l’ipotesi che tali contatti hanno distribuzione Gaus- siana, N (µ, σ2), seleziona un campione casuale di 10 giorni in cui il numero di contatti `e stato il

seguente:

giorni 1 2 3 4 5 6 7 8 9 10

n. contatti 226 803 625 871 326 288 724 149 637 807

1. Costruire un intervallo di confidenza per la media dei contatti giornalieri della popolazione, fissando α = 0.05.

2. Costruire un intervallo di confidenza per la media dei contatti giornalieri della popolazione, fissando α = 0.02.

2

Soluzione

1. L’intervallo di confidenza per la media della popolazione `e dato da: ¯ x − t(n−1;1−α/2) s √ n ≤ µ ≤ ¯x + t(n−1;1−α/2) s √ n tale che: P  ¯ x − t(n−1;1−α/2) s √ n ≤ µ ≤ ¯x + t(n−1;1−α/2) s √ n  = 1 − α Dai dati campionari emerge che:

¯

x = 545.6 ed s = 271 mentre t(n−1;1−α/2)= t(9;1−0.025)= 2.262.

Avvalendosi di tali risultati l’intervallo di confidenza, con α = 0.05, `e:  545.6 − 2.262√271 10; 545.6 + 2.262 271 √ 10  ovvero [351.75; 739.45]

2. Ad un livello di confidenza α = 0.02 l’intervallo risulter`a di ampiezza maggiore, infatti in questo caso t(9;1−0.01)= 2.821 e l’intervallo di confidenza `e:

 545.6 − 2.821√271 10; 545.6 + 2.821 271 √ 10  quindi [303.85; 787.35] 

Esercizio 16

Il partito XX desidera sottoporre al consiglio comunale una modifica al piano del traffico. Per valutare il gradimento della proposta decide di intervistare un campione casuale di 20 cittadini residenti ai quali chiede di manifestare il prorio accordo o disaccordo in merito ricevendo le seguenti risposte:

cittadino 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 risposta 0 1 1 1 0 0 0 0 0 1 0 0 0 0 0 1 1 1 1 0

dove 1=accordo mentre 0=disaccordo.

1. Stimare la proporzione di cittadini favorevoli alla modifica del piano del traffico.

2. Costruire un intervallo di confidenza per la proporzione di popolazione favorevole alla modifica del piano del traffico (con α = 0.05).

2

Soluzione

1. La stima della proporzione `e ˆp = 1 20 20 P i=1 xi= 208 = 0.4, dove: xi= ( 1 se ”accordo” 0 se ”disaccordo”

2. L’intervallo di confidenza per la proporzione p `e: ˆ p − z1−α/2 r ˆ p(1 − ˆp) n ≤ p ≤ ˆp + z1−α/2 r ˆ p(1 − ˆp) n

tale che: P p − zˆ 1−α/2 r ˆ p(1 − ˆp) n ≤ p ≤ ˆp + z1−α/2 r ˆ p(1 − ˆp) n ! = 1 − α

Dalle tavole della variabile casuale Normale standardizzata, N (0, 1), si osserva che z(1−0.025)= 1.96 e quindi l’intervallo di confidenza per p `e:

" 0.4 − 1.96r 0.4 · 0.620 ; 0.4 + 1.96r 0.4 · 0.6 20 # ovvero: [0.185; 0.615] 

3.4

Esercizi Proposti

Esercizio 1

Sia X una popolazione avente distribuzione X ∼ f(x, θ), con θ = (µ, σ2) incognito e si estragga da X il campione casuale osservato:

6.2; 3.1; 4.6; 10.5; 5.5; 1.5; 3.6; 6.5; 2.7; 6.3

Stimare i parametri del vettore θ utilizzando stimatori derivati con il metodo dei momenti.

2

Esercizio 2

Data la popolazione X ∼ f(x, θ) = 1

θ, con 0 ≤ x ≤ θ e θ ≥ 0 incognito. Derivare uno stimatore

per θ con il metodo dei momenti.

(Nota: si ricordi che trattandosi di un solo parametro incognito, lo stimatore dei momenti `e ottenuto

risolvendo la seguente equazione µ1 = m1, dove µ1 `e il momento primo della popolazione ed m1 `e il

momento primo campionario. Pi`u in dettaglio µ1=R

θ

0 xf(x)dx mentre m1= ¯X. Quindi lo stimatore per

θ `e ottenuto risolvendo l’equazione

0 x 1 θdx= 1 n Pn i=1Xirispetto a θ) 2

Esercizio 3

Data la popolazione X ∼ P (λ), con λ > 0 ed incognita. Derivare uno stimatore di massima verosimiglianza per λ:

(Nota: Estratto il campione casuale X = (X1, X2, ..., Xn) dalla popolazione X, la funzione di verosimiglianza

`e data da: L(λ, x) = n Y i=1 e−λλxi xi! = e−nλ n Y i=1 λxi xi! (3.1)

Dalla (3.1) `e ottenuta la funzione di log-verosimiglianza, l(λ, x) = log(L(λ, x)), dalla cui minimizzazione rispetto a λ `e derivato lo stimatore richiesto)

Esercizio 4

1. Sia X ∼ f(x, µ = 4, σ = 24) da cui `e estratto il campione casuale X = (X1, X2, ..., Xn), con

n = 58. Si calcoli la probabilit`a che la media campionaria ¯X sia compresa tra 2 e 3.

2. Sia X ∼ N(−2, 18) da cui `e estratto un campione casuale di numerosit`a 12. (a) Calcolare la probabilit`a che P (| ¯X| > 1.1).

(b) Se Y = 2 − 1.6 ¯X, calcolare la probabilit`a che P (Y < −1).

2

Esercizio 5

L’ammontare delle buste paga corrisposte ai dipendenti dell’Universit`a di Salerno ha distribuzione Normale N (µ, σ2).

Dopo aver estratto un campione casuale di 11 dipendenti aventi le seguenti buste paga (espresse in migliaia di Euro):

1.94 1.11 5.85 0.97 1.09 6.2 0.92 1.35 2.22 1.9 3.17

sottoporre a test che:

1. la media dell’ammontare delle buste paga sia pari a 2.1. 2. la varianza dell’ammontare delle buste paga sia pari a 1.5.

2

Esercizio 6

Un team di scienzati sta studiando il flusso migratorio dei fenicotteri rosa in Italia ed in Turchia. Da studi di settore `e noto che il numero di chilometri percorsi ogni anno dai fenicotteri rosa che partono dall’Italia ha distribuzione N (µI, σ2) mentre per quelli che partono dalla Turchia la

distribuzone `e N (µT, σ2) e che i due flussi migratori non hanno alcun legame di dipendenza.

Sottoporre a test (con α = 0.05) che la media dei km percorsi dai fenocotteri rosa italiani e quelli turchi sia la stessa.

A tale scopo, si estraggono dalle due popolazioni due campioni casuali di numerosit`a n = 14 per l’Italia e n = 12 per la Turchia, che assumono i seguenti valori (espressi in migliaia di km):

Italia 10 8.8 6.9 6.7 8.2 8.9 1.7 0.6 2 4.6 1.4 3.1 2.3 7.4

Turchia 0.5 10 2.1 7.9 3.1 7.8 9.5 1.9 6.2 7.9 7.2 7.1

2

Esercizio 7

I fenicotteri rosa migratori in Italia, di cui all’esercizio 3, sono sottoposti a controlli dagli scienzati che per accrescerne la restistenza in volo hanno loro somministrato un enzima. Si `e quindi osservato che il numero di km percorso dai medesimi 14 fenicotteri dell’esercizio 3 dopo tale cura `e:

Italia 1.3 10.7 7.5 9.5 10.8 10.2 2.1 2.5 3.8 7.4 4.3 4.1 5 7.5

Sottoporre a test (con α = 0.05) che la media dei km percorsi dai fenicotteri rosa prima e dopo la cura sia la stessa.

2

Esercizio 8

Si consideri una popolazione di 500 polli. E’ noto che una parte di essi sia malata. Si sottoponga a test, con α = 0.05 che la proporzione di polli malata sia:

H0: p = 0.30 H1: p > 0.30

A tale scopo `e estratto dalla popolazione un campione casuale di n = 50 polli e risulta che 21 di loro sono malati.

2

Esercizio 9

Due candidati di schieramenti politici opposti si contendono una posizione al consiglio regionale. Al fine di esaminare l’orientamento degli elettori, estraggono dalla popolazione degli aventi diritto al voto due campioni casuali indipendenti di numerosit`a rispettivamente pari ad n1 = 60 per il

primo candidato ed n2 = 75 per il secondo candidato. Risulta che tra gli n1 intervistati 25 hanno

espresso la volont`a di votare il candidato 1, mentre tra gli n2intervistati 37 voteranno il candidato

2.

Avvalendosi di tali informazioni, sottoporre a test (con α = 0.05) il seguente sistema di ipotesi:

H0: p1= p2 H1: p1< p2

dove p1 e p2 sono rispettivamente le proporzioni di coloro che voteranno il candidato 1 ed il can-

didato 2.

2

Esercizio 10

Su una popolazione si sono osservati due caratteri (X, Y ) tra i quali si vuole verificare l’eventuale presenza di dipendenza.

A tale scopo si osserva un campione casuale di n = 190 unit`a per le quali `e costruita la seguente distribuzione doppia: Y /X X1 X2 X3 Y1 21 9 12 Y2 19 15 18 Y3 16 14 11 Y4 14 18 23

Avvalendosi di tali informazioni campionarie, sottoporre a test il sistema di ipotesi:

H0: X e Y sono indipendenti H1: X e Y non sono indipendenti

fissato α = 0.05.

Il Modello di Regressione

4.1

Modello di Regressione Lineare Semplice

Esercizio 1

`

E stato intervistato un campione di 10 famiglie alle quali `e stato richiesto il luogo di residenza, il reddito mensile e le spese per la cura personale mensile:

Famiglia Residenza Reddito (R) Cura Personale (C) (×1000 Euro) (×1000 Euro) 1 Nord 1.16 0.68 2 Centro 7.26 2.71 3 Nord 6.09 2.03 4 Sud 2.58 0.84 5 Sud 3.82 1.54 6 Centro 9.43 3.11 7 Sud 5.31 1.79 8 Nord 5.61 2.46 9 Nord 5.17 2.35 10 Sud 5.71 2.37

1. stimare i parametri del seguente modello di regressione lineare semplice:

C = a + bR + e

2. verificare la bont`a di accostamento del modello stimato ai dati osservati 3. sottoporre a test, con α = 0.05, il seguente sistema di ipotesi:

(

H0: b = 0

H1: b 6= 0

Soluzione

1. Il grafico richiesto per la rappresentazione delle coppie di valori `e i presentato in Figura 4.1 da cui `e possibile osservare la presenza di un legame lineare positivo tra le due variabili in esame.

Figura 4.1: Diagramma scatter delle coppie di valori (Ri, Ci)

2. Le stime dei parametri a e b del modello di regressione sono date da: ˆb =SR,C

S2 R

ˆ

a = ¯C − ˆb ¯R

Come gi`a evidenziato per il modello di interpolazione, `e utile avvalersi dei dati nella tabella seguente per agevolare i calcoli necessari alla stima dei due parametri:

Famiglia R C C × R C2 R2 1 1.16 0.68 0.789 0.462 1.346 2 7.26 2.71 19.675 7.344 52.708 3 6.09 2.03 12.363 4.121 37.088 4 2.58 0.84 2.167 0.706 6.656 5 3.82 1.54 5.883 2.372 14.592 6 9.43 3.11 29.327 9.672 88.925 7 5.31 1.79 9.505 3.204 28.196 8 5.61 2.46 13.801 6.052 31.472 9 5.17 2.35 12.15 5.523 26.729 10 5.71 2.37 13.533 5.617 32.604 Totale 52.14 19.88 119.193 45.073 320.316

Segue quindi che: ¯ C = 1 10 10 P i=1 Ci= 1.988 R =¯ 101 10 P i=1 Ri = 5.214 mR,C = 101 10 P i=1 Ri· Ci = 11.919 SR,C = mR,C− ¯R · ¯C = 1.554 m2C =101 10 P i=1 C2 i = 4.507 m2R=101 10 P i=1 R2 i = 32.032

S2

C= m2C− ¯C2= 0.555 SR2 = m2R− ¯R2= 4.846

quindi le stime dei parametri sono: ˆb = 1.554

4.846 = 0.321 a = 1.988 − 0.321 · 5.214 = 0.314ˆ 3. La bont`a di accostamento ai dati `e valutata con l’indice R2. Ricordando che:

R2= r2R,C (dove rR,C `e la stima dell’indice di correlazione)

`e facile calcolare: R2= 1.554 0.555·4.846

2

= 0.899. Il valore assunto dall’indice R2 evidenzia

la rilevante capacit`a del modello nel cogliere la variabilit`a del fenomeno osservato, ovvero pi`u particolare il modello stimato coglie l’89.9% della variabilit`a totale del fenomeno.

4. Il test sul parametro b `e fondato sul seguente sistema di ipotesi: 

H0: b = 0

H1: b 6= 0

avente statistica test: tc = ˆb sˆb H0 ∼ t(n−2) con s2ˆb = ˆ s2 n · S2 R e regione critica |tc| > t(n−2;1−α/2).

Il calcolo di tc richiede la preliminare stima della varianza degli errori ˆei (indicata con ˆs2):

ˆ ei= Ci− ˆCi dove Cˆi= 0.314 + 0.321 · Ri i = 1, 2, . . . , 10 tale che ˆs2= 1 n−2 n P i=1 ˆ e2 i

Si rende quindi necessaria l’aggiunta di ulteriori colonne alla tabella precedente: Famiglia R C Cˆi eˆi ˆe2i 1 1.16 0.68 0.686 -0.006 0 2 7.26 2.71 2.644 0.066 0.004 3 6.09 2.03 2.269 -0.239 0.057 4 2.58 0.84 1.142 -0.302 0.091 5 3.82 1.54 1.54 0 0 6 9.43 3.11 3.341 -0.231 0.053 7 5.31 1.79 2.019 -0.229 0.052 8 5.61 2.46 2.115 0.345 0.119 9 5.17 2.35 1.974 0.376 0.141 10 5.71 2.37 2.147 0.223 0.05 Totale 52.14 19.88 0.567

da cui emerge che la stima della varianza degli errori `e ˆs2 = 0.071 mentre la statistica test

assume valore: tc= √0.3210.001 = 8.39

Confrontando quest’ultimo con i valori tabulati t(8;1−0.025) = 2.306 e t(8;0.025) = −2.306, `e

possibile concludere che ad un livello di significativit`a del 5% rifiuto l’ipotesi nulla del test. 

Esercizio 2

Utilizzando i dati dell’esercizio 1 del corrente capitolo ed il modello in esso stimato: 1. Effetturare l’analisi grafica dei residui del modello stimato

2. Fissato α = 0.05, la costante a pu`o essere considerata significativamente diversa da 0?

2

Soluzione

1. L’analisi grafica dei residui `e generalmente effettuata avvalendosi dei diagrammi scatter delle coppie di valori (i, ˆei) ed (ˆei, ˆei−1).

Il primo dei due grafici `e presentato in Figura 4.2 da cui non merge la presenza di struttura nelle coppie di valori e quest’assenza di struttura `e ulteriormente confermata dalla Figura 4.3 dove sono rappresentate le coppie (ˆei, ˆei−1).

Figura 4.2: Diagramma scatter delle coppie di valori (i, ˆei)

Tale valutazione grafica conferma la validit`a del modello stimato nel rappresentare la strut- tura dei dati osservati come gi`a verificato, con una procedura differente, nel precedente esercizio con l’indice R2.

2. Per verificare se l’intercetta del modello `e significativamente diversa da zero, fissato α = 0.05, `e necessario costruire un test su a avente sistema di ipotesi:



H0: a = 0

Figura 4.3: Diagramma scatter delle coppie di valori (ˆei, ˆei−1) e statistica test: tc= ˆa sˆa H0 ∼ t(n−2) con s2ˆa= ˆ s2· m 2R n · S2 R

dove m2R`e il momento secondo della variabile indipendente R, SR2 `e la varianza di quest’ultima,

ˆ

s2`e la varianza degli errori mentre la regione critica `e |tc| > t(n−2;1−α/2)

Utilizzando i risultati del precedente esercizio segue che: s2

ˆ

a= 0.071 · 32.032

10 · 4.846 = 0.047 e quindi la statistica test `e tc= 1.448.

Fissato α = 0.05 i valori che delimitano la regione di accettazione del test sono t(8;1−0.025) = 2.306 e t(8;0.025) = −2.306, quindi H0`e accettata, ovvero il parametro a non `e significativa-

mente diverso da zero.



Esercizio 3

`

E stata effettuata una ricerca medica su un campione di 350 pazienti, volta a valutare la relazione esistente tra l’assunzione di sale (SL) e la pressione sanguigna (PS).

Dai dati campionari `e emerso che il consumo medio giornaliero di sale `e 25.4 mg e la media della pressione sanguigna massima `e 117.8. `E inoltre emerso che la varianza campionaria di SL `e 134.3 mentre quella di PS `e 75.9 mentre la loro correlazione `e 0.521.

L’equipe medica ritiene che la relazione tra SL e PS `e ben descritta da un modello di regressione lineare semplice:

P S = a + b · SL + e

1. Stimare i parametri a e b del modello di regressione 2. Verificare la bont`a di accostamento del modello ai dati

Soluzione

1. La stima dei parametri del modello richiede la conoscenza della covarianza tra SL e PS. Osservando che:

SSL,P S= rSL,P S· SSLSP S

la covarianza sar`a SSL,P S = 0.521 ·

134.3 · 75.9 = 52.60. Quindi le stime dei due parametri sono:

ˆb = SSL,P S

S2 SL

=52.60

134.3 = 0.39 a = 117.8 − 0.39 · 25.4 = 107.89ˆ

2. La bont`a di accostamento del modello ai dati `e possibile valutarla con l’indice R2. Utilizzando

la relazione R2= r2

SL,P S segue che R2= 0.271 e quindi il 27.1% della variabilit`a totale del

fenomeno osservato `e spiegato dal modello di regressione lineare stimato.

Tracce di esame

Nel seguito sono presentate alcune tracce di esame che lo studente pu`o svolgere autonomamente utilizzando le proprie conoscenze teoriche ed alcuni suggerimenti forniti con gli esercizi proposti nelle pagine precedenti.

Compito 1

La societ`a Election s.r.l. `e stata contattata da alcuni gruppi politici per rilevare la spesa per la campagna elettorale ed il numero di preferenze ricevute di 14 candidati italiani appartenenti a partiti politici di destra (D) o di sinistra (S):

Spesa (S) Voti (V) Partito Spesa (S) Voti (V) Partito Candidato (×1000 Euro) (×1000) (PT) Candidato (×1000 Euro) (×1000) (PT)

1 12.5 18 D 8 7.1 8.4 S 2 8.4 12 S 9 4.5 3.2 D 3 5.9 8 D 10 9.5 11.6 D 4 4.6 7 D 11 9.8 13 S 5 9.4 12 S 12 2.9 5 D 6 9.3 15 D 13 3.4 6.3 S 7 6.7 9.5 S 14 8.5 10.2 D

1. Calcolare la media, la mediana e la varianza della variabile Spesa (S).

2. Rappresentare graficamente le coppie di valori delle variabili Spesa (S) e Voti (V). 3. Misurare la forza del legame lineare eventualmente presente tra le variabili S e V. 4. Stimare i parametri β0 e β1 del modello:

V = β0+ β1S + e

5. Assumendo che i 14 candidati siano stati estratti bernoullianamente da una popolazione, sottoporre a test (con un livello α = 0.05) che la proporzione di voti presi dai partiti di sinistra sia pari a 0.30.

6. Sia X ∼ t(6) calcolare la seguente probabilit`a:

P (−3.707 < X < 1.943)

7. Sia Y ∼ t(40) calcolare le seguenti probabilit`a:

• P (|Y − µ| > 1 ∩ Y > 1.5) • P [|Y | < 1.3 ∪ (Y − µ) = 2]



Compito 2

La societ`a Consult s.p.a. ha rilevato il fatturato di 30 aziende Italiane ubicate al Nord, al Centro ed al Sud:

Fatturato Fatturato

Azienda (×1000 Euro) Ubicazione Azienda (×1000 Euro) Ubicazione

1 1.7 Nord 16 1.8 Centro 2 2.3 Sud 17 3.7 Sud 3 1.9 Nord 18 2.1 Centro 4 4.2 Centro 19 4.4 Nord 5 3.1 Centro 20 1.8 Nord 6 1.1 Sud 21 2.9 Centro 7 3.4 Nord 22 1.3 Centro 8 2.3 Nord 23 6.4 Sud 9 1.8 Centro 24 1.6 Nord 10 2.4 Sud 25 2.5 Sud 11 0.9 Sud 26 1.4 Nord 12 3.3 Centro 27 2.6 Centro 13 2.8 Centro 28 1.3 Nord 14 1.7 Sud 29 4.2 Sud 15 4.6 Nord 30 5.1 Centro

1. Calcolare la media, la varianza ed i quartili del fatturato delle aziende del Nord;

2. Utilizzando due box-plot paralleli, rappresentare il fatturato delle aziende del Nord e del Sud. Commentare i grafici ottenuti.

3. Misurare la concentrazione del fatturato delle aziende del Nord.

4. Verificare, ad un livello α = 0.05, che la media del fatturato delle aziende del Nord sia uguale alla media del fatturato delle aziende del Sud.

5. Sia X una variabile casuale di Poisson con media 2, calcolare la probabilit`a che X assuma valori minori di 3.

6. 6) `E estratto un campione casuale di 30 individui da una popolazione Y ∼ N(2, 10). Calcolare le seguenti probabilit`a:

• P ( ¯Y < 2.1 ∩ | ¯Y | < 0.5) • Ph ¯Y > 1.6 ∪ ( ¯Y − µ) < −1i



Compito 3

La societ`a Social Stat s.p.a. ha osservato il reddito mensile (RM) e la spesa in consumi alimentari (SC) di 14 famiglie:

Reddito Mensile (RM) Spesa Consumi Alimentari (SC) Famiglia (in migliaia di Euro) (in migliaia di Euro)

1 0.80 0.52 2 8.31 3.21 3 9.67 3.14 4 8.97 2.85 5 0.47 0.20 6 6.67 2.14 7 6.22 2.76 8 0.62 0.26 9 0.62 0.47 10 9.21 2.64 11 6.82 2.59 12 0.67 0.42 13 2.29 0.89 14 6.02 2.52

1. Si calcolino opportuni indici robusti di posizione e forma per la variabile RM

2. Si costruisca per RM una distribuzione di frequenze con quattro classi di modalit`a, tutte della stessa ampiezza, e si misuri la concentrazione del fenomeno in esame. Rappresentare la relativa curva di Lorenz.

3. Assumendo che SC sia un campione casuale estratto da popolazione Normale, si sottoponga a test che la varianza σ2= 2

4. Stimare, con il metodo dei minimi quadrati, i parametri del seguente modello di regressione lineare semplice:

SC = β0+ β1RM + e

5. Sia X ∼ N(2; 12), si calcolino le seguenti probabilit`a:

• P [(X − µ) > 1.1 ∩ X < 3.3] • P [|X − µ| < 0.7 ∪ X ≤ 2]

Compito 4

La societ`a Pubbly s.p.a. ha stampato dal 1997 al 2003 le seguenti pubblicazioni:

Saggi Riviste Periodici Libri scolastici Anni pi qi pi qi pi qi pi qi 1997 2.63 3 5.81 11 6.92 18 7.71 14 1998 0.25 2 4.61 11 4.45 3 8.76 2 1999 4.17 9 0.85 13 7.59 18 7.48 16 2000 4.35 12 4.51 9 5.58 16 0.96 14 2001 0.79 15 6.13 11 2.49 5 3.23 9 2002 9.78 8 2.81 14 7.39 3 5.05 10 2003 3.61 9 8.98 6 5.06 16 3.98 10

dove pi `e il prezzo unitario (in Euro) e qi `e il numero di pubblicazioni stampate (in migliaia).

1. Calcolare la media e la varianza dei prezzi dei Saggi

2. Rappresentare e commentare il box-plot della variabile prezzo Saggi 3. Misurare la forza del legame lineare tra i prezzi e le quantit`a dei Saggi

4. Calcolare la serie dei numeri indici di Laspeyres con base 1997 dei quattro beni in esame 5. Stimare i parametri del modello di interpolazione lineare:

P = a + bQ + e

dove P `e la variabile prezzo dei Saggi e Q `e la variabile quantit`a dei Saggi. 6. Sia X ∼ N(4; 38) , calcolare le seguenti probabilit`a:

• P [X < 3 ∪ (X − µ) > 1.5] • P (|X| > 4.5 ∩ X < 7) • P (|X − µ| < 1 ∪ X = 3)

Compito 5

La societ`a Tourist Survey s.r.l. ha effettuato un’indagine su 20 citt`a del mondo con la quale ha rilevato il numero di turisti e le spese per la sicurezza (espresse in Euro) sostenute da ciascuna delle citt`a osservate:

n. turisti Spese Sicurezza n. turisti Spese Sicurezza

Citt`a (×1000) (×10000) Continente Citt`a (×1000) (×10000) Continente

(NT) (SS) (NT) (SS) 1 10.3 4.5 Europa 11 11.9 4.3 Africa 2 14.6 6.1 America 12 12.2 5 Europa 3 9 3.5 Oceania 13 6.8 3.1 Africa 4 16.1 5.8 Africa 14 1.1 0.5 Oceania 5 11.4 4 Africa 15 3.4 2.2 Europa 6 8.3 2.4 Asia 16 8.1 2.2 Oceania 7 21.1 7.9 Europa 17 18.1 7.4 Europa 8 5.2 2 Asia 18 6.9 3.3 America 9 1.7 1.3 Oceania 19 23.1 8 America 10 6.5 2.9 Europa 20 7.4 3.8 Africa

1. Calcolare la media ed il coefficiente di variazione del numero di turisti nelle citt`a europee e la media ed il coefficiente di variazione del numero di turisti nelle citt`a africane.

2. Misurare la concentrazione del numero di turisti delle citt`a in Europa.

3. Misurare la forza del legame lineare eventualmente presente tra le variabili NT ed SS. 4. Sottoporre a test che la media della spesa per la sicurezza in Europa sia uguale alla media

della spesa per la sicurezza in Africa.

5. Si considerino due variabili casuali Normali indipendenti X ∼ N(3; 12) ed Y ∼ N(2; 8) e sia

W = 2 + X, calcolare le seguenti probabilit`a:

• P (|W | ≤ 5.6)

• P W < 2.3 ∪ W > 0.45 • P (X > 1.3 ∩ Y < 0.5)



Compito 6

La societ`a Sell s.p.a. ha osservato durante mese di maggio il fatturato (in migliaia di Euro) ed il numero di visitatori (in centinaia) dei propri 14 punti vendita rilevando i seguenti dati:

Fatturato (F) 1.4 8.1 1.4 7.1 7.5 0.2 6.8 8.6 7.1 4.0 9.1 0.6 3.6 6.1 Numero Visitatori (V) 23 11 5 14 8 5 6 11 5 14 8 5 8 12

1. Calcolare la media, la mediana e la varianza delle variabili F e V 2. Rappresentare il box plot della variabile V e commentare il risultato 3. Misurare la forza del legame lineare tra F e V e commentare il risultato. 4. Sia X ∼ χ2

(45) , calcolare la seguente probabilit`a:

P (|X − µ| > 2.1 ∪ X < 45)

Sia X ∼ N(10, 45), calcolare la seguente probabilit`a:

P [(X − µ) < 1.5 ∩ |X| > 1.8]

5. Assumendo che F e V siano i valori assunti da campioni casuali estratti da due popolazioni indipendenti aventi distribuzione rispettivamente F ∼ N(µF, σ2) e V ∼ N(µV, σ2) , sotto-

porre a test (con α=0.05) il seguente sistema di ipotesi:

H0: µF = µV H1: µF 6= µV

6. Stimare i parametri β0 e β1 del modello di regressione lineare semplice:

F = β0+ β1V + e



Compito 7

La societ`a XY Z ha un gruppo di n = 14 agenti commerciali su ciascuno dei quali nell’anno solare 2009 ha raccolto le informazioni in tabella relative al numero di clienti attivi (CA) ed alle provvigioni (P) corrisposte (in migliaia ai Euro):

# 1 2 3 4 5 6 7 8 9 10 11 12 13 14

CA 87 31 57 33 94 88 88 91 64 99 84 81 45 74 P 71.8 56.7 51.5 22.1 20.8 54.8 21.7 38.4 26.8 72.7 46.4 52.5 37.4 33.7

1. Calcolare la media di P e la covarianza tra CA e P (commentare il risultato della covarianza) 2. Rappresentare graficamente la variabile P.

3. Misurare la concentrazione della variabile P.

4. Se l’azienda decide di ridurre del 4% l’ammontare delle provvigioni corrisposte agli agenti, la concentrazione di P rimane immutata? (Motivare la risposta con commenti)

5. Vengono lanciati due dadi. Determinare la probabilit`a che il massimo tra i due sia 5 sapendo che la somma `e 7.

6. Sia X ∼ N(6; 12) una popolazione da cui `e estratto un campione casuale di n = 16 unit`a. Calcolare la seguente probabilit`a: P (| ¯X| < 3.6 ∪ ¯X > 7)

7. Assumendo che i dati della variabile P in tabella siano un campione casuale estratto da

P ∼ N(µ, σ2), sottoporre a test (con α = 0.01) il seguente sistema di ipotesi:

H0: σ2= 21 vs H1: σ2< 21

Compito 8

E’ stata effettuata un’indagine su un gruppo di 15 consumatori sui quali `e stato osservato l’ammontare di spesa media mensile (×100 Euro) per prodotti alimentari negli anni 2008 e 2009. In particolare si `e voluto valutare se la crisi economica abbia avuto un impatto su tale tipologia di acquisti. I dati raccolti sono presenti in tabella:

# 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 C08 7.6 3.7 5.5 3.9 3.5 7.5 5.8 5.4 6.4 7.5 5.1 3.6 4.8 5.4 5.0 C09 2.4 6.5 2.9 6.1 5.7 3.3 4.5 5.2 2.2 4.6 6.1 5.0 3.0 5.6 4.7

1. Calcolare per la variabile C08 indici robusti di posizione, variabilit`a e forma. 2. Rappresentare i box-plot paralleli delle variabili C08 e C09. Commentare il grafico. 3. Misurare le forza del legame lineare presente tra le due variabili C08 e C09.

4. Si consideri un’urna composta di 20 palline di cui 16 Rosse e 4 Verdi. Vengono estratte dall’urna tre palline senza reimmissione. Calcolare la probabilit`a che la terza pallina estratta sia verde.

5. Assumendo che i dati in tabella siano un campione casuale, sottoporre a test, con α = 0.025, il seguente sistema di ipotesi:

H0: µC08= µC09 H1: µC08< µC09

6. Si considerino le seguenti variabili casuali X ∼ N(12; 65) e Y ∼ U(3; 16) (con Y una variabile casuale uniforme continua), calcolare le seguenti probabilit`a:

• P (X > 6 ∩ |X| < 4.5) • P (Y < 5 ∪ Y ≤ 7.5)

7. Assumendo che il legame tra le variabili C08 e C09 sia descritto dal seguente modello di regressione lineare semplice:

C09 = a + bC08 + e

stimare a e b e valutare la bont`a di accostamento del modello ai dati.



Compito 9

La societ`a Alpha sta esaminando un gruppo di n = 25 imprenditori per ciascuno dei quali ha rilevato il fatturato annuo (F) dell’azienda (espresso in migliaia di euro) ed il titolo di studio (TS). I dati raccolti sono sintetizzati in tabella:

1. Calcolare il valore medio e misurare l’asimmetria della variabile marginale F . 2. Rappresentare graficamente la variabile marginale F .

F/T S elementare media superiore laurea

30, 5| − |40 2 3 0 2

40 − |50 3 0 3 1

50 − |80 2 0 1 0

80 − |120 1 0 2 5

3. Misurare la forza del legame associativo presente tra F e T S.

4. Assumendo che il fatturato dei 25 imprenditori formi un campione casuale estratto da una popolazione Normale, sottoporre a test (con α = 0.025) che la varianza del fatturato sia pari a 708 contro l’ipotesi alternativa che sia minore di tale valore.

5. Costruire un intervallo di confidenza, con α = 0.01, per la media del fatturato.

6. Sia X ∼ N(11; 34) da cui `e estratto un campione casuale di n = 12 unit`a, calcolare le seguenti probabilit`a:

• P (X < 9 ∪ |X| ≥ 14)

• P [(X − E(X)) > −3 ∩ X > 13]

7. Sia Y ∼ B(44; 0.56), calcolare la seguente probabilit`a: P (Y < 34 ∪ Y = 40).



Compito 10

La societ`a Gamma ha rilevato il numero di reclami effettuati dai suoi clienti per difetti di fab- bricazione del prodotto da loro venduto negli anni 2004 e 2005, presso 10 delle sue filiali. Al 31/12/2005 sono stati introdotti nuovi impianti al fine di rinnovare il ciclo produttivo. Si indichi con Xiil numero di reclami giunti nell’anno 2004 nelle singole filiali, vale a dire prima del rinnovo

degli impianti, e con Yi il numero di reclami effettuati nell’anno 2005, ovvero dopo il rinnovo degli

impianti.

Filiale 1 2 3 4 5 6 7 8 9 10 Xi 8 9 8 9 10 10 10 8 7 7

Yi 6 7 6 7 7 8 8 6 5 8

1. Calcolare il numero medio di reclami per entrambi gli anni considerati. 2. Calcolare le varianze dei dati osservati nei due anni considerati.

3. Calcolare la mediana ed i quartili dei dati osservati per i due anni considerati. 4. Rappresentare le due distribuzioni mediante i box-plot paralleli.

6. Si verifichi l’ipotesi che sia µX = µY contro l’ipotesi alternativa che sia µX > µY, al livello

di significativit‡ α = 0.05.

7. Data la seguente serie di numeri indici a base fissa 2000, relativa alle spese che la societ‡

Gamma ha sostenuto per la voce ”Ricerca e Sviluppo” dal 2000 al 2005: costruire la cor-

t 2000 2001 2002 2003 2004 2005 It 1.00 1.06 1.18 0.097 0.89 1.10

rispondente serie di numeri indici a base mobile.

8. Si consideri un mazzo di carte napoletane, composto da 10 carte di denari, 10 carte di coppe, 10 carte di bastoni e 10 carte di spade. Si estraggono tre carte dal mazzo senza reimmissione. Calcolare:

• La probabilit‡ di estrarre almeno un asso. • La probabilit‡ di estrarre non pi˘ di un asso.

9. Sia X ∼ N(5; 1) una v.c. normale e sia W = 3X − 2. Calcolare:

• La media e la varianza di W • P [|W − µW| > 5 ∩ W ≤ 4].

• P [|W | < 4 ∪ W ≤ 3].



Compito 11

La societ`a telefonica Omega s.p.a. ha effettuato uno studio statistico sui propri clienti. I due caratteri rilevati, livello di istruzione (LI) e spesa telefonica (ST), ha dato luogo alla seguente distribuzione doppia:

ST /T S elementare media superiore laurea

0 − |50 10 16 6 12

50 − |100 6 12 17 5

100 − |150 3 10 17 12

1. Si calcoli la media e la mediana della distribuzione marginale ST .

2. Si calcoli la varianza della distribuzione condizionata ST |LI = Superiore e si misuri l’eterogeneit`a (indice di Gini) della distribuzione condizionata LI|ST = 50 − |100.

4. Assumendo che lo studio statistico sia stato effettuato su un campione casuale di clienti della societ`a Omega s.p.a. si verifichi, con un opportuno test, l’indipendenza tra ST e LI. 5. Costruire un intervallo di confidenza, con α = 0.01, per la media del fatturato.

6. Sia X una variabile casuale t-student con g = 30 gradi di libert`a. Si calcolino le seguenti probabilit`a: • P (|X − µX| > 1.6). • P [|X| < 2 ∪ (X − µX) > 0]. • P [(X − µX) > 0.9 ∩ (X < 2)]. 

Compito 12

Una rilevazione statistica del fatturato Fi, espresso in milioni di euro, di 14 piccole imprese ha

dato luogo ai risultati seguenti:

i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Fi 3 2 4 5 3 7 4 4 2 3 5 7 1 5

Il candidato effettui le seguenti elaborazioni:

1. Dalla rilevazione statistica data derivi la distribuzione di frequenza e ne costruisca il relativo grafico.

2. Calcoli la media, mediana e scarto quadratico medio del fatturato.

3. Calcoli la concentrazione del fatturato e costruisca il grafico della spezzata di Lorenz. 4. Sotto l’ipotesi che la rilevazione data sia un campione casuale estratto da una popolazione

normale, con media e varianza incognita, sottoponga a test il sistema di ipotesi (con α =

Nel documento Materiali e Risorse (pagine 87-110)

Documenti correlati