• Non ci sono risultati.

Parte teoricadelle prove scritte del corsoMetodi Statistici e Probabilisticiper Scienze Amabientali

N/A
N/A
Protected

Academic year: 2021

Condividi "Parte teoricadelle prove scritte del corsoMetodi Statistici e Probabilisticiper Scienze Amabientali"

Copied!
1
0
0

Testo completo

(1)

R a c c o l t a d i d o m a n d e p o s t e n e l l a

P a r t e t e o r i c a

d e l l e p r o v e s c r i t t e d e l c o r s o M e t o d i S t a t i s t i c i e P r o b a b i l i s t i c i

p e r S c i e n z e A m a b i e n t a l i

All’occorrenza, evidenziare la risposta che si ritiene corretta.

Statistica descrittiva

Esercizio 1. Le due tabelle sotto riportate sono relative ad uno stesso rilevamento di n dati di due variabili qualitative X e Y. La prima tabella è quella dei profili riga percentuali; la seconda esprime in termini letterali i corrispondenti conteggi (in generale non noti numericamente).

Y Totale

C D

X A 20 80 100

B 40 60 100

Totale 32 68 100

Y Totale

C D

X A nAC nAD nA B nBC nBD nB

Totale nC nD n

(2)

1.1. Se fosse noto che il numero dei soggetti esaminati è n500, si potrebbe utilizzare questa informazione e i valori della prima tabella per determinare i totali nA e nB?

Sì, perché: No, perché:

1.2. Se fossero noti i due valori nA e nB, si potrebbero utilizzare queste informazioni e i valori della prima tabella per determinare i due valori nC e nD?

Sì, perché: No, perché:

Esercizio 2. La prima delle tre tabelle che seguono riporta i profili riga percentuali delle due righe contrassegnate dalle modalità E ed F. Costruire le due successive tabelle di frequenze assolute (conteggi) di dati in modo che le righe E ed F abbiano gli stessi profili percentuali di quelli della prima tabella, ma abbiano le righe dei totali con profili percentuali diversi fra di loro.

A B Tot.

E 40 60 100

F 30 70 100

Tot. --- ---- ----

A B Tot.

E F Tot.

A B Tot.

E F Tot.

(3)

Esercizio 3. Un gruppo di 200 studenti è stato classificato a seconda del sesso e del corso di studio di appartenenza; i possibili corsi di studio sono solo due: Biologia e Matematica. È risultato che 120 studenti sono iscritti a Biologia e 80 a Matematica.

Maschi Femmine Totale Biologia

Matematica Totale

Maschi Femmine Totale Biologia

Matematica Totale

3.1. Riportare il profilo riga percentuale della variabile “sesso” nella tabella di sinistra, alla sua giusta collocazione.

3.2. Supponiamo che le variabili “sesso” e “corso di studi” siano indipendenti! Riportare i tre profili riga percentuali (corrispondenti alle voci “Biologia”, “Matematica” e “Totale”) nella tabella di destra.

Esercizio 4. Si dispone delle tabella di contingenza relative ad una coppia di variabili qualitativeX e Y. Si considerino le quattro situazioni sotto indicate; per ciascuna, dire se essa esprime o meno l’indipendenza delle variabili.

4.1. Nella tabella di contingenza tutte le righe hanno valori proporzionali ai corrispondenti valori della riga del totale.

4.2. Nella tabella dei profili riga tutte le righe sono uguali fra di loro.

4.3. Nella tabella percentuale non vi è proporzionalità delle righe fra di loro.

4.4. Nella tabella dei profili colonna tutte le colonne sono diverse l’una dall’altra.

Esercizio 5. La seguente tabella (incompleta) si riferisce a 1000 incidenti automobilistici avvenuti col solo guidatore a bordo, classificandoli a seconda del fatto che, al momento dell’incidente, l’autista avesse le cinture allacciate o meno, e a seconda del fatto che vi siano state conseguenti lesioni al capo oppure no.

lesioni al capo assenza di lesioni

al capo Totale

cinture allacciate 800

cinture non

allacciate 200

Totale 100 900 1000

5.1. Supponiamo che valga l’affermazione: l’uso delle cinture di sicurezza riduce di un fattore dieci il rischio di lesioni al capo. Completare i dati mancanti nella tabella in modo che essa corrisponda all’affermazione ipotizzata.

5.2. Supponiamo, invece, che valga l’affermazione: l’uso delle cinture di sicurezza riduce di un fattore cinque il rischio di lesioni al capo. Delle due tabelle A e B sotto indicate qual’è quella dei profili riga (percentuali) che corrisponde all’affermazione precedente?

Tabella A

lesioni al capo assenza di lesioni

al capo Totale

cinture allacciate 2 98 100

cinture non

allacciate 42 58 100

Totale 10 90 100

Tabella B

lesioni al capo assenza di lesioni

al capo Totale

cinture allacciate 1 99 100

(4)

cinture non

allacciate 46 54 100

Totale 10 90 100

Esercizio 6. Una recente informazione giornalistica ha affermato che la SARS colpisce anche la popolazione giovanile, anzi la colpisce in modo particolare; ed ha giustificato tale comunicazione dicendo che il 9 % dei malati (in Cina) ha meno di 21 anni.

Basta quest’ultima frase per giustificare l’affermazione precedentemente fatta?

Se sì, giustificarlo brevemente; se no, indicare qualche informazione necessaria e mancante.

Esercizio 7. Si consideri la seguente tabella, riprodotta da un quotidiano del 2.7.05:

Dove va l’otto per mille dello Stato (valori in euro)

Anno Fame nel

mondo Calamità

naturali Assistenza rifugiati

Conservazione beni culturali

Totali Confessioni religiose

Opere civili Chiesa

cattolica Ebrei

2002 2.595.537,00

2,62% 17.976.497,00

18,12% 8.640.807,00

8,70% 32.857.731,00

33,11% 288.393,00

0,29% 36.870.284,00

37,1% 99.229.249,00 100%

2003 2.555.993,00

2,52% 26.059.904,00

25,7% 8.750.000,00

8,6% 36.993.484,64

36,46% 107.000,00

0,11% 26.992.060,00

26,61% 101.458.441,64 100%

2004 910.941,854,44% 5.073.661,12

24,73% 648.000,00

3,16% 9.160.989,03

44,64% 4.724.000,00

23,03% 20.517.592,00 100%

La tabella riguarda due variabili X e Y.

Un po’ impropriamente, nel seguito di questo esercizio consideriamo entrambe le variabili come se fossero qualitative.

La tabella precedente contiene, fuse in una sola, più tabelle relative alle variabili X e Y; di quelle sotto riportate, indicare quali vi sono contenute e quali no:

tabella dei profili riga percentuali SI NO tabella dei profili colonna percentuali SI NO

tabella di contingenza SI NO

tabella (di contingenza) percentuale SI NO

Esercizio 8. Due tabelle di dati relativi a una coppia di variabili qualitative, hanno lo stesso numero di righe e di colonne. Supponiamo che esse abbiano i relativi profili riga uguali (compresi quelli della riga marginale). Si può dedurre da questo che le corrispondenti tabelle di conteggi assoluti

sono uguali? SI NO perché:

Esercizio 9.

9.1. La prima delle due tabelle che seguono riporta i profili riga percentuali delle due righe contrassegnate dalle modalità E ed F. È possibile completare la tabella dei profili riga percentuali, indicando anche il profilo riga percentuale corrispondente alla riga marginale dei totali?

Se SI, riportare tutti i valori nella tabella a destra; se NO, giustificarne brevemente la ragione.

A B Tot. A B Tot.

E 60 40 100 E

F 20 80 100 F

Tot. --- ---- ---- Tot.

(5)

A B Tot. A B Tot.

E 60 40 100 E

F 20 80 100 F

Tot. --- ---- ---- Tot.

Esercizio 10. Una serie di n dati quantitativi

x ,...,x1 n

ha il seguente box-plot.

Precisare quali fra le seguenti grandezze è determinabile a partire dal box-plot e quale no (per quelle determinabili, specificare il valore numerico):

10.1. Il valore medio x; SI x NO 10.2. Il primo quartile Q1 SI Q1 NO 10.3. Il numero n dei dati. SI n NO

10.4. Il dato mdi valore massimo. SI m NO 10.5. La media xn. SI xn NO

Esercizio 11. 1. Indicare una serie di dati A che abbia quello a fianco come box-plot:

A :

11.2. Indicare, se esiste, una seconda serie di dati B, diversa da A, che abbia lo stesso box-plot.

B :

Esercizio 12. Si consideri la serie di 5 dati

1, 2, 4,5,6

A. Il box-plot dei dati A è quello a fianco.

SI, perché:

Si può aggiungere ai dati della serie A

1, 2, 4,5,6

un sesto dato x6 in modo che il box-plot dei 6 dati sia quello della figura a fianco?

SI, x6 NO, perché:

Esercizio 13. Si consideri il box-plot riportato a fianco relativo a un insieme di dati di numerosità sconosciuta.

13.1. Si può determinare il numero minimo n di dati compatibili con questo box-plot? Se si, quanto vale n e quali sono i dati?

13.2. Se la domanda precedente ha risposta affermativa, è possibile aggiungere un dato ai precedenti in modo che il box-plot non cambi?

Esercizio 14. In figura è riportato il box-plot di 100 dati quantitativi.

Supponiamo che ai 100 dati iniziali si continuano ad aggiungere altri tutti paradossalmente eguali a 3.

Dire se prima o poi succede che:

14.1. la “scatola“ del box-plot degenera fino ad avere lunghezza nulla e contrarsi nel solo punto 3;

(6)

14.2. i “baffi” del box-plot degenerano fino ad avere lunghezza nulla;

14.3. oltre i baffi compare qualche *.

Esercizio 15. L’istogramma a fianco riporta la distribuzione delle età dei concorrenti di un concorso per giovani pianisti.

Tracciare il relativo box-plot.

Esercizio 16.

16.1. Tracciare il grafico di una funzione di distribuzione cumulata relativa ad una variabile casuale discreta, tale da corrispondere al box-plot sotto riportato.

16.2. La funzione di distribuzione cumulata di cui al precedente punto 1.1 è unica?

SI, perché

NO, eccone un’altra diversa da quella sopra disegnata:

16.3. Tracciare il grafico di una funzione di distribuzione cumulata relativa ad una variabile casuale continua, tale da corrispondere al box-plot sotto riportato.

16.4. La funzione di distribuzione cumulata di cui al precedente punto 1.3 è unica?

SI, perché

NO, eccone un’altra diversa da quella sopra disegnata:

(7)

Esercizio 17. Nella figura a fianco è riportato l’istogramma di due valori osservati x1, x2 di una variabile quantitativa, che può assume valori sugli interi, positivi e negativi.

È possibile aggiungere ai due dati un terzo dato x3 in modo che, rispetto ai valori originali,

17.1. la media aumenti e lo scarto aumenti? Si x3 No, perché: ...

17.2. la media diminuisca e lo scarto aumenti? Si x3 No, perché: ...

17.3. la media aumenti e lo scarto diminuisca? Si x3 No, perché: ...

17.4. la media rimanga invariata? Si x3 No, perché: ...

17.5. la media rimanga invariata e lo scarto aumenti? Si x3  No, perché: ...

Esercizio 18. È possibile riportare nella figura sotto due dati in modo che il loro valore medio sia maggiore del loro scarto?

Se SI riportare i due dati in figura;

se NO spiegare il perché:

Esercizio 19. Una serie di dati

x1,...,xn

ha media xn e scarto  .n

19.1. Agli n dati se ne aggiunge uno di valore eguale alla media: xn1xn; siano xA e A

rispettivamente la media e lo scarto degli n1 dati così ottenuti.

19.1.1. Si può dire quale delle tre relazioni sotto indicate è valida (se SI, evidenziarla; se NO darne una breve giustificazione)?

A n

xx xAxn xAxn

19.1.2. Si può dire quale delle tre relazioni sotto indicate è valida (se SI, evidenziarla; se NO darne una breve giustificazione)?

A n

  A nA n

19.2. Agli n dati

x1,...,xn

se ne aggiunge uno, che indichiamo ancora con xn1, di valore

1

n n n

x x  ; siano xB e  rispettivamente la media e lo scarto degli B n1 dati così ottenuti. Delle sei relazioni sotto indicate evidenziare le due corrette:

19.2.1. Si può dire quale delle tre relazioni sotto indicate è valida (se SI, evidenziarla; se NO darne una breve giustificazione)?

B n

xx xBxn xBxn

19.2.2. Si può dire quale delle tre relazioni sotto indicate è valida (se SI, evidenziarla; se NO darne una breve giustificazione)?

B n

  B nB n

(8)

Esercizio 20. I due istogrammi a fianco A e B, sono relativi il primo a due dati e il secondo a 4 dati. I valori assunti dai dati relativi ai due istogrammi non sono noti, ma è noto che le due relative all’istogramma B sono maggiori di entrambe quelle relative all’istogramma A (ovvero, è noto che t > s + 2).

20.1. Quale dei gruppi di dati ha media maggiore? A B 20.2. Quale dei gruppi di dati ha scarto maggiore? A B

Esercizio 21 (proposto nel 1999). Immaginiamo che fra 7 anni un ricercatore debba effettuare 150 misure di tempo riferite all’inizio del terzo millennio. Come molti sbaglia di un anno la data di inizio del millennio. Dire quale dei seguenti indici statistici riferiti alle sue 150 misure è invariante rispetto all’errore commesso:

Media varianza mediana IQR

Esercizio 22. Le due figure seguenti rappresentano gli istogrammi di due serie di dati. Indichiamo con x1 e  rispettivamente la media e lo scarto dei dati relativi alla figura 1, e con 1 x2 e 2

rispettivamente la media e lo scarto dei dati relativi alla figura 2.

Figura 1 Figura 2

Delle sei relazioni sotto riportate, indicare le due corrette:

1 2

xx x1x2 x1x2

1 2

  1 212

Esercizio 23. Una serie di n osservazioni quantitative ha l’istogramma riportato a lato;

in esso non sono riportate le unità di misura delle ascisse né quella delle ordinate perché né i valori xi né le corrispondenti frequenze ni dei dati sono noti. Indichiamo con xn e con  rispettivamente la media e lo scarton

degli n dati.

(9)

Supponiamo che l’istogramma di una seconda serie di 2n osservazioni quantitative abbia le stesse ascisse xi ma con frequenze esattamente eguali al doppio delle precedenti. Indichiamo con

x2n e con  rispettivamente la media e lo scarto della seconda serie di dati.2n

Delle sei relazioni sotto riportate, indicare le due corrette:

2n n

xx x2nxn x2nxn

2n n

  2n n2n n

Esercizio 24. Due serie di dati

x1,...,xn

e

y1,...,ym

hanno rispettivamente i valori medi x e y. È noto che x y; da tale informazione si può dedurre:

24.1. che comunque presi un dato xi dalla prima serie ed uno yj dalla seconda, risulta

necessariamente xiyj? SI NO;

24.2. che esistono necessariamente un dato x appartenente alla prima serie ed un dato y appartenente alla seconda in modo tale che sia verificata la relazione x y ?

SI NO;

Esercizio 25. Due ditte A e B producono ognuna diversi modelli di telefoni cellulari. Siano rispettivamente cA, cB e  , A  i valori medi e gli scarti dei costi dei cellulari prodotti dalle dueB

ditte. Supponiamo che il modello più costoso fra quelli prodotti dalla ditta A abbia un prezzo che è inferiore a quello del modello meno costoso fra quelli prodotti dalla ditta B.

25.1. È necessariamente cAcB? SI NO perché:

25.2. È necessariamente A B? SI NO perché:

Esercizio 26. La figura rappresenta l’istogramma di un certo numero n (non precisato) di osservazioni di una variabile quantitativa. I dati hanno media xn e scarto quadratico medio  .n

26.1. In quale dei seguenti tre intervalli ritieni che cada la media xn?

[1, 1.5) [1.5, 3.5) [3.5, 10)

26.2. Agli n dati originali se ne aggiunge uno di valore pari alla loro media. Si considerano la media xn1 e lo scarto n1 degli n1 dati così ottenuti. Delle sei relazioni sotto riportate, indicare le due corrette:

1

n n

x x xn1xn xn1xn

1

n n

 n1nn1n

26.3. Agli n dati originali se ne aggiunge uno di valore 4. Si considerano la media xn1 e lo scarto n1 degli n1 dati che così si ottengono. Delle sei relazioni sotto riportate, indicare le due corrette: xn1xn xn1xn xn1xn

1

n n

 n1nn1n

Esercizio 27. I due istogrammi a fianco A e B, sono relativi il primo a 40 dati e il secondo a 20. Le ascisse dei dati relativi ai due istogrammi non sono note, ma è noto che le due relative all’istogramma B sono maggiori di entrambe quelle relative all’istogramma A (ovvero, è noto che t >

s + d).

27.1 Quale dei due istogrammi ha media minore A B

(10)

27.2. Detti A e B gli scarti, rispettivamente, degli istogrammi A e B, evidenziare la relazione corretta: A < BA = BA > B

Esercizio 28. In figura 1 è riportato l’istogramma di una serie di 10 dati. Indichiamo con x1 e 1

rispettivamente la loro media e il loro scarto.

28.1. Riportare, nella figura 2, una seconda serie di 10 dati, ciascuno dei quali può essere un numero intero compreso fra 1 e 5, in modo che, detti x2 e  rispettivamente la loro media e2

il loro scarto, valgano entrambe le condizioni: x2x1 e 2 1.

Figura 1 Figura 2

Figura 3

28.2. Riportare, nella figura 3, una terza serie di 10 dati, ciascuno dei quali può essere un numero intero compreso fra 1 e 5, in modo che, detti x3 e  rispettivamente3

la loro media e il loro scarto, valgano entrambe le condizioni: x3x1 e 3 1.

Esercizio 29. I due dati rappresentati nell’istogramma a fianco hanno ascisse sconosciute s < t. Siano m e  rispettivamente la loro media ed il loro scarto.

Ai due dati se ne aggiungono altri 8 aventi tutti valore uguale a t; dire se:

29.1. il valore medio dei 10 dati complessivi rispetto a quello dei due iniziali;

aumenta diminuisce rimane invariato

(11)

Esercizio 18. Su uno stesso sistema di assi sono riportati gli istogrammi di due gruppi di dati: il gruppo A e il gruppo B.

Dire quale dei due gruppi ha:

18.1. media maggiore: ……;

18.2. scarto maggiore: …….

Esercizio 19. La figura rappresenta l’istogramma di 9 osservazioni di una variabile quantitativa che assume valori sui numeri interi positivi, che hanno media x 3 e scarto quadratico medio

2 3 1.15

   .

19.1. È possibile aggiungere ai 9 dati un decimo dato x10 in modo che la media diminuisca (cioè abbia valore 3) e lo scarto diminuisca (cioè abbia valore 1.15) ?

Si, per esempio: x10  ……; No, perché:

19.2. Ai 9 dati originali si aggiunge un dato di valore 3: Si considerano la media x10 e lo scarto  dei 10 dati così10

ottenuti. Indicare le relazioni corrette:

x10x x10x x10x

10  10  10 

Esercizio 20. Le due figure seguenti rappresentano gli istogrammi di due serie di dati. Indichiamo con x1 e  rispettivamente la media e lo scarto dei dati relativi alla figura 1, e con 1 x2 e 2

rispettivamente la media e lo scarto dei dati relativi alla figura 2.

Figura 1 Figura 2

Delle sei relazioni sotto riportate, indicare le due corrette:

1 2

xx x1x2 x1x2

1 2

  1 212

(12)

Esercizio 21. A fianco è riportato l’istogramma dei tempi (in ore/giorno) che esprimono, per ciascun operatore di una ditta, il numero di ore che impiega ogni giorno per svolgere la mansione di cui è incaricato. Fra le grandezze sotto riportate alcune hanno un valore che può essere ricavato dall’istogramma, altre no; individuare le prime, indicandone il valore numerico; per quanto riguarda le seconde, motivare possibili ragioni per cui il loro valore non può essere determinato.

21.1. Il numero degli operatori: o

21.2. Il numero delle ore al giorno complessive impiegate da tutti gli operatori per svolgere le loro mansioni: h . Può essere h24?

21.3. Il numero dei giorni che sono stati utilizzati per effettuare il rilevamento dei dati riportati nell’istogramma: g

Esercizio 22. Nelle due figure sotto sono rappresentati valori di coppie di dati quantitativi (ogni punto rappresenta una coppia di dati).

Figura 1. Figura 2.

22.1. In quale dei due grafici

X Y,

ha valore maggiore? ………

22.2. In quale dei due grafici

X Y,

ha valore positivo? ………

Esercizio 23. Nelle due figure sotto sono rappresentati valori di coppie di dati quantitativi.

A B

23.1. In quale dei due grafici

X Y,

ha valore più vicino a zero? ………

23.2. Delle sei relazioni sotto riportate, indicare le due corrette:

A 0

  A 0 A 0

B 0

  B 0 B 0

(13)

appare paradossale, da un punto di vista statistico, ma non ci si faccia carico di questo problema). Indichiamo con  il coefficiente di relazione dei punti presenti nel grafico C C. Delle sei relazioni sotto riportate, indicare le due corrette:

C A

  C AC A

C B

  C BC B

Esercizio 24. Nelle tre figure che seguono sono rappresentati valori di coppie di dati quantitativi (ogni punto rappresenta un dato); in tutte sono riportati gli assi che passano per il baricentro.

Figura 1. Figura 2.

Figura 3.

Disporre i grafici per ordine decrescente di coefficiente di correlazione:

coefficiente massimo: figura coefficiente intermedio: figura coefficiente minimo: figura

Esercizio 25. Nella figura a destra sono rappresentati valori di coppie di dati quantitativi (ogni punto rappresenta una coppia di dati, è tracciato il sistema d’assi che passa per il punto medio dei dati).

Il coefficiente di correlazione dei dati viene indicato con

X Y,

.

25.1. Si può aggiungere ai dati originali un “punto” A in modo che detto A

X Y,

il coefficiente di correlazione dei dati così ottenuti sia A

X Y,



X Y,

? Se SI, riportare A in figura; se NO, dire il perché.

25.2. Si può aggiungere ai dati originali un “punto” B in modo che detto B

X Y,

il coefficiente di correlazione dei dati così ottenuti sia B

X Y,



X Y,

? Se SI, riportare B in figura; se NO, dire il perché

(14)

Esercizio 26. La figura a fianco riportata, schematicamente, due dati A e B, relativi dalla coppia di variabili quantitative

X Y,

. I punti A e B stanno su una retta orizzontale, ma le loro coordinate non sono note.

26.1. Cosa si può dire circa il valore della covarianza

X Y,

? (Dare una risposta motivata).

26.2. Circa il valore del coefficiente di correlazione

X Y,

, qual’è la relazione corretta?

(Dare una risposta motivata).

X Y,

0

 

X Y,

1

X Y,

non è definito

perché:

Figura 1

Figura 2

Esercizio 27. Nelle due figure a fianco sono rappresentati valori di coppie di dati quantitativi (ogni punto rappresenta un unico dato). In entrambe sono riportati gli assi che passano per il baricentro. Confrontando le due figure, dire quale ha:

27.1. coefficiente di correlazione positivo:

Figura 1 Figura 2

27.2. valore assoluto del coefficiente di correlazione più vicino all’unità:

Figura 1 Figura 2 27.3. covarianza maggiore:

Figura 1 Figura 2

Esercizio 16. In figura è rappresentata la distribuzione congiunta di due variabili X e

Y.

I valori della variabile Y vengono aumentati di 2 unità mentre quelli della variabile X rimangono inalterati. Delle grandezze sotto indicate dire quali rimangono invariate e quali sono modificate e in che modo.

16.1. media di Y 16.2. varianza di Y 16.3. cov( X ,Y ) 16.4. ( X ,Y )

(15)

Esercizio 17. Una popolazione è formata da due sottopopolazioni A e B. Su di essa sono definite due variabili casuali quantitative X e Y.

Tracciare una “nuvola di punti”

corrispondenti ai valori osservati di X e Y in modo che le rispettive covarianze,

cov ( X ,Y )A e cov ( X ,Y )B , siano entrambe negative, mentre la covarianza cov( X ,Y ) delle due variabili sull’intera popolazione sia positiva.

Esercizio 28. La figura sotto rappresentata valori di coppie di dati quantitativi (ogni punto rappresenta una coppia di dati).

28.1. Dei tre valori sotto indicati del coefficiente di correlazione evidenziare quello corretto:

0.41  0.96  0.96

28.2. Delle tre rette sotto indicate evidenziare quella di regressione precisando, per le altre due, le ragioni per cui sono state escluse:

3 3

2 2

yxy x y 6 x

Esercizio 29. Un insieme A di valori di coppie di dati quantitativi è tale che il coefficiente di correlazione ha valore nullo: A0; un insieme B di valori di coppie di dati quantitativi ha anch’esso coefficiente di correlazione di valore nullo: B0. Si uniscono i due insiemi di dati A e

B in un terzo insieme C, che risulta quindi formato dai punti sia dell’uno che dell’altro.

29.1. Detto  il coefficiente di correlazione di C C, è necessariamente C 0?

SI, NO, perché:

29.2. Vale l’analoga proprietà se, invece che 0, tutti i coefficienti citati hanno valore 1? in altre parole, è vero che se A B1 allora è necessariamente anche C1?

SI, NO, perché:

Esercizio 18. Nelle tre figure sotto sono rappresentati valori di coppie di dati quantitativi. In tutte e tre sono riportati gli assi che passano per il baricentro.

Le corrispondenti tre rette di regressione hanno equazioni, non nell’ordine:

r1 1 1

2 2

yx ; r2 1

3 2

y  x ; r3 1

y3x Abbinarli correttamente alle tre figure, motivandone le ragioni:

(16)

Figura 1.

Figura 2.

Figura 1, retta : ………, perché:

Figura 2, retta : ………, perché:

Figura 3, retta : ………, perché:

Figura 3.

Esercizio 19. Nelle tre figure sono rappresentati valori di coppie di dati quantitativi (ogni punto rappresenta un dato); in tutte sono riportati gli assi che passano per il baricentro.

Disporre i grafici per ordine crescente di coefficiente di correlazione.

Figura 1.

Figura 2.

coefficiente minimo: figura coefficiente intermedio: figura coefficiente massimo: figura

Figura 3.

Esercizio 20. Sia fanno n coppie di rilevazioni di 2 variabili quantitative X e Y .

Se si cambiano le unità di misura dei dati, ponendo AsX e Bt Y con

s

e t costanti reali positive, dire quali dei seguenti valori cambiano e quali no (rispetto ai corrispondenti di X e Y ):

20.1. lo scarto quadratico medio di A e quello di B 20.2. la media di A e quella di B

20.3. la covarianza fra A e B

20.4. i coefficienti della retta di regressione di B rispetto a A

Esercizio 30. Una variabile quantitativa definita su una popolazione ha media  sconosciuta e scarto noto. Dalla popolazione vengono estratti due campioni che hanno media rispettivamente x1 e

(17)

Il test effettuato col primo campione porta a rifiutare l’ipotesi; mentre quello relativo al secondo campione porta ad accettarla.

30.1. Si può dire quale dei due campioni ha media minore, ovvero, quale delle tre relazioni sotto indicate, è quella corretta?

1 2

xx x1x2 x1x2

Se SI, evidenziare quella corretta; se NO, spiegare il perché.

30.2. Si può dire quale dei due campioni ha media più vicina a quella ipotizzata  , ovvero, quale0

delle tre relazioni sotto indicate, è quella corretta?

1 0 2 0

x   x  x10x20 x10x20 Se SI, evidenziare quella corretta; se NO, spiegare il perché.

Probabilità

Esercizio 21. Nel seguito di questo esercizio si faccia riferimento a eventi che riguardano l’estrazione di una carta da una mazzo di 40 carte da gioco (anche quando gli eventi siano più di uno, si devono riferire all’estrazione di una sola carta; questa potrà verificare entrambi gli eventi, oppure verificarne uno solo, o nessuno).

1. Due eventi distinti A e B vanno scelti in modo che le rispettive probabilità siano

 

A

 

B 75%

P P ; è possibile farlo in modo che sia P

A B

50%?

SI, ad esempio AB NO, perché:

2. Esistono due eventi A e B aventi le seguenti tre proprietà:

 

1 2

IP AIP B

 

1 4 A e B sono indipendenti

SI, ad esempio AB

NO, perché:

3. Esistono due eventi C e D aventi le seguenti tre proprietà:

 

1 2

IP CIP D

 

1 2 IP C D

 

1 2

SI, ad esempio CD NO, perché:

4. Esistono due eventi A e B aventi le seguenti tre proprietà:

 

1 2

IP AIP B

 

1 4 A e B sono indipendenti

SI, ad esempio AB NO, perché:

5. Esistono due eventi C e D aventi le seguenti tre proprietà:

 

1 2

IP CIP D

 

1 2 IP C D

 

1 2

SI, ad esempio CD NO, perché:

6. Esistono due eventi A e B aventi le seguenti tre proprietà:

   

P AP B IP A B

 

0

SI, ad esempio AB NO, perché:

7. Fornire l’esempio di due eventi C e D aventi le seguenti tre proprietà:

 

1 4

IP CIP D

 

1 2 IP C D

 

1 4

CD

Esercizio 22. Siano A e B due eventi tali che “A implica B”.

8. È vero che:

IP ( A ) IP ( B ) ? IP ( B A )1? IP ( A B )1?

9. Sia E un ulteriore evento tale che “E implica A”. È vero che IP ( E A ) IP ( E B ) ?

(18)

Esercizio 23. Siano A e B due eventi (entrambi diversi dall’insieme vuoto e dall’universo). In ciascuna delle seguenti tre situazione dire se vi sono o no casi in cui A e B possono essere indipendenti.

10. IP ( A B ) IP ( A )  11. IP ( A B ) IP ( A )  12. IP ( A B ) IP ( A ) 

Esercizio 24. Siano A, B e C eventi di probabilità non nulla. Dire quali delle seguenti affermazioni sono vere e quali no, giustificando il loro essere vere oppure producendo controesempi che motivino la loro falsità:

13. IP(A|B)IP(B|A) implica IP(A)IP(B) 14. IP(A)IP(B) implica IP(A|C)IP(B|C) 15. IP(A|B)IP(C) implica IP(A)IP(C) 16. IP(A|B)IP(A) implica IP(A)IP(B)

Esercizio 25. Siano A, B due eventi tali che 0IP(A)IP(B), più precisamente sia

30 . 0 ) (A P

I e IP(B)0.50.

Dire (giustificando e/o producendo esempi) se può accadere che:

17. IP(A|B)1 18. IP(B|A)1 19. IP(A|B) 21 20. IP(B|A) 21

Esercizio 26. Da un mazzo di 40 carte da gioco si deve estrarre una carta scelta a caso. Siano gli eventi A : estrarre una carta di cuori; B : estrarre un asso. È evidente che IP(A)IP(B).

21. Determinare, se esiste, un evento C tale che IP(A C)IP(B C); 22. Determinare, se esiste, un evento D tale che IP(A D)IP(B D); 23. Determinare, se esiste, un evento E tale che IP(A E)IP(B E);

24. Determinare, se esiste, un evento F tale che IP(A F)1 e IP(B F)0. Esercizio 27. Tre eventi A, B, C hanno tutti probabilità diverse sia da 0 che da 1.

25. Può capitare che A sia indipendente da A B ? 26. Può capitare che A sia indipendente da AB?

27. Se A e B sono incompatibili fra loro ed entrambi indipendenti da C, è necessariamente A B indipendente da C?

Esercizio 28. In riferimento ad eventi realizzabili con un mazzo di 40 carte da gioco, esistono due eventi A e B tali che valgano contemporaneamente le due relazioni IP A

 

IP B

 

e IP A B

 

1

? SI, ad esempio AB NO, perché:

Statistica inferenziale

Esercizio 29. Un’urna contiene 30 palline numerate da 1 a 30. Si effettuano estrazioni senza il reimbussolamento della pallina estratta. Sia Xi la variabile casuale che indica il numero uscito

n

(19)

Esercizio 31. La media di una popolazione è sconosciuta, lo scarto è noto. Si fa l’ipotesi che la media abbia un determinato valore. Ad un campione si applica il test sulla media: il p-valore risulta 2.34%; inoltre è noto quale sia l’intervallo di fiducia I al livello del 5%. Disponendo di queste informazioni, dire se la media campionaria appartiene all’intervallo di fiducia:

SI, la media campionaria appartiene ad I, perché:

NO, la media campionaria non appartiene ad I, perché:

Esercizio 32. La media di una popolazione è sconosciuta, lo scarto è noto. Si fa l’ipotesi che la media della popolazione abbia un determinato valore. Ad uno stesso campione di dati si applicano, in relazione alla stessa ipotesi, due test sulla media: il primo, al livello del 5%; il secondo, al livello dell’1%. Il secondo test porta a rifiutare l’ipotesi fatta. Ne segue che si può prevedere l’esito del primo test anche senza effettuarlo: il primo test porta necessariamente a

accettare rifiutare

l’ipotesi (evidenziare la risposta corretta e darne una spiegazione grafica).

Esercizio 33. La media di una popolazione è sconosciuta, lo scarto è noto. Si fa l’ipotesi che la popolazione abbia media 50: Due campioni hanno la stessa media campionaria. Il test sulla media, al livello del 5%, fatto col primo campione porta a rifiutare l’ipotesi fatta. Si può sapere quale sarebbe l’esito del test se lo si effettuasse utilizzando il secondo campione (sempre al livello del 5%) senza farlo realmente?

Si; l’esito sarebbe accettare l’ipotesi rifiutare l’ipotesi No, perché

Esercizio 34. Una variabile quantitativa definita su una popolazione ha media  sconosciuta e scarto noto. Dalla popolazione vengono estratti due campioni che vengono utilizzati per testare (allo stesso livello  nei due casi) l’ipotesi che la media della popolazione abbia un determinato valore  .0

Il test effettuato col primo campione porta a rifiutare l’ipotesi; mentre quello relativo al secondo campione porta ad accettarla.

34.1. Siano x1 e x2 le medie dei due campioni; si può dire quale di essi ha media minore, ovvero, quale delle tre relazioni sotto indicate, è quella corretta? (se SI, evidenziare quella corretta; se NO, spiegare il perché).

1 2

xx x1x2 x1x2

34.2. Siano p1 e p2 i p-valori relativi ai due campioni; si può dire quale delle tre relazioni sotto indicate è quella corretta? (se SI, evidenziare quella corretta; se NO, spiegare il perché).

1 2

pp p1p2 p1p2

Esercizio 35. La media di una popolazione è sconosciuta, lo scarto è noto. Si fa l’ipotesi che la media abbia valore 60. Un campione di 100 osservazioni ha media m1 60.7. È noto che, al livello del 5%, l’ipotesi va rifiutata. Un secondo campione, anch’esso di 100 osservazioni, ha media

2 59.1

m  . Si può conoscere qual è l’esito del test fatto utilizzando il secondo campione?

Se SI, indicare il risultato del test dando una breve giustificazione (eventualmente anche grafica) del ragionamento fatto, se NO, giustificare brevemente il perché:

Esercizio 36. La media di una popolazione è sconosciuta, lo scarto è noto. Se si applica il test, al livello del 4%, viene confermata l’ipotesi che la media sia 12. Dei due valori di seguito indicati uno è il p-valore del test; quale? 0.034 0.492 Perché:

Esercizio 37. Il test  , applicato al livello dell’1% ad un insieme di osservazioni relativo a due2 variabili (per il quale la minima frequenza teorica è molto elevata), porta a respingere l’ipotesi che le variabili siano indipendenti. Si può dire, senza ripetere i calcoli relativi al test, che necessariamente l’ipotesi fatta sarebbe respinta se, agli stessi dati, si applicasse il test al livello del

(20)

5%? Dare una risposta con una giustificazione esauriente e breve!

Esercizio 38. Viene eseguito il test sulla media, per una variabile quantitativa definita su una popolazione, rispetto ad un certo valore ipotizzato, nel caso in cui lo scarto sia noto, utilizzando un campione di osservazioni. Risulta p valore 3.26%

38.1. Qual’è la conclusione del test se si sceglie di effettuarlo al livello del 5%? 38.2. Qual’è la conclusione del test se si sceglie di effettuarlo al livello dell’1%?

Esercizio 31. Una variabile definita su una popolazione ha distribuzione normale. Ci si appresta a testare l’ipotesi che essa abbia media  al livello  5%. Si può dire quanto valgono le seguenti due probabilità?

28. la probabilità p1 che si realizzino entrambi i due eventi:

“la media della popolazione vale effettivamente  ” e

“il test porta a respingere l’ipotesi che la media sia  ”;

SI, p1NO, perché:

29. la probabilità p2 che, se la popolazione ha realmente media eguale a  , il test porti ad accettare l’ipotesi che la media sia  .

SI, p2NO, perché:

Esercizio 32. Dire quali sono le grandezze che intervengono nella determinazione dell’intervallo di confidenza per la media di una variabile casuale con distribuzione normale e varianza nota e, per ciascuna di essa, precisare quali sue variazioni aumentano l’ampiezza dell’intervallo, quali la fanno diminuire e discutere tali variazioni

Esercizio 33. Dai dati del censimento del 1991 risulta che il numero di abitazioni di una città è 300 000 e che la media dell’epoca di costruzione delle abitazioni è 1815 e lo scarto quadratico medio è 50 anni. Uno statistico applica il test sulla media dell’epoca di costruzione al livello del 5%.

Commentare!

Esercizio 34. Una variabile definita su una popolazione ha distribuzione normale con varianza uguale a 1. Due campioni indipendenti, di 100 elementi ciascuno, portano entrambi a rifiutare, al livello del 5 %, l”ipotesi che la media della variabile nella popolazione sia 5.

Se si considerano le 200 osservazioni precedenti come formanti un unico campione, avviene che la stessa ipotesi, allo stesso livello, sia:

sempre rifiutata sempre accettata

talvolta rifiutata, talvolta accettata, a seconda del valore delle medie dei due campioni iniziali Esercizio 35. Un test a livello del 5% viene effettuato su due campioni indipendenti. Supponiamo che l’ipotesi principale sia vera.

35.1. Qual è la probabilità che in entrambi i casi venga rifiutata l’ipotesi principale?

35.2. Qual è la probabilità che in un caso venga rifiutata l’ipotesi principale e nell’altro no?

Esercizio 36. Una variabile casuale in una popolazione ha distribuzione normale con media sconosciuta e deviazione standard nota,

15 . Si vuole verificare se la media della variabile

casuale è 20 contro l’alternativa che sia diversa da 20. Ad un campione si applica il test sulla media al livello del 5%.

36.1. Qual è la probabilità di rifiutare l’ipotesi principale quando nella popolazione si ha 20? 36.2. Che cosa si può dire circa la probabilità di rifiutare l’ipotesi principale quando nella

(21)

stesso campione di dati si applicano, in relazione alla stessa ipotesi, due test sulla media: il primo, al livello del 5%; il secondo, al livello dell’1%. Per ciascuna delle quattro condizioni sotto indicate dire se è possibile o no (barrare la risposta corretta):

Esito del 1˚ test Esito del 2˚ test

accettare accettare possibile non possibile accettare rifiutare possibile non possibile rifiutare accettare possibile non possibile rifiutare rifiutare possibile non possibile Esercizio 39. Si consideri la seguente tabella, riprodotta da un quotidiano del 2.7.05:

Dove va l’otto per mille dello Stato (valori in euro)

Anno Fame nel

mondo Calamità

naturali Assistenza rifugiati

Conservazione beni culturali

Totali Confessioni religiose

Opere civili Chiesa

cattolica Ebrei

2002 2.595.537,00

2,62% 17.976.497,00

18,12% 8.640.807,00

8,70% 32.857.731,00

33,11% 288.393,00

0,29% 36.870.284,00

37,1% 99.229.249,00 100%

2003 2.555.993,00

2,52% 26.059.904,00

25,7% 8.750.000,00

8,6% 36.993.484,64

36,46% 107.000,00

0,11% 26.992.060,00

26,61% 101.458.441,64 100%

2004 910.941,854,44% 5.073.661,12

24,73% 648.000,00

3,16% 9.160.989,03

44,64% 4.724.000,00

23,03% 20.517.592,00 100%

La tabella riguarda due variabili X e Y.

Un po’ impropriamente, nel seguito di questo esercizio consideriamo entrambe le variabili come se fossero qualitative.

Uno statistico effettua il test  di indipendenza delle variabili 2 X e Y, con i valori della tabella espressi sia in euro (€) che in milioni di euro (M€). Indichiamo rispettivamente con 2 e M€2 i valori dell’indice  ottenuto nei due test.2

39.1 Vale necessariamente la relazione 2 M€2 ? SI NO 39.2. I due test hanno necessariamente lo stesso risultato? SI NO

Esercizio 40. La media di una popolazione è sconosciuta, lo scarto è noto. Si fa l’ipotesi che la media abbia valore 60. Un campione di 150 osservazioni ha media tale che, al livello dell’1%, l’ipotesi va rifiutata. Si decide di ripetere il test, utilizzando lo stesso campione, ma con diversi valori del livello.

40.1. Si può dire quale sarebbe l’esito del test se si utilizzasse il livello del 5% (Se SI, indicare il risultato del test dando una breve giustificazione - eventualmente anche grafica - del ragionamento fatto, se NO, giustificare brevemente il perché)?

40.2. Si può dire quale sarebbe l’esito del test se si utilizzasse il livello dell’1‰ (Se SI, indicare il risultato del test dando una breve giustificazione - eventualmente anche grafica - del ragionamento fatto, se NO, giustificare brevemente il perché)?

Riferimenti

Documenti correlati

Nel caso della verifica di ipotesi sulla moneta, se il numero n di lanci è abbastanza elevato da poter utilizzare il teorema limite centrale, la regione di

Nel caso lo studente non abbia una videocamera esterna che assicuri le suddette riprese potrà usare, al suo posto, lo smartphone che, in tal caso, dovrà essere

In un campione casuale di 20 individui maschi di 25 anni sono state misurate le potenze massime, ottenendo una media campionaria x = 221W e una deviazione standard campionaria s x

Nella figura 5.23 sono riportati gli andamenti della velocità di rotazione della pompa e della temperatura di ingresso in turbina nei due tipi di configurazione per un transitorio

La tabella illustra i possibili errori in un test statistico... Si vuole testare a livello 5%:.. Test bilaterali per la varianza da popolazione di legge Normale. Sia X una

Una variabile quantitativa, definita sugli elementi di una popolazione, ha media  sconosciuta e scarto quadratico medio   1.44.. Calcolare il p-valore (precisando la

Entrambi i campioni vengono utilizzati per testare (allo stesso livello   5% nei due casi) l’ipotesi che la media della popolazione abbia un determinato valore .. Il

All’interno di ciascuna famiglia (test parametrici e non parametrici) la scelta del test più idoneo dovrà essere guidata dal tipo di quesito e dalla necessità di esplorare il