Statistica di Base, N-Z. Prova scritta del 3-2-2021 Nome e Cognome:
Matricola:
Avvertenze:
L’esame consta di 2 parti:
1. Parte A (punteggio massimo 10 punti): 10 domande a risposta multipla: per ognuna delle 10 domande si ottiene 1 punto per ogni risposta esatta, e si perde 0.25 punti per ogni risposta sbagliata. Le risposte doppie o assenti valgono zero.
Relativamente alle domande a risposta chiusa, una sola delle risposte è cor- retta.
2. Parte B (punteggio massimo 14 punti). La parte B è costituita da tre esercizi che valgono, rispettivamente, 6, 2 e 6 punti
3. Voto massimo conseguibile: 24; la prova scritta è superata con un voto superiore o uguale a 18.
4. Tempo: 90 minuti
5. Chi vuole ottenere un punteggio superiore a 24 può richiedere una prova orale.
6. Si ricorda l’articolo 17 della carta dei diritti e dei doveri delle studentesse e degli studenti della Sapienza. Le studentesse e gli studenti hanno il dovere di assumere un comportamento rigoroso e leale in tutte le loro attività all’inter- no dell’Università. In particolare, sono tenuti ad un comportamento corretto durante lo svolgimento delle prove di esame dando esempio tangibile dei loro valori di integrità personale e di onestà intellettuale.
Parte A
1. Un negozio espone 278 magliette. La seguente tabella riporta le distribuzioni di frequenze del carattere colore
Rosso 23 Giallo 10
Blu 45
Nero 200 Totale 278 A. L’eterogeneità è minima e la moda è 200 B. La distribuzione è asimmetrica e la moda è 200 C. La moda è la modalità Nero
Risposta corretta C
2. Per un carattere quantitativo la varianza è pari al A. Valore che rende minima la quantitàPN
i=1(xi− c)2 B. Valore minimo che può averePN
i=1|xi− c|
C. Valore minimo che può avere (PN
i=1(xi− c)2)/N Risposta corretta C
3. Hai 4 amici e ne vuoi invitare due a casa. In quanti modi puoi scegliere chi inviterai? (L’ordine all’interno della coppia non conta)
A. 24 B. 6 C. 4
Risposta corretta B, 6= 42 = 4!/(2!2!).
4. Supponi di avere degli eventi incompatibili a coppie la cui unione corrisponde allo spazio campionario
A. La probabilità dell’unione di questi eventi è minore di 1 e la probabilità della loro intersezione è 0
B. La probabilità dell’unione di questi eventi è pari a 1
C. La probabilità dell’unione di questi eventi è maggiore di 0 e la probabilità della loro intersezione è maggiore di 0
Risposta corretta B
5. Data le due seguenti distribuzioni di per unità A e B per un carattere X:
A : 2 5 2 9 3 2 5 100
B : 5 9 2 101 2 3 5 2 A. La media di B è maggiore della mediana di A B. La mediana di B è maggiore della mediana di A C. La media di A è maggiore della media di B Risposta corretta A
6. La distribuzione delle frequenze relative cumulata di un collettivo di 100 studenti secondo il carattere “numero di esami superati è
Esami Studenti
0 0.15
1 0.37
2 0.52
3 0.73
4 0.85
5 1
Il terzo quartile del carattere è A. 3
B. 4 C. 3.5
Risposta corretta B
7. Se il coefficiente di correlazione tra due caratteri quantitativi X e Y è pari a 0
A. I due caratteri sono indipendenti
B. Non è possibile perché il coefficiente di correlazione lineare assume solo valori positivi
C. La retta di regressione y = b0+ b1x è parallela all’asse x
Risposta corretta C. La risposta A non è corretta in quanto se r = 0 la correlazione è nulla ma ci possono essere altre forme di dipendenza tra Y e X.
Ad esempio se x=(-2,1,0,1,2) e y=(4,1,0,1,4) si ha esattamente y = x2ovvero una dipendenza di tipo quadratico. ll coefficiente r misura la correlazione lineare e non misura, in generale, la dipendenza tra caratteri quantitativi
8. Consideriamo un dado magico che all’inizio ha sei facce colorate e i colori sono nero,rosso, verde, bianco, giallo, blu. Una volta lanciato e osservato il colore uscito, il dado si trasforma perdendo la faccia che è appena uscita. In ogni lancio però le possibili facce sono comunque equiprobabili. Il dado viene lanciato 3 volte. Calcolare la probabilità che escano in ordine i colori nero, rosso, verde
A. 3! × 16×15×14 B. 16×16×16 C. 16×15×14
Risposta corretta C
9. Nella retta di regressione yi = β0+ β1xi, per i = 1, . . . , N se la devianza residua è pari a 0
A. Tutti i punti sono allineati sulla retta di regressione B. Il coefficiente di correlazione tra Y e X è pari a 0 C. la somma dei residui al quadrato è pari a 0
Risposte corrette C e A. (Per errore sono state inserite due risposte corrette)
10. Per un caratettere quantitativo X sono state considerate le classi c0− c1
c1− c2 e c2− c3. Le frequenze assolute nelle tre classi sono uguali, ovvero n1 = n2 = n3. Inoltre c0 = 0 e c3 = 100 e tutte le classi sono contigue e hanno uguale ampiezza. Assumendo l’uniforme distribuzione del carattere all’interno delle classi possiamo dire che
A. la media aritmetica non può comunque essere calcolata B. la media aritmetica è pari a 50
C. la media aritmetica è 1/3
Risposta corretta B
• • •
Parte B
1. Esercizio 1. 6 punti. La seguente tabella riporta il carattere X = ‘goal segnati nella stagione 19-20” e il carattere Y = “stipendio netto annuo in milioni di euro” per N = 6 attaccanti che giocano nella massima serie di un campionato di calcio di una nazione europea
i xi yi
1 12 1,4
2 9 1,3
3 11 1,3
4 24 1,2
5 36 4,5
6 27 7,5
Totale 119 17,2 sapendo che
N
X
i=1
x2i = 2947
N
X
i=1
y2i = 83, 28
N
X
i=1
xi· yi= 436, 1
a) Calcolare l’indice di concentrazione di Gini per Y . i Ai Qi Pi Pi− Qi 1 1.2 0,070 0,167 0,097 2 2.5 0,145 0,333 0,188 3 3.8 0,221 0,500 0,279 4 5.2 0,302 0,667 0,365 5 9.7 0,564 0,833 0,269 6 17.2 1,000
Totale 2,5 1,198
G = P5
i=1(Pi− Qi) P5
i=1Pi
= 1, 198
2, 5 = 0, 479 b) Rappresentare graficamente la spezzata di Lorenz per Y .
0.0 0.2 0.4 0.6 0.8 1.0
0.00.20.40.60.81.0
Pi Qi
c) Determinare i parametri della retta di regressione che spiega Y in funzione di X.
La media di X è µX= 1196 = 19, 83.
La media di Y è µX =17.26 = 2, 87.
La media dei prodotti è 1 6
6
X
i=1
xiyi= 436, 1
6 = 436, 1
6 = 72, 68 La covarianza è
σXY = 1 6
6
X
i=1
xiyi− µXµY = 72, 68 − 19.83 · 2, 87 = 15.83
La varianza di X è
σ2X= 1 6
6
X
i=1
x2i − µ2X= 2947
6 − 19, 832= 97, 81 I coefficienti b1 e b0 della retta di regressione sono quindi
b1= σXY
σX2 = 15, 83
97, 81= 0, 162
b0= µy− b1µX = 2, 86 − 0, 162 · 19, 83 = −0.342
d) Valutare la bontà di adattamento della retta determinata al punto prece- dente.
La varianza di Y è
σY2 =1 6
6
X
i=1
yi2− µ2y= 83, 28
6 − 2, 872= 97, 81 = 5, 64 Il coefficiente di correlazione è
r = σXY
pσ2xσ2Y = 15, 83
√97, 81 · 5, 64 = 0, 674
L’indice R2 è quindi
R2= r2= 0, 6742= 0, 454
2. Esercizio 2. 2 punti. Su un campione di 100 studenti universitari scelti casualmente, 25 hanno dichiarato di preferire la didattica a distanza rispet- to a quella in presenza. Riportare l’intervallo di confidenza al 90% per la percentuale di studenti universitari che preferiscono la didattica a distanza rispetto a quella in presenza.
"
ˆ p ± z0,05
rp(1 − ˆˆ p) n
#
=
"
0.25 ± 1, 65
r0, 25 · 0, 75 100
#
= [0, 18; 0, 32]
3. Esercizio 3. 6 punti. Tizio partecipa al seguente gioco. In un’urna ci sono 4 palline bianche e 6 palline nere. Tizio estrae due palline. Se sono dello stesso colore Tizio lancia una moneta due volte. Se sono di colore diverso lancia una moneta 3 volte. Tizio vince il gioco se il numero di teste osservate è pari a 0
a) Calcolare la probabilità che Tizio ottenga due palline dello stesso colore Sia A l’evento “due palline dello stesso colore”, Bil’evento “l’iesima pallina è bianca e Ni l’evento l’esima pallina è nera
A = B1∩ B2
[N1∩ N2
P (B1∩ B2) = 4 10
3
9 P (N1∩ N2) = 6 10
5 9 Inoltre gli eventi B1∩ B2 e N1∩ N2 sono incompatibili. Quindi
P (A) = P (B1∩ B2
[N1∩ N2= P (B1∩ B2) + P (N1∩ N2)
= 4
10 3 9 + 6
10 5
9 = 4 · 3 + 6 · 5
90 =42
90 = 0, 467
b) Calcolare la probabilità che Tizio vinca il gioco
Sia X il numero di teste. P (X = 0|A) = 1/4, P (X = 0| ¯A) = 1/8
P (X = 0) = P (X = 0|A)P (A) + P (X = 0| ¯A)P ( ¯A)
= 1
4 42 90+1
8
1 − 42
90
=11
60 = 0, 183
c) Sapendo che Tizio ha vinto, qual è la probabilità che abbia estratto due palline dello stesso colore
P (A|X = 0) = P (X = 0|A)P (X = 0)
P (X = 0) =(1/4)(42/90)
11/60 = 21/180
33/180= 21/33 = 0, ¯63
FINE COMPITO