• Non ci sono risultati.

Homework 4

N/A
N/A
Protected

Academic year: 2021

Condividi "Homework 4"

Copied!
6
0
0

Testo completo

(1)

1

HOMEWORK 4

4.1 Un’azienda di trasporti vuole stimare la probabilità che i suoi clienti siano soddisfatti della puntualità delle corse dei suoi pullman sulla base delle risposte fornite da un campione casuale di 500 clienti, dei quali 380 si dichiarano soddisfatti. Determinare la stima di massima verosimiglianza della probabilità che un cliente sia soddisfatto.

4.2 Un’azienda che produce fogli di carta è interessata a determinare la distribuzione di probabilità della loro resistenza alla lacerazione e per tale motivo ha esaminato un campione casuale di 20 fogli ottenendo i seguenti risultati relativi alla loro resistenza

112 119 117 123 108 99 112 118 120 106 102 109 110 101 99 104 100 102 96 103

Ipotizzando che la variabile “resistenza alla lacerazione” si distribuisca in modo normale, determinare le stime di massima verosimiglianza dei suoi due parametri

4.3 Un’industria farmaceutica è interessata a valutare l’incidenza di effetti collaterali gravi causati da un certo tipo di vaccino. Sapendo che su un campione di 400 persone a cui è stato somministrato quel vaccino 20 hanno presentato effetti collaterali di una certa entità, determinare un intervallo di confidenza approssimato al livello di probabilità del 95% per la probabilità del verificarsi di questi effetti collaterali (utilizzando le prime 6 cifre decimali). Sapendo inoltre che il vaccino verrà somministrato complessivamente a 800mila persone, determinare l’intervallo di confidenza del numero di persone che presenterà effetti collaterali allo stesso livello di probabilità.

4.4 Un ente che si occupa della soluzione di problemi ambientali ha condotto un’indagine per stimare la proporzione di persone disposte a pagare un prezzo maggiore per la benzina così da proteggere l’ambiente. Sapendo che su 1500 individui intervistati 660 hanno risposto affermativamente, costruire l’intervallo di confidenza approssimato per la proporzione di persone disposte a pagare un prezzo maggiore nella popolazione al livello di probabilità del 99% e verificare se in tale intervallo è compreso il valore 0.5, corrispondente alla metà della popolazione.

(2)

2

4.5 Nel corso di un’indagine sulle abitudini degli italiani condotta su 1600 individui è risultato che il numero medio di ore passate giornalmente davanti alla TV è pari a 2.9, con una varianza corretta pari a 6.76. Determinare l’intervallo di confidenza del parametro  “numero medio di ore giornaliere passate davanti alla TV” al livello di probabilità 1−=0.9.

4.6 Le seguenti informazioni si riferiscono ai punteggi ottenuti nel gioco del golf per un campione di giocatori classificati a seconda del sesso. Si vuole verificare l’ipotesi di uguaglianza dei punteggi medi per maschi e femmine mediante il calcolo del p-valore.

Numerosità Punteggio medio Varianza corretta

Maschi 60 82.72 16.1604

Femmine 40 79.85 14.7456

4.7 In uno studio volto a rilevare se una sostanza influisce sul tempo di reazione dei guidatori si sono considerati due gruppi di individui, al primo dei quali è stata somministrata la sostanza in questione, mentre al secondo gruppo è stato somministrato un placebo. Sulla base delle informazioni contenute nella tabella successiva, verificare se la sostanza ha un qualche effetto mediante il calcolo del p-valore

Numerosità Tempo medio di reazione (in millisecondi)

Varianza corretta

Sostanza 50 543.2 6202.8

Placebo 50 585.8 7675.5

4.8 Un’azienda produttrice di automobili aveva commissionato nel 2018 un’indagine per rilevare le preferenze dei consumatori su 4 diversi modelli (A, B, C e D) di un’automobile, ottenendo rispettivamente le seguenti percentuali di preferenza: 22%, 33%, 18% e 27%. Sapendo che nell’indagine effettuata l’anno successivo su 200 consumatori il numero di quelli che preferiscono il modello A è pari a 42, il numero di preferenze per B è pari a 70, il numero di preferenze per C è 38 e quello per D a 50, si vuole verificare l’ipotesi che non ci sia stato un cambiamento significativo nelle preferenze fra i due anni al livello di probabilità del 99%.

(3)

3

4.9 In una sperimentazione clinica per valutare se un farmaco per il trattamento dei dolori reumatici ha un qualche effetto sulla nausea (intesa come effetto collaterale), 400 pazienti con dolori reumatici sono stati assegnati casualmente al gruppo trattato con il farmaco in studio (n1=250) o al placebo (n2=150). Dopo un mese 188 dei 250 pazienti trattati con il farmaco hanno presentato uno o più episodi di nausea, mentre sono 108 quelli che hanno presentato episodi simili nel gruppo trattato con il placebo. Si vuole verificare se questa sperimentazione offre sufficienti evidenze che il farmaco ha un qualche effetto sulla nausea tramite il calcolo del p-valore.

(4)

4

SOLUZIONI

4.1 La variabile di interesse ha una distribuzione Bernoulliana di parametro . La stima di massima verosimiglianza di  è la media (o proporzione) campionaria che corrisponde al rapporto 380/500 = 0.76.

4.2 La stima di massima verosimiglianza di  è la media campionaria, che in questo caso risulta uguale a 108.

La stima di massima verosimiglianza di 2 è la varianza campionaria (non corretta), che in questo caso risulta uguale a 62.2

4.3 La proporzione di individui che presentano effetti collaterali nel campione è pari a 20/400=0.05. Pertanto l’intervallo di confidenza approssimato per la probabilità  richiesta risulta

0.05 ∓ 1.96√0.05 × 0.95

400 ≈ [0.028641,0.071359]

Di conseguenza l’intervallo di confidenza del numero di individui che presenterà effetti collaterali si ottiene dai precedenti estremi dell’intervallo di confidenza di

 moltiplicandoli per 800mila. Arrotondando i valori a una cifra intera, l’intervallo di confidenza richiesto è dato da

[22913, 57087]

4.4 La proporzione di individui disposti a pagare un prezzo maggiore per la benzina nel campione è pari a 660/1500=0.44. Pertanto l’intervallo di confidenza approssimato richiesto risulta

0.44 ∓ 2.576√0.44 × 0.56

1500 ≈ [0.4070,0.4730]

e non contiene quindi al suo interno il valore 0.5.

(5)

5

4.5 Data l’elevata numerosità campionaria, l’intervallo di confidenza per  si ottiene applicando il teorema limite fondamentale ed è dato da

2.9 ∓ 1.6452.6

40 ≈ [2.793075,3.006995]

4.6 Si tratta di una verifica di ipotesi del tipo H0: 1= 2

Non essendo specificata l’ipotesi che le varianze delle due popolazioni siano le stesse, la statistica test idonea per la verifica dell’ipotesi assume la forma seguente

|| 82.72 − 79.85

√16.1604

60 +14.7456 40

|| ≈ 3.59

Il p-valore associato risulta all’incirca pari a 0.0004 e l’ipotesi nulla di uguaglianza dei punteggi medi va quindi respinta per qualunque livello di significatività maggiore di tale valore.

4.7 Si tratta sempre di una verifica di ipotesi del tipo H0: 1= 2

Non essendo specificata l’ipotesi che le varianze delle due popolazioni siano le stesse, la statistica test idonea per la verifica dell’ipotesi assume la forma seguente

|| 543.2 − 585.8

√6202.8

50 +7675.5 50

|| ≈ 2.56

Il p-valore associato risulta all’incirca pari a 0.0104 per cui l’ipotesi nulla di mancanza di effetto della sostanza va rifiutato se si lavora a un livello di significatività  > 0.0104.

(6)

6

4.8 In questo caso si tratta di verificare una ipotesi di uguaglianza fra due distribuzioni, per cui si tratta di un test di adattamento.

La statistica test chi-quadrato si basa sulle differenze al quadrato fra le proporzioni di preferenze e risulta pari a

𝜒2 = 200 [(0.22-42/200)2

42/200 +(0.33-70/200)2

70/200 +(0.18-38/200)2

38/200 +(0.27-50/200)2 50/200 ] =

= 0.74074

per cui non si ha motivo di rifiutare l’ipotesi di uguaglianza delle preferenze nei due anni, dato che 𝜒3,0.992 = 11.34

4.9 Si tratta di verificare un’ipotesi nulla del tipo H0 : 1 = 2 = 0

e la stima di di 0 corrisponde a

𝜋̂0 = 𝑝̂0 =𝑛1𝑝̂1+ 𝑛2𝑝̂2

𝑛1+ 𝑛2 =250 ×188

250+ 150 ×108 150

400 = 0.74

La statistica test per verificare H0 risulta quindi pari a

|| 𝑝̂1− 𝑝̂2

√𝑝̂0(1 − 𝑝̂0) (1 𝑛1+ 1

𝑛2)

|| = || 0.752 − 0.72

√0.74 × 0.26 × ( 1

250+ 1 150)

|| ≈ 0.71

Il p-valore è uguale a 0.4778 per cui si può concludere che il farmaco in questione non esercita un effetto significativo sulla nausea a nessun livello di significatività.

Riferimenti

Documenti correlati

“vera” percorrenza media, al livello del 95%. b) In un esperimento in cui la deviazione standard della v.a. La concentrazione di ossigeno disciolto in un corso d’acqua è

Mescolando una quantit`a della prima con il doppio di quantit`a della seconda, si ottiene una soluzione con concentrazione dell’11%. Calcolare la concentrazione della

Le scale più usate sui disegni si leggono nel seguente modo: scala 1:2 = scala uno a due; scala 1:10 = scala uno a dieci (usate per particolari ed oggetti piccoli); scala 1:100 =

La rigidezza di alcune molle prodotte da una azienda, da indagini fatte nel tempo, segue una distribuzione normale con deviazione standard pari a 3.1 N/mm. Determinare un

La rigidezza di alcune molle prodotte da una azienda, da indagini fatte nel tempo, segue una distribuzione normale con deviazione standard pari a 3.1 N/mm.

Sia L il linguaggio in Σ 0,1,2 che comprende tutte le stringhe che non hanno coppie consecutive delleo stesso simbolo.. L e’ un linguaggio regolare, quindi esistono sia

Sapendo che la varianza è pari a 0.226, costruire un intervallo di confidenza per la media a livello 95% per il tempo medio di vita dei transistor. Come varierebbe

Formulare come PL-{0, 1} il problema di massimizzare la redditività senza violare il vincolo di budget trimestrale.. Rafforzare il rilassamento lineare della formulazione di cui