ESERCITAZIONE AL CALCOLATORE n. 2
Il file reddito.txt contiene le rilevazioni del reddito annuo degli abitanti di una città, suddivisi rispetto al sesso e al tipo di professione.
Le variabili sono:
• Reddito annuo (in migliaia di Euro);
• Tipo di lavoro (0 = dipendente, 1 = autonomo).
• Genere (M=maschio, F=femmina).
Si vuole stimare la media del reddito, utilizzando un campionamento stratificato rispetto alla variabile sesso e con allocazione ottimale sulla base di un campione di numerosità 500.
a) Costruire un DSS permanente contenente i dati.
b) Con la proc means, calcolare le numerosità dei due strati.
F M
Nh
Non conoscendo la deviazione standard della variabile reddito nei due strati (necessaria per l’allocazione ottima) si ottiene una sua stima tramite campioni di numerosità 30.
Attenzione: osservare che la numerosità del campione per la stima delle standard deviation è molto più piccola di quella del campione per la stima del parametro (media) della variabile di interesse (reddito).
c) Estrarre da ciascuno strato due campioni di numerosità 30 utilizzando la proc surveyselect (utilizzare le opzioni method=srs e size=30 e l’istruzione strata ...). I valori estratti vanno scritti in un nuovo DSS di nome campione1.
d) Con la proc means, calcolare la stima della deviazione standard nei due strati del DDS campione1.
F M
sh
e) Utilizzando queste stime, calcolare la numerosità di ciascuno strato con allocazione ottima rispetto al genere del campione da 500:
F M
nh
f) Utilizzando la proc surveyselect estrarre un campione con numerosità negli strati calcolata precedentemente. Per fare questo utilizzare l’opzione sampsize=( ... , ...). Scrivere i dati in un DDS di nome campionefinale.
g) Utilizzando la proc means, calcolare le stime della media del reddito nei due strati del campione finale:
F M
x h
h) Calcolare la stima della media del reddito, la varianza dello stimatore e un interevallo di confidenza per la media del reddito.