ESERCITAZIONE AL CALCOLATORE n.1
Il file elettr.txt contiene 110 rilevazioni del consumo di corrente elettrica delle macchine di una fabbrica.
Le variabili sono nell’ordine:
• codice della macchina;
• codice dell’operatore;
• giorno di produzione;
• misura del consumo di corrente elettrica (in kWh).
a) Assegnare una library e costruire un DSS permanente contenente i dati. Fare attenzione al formato della data.
b) Utilizzando la proc means, calcolare il totale della variabile consumo [parametro che in seguito sarà considerato non noto e da stimare]
c) Utilizzando la proc freq, calcolare le numerosità della variabile operatore [che in seguito saranno utilizzate per il campionamento stratificato]
CAMPIONAMENTO CASUALE SEMPLICE SENZA RIPETIZIONE
d) Utilizzando la proc surveyselect, estrarre un campione di numerosità 50 con il metodo del campionamento casuale semplice senza ripetizione (utilizzare le opzioni method=srs e n=50)
e) Utilizzando la proc means, calcolare le stime della media del consumo e la standard deviation del campione:
x s
f) Con i dati precedenti, stimare il totale del consumo, stimare la varianza dello stimatore e calcolare un intervallo di confidenza per il totale.
CAMPIONAMENTO STRATIFICATO CON ALLOCAZIONE PROPORZIONALE
g) Ordinare il DSS rispetto alla variabile operatore (la procedura SAS per il campionamento stratificato richiede che il DSS sia ordinato rispetto alla variabile di stratificazione).
h) Utilizzando la proc surveyselect, estrarre un campione di numerosità 50 con il metodo del campionamento senza ripetizione stratificato rispetto alla variabile operatore con metodo di allocazione proporzionale. Utilizzare le opzioni method=sys e rate= .... e l’istruzione strata ...; il valore di rate deve essere il valore del rapporto n
N .
i) Utilizzando la proc means, calcolare le stime della media del consumo e la standard deviation nei quattro strati del campione (i quattro operatori):
x h
s h
j) Con i dati precedenti, stimare il totale del consumo, stimare la varianza dello stimatore e calcolare un intervallo di confidenza per il totale.
k) Confrontare le stime puntuali e gli intervalli di confidenza per il totale con i due campionamenti