SONDAGES - TP 1 6 gennaio 2006
ESERCIZIO 1
Il file elettr.txt contiene 120 rilevazioni del consumo di corrente elettrica delle macchine di una fabbrica. Le variabili sono nell’ordine:
codice della macchina;
codice dell’operatore;
giorno di produzione;
misura del consumo di corrente elettrica (in kWh).
a) Assegnare una library e costruire un DSS permanente contenente i dati.
Visualizzare il DSS sulla finestra di output.
b) Utilizzando la proc means, calcolare il totale della variabile consumo. (Per calcolare il totale, calcolare la media e moltiplicare per 120).
c) Utilizzando la proc surveyselect, estrarre un campione di numerosità 20 con il metodo del campionamento con ripetizione e stimare il totale della variabile consumo sulla base del campione. Visualizzare il DSS sulla finestra di output.
Attenzione: se una osservazione è selezionata più volte, la riga corrispondente viene scritta una volta sola. Il numero di ripetizioni di una osservazione va letto nella colonna NumberHits. Pertanto si deve fare una media pesata, utilizzando l’istruzione weight della proc means.
d) Estrarre un campione di numerosità 20 con il metodo del campionamento senza ripetizione e stimare il totale della variabile consumo sulla base del campione. Visualizzare il DSS sulla finestra di output.
Attenzione: trattandosi di campionamento senza ripetizione, in questo caso la variabile NumberHits non è presente nell’output.
e) Aggiungere ai due DSS costruiti una variabile carattere che vale “S” per il campione senza ripetizione e vale “C” per il campione con ripetizione. Nel DSS contenente il campione senza ripetizione, bisogna anche impostare la variabile NumberHits sempre uguale a 1.
f) Unire i due DSS costruiti al punto e). Visualizzare il DSS sulla finestra di output.
ESERCIZIO 2
Si considerino i dati dell’esercizio precedente.
a) Utilizzando l’opzione rep della proc surveyselect estrarre 100 campioni di numerosità 20 con il metodo del campionamento con ripetizione.
Visualizzare il DSS sulla finestra di output.
b) Utilizzando l’istruzione by della proc means, calcolare le stime del totale della variabile consumo in ciascun campione, conservando i dati in un DSS (la variabile che indica il numero del campione si chiama Replicate).
Visualizzare il DSS sulla finestra di output.
Nota
Per conservare i risultati della proc means bisogna utilizzare l’istruzione output nel modo seguente:
proc means data=<data set sas>;
……output out=<nuovo data set sas >
mean=consumo_medio;
run;
Per la sintassi della proc means, consultare Sas OnLineDoc.
c) Utilizzando l’opzione rep della proc surveyselect estrarre 100 campioni di numerosità 20 con il metodo del campionamento senza ripetizione.
Visualizzare il DSS sulla finestra di output.
d) Utilizzando l’istruzione by della proc means, calcolare le stime del totale della variabile consumo in ciascun campione, conservando i dati in un DSS. Visualizzare il DSS sulla finestra di output.
e) Unire i due DSS contenenti le medie aggiungendo una variabile carattere che permetta di distinguerli.
f) Fornire indici numerici (media e varianza) e rappresentazioni grafiche (istogrammi e boxplot) per i valori del totale stimato della variabile consumo, suddividendo i campioni con ripetizione e quelli senza ripetizione.
ESERCIZIO 3
Ripetere l’esercizio 2 considerando campioni di numerosità 50 e con campioni di numerosità 100.