PARTE IV
LINGUAGGIO SAS: ORDINAMENTO,
CONCATENAZIONE E FUSIONE DI SAS DATA SET
PROC SORT
Istruzione SET
Istruzione MERGE
*PROGRAM_GESTIONE2;
PROC SORT: ordina le osservazioni del Sas data set rispetto ad una o più variabili, memorizzando il risultante file ordinato in un nuovo Sas data set o sostituendo l’originale
PROC SORT <option(s)> <collating-sequence-option>;
BY <DESCENDING> variable-1 <...<DESCENDING>
variable-n>;
/*semplice ordinamento, sostituisce il file ordinato*/
proc sort data=info_capof;
by eta1;run;
/* ordinamento rispetto a due variabili: sesso (creescente) numcomp (decrescente),
il file ordinato viene memorizzato in un nuovo data set*/
proc sort data=consumo_toscana out=sorted;
by sesso1 descending numcomp;
run;
istruzione SET: permette la concatenazione di due o più data set.
UNO
DUE
Data tot;
set uno due;
run;
UNO DUE
data d_u;
set donne uomini;
run;
L’istruzione SET permette anche il concatenamento ordinato rispetto ad una variabile specificata con la parola chiave BY (concatenamento interleaving).
*****se volessi concatenare il file mettendo insieme gli archivi in modo ordinato
rispetto all'ETA*************;
proc sort data=donne ; by eta1;run;
proc sort data=uomini ; by eta1;run;
data d_u_sort;
set donne uomini;
by ETA1;
run;
Istruzione MERGE: fusione di due o più Sas data set.
L’istruzione MERGE concatena i file in orizzontale con 2 possibilità:
semplicemente affiancando i due Sas data set
affiancando i due Sas data set tramite un match merging
data tot;
merge uno due;
by K;
run;
K X K Y
91 a 91 1 92 b 91 2 93 c 93 3 94 d 94 4
K X Y
91 a 1 91 a 2 92 b . 93 c 3 94 d 4
Vedi esercizio MERGE
Esercizio
/**il file FAMIGLIA: archivio familiare, una osservazione per ogni famiglia identificata dalla variabile CODICE,
B201 indica il possesso dell'abitazione di residenza 1 se possesso
YNTOTF indica il reddito familiare in migliaia di lire B207 i mq abitazione di residenza*******/
1)***calcolare ammontare ICI per i propietari se l'aliquota dipendesse solo dai mq e fosse
pari a 20000 lire al mq***
/**il file FOGLIOFAM: archivio individuale, una osservazione per ogni individuo identificato
dalla variabile CODICE che identifica la famiglia e ID che identifica l'individuo:
ANNONASC indica l'anno di nascita
RELPAR indica la relazione con il capofamiglia *******/
2)*******costruire la variabile eta' dell'individuo, sapendo che l'indagine si e' svolta nel 2002, inoltre, supponendo una soglia di povertà pari a 1000 (un milione di lire),
costruire una variabile che per ogni individuo stabilisce se il proprio reddito familiare (YNTOTF) si trova sopra o sotto la soglia di povertà***;
******************buon lavoro***************;
PARTE V
LE OPZIONI DEL SISTEMA
Sono istruzioni che controllano la sessione di lavoro SAS e rimangono attive per tutta la sessione di lavoro, salvo nuove specificazioni. Le opzioni si controllano mediante l’istruzione
OPTIONS opzioni;
opzioni
controllo della dimensione fisica della pagina di stampa;
PAGESIZE=n default=93 LINESIZE=n default=58
controllo della dimensione fisica della pagina di controllo dell’informazioni aggiuntive stampate
DATE|NODATE
NUMBER|NONUMBER
controllo della forma dell’output CENTER|NOCENTER
MISSING=’carattere’ default .
Options are best set at the very top of your SAS program, since they usually are supposed to affect the session. For example,
options ls=84 ps=64 nocenter;
defines a page as 84 columns wide and 64 lines long.
Output will be displayed left justified.