Leggere il file ASCII esame3.txt che si trova nella directory
'C:\Users\naddeo\Desktop’
e che riporta l'età, il sesso e il titolo di studio di 1797 individui
esame3.txt
Sapendo che la codifica per l'età è la seguente
7 da 18 a 19 anni 8 da 20 a 24 anni 9 da 25 a 34 anni 10 da 35 a 44 anni 11 da 45 a 54 anni 12 da 55 a 59 anni 13 da 60 a 64 anni
a) costruire la distribuzione di frequenza espressa in classi
b) utilizzando il valore centrale delle classi determinare la moda, i tre quartili e la media aritmetica dell'età c) determinare la distribuzione bivariata
del sesso e del grado di istruzione e calcolarne il chi-quadrato
SOLUZIONE
data a1;
infile 'C:\Users\naddeo\Desktop\esame3.txt';
input eta sesso istruz;
proc format;
value eta_val 7 = "da 18 a 19 anni"
8 = "da 20 a 24 anni"
9 = "da 25 a 34 anni"
10 = "da 35 a 44 anni"
11 = "da 45 a 54 anni"
12 = "da 55 a 59 anni"
13 = "da 60 a 64 anni";
proc freq;
tables eta;
format eta eta_val.;
data a2; set a1;
if eta = 7 then eta1=18.5;
else if eta = 8 then eta1=22;
else if eta = 9 then eta1=29.5;
else if eta = 10 then eta1=39.5;
else if eta = 11 then eta1=49.5;
else if eta = 12 then eta1=57;
else eta1=62;
proc univariate;
var eta1;
proc freq;
tables sesso*istruz /chisq;
run;