PROVA SAS PER METODI PER LA RICERCA SOCIALE 25/01/2018
a) Leggere il dataset "file1a.txt" che contiene le informazioni relative a 20 famiglie su cui sono state rilevate le seguenti variabili:
- numero identificativo della famiglia
- reddito mensile dell'intervistato (in migliaia di euro)
- sesso dell'intervistato: 0 = maschio, 1 = femmina
b) Leggere il dataset "file2a.txt" che contiene le informazioni relative alle medesime famiglie su cui sono state rilevate le seguenti variabili:
- numero identificativo della famiglia
- "t1" = tempo (espresso in ore) impiegato per andare e tornare dal lavoro nel giorno 1
- "t2" = tempo (espresso in ore) impiegato per andare e tornare dal lavoro nel giorno 2
- "t3" = tempo (espresso in ore) impiegato per andare e tornare dal lavoro nel giorno 3
- "t4" = tempo (espresso in ore) impiegato per andare e tornare dal lavoro nel giorno 4
c) accoppiare orizzontalmente i due file per identificativo della famiglia in modo da ottenere un solo file contenente tutte le variabili
d) Creare la variabile alfanumerica "genere" che assume il valore "m" se l'individuo è maschio e "f" se è femmina
e) calcolare la variabile "tempo_medio" corrispondente alla media aritmetica dei 4 tempi rilevati per ciascun individuo
f) calcolare la media, la varianza (non corretta), l'asimmetria e la curtosi della variabile "tempo_medio"
g) affiancare su una stessa figura i boxplot della variabile
"tempo_medio" per maschi e per femmine, utilizzando la variabile "genere"
h) costruire la distribuzione in classi (chiuse a sinistra e aperte a destra) del reddito utilizzando le classi
0.0 |- 1.0 1.0 |- 1.5 1.5 |- 2.0 2.0 o più
i) costruire l'istogramma di tale variabile separatamente per maschi e per femmine, utilizzando la variabile "genere"
l) verificare l’uguaglianza dei valori medi del reddito per i maschi e per le femmine sia sotto ipotesi di omoschedasticità, sia sotto ipotesi di eteroschedasticità