Modèle Linéaire - TP 1
Dipendenza lineare di una variabile da un’altra
Considerare il Data Set SAS (DSS) “STID98”.
1. Costruire con la PROC GPLOT il grafico cartesiano che rappresenta la distribuzione congiunta delle variabili ALTEZZA e PESO; osservare se tale grafico suggerisce un legame lineare fra le due variabili.
2. Supporre comunque che ci sia una dipendenza lineare fra le variabili PESO (Y) e ALTEZZA (X) ed effettuare una regressione con la PROC REG costruendo il grafico cartesiano con la PROC REG. Commentare le tabelle ottenute.
3. Effettuare quindi la regressione del punto precedente, suddividendo i soggetti per sesso.
Per far ciò utilizzare l’istruzione BY della PROC REG, su un DSS con le osservazioni ordinate per sesso.
Per ordinare secondo la variabile SEX si può:
Visualizzare il DSS (con la “viewtable”) e 1. selezionare la colonna SEX
2. cliccare sul tasto ordina A-Z
Attenzione: in tal modo si perde il DSS originale
utilizzare la PROC SORT
Confrontare le tre regressioni e in particolare l’indice R-sq nella regressione con tutte le osservazioni e nelle regressioni nei due sottogruppi.
4. Effettuare una regressione lineare fra le variabili MISURA PIEDE (Y) e ALTEZZA (X). Commentare i risultati ottenuti.
5. Effettuare quindi le regressioni suddividendo i soggetti per sesso.
Confrontare le tre regressioni e in particolare l’indice R-sq nella regressione con tutte le osservazioni e nelle regressioni nei due sottogruppi.
L’alta correlazione nella popolazione è effettiva o è distorta dalla presenza di due sottogruppi?
E allora, è considerato ragionevole il modello di regressione su tutta la popolazione, nonostante l’alto R-sq?
6. Per comprendere meglio i risultati delle regressioni suddivise per sesso e nell’intera popolazione effettuare, con la PROC GPLOT, due grafici bidimensonali delle variabili, evidenziando, con simboli diversi, il sesso dei soggetti.
NOTA
In tutte le regressioni richieste, utilizzare l’opzione GRAPHICS per ottenere grafici in alta
risoluzione.
Modèle Linéaire – TP 2
Nom
Dipendenza lineare di una variabile da un’altra (Y,X)
Modello lineare: y =
0+
1x + PARTE 1
Si vuole stabilire se esiste una dipendenza fra il FLUSSO di un corso d’acqua (= quantità di acqua che passa in un dato punto in un determinato intervallo di tempo) e la PROFONDITÀ del corso d’acqua. I dati da analizzare sono i seguenti:
OBS PROFOND FLUSSO 1 0.34 0.636 2 0.29 0.319 3 0.28 0.734 4 0.42 1.327 5 0.29 0.487 6 0.41 0.924 7 0.76 7.350 8 0.73 5.890 9 0.46 1.979 10 0.40 1.124