• Non ci sono risultati.

Modèle Linéaire - TP 1

N/A
N/A
Protected

Academic year: 2021

Condividi "Modèle Linéaire - TP 1"

Copied!
1
0
0

Testo completo

(1)

Modèle Linéaire - TP 1

Dipendenza lineare di una variabile da un’altra

Considerare il Data Set SAS (DSS) “STID98”.

1. Costruire con la PROC GPLOT il grafico cartesiano che rappresenta la distribuzione congiunta delle variabili ALTEZZA e PESO; osservare se tale grafico suggerisce un legame lineare fra le due variabili.

2. Supporre comunque che ci sia una dipendenza lineare fra le variabili PESO (Y) e ALTEZZA (X) ed effettuare una regressione con la PROC REG costruendo il grafico cartesiano con la PROC REG. Commentare le tabelle ottenute.

3. Effettuare quindi la regressione del punto precedente, suddividendo i soggetti per sesso.

Per far ciò utilizzare l’istruzione BY della PROC REG, su un DSS con le osservazioni ordinate per sesso.

Per ordinare secondo la variabile SEX si può:

 Visualizzare il DSS (con la “viewtable”) e 1. selezionare la colonna SEX

2. cliccare sul tasto ordina A-Z

Attenzione: in tal modo si perde il DSS originale

 utilizzare la PROC SORT

Confrontare le tre regressioni e in particolare l’indice R-sq nella regressione con tutte le osservazioni e nelle regressioni nei due sottogruppi.

4. Effettuare una regressione lineare fra le variabili MISURA PIEDE (Y) e ALTEZZA (X). Commentare i risultati ottenuti.

5. Effettuare quindi le regressioni suddividendo i soggetti per sesso.

Confrontare le tre regressioni e in particolare l’indice R-sq nella regressione con tutte le osservazioni e nelle regressioni nei due sottogruppi.

L’alta correlazione nella popolazione è effettiva o è distorta dalla presenza di due sottogruppi?

E allora, è considerato ragionevole il modello di regressione su tutta la popolazione, nonostante l’alto R-sq?

6. Per comprendere meglio i risultati delle regressioni suddivise per sesso e nell’intera popolazione effettuare, con la PROC GPLOT, due grafici bidimensonali delle variabili, evidenziando, con simboli diversi, il sesso dei soggetti.

NOTA

In tutte le regressioni richieste, utilizzare l’opzione GRAPHICS per ottenere grafici in alta

risoluzione.

(2)

Modèle Linéaire – TP 2

Nom

Dipendenza lineare di una variabile da un’altra (Y,X)

Modello lineare: y = 

0

+ 

1

x +  PARTE 1

Si vuole stabilire se esiste una dipendenza fra il FLUSSO di un corso d’acqua (= quantità di acqua che passa in un dato punto in un determinato intervallo di tempo) e la PROFONDITÀ del corso d’acqua. I dati da analizzare sono i seguenti:

OBS PROFOND FLUSSO 1 0.34 0.636 2 0.29 0.319 3 0.28 0.734 4 0.42 1.327 5 0.29 0.487 6 0.41 0.924 7 0.76 7.350 8 0.73 5.890 9 0.46 1.979 10 0.40 1.124

1. Creare un Data Set SAS permanente inserendo direttamente i dati sopra riportati nel programma e visualizzare il DSS costruito.

2. Costruire con la PROC GPLOT il grafico cartesiano che rappresenta l’andamento della variabile FLUSSO al variare della variabile PROFONDITÀ; osservare se tale grafico suggerisce un “legame” fra le due variabili.

3. Supporre comunque che ci sia una dipendenza lineare fra le variabili FLUSSO (Y) e PROFONDITÀ (X) e effettuare una regressione con la PROC REG.

y=

0

+ 

1

x+ 

Costruire il grafico dei residui e stabilire se il modello scelto è adeguato.

4. Supporre ora che vi sia una dipendenza quadratica fra le due variabili, in modo tale che la radice quadrata del FLUSSO (Y) dipenda dalla variabile PROFONDITÀ (X) e, usando sempre la PROC REG.

sqrt(y)=

0

+ 

1

x + 

Costuire preventivamente un DSS contenente anche la variabile con la radice quadrata del flusso .

Costruire il grafico dei residui e stabilire se il modello scelto è adeguato.

(3)

Modèle Linéaire – TP 4

Nom

ESERCIZIO

Effettuare una regressione sui dati del file Atleti.dat.

Si vuole stabilire se il consumo di ossigeno da parte di atleti che praticano sport di fondo è esprimibile come combinazione lineare di variabili esplicative facilmente rilevabili anche sul campo.

I dati riportati nel file sono relativi in ordine alle variabili SESSO, ETA, PESO, OSSIGENO, TEMPO, PULS_FER, PULS_MED, PULS_MAX; si stabilisca se l’OSSIGENO dipende linearmente dalle variabili ETA, PESO, TEMPO, PULS_FER, PULS_MED, PULS_MAX . Usare le opportune opzioni dell’istruzione model della PROC REG per costruire la matrice di covarianza degli stimatori dei coefficienti (X

t

X)

-1

(vedi manuale PROC REG o fotocopie consegnate; in particolare vedere le opzioni corrb, covb, i).

Effettuare l’analisi dei residui con l’opzione r di model e commentare l’output risultante;

osservare in particolare le colonne Predict value, Std Err Predict, Residual, Std Err Residual, Student Residual.

Effettuare una regressione suddividendo i dati rispetto alla variabile SESSO e dire in quale dei

due casi il modello di regressione precedente è migliore; ripetere per le due sotto popolazioni

lo studio completo della regressione con matrice di covarianza degli stimatori e analisi dei

residui.

(4)

MODÈLE LINÉAIRE - TP 5

Nom

I dati da esaminare riguardano uno studio sul grasso corporeo come indice dello stato di salute di un individuo. Le rilevazioni sono state effettuate su 238 uomini e rappresentano le stime delle percentuali di grasso corporeo determinate mediante il calcolo della densità corporea in immersione e di varie misure di circonferenze del corpo. I dati sono tratti dal sito web http://lib.stat.cmu.edu

.

Nel dettaglio, le variabili contenute nel file antrop.txt sono:

 Densità corporea (determinata mediante la rilevazione del peso in immersione)

 Età

 Peso (in libbre)

 Altezza (in pollici)

 Circonferenza del collo (centimetri)

 Circonferenza toracica (centimetri)

 Circonferenza addominale (centimetri)

 Circonferenza dei fianchi (centimetri)

 Circonferenza della coscia (centimetri)

 Circonferenza del ginocchio (centimetri)

 Circonferenza della caviglia (centimetri)

 Circonferenza dei bicipiti (centimetri) in estensione

 Circonferenza dell’avambraccio (centimetri)

 Circonferenza del polso (centimetri)

1. Costruire un DDS in cui le unità di misura delle variabili Altezza e Peso siano rispettivamente i cm e i kg (da inch a cm moltiplicare per 2.54; da libbre a kg per 0.453).

2. Effettuare una regressione lineare in cui si faccia dipendere il peso dalle restanti variabili esclusa la densità corporea.

3. Costruire – se si ritiene opportuno - uno o più modelli ridotti; se ne verifichi la

significatività rispetto al modello completo (utilizzare l’istruzione test della proc

reg).

(5)

MODÈLE LINÉAIRE - TP 6

Nom

Intervalli di confidenza su qualcosa.

(6)

MODÈLE LINÉAIRE - TP 7

Nom

Effettuare una regressione sui dati del file Atleti2.dat.

Si vuole stabilire se il consumo di ossigeno da parte di atleti che praticano sport di fondo è esprimibile come combinazione lineare di variabili esplicative facilmente rilevabili anche sul campo.

I dati riportati nel file sono relativi, nell’ordine alle variabili SESSO, ETA, PESO, OSSIGENO, TEMPO, PULS_FER (pulsazioni da fermo), PULS_MED (pulsazioni medie), PULS_MAX (pulsazioni massime); si stabilisca se l’OSSIGENO dipende linearmente dalle variabili ETA, PESO, TEMPO, PULS_FER, PULS_MED, PULS_MAX .

4. Effettuare una regressione lineare in cui si faccia dipendere il consumo di ossigeno dalle restanti variabili quantitative.

5. Costruire un modello ridotto utilizzando il metodo forward.

6. Costruire un modello ridotto utilizzando il metodo backward.

7. Costruire un modello ridotto utilizzando il metodo stepwise.

8. Utilizzando l’ultimo modello ridotto ottenuto, calcolare gli intervalli di confidenza per la

media e per il valore previsto della variabile risposta per gli individui in cui tale variabile

non è stata rilevata (si utilizzino le opzioni clm e cli dell’istruzione model).

Riferimenti

Documenti correlati

Durante la "discesa" in camera iperbarica, ovvero all’aumentare della pressione, si ha una sensazione di caldo; per contro, si avrà una sensazione di freddo al diminuire

Etichettatura secondo il regolamento (CE) n. H281 - Contiene gas refrigerato; può provocare ustioni o lesioni criogeniche. P220 - Tenere lontano da indumenti e altri

RINUNCIA ALLA RESPONSABILITA' : Prima di utilizzare questo prodotto in qualsiasi nuovo processo o esperimento, deve essere condotto uno studio approfondito sulla sicurezza e

Calcolare la composizione, espressa in frazioni molari, della fase liquida e della fase gassosa alla temperatura di ebollizione... Calcolare il pH della soluzione finale

Per effettuare l’impostazione della logica di comando dei relè diretta (relè energizzato in presenza di evento) o inversa (relè energizzato in assenza di evento), occorre agire sul

Oltre che dai Medici specialisti su Piano terapeutico, l’attivazione del servizio di Ossigeno Terapia Liquida domiciliare (OTL) per le persone con Covid-19 può essere effettuata

Visto Il Regolamento per l’acquisizione in economia dei lavori beni e servizi di cui alla determinazione del Presidente n... Vista la determina n° 21 del 25 marzo 2015 con la quale

Test: LD50 - Via: Orale - Specie: Ratto = 1034 mg/kg Test: LD50 - Via: Pelle - Specie: Coniglio > 2000 mg/kg Test: LD50 - Via: Inalazione - Specie: Topo = 700 mg/m3 Test: LD50 -