ESERCIZI 4
I dati – gi`a considerati in una lezione precedente – sono tratti dalla libreria on-line Statlib: http://lib.stat.cmu.edu/datasets/pbc e riguardano pazienti affetti da una malattia del fegato, la cirrosi biliare primaria.
Il file CIRROSI.txt contiene i dati relativi al momento della diagnosi inziale di 312 pazienti sono sottoposti allo studio clinico. I paziento sono stati suddivisi a caso in due gruppi: al primo gruppo `e stato somministrato un farmaco, agli altri un placebo. Le variabili considerate sono le seguenti:
- numero di identificazione del paziente (ID)
- numero di giorni fra la registrazione e il primo evento fra morte, trapianto o momento di compilazione (NGIORNI)
- stato del paziente: 0 = vivo in cura, 1 = subito trapianto, 2 = morto (STATO) - tipo di trattamento: 1 = farmaco, 2 = placebo (TRATTAM)
- et`a in giorni (ETA)
- genere: 0 = maschio, 1 = femmina (SEX)
- aumento di volume del fegato: 0 = no, 1 = si (VOLFEG)
- presenza di edema: 0 = nessun edema e nessuna terapia per l’edema, 0.5 = presenza di edema e nessuna terapia diuretica, 1 = presenza di edema e terapia diuretica (EDEMA)
- bilirubina in mg/dl (BILIRUB) - colesterolo in mg/dl (COLEST) - albumina in gm/dl (ALBUM) - trigliceridi in mg/dl (TRIGLIC) - piastrine per ml3 / 1000 (PIASTR)
Leggere i dati in R e assegnare opportune etichette ai livelli delle variabili qualitative con il seguente pro- gramma.
cirrosi=read.table("C:/c-rogantin/DATI/CIRROSI.txt", na.string=".", sep=" ", row.names=1, header=TRUE, dec=".") cirrosi$EDEMA=ordered(cirrosi$EDEMA, levels=c(0,0.5,1), labels=c("ed_no","ed_si_ter_no", "ed_si_ter_si") ) cirrosi$SEX=factor(cirrosi$SEX, levels=c(0,1), labels=c("M","F") )
cirrosi$TRATTAM=factor(cirrosi$TRATTAM, levels=c(1,2), labels=c("farmaco","placebo") ) cirrosi$STATO=ordered(cirrosi$STATO, levels=c(0,1,2), labels=c("vivo","vivo_trap", "morto") ) cirrosi$VOLFEG=factor(cirrosi$VOLFEG, levels=c(0,1), labels=c("feg_aum_NO","feg_aum_SI") ) attach(cirrosi)
1. Costruire le tabelle di contingenza di ciascuna variabile qualitativa.
2. Considerare coppie di variabili quantitative ritenute di interesse.
• Costruire i corrispondenti scatterplot, evidenziando con simboli e colori diversi i livelli di una o pi`u variabili qualitative.
• Calcolare il coefficiente di correlazione totale e nei sottogruppi individuati dalle variabili qualita- tive precedentemente considerate
• Commentare i risultati ottenuti
1