• Non ci sono risultati.

ESERCIZI 4 I dati – gi`a considerati in una lezione precedente – sono tratti dalla libreria on-line Statlib:

N/A
N/A
Protected

Academic year: 2021

Condividi "ESERCIZI 4 I dati – gi`a considerati in una lezione precedente – sono tratti dalla libreria on-line Statlib:"

Copied!
1
0
0

Testo completo

(1)

ESERCIZI 4

I dati – gi`a considerati in una lezione precedente – sono tratti dalla libreria on-line Statlib: http://lib.stat.cmu.edu/datasets/pbc e riguardano pazienti affetti da una malattia del fegato, la cirrosi biliare primaria.

Il file CIRROSI.txt contiene i dati relativi al momento della diagnosi inziale di 312 pazienti sono sottoposti allo studio clinico. I paziento sono stati suddivisi a caso in due gruppi: al primo gruppo `e stato somministrato un farmaco, agli altri un placebo. Le variabili considerate sono le seguenti:

- numero di identificazione del paziente (ID)

- numero di giorni fra la registrazione e il primo evento fra morte, trapianto o momento di compilazione (NGIORNI)

- stato del paziente: 0 = vivo in cura, 1 = subito trapianto, 2 = morto (STATO) - tipo di trattamento: 1 = farmaco, 2 = placebo (TRATTAM)

- et`a in giorni (ETA)

- genere: 0 = maschio, 1 = femmina (SEX)

- aumento di volume del fegato: 0 = no, 1 = si (VOLFEG)

- presenza di edema: 0 = nessun edema e nessuna terapia per l’edema, 0.5 = presenza di edema e nessuna terapia diuretica, 1 = presenza di edema e terapia diuretica (EDEMA)

- bilirubina in mg/dl (BILIRUB) - colesterolo in mg/dl (COLEST) - albumina in gm/dl (ALBUM) - trigliceridi in mg/dl (TRIGLIC) - piastrine per ml3 / 1000 (PIASTR)

Leggere i dati in R e assegnare opportune etichette ai livelli delle variabili qualitative con il seguente pro- gramma.

cirrosi=read.table("C:/c-rogantin/DATI/CIRROSI.txt", na.string=".", sep=" ", row.names=1, header=TRUE, dec=".") cirrosi$EDEMA=ordered(cirrosi$EDEMA, levels=c(0,0.5,1), labels=c("ed_no","ed_si_ter_no", "ed_si_ter_si") ) cirrosi$SEX=factor(cirrosi$SEX, levels=c(0,1), labels=c("M","F") )

cirrosi$TRATTAM=factor(cirrosi$TRATTAM, levels=c(1,2), labels=c("farmaco","placebo") ) cirrosi$STATO=ordered(cirrosi$STATO, levels=c(0,1,2), labels=c("vivo","vivo_trap", "morto") ) cirrosi$VOLFEG=factor(cirrosi$VOLFEG, levels=c(0,1), labels=c("feg_aum_NO","feg_aum_SI") ) attach(cirrosi)

1. Costruire le tabelle di contingenza di ciascuna variabile qualitativa.

2. Considerare coppie di variabili quantitative ritenute di interesse.

• Costruire i corrispondenti scatterplot, evidenziando con simboli e colori diversi i livelli di una o pi`u variabili qualitative.

• Calcolare il coefficiente di correlazione totale e nei sottogruppi individuati dalle variabili qualita- tive precedentemente considerate

• Commentare i risultati ottenuti

1

Riferimenti

Documenti correlati

Dato che, come si vedrà nell’ultima parte di questo corso di Statistica, i procedimenti inferenziali sono molto più semplici quando la distribuzione reale di

Dal grafico precedente vediamo che la previsione futura, ed il trend nella parte finale, sono migliorati, mentre all’inizio la previsione è completamente errata. La causa

Nota: realisticamente, andrebbero considerati solo i residui più recenti (che sono più piccoli), che darebbero bande un po’ più strette. APPROFONDIMENTI SULL’INCERTEZZA

Possiamo calcolare il coefficiente di correlazione tra altezza e peso col comando cor(Alt,Peso).. i) Se non lo sappiamo già o non lo ritroviamo, come si trovano le istruzioni

I dati da esaminare (contenuti nel file cereal.txt) sono tratti dalla libreria on-line su http://lib.stat.cmu.edu/datasets/ e riguardano la

Poiché la dimostrazione del Teorema di Rabin è molto complicata, ci limiteremo ad una forma semplificata in cui però la maggiorazione ottenuta per la probabilità è 1/2 (come nel test

Nella dimostrazione originale di Rabin (1980) si dimostra che la probabilità che un numero composto superi il test è  1/4: quindi eseguendo il test k

[r]