CORREZIONE ESERCIZI 3
1. Si considerino i dati contenuti nel file cicala.txt.
La prima riga contiene il nome delle variabili; i dati sono separati dal carattere ; e il separatore decimale ` e la virgola. Le unit` a sperimentali sono 104. La prima colonna contiene l’identificatore delle unit` a sperimentali. La descrizione delle variabili si trova in fondo al file; quindi vanno lette solo le prime 104 righe.
1. Leggere i dati in R
2. Assegnare nuove etichette alle variabili (pi` u “chiare”) 3. Costruire una tabella con le numerosit` a delle tre specie
4. Considerare il peso corporeo. Disegnare il box plot e il grafico della funzione di distribuzione cumulata per l’insieme totale delle unit` a sperimentali.
Successivamente disegnare il box plot (e il grafico della funzione di distribuzione cumulata) sud- divisi nelle tre specie di cicale.
5. Considerare le altre variabili quantitative e ripetere le analisi fatte per il peso corporeo.
PROGRAMMA R E OUTPUT
### Lettura dati
cicale=read.table("C:/c-rogantin/DATI/cicala.txt",header =T,nrows=104,row.names=1, sep=";",dec=",",na.strings="999")
### Assegnazione nuovi nomi alle variabili e visualizzazione struttura dataset colnames(cicale)=c("peso","lungh_ali","largh_ali","lungh_corpo","genere","specie") str(cicale)
’data.frame’: 104 obs. of 6 variables:
$ peso : num 0.25 0.16 0.26 0.16 0.26 0.25 0.15 0.15 0.1 0.22 ...
$ lungh_ali : int 28 26 31 26 30 27 28 29 24 27 ...
$ largh_ali : int 11 11 11 9 12 11 11 10 9 11 ...
$ lungh_corpo: int 28 22 27 21 26 25 26 25 22 25 ...
$ genere : Factor w/ 2 levels " f"," m": 1 2 1 2 1 1 2 2 2 1 ...
$ specie : Factor w/ 3 levels " tredecassini",..: 3 3 2 3 3 3 3 3 3 3 ...
Analisi del peso rispetto alle variabili qualitative
table(specie) specie
tredecassini tredecim tredecula
54 6 44
### attenzione: ci sono solo 6 unit\‘a sperimentali della specie ‘‘tredecim’’ !!!!!!
boxplot(peso~specie,cex.axis=2)
tredecassini tredecim tredecula
0.100.200.300.40
> plot(ecdf(peso[specie=="tredecassini"])) Error in ecdf(peso[specie == "tredecassini"]) :
’x’ must have 1 or more non-missing values
### controllare i livelli della variabile specie #########
> levels(specie)
[1] " tredecassini" " tredecim" " tredecula"
1
plot(ecdf(peso[specie==" tredecassini"]),pch=19, cex.axis=1.2, xlim=c(min(peso),max(peso)),main="") par(new=T) #the following plot on the same graphic window
plot(ecdf(peso[specie==" tredecim"]),pch=17,cex.axis=1.2,xlim=c(min(peso),max(peso)),col="red",main="") par(new=T) #the following plot on the same graphic window
plot(ecdf(peso[specie==" tredecula"]),pch=15,cex.axis=1.2,xlim=c(min(peso),max(peso)),col="blue",main="")
legend("bottomright",legend=c("tredecassini","tredecim","tredecula"),pch=c(19,17,15),col=c("black","red","blue"))
### to add a legend in the bottom-right part of the graphic window
0.10 0.15 0.20 0.25 0.30 0.35 0.40
0.00.20.40.60.81.0
x
Fn(x)
0.10 0.15 0.20 0.25 0.30 0.35 0.40
0.00.20.40.60.81.0
x
Fn(x)
0.10 0.15 0.20 0.25 0.30 0.35 0.40
0.00.20.40.60.81.0
x
Fn(x)
tredecassini tredecim tredecula
table(genere) genere
f m
59 45 levels(genere) [1] " f" " m"
plot(ecdf(peso[genere==" f"]),pch=19, cex.axis=1.2, xlim=c(min(peso),max(peso)),col="red",main="") par(new=T) #the following plot on the same graphic window plot(ecdf(peso[genere==" m"]),pch=17,cex.axis=1.2,
xlim=c(min(peso),max(peso)),col="blue",main="") legend("bottomright",legend=c("f","m"),pch=c(19,17),
col=c("red","blue"))
f m
0.100.200.300.40
0.10 0.15 0.20 0.25 0.30 0.35 0.40
0.00.20.40.60.81.0
x
Fn(x)
0.10 0.15 0.20 0.25 0.30 0.35 0.40
0.00.20.40.60.81.0
x
Fn(x)
f m
Boxplot delle altre variabili quantitative rispetto alle variabili qualitative
tredecassini tredecim tredecula
1820222426283032
f m
1820222426283032
Lunghezza corpo
2
tredecassini tredecim tredecula
9101112131415
f m
9101112131415
Larghezza ali
8 10 12 14 16
0.00.6
x
Fn(x)
8 10 12 14 16
0.00.6
x
Fn(x)
8 10 12 14 16
0.00.6
x
Fn(x)
tredecassini tredecim tredecula
8 10 12 14 16
0.00.6
x
Fn(x)
8 10 12 14 16
0.00.6
x
Fn(x) f
m
Larghezza ali
NOTA: i valori assunti da largh_ali sono pochi
tredecassini tredecim tredecula
22242628303234
f m
22242628303234
Lunghezza ali