ESERCIZI 3
1. Si considerino i dati contenuti nel file cicala.txt.
La prima riga contiene il nome delle variabili; i dati sono separati dal carattere ; e il separatore decimale `e la virgola. Le unit`a sperimentali sono 104. La prima colonna contiene l’identificatore delle unit`a sperimentali. La descrizione delle variabili si trova in fondo al file; quindi vanno lette solo le prime 104 righe.
1. Leggere i dati in R
2. Assegnare nuove etichette alle variabili (pi`u “chiare”) 3. Costruire una tabella con le numerosit`a delle tre specie
4. Considerare il peso corporeo. Disegnare il box plot e il grafico della funzione di distribuzione cumulata per l’insieme totale delle unit`a sperimentali.
Successivamente disegnare il box plot (e il grafico della funzione di distribuzione cumulata) sud- divisi nelle tre specie di cicale.
5. Considerare le altre variabili quantitative e ripetere le analisi fatte per il peso corporeo.
2. Qui sotto sono riportati i diagrammi di dispersione di 5 variabili, indicate con A, B, C, D ed E.
A
Frequency
0 20 40 60 80 100
010203040
B
Frequency
0 20 40 60 80 100
010203040
C
Frequency
0 20 40 60 80 100
010203040
D
Frequency
0 20 40 60 80 100
010203040
E
Frequency
0 20 40 60 80 100
010203040
1. Qui sotto sono riportati i grafici delle funzioni di distribuzione cumulata di 3 di queste variabili.
Dire a quale rilevazione corrisponde ciascun grafico.
0 20 40 60 80 100 0.00.20.40.60.81.0 ●● ●
● ●●● ●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●●●●●●● ●●●●●●●●● ●●●● ●
0 20 40 60 80 100 0.00.20.40.60.81.0 ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●●●●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●●●●●●●●●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●● ●●●●●●●●●●●●●●●●●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
0 20 40 60 80 100 0.00.20.40.60.81.0 ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●●●●●●●●●●●●●●●● ●●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● ● ●●●●●●●●●●● ●●●● ● ●●●●●●●●●●●● ●●●●●●● ●●● ●●●●●●●●●●●●●●●●●●●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●●● ●●●●●●●●●●●●●●●● ●●●●●●●●●●●●●●●● ●●●●●●●●●●●●●●●●●●● ● ●●●●●●●●●●● ●●●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●
Disegnare approssimativamente le funzioni di distribuzione cumulata delle altre 2 variabili.
2. Sotto sono riportati i box-plot di 3 variabili (non necessariamente le stesse del punto precedente).
Dire a quale rilevazione corrisponde ciascun box-plot.
020406080100 020406080100
●
●
●
●
020406080100
Disegnare approssimativamente i box-plot delle altre 2 variabili.
1
3. Sotto sono riportati, su un unico piano cartesiano, i grafici delle funzioni di distribuzione cumu- lata del peso, espresso in grammi, di due insiemi di pesci di specie diversa che chiameremo specie
“triangolo” e specie “pallino”.
Indicare quali delle seguenti affermazioni rel- ative alla “forma” della distribuzione del peso delle due specie sono vere e quali false.
i. Il peso della specie “triangolo” ha una distribuzione simmetrica rispetto alla mediana.
ii. Il peso della specie “pallino” ha una dis- tribuzione simmetrica rispetto alla me- diana.
iii. Il peso della specie “triangolo” e quello della specie “pallino” assumono valori
su uno stesso intervallo. 0 200 400 600 800 1000 1200
0.00.20.40.60.81.0
●
●●●
●●
●●
●
●
●
●●●
●●
●
●●●
● ●●
●●●
●
0 200 400 600 800 1000 1200
0.00.20.40.60.81.0
4. La maggior parte dei pesci della specie “triangolo” `e pi`u leggera di tutti i pesci della specie
“pallino”.
5. La maggior parte dei pesci della specie “pallino” `e pi`u pesanti di tutti i pesci della specie
“triangolo”.
6. Nell’intervallo corrispondente all’ultimo 25% dei dati le distribuzioni delle due specie sono molto diverse.
Calcolare (approssimativamente) la distanza interquartile del peso delle due specie.
2