• Non ci sono risultati.

ELABORAZIONE DEI DATI NATURALISTICIA.A. 2008/2009

N/A
N/A
Protected

Academic year: 2021

Condividi "ELABORAZIONE DEI DATI NATURALISTICIA.A. 2008/2009"

Copied!
1
0
0

Testo completo

(1)

Esercizi di preparazione alla prova scritta di

ELABORAZIONE DEI DATI NATURALISTICI

A.A. 2008/2009

Es 1. Viene rilevata la profondità (in m) di un corso d’acqua in 10 postazioni diverse. I dati sono riportatati in seguito

0.34 0.28 0.29 0.42 0.29 0.41 0.76 0.73 0.46 0.40

1. Calcolare media, varianza e mediana.

2. Rappresentare questi dati con un dotplot.

3. Rappresentare questi dati con un istogramma, specificando il numero di classi che si sono scelte.

Es 2. Per lo studio di un nuovo vaccino un gruppo di pazienti viene suddiviso in due sottogruppi. A un gruppo viene somministrato un farmaco all’altro un placebo. I pazienti non sanno se hanno assunto il farmaco o il placebo. La risposta viene codificata in

“scarsa”, “media” e “notevole”. I risultati sono riportati nella seguente tabella dei conteggi

farmaco

Risposta

scarsa media notevole

placebo 25 8 5

vaccino 6 18 11

1. Costruire la tabella delle percentuali.

2. Costruire la tabella profilo riga / profilo colonna.

3. Qual è la percentuale dei pazienti a cui è stato somministrato il vaccino e che ha dato una risposta scarsa?

4. Fra i pazienti a cui è stato somministrato il vaccino, quanti hanno dato una risposta scarsa?

5. Qual è la percentuali dei pazienti a cui è stato somministrato il placebo?

Es 3. E’ dato il seguente output in MINITAB

Var Count Mean StDev Variance Q1 Median Q3 Min Max X 30 10,317 0,914 0,836 9,705 10,413 10,818 8,7 12,2

1. Quante sono le osservazioni?

2. Tracciare, approssimativamente, il boxplot (o parte di esso) In seguito è riportata la funzione di distribuzione cumulata dei dati

3. Calcolare il 40esimo percentile 4. Calcolare la frequenza dei dati <10,5

12,5 12,0 11,5 11,0 10,5 10,0 9,5 9,0 100

80 60 40 20 0

X

Percent

Empirical CDF of X

(2)

Es 4. Dato il seguente scatterplot, dire se X è positivamente o negativamente correlata o correlata con Y1, Y2 e Y3.

12,5 12,0 11,5 11,0 10,5 10,0 9,5 9,0 60 50 40 30 20 10 0 -10 -20

X

Y-Data

Y1 Y2 Y3 Variable

Scatterplot of Y1; Y2; Y3 vs X

Sapendo che la matrice delle covarianze è la seguente, Covariances: X; Y1; Y2; Y3

X Y1 Y2 Y3 X 0,835861

Y1 1,153484 19,956972

Y2 -0,239618 18,034498 18,433861

Y3 -2,487455 -21,164816 -17,019057 82,859695 quanto valgono i coefficienti di correlazione fra le variabili?

Es 5. Abbiamo eseguito un test sulla media. I risultati sono riportati in seguito One-Sample T: X

Test of mu = 10 vs not = 10

Variable N Mean StDev SE Mean 95% CI T P X 30 10,317 0,914 0,167 (9,976; 10,659) 1,90 0,067

1. Come si conclude il test?

2. A che livello si può accettare l’ipotesi che la media sia 10?

3. Quale è l’intervallo di confidenza?

4. è vero che la media è SEMPRE contenuta nell’intervallo di confidenza?

5. è vero che la media campionaria è SEMPRE contenuta nell’intervallo di confidenza?

6. Per avere un intervallo di confidenza con ampiezza maggiore il livello di confidenza deve essere maggiore o minore?

Es 6. Abbiamo eseguito un test di uguaglianza della media per due campioni indipendenti

Two-sample T for X vs Y1 N Mean StDev SE Mean X 30 10,317 0,914 0,17 Y1 30 11,70 4,47 0,82

Difference = mu (X) - mu (Y1) Estimate for difference: -1,387

95% CI for difference: (-3,085; 0,311)

T-Test of difference = 0 (vs not =): T-Value = -1,67 P-Value = 0,106 DF = 31

(3)

Come si conclude il test seil livello è del 7%?

Es 7. Abbiamo il seguente modello di regressione lineare The regression equation is

y = 7,71 + 0,0807 x1 + 5,00 x2 + 0,0404 x3 - 6,00 x4

Predictor Coef SE Coef T P Constant 7,7085 0,3631 21,23 0,000 x1 0,08072 0,05319 1,52 0,133 x2 5,00372 0,04929 101,52 0,000 x3 0,04036 0,05280 0,76 0,447 x4 -6,00181 0,05080 -118,15 0,000

Quali variabili si possono considerare singolarmente ininfluenti?

Es 8. Abbiamo il seguente risultato di un’ ANOVA con cui si vuole capire se tre fattori 0, 1 e 2 influenzano una variabile X

One-way ANOVA: X1 versus C2

Source DF SS MS F P C2 2 0,770 0,385 0,44 0,647 Error 27 23,470 0,869

Total 29 24,240

S = 0,9323 R-Sq = 3,18% R-Sq(adj) = 0,00%

Individual 95% CIs For Mean Based on Pooled StDev

Level N Mean StDev ---+---+---+---+- 0 10 10,384 1,106 (---*---)

1 13 10,147 0,826 (---*---)

2 7 10,540 0,843 (---*---) ---+---+---+---+- 10,00 10,50 11,00 11,50 Pooled StDev = 0,932

Cosa si conclude?

Riferimenti

Documenti correlati

Le tabelle riportano le frequenze ed i tassi di incidenza standardizzati per età utilizzando le popolazioni italiana 2001, europea e mondiale (totale, ITA01, EUR e MON) ed il

Misurare significa “confrontare” una grandezza con una campione scelta come unità e il ri- sultato di una misura è un numero, o meglio un intervallo di valori in quanto

Stimare l’errore di interpolazione massimo nell’intervallo assegnato, utilizzando la formula dell’errore di interpolazione di Lagrange, per il polinomio di grado 3 e

 Alcuni algoritmi di analisi hanno dei meccanismi per gestire dati con valori mancanti o con outliers.  essi operano però senza conoscenza del

SE RIPETIAMO PIU’ VOLTE LA MISURA DELLA LUNGHEZZA DI UN PEZZO DI FERRO USANDO SEMPRE LO STESSO STRUMENTO E’ PROBABILE CHE IL RISULTATO SIA SEMPRE UGUALE. COSA CAMBIA

They measured the diameter in centimeters, height in meters, and the dry weight of wood in kilograms for a sample of three-year-old trees so that they could determine the weight of

Nella tabella (dei conteggi) seguente sono riportati i risultati campionari di un’intervista effettuata su un campione di N persone, suddivisi fra maschi e femmine..

Naturalmente XML può essere usato anche per lo scambio di dati tra componenti di una stessa applicazione: programmatori diversi possono lavorare in modo indipendente, a patto