• Non ci sono risultati.

1. RICHIAMO: CARICAMENTO DI TABELLE

N/A
N/A
Protected

Academic year: 2021

Condividi "1. RICHIAMO: CARICAMENTO DI TABELLE"

Copied!
6
0
0

Testo completo

(1)

1. RICHIAMO: CARICAMENTO DI TABELLE

Se abbiamo una tabella, scritta su un foglio, la procedura è:

a) Scrivere (o copiare) su R il comando A <- read.table ("clipboard") senza dare d’invio.

b) Andare sul foglio dove c’è la tabella, selezionarla e fare “copia”

c) Tornare col cursore su R e dare “invio”.

2. UN ESEMPIO REALE

Con la procedura appena vista, caricare su R la seguente tabella:

1.67 61 04 0

1.78 62 26 0

1.78 72 05 0

1.84 75 2 0

1.82 76 12 0

1.80 72 2 0

1.95 91 3 0

1.81 80 9 0

1.80 70 9 0

1.86 77 6 0

1.68 65 9 0

1.84 64 8 0

1.72 62 1 0

1.76 65 26 0

1.82 74 4 0

1.86 86 3 0

1.84 75 14 0

1.73 65 19 0

1.72 57 25 1

1.62 56 2 1

(2)

1.70 59 3 1

1.61 46 15 1

1.70 64 22 1

1.60 63 26 1

1.61 60 16 1

1.60 55 28 1

1.65 50 12 1

Isoliamo con nomi facili le diverse colonne (in altri casi i nomi ci sono già nella tabella di partenza, qui no).

Alt = A[,1]

Peso = A[,2]

Data = A[,3]

Sesso = A[,4]

cor(Alt,Peso) plot(Alt,Peso)

abline(lm(Peso~Alt),col="red")

(3)

Quindi approssimativamente c’è una regola che dice il peso data l’altezza, con una banda di confidenza.

PROBLEMA: Come si può determinare e disegnare una banda di confidenza?

Potremmo immaginare che la regola dipenda dal sesso. Vediamo graficamente i due gruppi colorati diversamente (18 maschi, 9 femmine):

plot(Alt[1:18],Peso[1:18],col="blue") lines(Alt[19:27],Peso[19:27],col="red") abline(lm(Peso~Alt),col="green")

Non ha funzionato. Il comando lines non è proprio esattamente come plot: di default produce linee invece che punti.

plot(Alt[1:18],Peso[1:18],col="blue")

lines(Alt[19:27],Peso[19:27],type="p",col="red") abline(lm(Peso~Alt),col="green")

(4)

Di nuovo non ha funzionato. Il comando lines non allarga la finestra. Bisogna quindi settare la finestra all’origine.

plot(c(1.50,2),c(50,100),type="n")

plot(Alt,Peso)

lines (Alt[1:18],Peso[1:18], type="p",col="blue") lines(Alt[19:27],Peso[19:27],type="p",col="red") abline(lm(Peso~Alt),col="green")

Non c’è alcuna evidenza grafica che il rapporto peso/altezza cambi tra maschi e femmine.

(5)

Infine, esaminiamo il legame tra altezza e data di nascita.

cor(Alt,Data) plot(Alt,Data)

abline(lm(Data~Alt),col="red")

cor(Peso,Data) plot(Peso,Data)

abline(lm(Data~Peso),col="red")

cor(Peso[1:18],Data[1:18]) plot(Peso[1:18],Data[1:18])

abline(lm(Data[1:18]~Peso[1:18]),col="red")

cor(Peso[19:27],Data[19:27]) plot(Peso[19:27],Data[19:27])

abline(lm(Data[19:27]~Peso[19:27]),col="red")

I risultati globali e dei maschi sono sorprendenti. Analizziamoli allora anche col metodo visto nell’esercitazione precedente.

n=27; N=50000 COR = 1:N for (i in 1:N) { x= rnorm(n) y= rnorm(n) COR[i] = cor(x,y) }

hist(COR,50)

(6)

3. ESERCIZI

i. Come si può determinare e disegnare una banda di confidenza, nella regressione?

ii. Come dare una risposta scientifica (numerica) e non solo graficamente intuitiva, riguardante la bontà della correlazione 0.863 e l’anomalia della correlazione -0.41?

Riferimenti

Documenti correlati

Previous studies indicate that pretreatment of human hepatoma cells with coffee (117) and biscuit (118) melanoidins exerts remarkable protection against oxidative

Dolomie afanitiche con tracce di radici e

per esaminare l’eventuale relazione di dipendenza che esiste tra due variabili casuali e’ utile rappresentare in un grafico ciascuna delle coppie (x i y i )... Dimostrazione

Diesel fuel heaters are replaced by wood-chip boil- ers, positioned into boilers sites, and the heating supply is performed by hot water pipes plants. Production of wood-chip, which

Three different steam power plants (a 320 MW conventional steam power plant, a 320 MW and a 160 MWe unit with geothermal feed-water preheating); two different

Possiamo decidere di minimizzare la “vera distanza” dalla retta (e non la sua proiezione lungo l’asse y)... Catalogo RC3 (Third Reference Catalogue of bright galaxies) de

• assume al massimo il valore 1 in caso di massima correlazione lineare positiva, che si ha quando i punti dello scatterplot sono tutti esattamente disposti su una retta

• L’obiettivo della verifica è di valutare se uno studente possiede i concetti di indipendenza statistica di due variabili, di verifica delle ipo- tesi (inferenza statistica),