• Non ci sono risultati.

1. RICHIAMO: CARICAMENTO DI TABELLE

N/A
N/A
Protected

Academic year: 2021

Condividi "1. RICHIAMO: CARICAMENTO DI TABELLE"

Copied!
6
0
0

Testo completo

(1)

1. RICHIAMO: CARICAMENTO DI TABELLE

Se abbiamo una tabella, scritta su un foglio, la procedura è:

a) Scrivere (o copiare) su R il comando A <- read.table ("clipboard") senza dare d’invio.

b) Andare sul foglio dove c’è la tabella, selezionarla e fare “copia”

c) Tornare col cursore su R e dare “invio”.

2. UN ESEMPIO REALE

Con la procedura appena vista, caricare su R la seguente tabella:

1.67 61 04 0

1.78 62 26 0

1.78 72 05 0

1.84 75 2 0

1.82 76 12 0

1.80 72 2 0

1.95 91 3 0

1.81 80 9 0

1.80 70 9 0

1.86 77 6 0

1.68 65 9 0

1.84 64 8 0

1.72 62 1 0

1.76 65 26 0

1.82 74 4 0

1.86 86 3 0

1.84 75 14 0

1.73 65 19 0

1.72 57 25 1

1.62 56 2 1

(2)

1.70 59 3 1

1.61 46 15 1

1.70 64 22 1

1.60 63 26 1

1.61 60 16 1

1.60 55 28 1

1.65 50 12 1

Isoliamo con nomi facili le diverse colonne (in altri casi i nomi ci sono già nella tabella di partenza, qui no).

Alt = A[,1]

Peso = A[,2]

Data = A[,3]

Sesso = A[,4]

cor(Alt,Peso) plot(Alt,Peso)

abline(lm(Peso~Alt),col="red")

(3)

Quindi approssimativamente c’è una regola che dice il peso data l’altezza, con una banda di confidenza.

PROBLEMA: Come si può determinare e disegnare una banda di confidenza?

Potremmo immaginare che la regola dipenda dal sesso. Vediamo graficamente i due gruppi colorati diversamente (18 maschi, 9 femmine):

plot(Alt[1:18],Peso[1:18],col="blue") lines(Alt[19:27],Peso[19:27],col="red") abline(lm(Peso~Alt),col="green")

Non ha funzionato. Il comando lines non è proprio esattamente come plot: di default produce linee invece che punti.

plot(Alt[1:18],Peso[1:18],col="blue")

lines(Alt[19:27],Peso[19:27],type="p",col="red") abline(lm(Peso~Alt),col="green")

(4)

Di nuovo non ha funzionato. Il comando lines non allarga la finestra. Bisogna quindi settare la finestra all’origine.

plot(c(1.50,2),c(50,100),type="n")

plot(Alt,Peso)

lines (Alt[1:18],Peso[1:18], type="p",col="blue") lines(Alt[19:27],Peso[19:27],type="p",col="red") abline(lm(Peso~Alt),col="green")

Non c’è alcuna evidenza grafica che il rapporto peso/altezza cambi tra maschi e femmine.

(5)

Infine, esaminiamo il legame tra altezza e data di nascita.

cor(Alt,Data) plot(Alt,Data)

abline(lm(Data~Alt),col="red")

cor(Peso,Data) plot(Peso,Data)

abline(lm(Data~Peso),col="red")

cor(Peso[1:18],Data[1:18]) plot(Peso[1:18],Data[1:18])

abline(lm(Data[1:18]~Peso[1:18]),col="red")

cor(Peso[19:27],Data[19:27]) plot(Peso[19:27],Data[19:27])

abline(lm(Data[19:27]~Peso[19:27]),col="red")

I risultati globali e dei maschi sono sorprendenti. Analizziamoli allora anche col metodo visto nell’esercitazione precedente.

n=27; N=50000 COR = 1:N for (i in 1:N) { x= rnorm(n) y= rnorm(n) COR[i] = cor(x,y) }

hist(COR,50)

(6)

3. ESERCIZI

i. Come si può determinare e disegnare una banda di confidenza, nella regressione?

ii. Come dare una risposta scientifica (numerica) e non solo graficamente intuitiva, riguardante la bontà della correlazione 0.863 e l’anomalia della correlazione -0.41?

Riferimenti

Documenti correlati

Dolomie afanitiche con tracce di radici e

Possiamo decidere di minimizzare la “vera distanza” dalla retta (e non la sua proiezione lungo l’asse y)... Catalogo RC3 (Third Reference Catalogue of bright galaxies) de

• assume al massimo il valore 1 in caso di massima correlazione lineare positiva, che si ha quando i punti dello scatterplot sono tutti esattamente disposti su una retta

• L’obiettivo della verifica è di valutare se uno studente possiede i concetti di indipendenza statistica di due variabili, di verifica delle ipo- tesi (inferenza statistica),

Previous studies indicate that pretreatment of human hepatoma cells with coffee (117) and biscuit (118) melanoidins exerts remarkable protection against oxidative

Diesel fuel heaters are replaced by wood-chip boil- ers, positioned into boilers sites, and the heating supply is performed by hot water pipes plants. Production of wood-chip, which

Three different steam power plants (a 320 MW conventional steam power plant, a 320 MW and a 160 MWe unit with geothermal feed-water preheating); two different

per esaminare l’eventuale relazione di dipendenza che esiste tra due variabili casuali e’ utile rappresentare in un grafico ciascuna delle coppie (x i y i )... Dimostrazione