• Non ci sono risultati.

704SM Biostatistica

N/A
N/A
Protected

Academic year: 2021

Condividi "704SM Biostatistica"

Copied!
25
0
0

Testo completo

(1)

704SM Biostatistica

Massimo Borelli

dicembre 2016

(2)

questioni da approfondire

(3)

La regressione multipla

il dataset airquality

Ozone Solar.R Wind Temp Month Day

1 41 190 7.40 67 5 1

2 36 118 8.00 72 5 2

3 12 149 12.60 74 5 3

4 18 313 11.50 62 5 4

5 NA NA 14.30 56 5 5

6 28 NA 14.90 66 5 6

.. .. .. .. .. .. ..

152 18 131 8.00 76 9 29

153 20 223 11.50 68 9 30

si tratta di una serie temporale, non di un design cross-section

(4)

questioni da approfondire

domande

come si sceglie il ’migliore’ modello

statistico?

(5)

domande

come si sceglie il ’migliore’ modello statistico

mediante la analisi della devianza

confrontando i criteri di informazione

simulando dati in base allo

residual standard error

(6)

che cosa è la devianza?

5 10 15 20

46810

x1

y1

5 10 15 20

46810

x2

y2

5 10 15 20

46810

x3

y3

5 10 15 20

46810

x4

y4

(7)

che cosa è la devianza

4 6 8 10 12 14

4 5 6 7 8 9 10 11

y = 0.5 x + 3 (p = 0.002)

(8)

che cosa è la devianza

4 6 8 10 12 14

4 5 6 7 8 9 10 11

residui

(9)

che cosa è la devianza

4 6 8 10 12 14

4 5 6 7 8 9 10 11

devianza = 13.8

(10)

analisi della devianza

4 6 8 10 12 14

4567891011

devianza = 13.8

la somma dei quadrati dei residui (RSS) si comporta approssimativamente come una variabile aleatoria Chi Quadrato possiamo testare le RSS dei modelli:analisi della devianza

anova(modelloA, modelloB)

(11)

che cosa sono i criteri di informazione?

che cosa è la log-verosimiglianza?

4 6 8 10 12 14

4567891011

residui

-2 -1 0 1 2

-0.10.00.10.20.30.4

residui

densità della normale

plot(resid(m2), dnorm(resid(m2), 0, sigma))

(12)

che cosa sono i criteri di informazione?

che cosa è la log-verosimiglianza?

(13)

che cosa sono i criteri di informazione?

(14)

come si simulano i dati in base allo residual standard error ?

Alice Ellen Alice Ellen 1 73.60 73.80 12 74.10 74.60 2 73.40 73.50 13 73.60 73.80 3 74.10 74.60 14 73.40 73.60 4 73.50 73.80 15 74.10 74.40 5 73.20 73.60 16 73.50 73.70 6 74.00 74.40 17 73.20 73.50 7 73.60 73.80 18 74.00 74.40 8 73.30 73.50 19 73.60 73.90 9 74.20 74.30 20 73.30 73.60 10 73.60 73.90 21 74.20 74.50

11 73.40 73.60 - - -

(15)

come si simulano i dati in base allo residual standard error ?

(16)

come si simulano i dati in base allo residual standard error ?

73.2 73.4 73.6 73.8 74.0 74.2

73.674.074.4

terzo esperimento

Alice

Ellen

1 2

3

4 5

6

7

8

9

10 11

12

13 14

15

16 17

18

19 20

21

73.0 73.4 73.8 74.2

73.473.874.274.6

simulazione

AliceFinta

EllenFinta

2 1 3

4 5

6

7 8

9 10

11

12 13 14

15 16

17

18 19

20 21

(17)

come si simulano i dati in base allo residual standard error ?

56789101112

simulazione

brainstem cerebellum cortex

56789101112

Taba

(18)

il dataset diabete

(19)

il dataset diabete

(20)

il dataset diabete

serumprotein response group

1 12.60 43.60 black

2 10.50 38.70 black

3 12.80 38.20 black

4 7.10 34.40 black

5 16.90 33.60 black

6 13.50 33.30 white

... ... ... ...

51 14.40 14.20 white

52 20.90 13.90 white

53 16.80 11.50 white

(21)

il dataset diabete

(22)

il dataset diabete

5 10 15 20 25 30 35

152025303540

modello massimale

insuline sensitivity clamp

retinol binding protein

(23)

il dataset diabete

5 10 15 20 25 30 35

152025303540

modello additivo

insuline sensitivity clamp

retinol binding protein

(24)

il dataset diabete

5 10 15 20 25 30 35

152025303540

minimale adeguato

insuline sensitivity clamp

retinol binding protein

(25)

il dataset diabete

5 10 15 20 25 30 35

152025303540

p = 0.04

insuline sensitivity clamp

retinol binding protein

Riferimenti

Documenti correlati

Se possibile scrivere n come somma di tre quadrati.. Se possibile scrivere n come somma di

risposta: dal particolare all’universale Quindi se io ho dei dati numerici tratti da un campione e calcolo la media (campionaria) ottengo una stima della media vera (ignota) di

c’è un 12% di probabilità che la discrepanza tra la media della popolazione µ = 0 e la media del campione M = 33.7 sia dovuta al caso e non all’efficacia del

Quali sono le tipiche situazioni di laboratorio che vengono (venivano? ) affrontate con i test statistici.. Quali metodi

adesso che conosciamo il ’razionale’ della retta di regressione, come possiamo precisare il fatto che essa sia la migliore retta che passa per la nuvola di punti. come sono legati

Problema: Da un’urna contenente sei palline, numerate da 1 a 6, se ne estraggono due senza rimpiazzo (cioè senza reinserire ciascuna pallina estratta nell’urna, in modo che le

[r]

Tuttavia, questa variabile pu` o essere osservata solo se ` e positiva, poich` e se vale 0 non possiamo sapere se l’insetto studiato fosse effettivamente presente su quella foglia..