• Non ci sono risultati.

Corso Integrato Integrato di di Statistica Statistica Informatica Informatica e e Analisi

N/A
N/A
Protected

Academic year: 2021

Condividi "Corso Integrato Integrato di di Statistica Statistica Informatica Informatica e e Analisi"

Copied!
29
0
0

Testo completo

(1)

C.I. - statistica, informatica e analisi 1

prof. Carlo Meneghini

Dip. di Fisica “E. Amaldi”

via della Vasca Navale 84 meneghini@fis.uniroma3.it

http://webusers.fis.uniroma3.it/~meneghini

Grafici di dispersione e rette di regressione

Corso

Corso Integrato Integrato di di Statistica Statistica Informatica Informatica e e Analisi

Analisi dei dei dati dati

(2)

C.I. - statistica, informatica e analisi 2

Indice Indice

Relazioni funzionali tra variabili Grafici di dispersione (x,y)

Retta di regressione

Correlazione

(3)

C.I. - statistica, informatica e analisi 3

Y= variabile dipendente X=variabile indipendente

Relazione funzionale tra y e x

X[u.m.]

xa ya

y[u.m.] f(x)

(4)

C.I. - statistica, informatica e analisi 4

X[u.m.]

xi yi

y[u.m.]

Variabile esplicativa variabile

risposta

Relazione funzionale Effetti stocastici

Relazione statistica tra y e x

Quanto è ragionevole assumere una

relazione lineare tra x e y ?

Esiste una relazione tra x e y?

(5)

C.I. - statistica, informatica e analisi 5

Fenomeno

Dati y Dati x

Sintesi: grafico di dispersione

Modello fisico Y=f(x)

Parametri della relazione

funzionale

carattere A carattere B

(6)

C.I. - statistica, informatica e analisi 6

Moto rettilineo uniformeL x(t) = xo + vt

Caso semplice: relazione lineare

(7)

C.I. - statistica, informatica e analisi 7

Caso semplice: relazione lineare

coefficiente angolare

P1

P2

x1 x2

y1 y2 Coordinate

di un punto nel piano cartesiano

Pi =(xi, yi)

Termine noto

c

0

(8)

C.I. - statistica, informatica e analisi 8

Caso semplice: relazione lineare

Quale è il modello migliore?

Per il calcolo:

Funzioni predefinite dei fogli elettronici

2

(9)

C.I. - statistica, informatica e analisi 9

Calcolo della retta di regressione 1.

Right-click

(10)

C.I. - statistica, informatica e analisi dei dati sperimentali

10

Calcolo della retta di regressione 2.

Y_nota=ordinate X_nota=ascisse

PENDENZA(Y,X) INTERCETTA(Y,X) Funzioni predefinite

(11)

C.I. - statistica, informatica e analisi 11

Requisiti

Dati: (X,Y)

Nota: m e c sono effettivamente i parametri del modello che meglio approssima di dati se sono verificate le seguanti condizioni:

1. i valori misurati xi sono noti con errore trascurabile

2. il valore atteso di yi è yi = mx + c (correttezza del modello)

3. i valori yi seguono una distribuzione normale attorno al valor medio yi con la stessa deviazione standard (omoschedastici)

4. I valori misurati y sono tutti indipendenti (indipendenza delle misure)

(12)

C.I. - statistica, informatica e analisi 12 Nota: una formula in forma di matrice si riferisce ad un intero gruppo di celle e si presenta tra parentesi {} nella barra delle

formule

X = colonna delle ascisse Y = colonna

delle ordinate

Regr.lin(X,Y,cost,stat)

Calcolo della retta di regressione 3.

Avanzato!

Regr.lin(Y,X,cost,stat)

1= calcola l'intercetta 0= intercetta nulla 1= riepilogo statistiche

0= pendenza e intercetta

1. Selezionare una regione 2x5 celle

2. Inserire (o scegliere da fx)

=Regr.lin(Y,X,cost,stat) 3. digitare: crtl+shft+enter

(13)

C.I. - statistica, informatica e analisi 13 SSred

SSreg

gradi di lib.

Coefficiente di determinazione

R2

Errore standard sull’intercetta: σσσσc Errore standard sulla

pendenza: σσσσm

Intercetta: c Pendenza: m

Calcolo della retta di regressione 3.

Avanzato!

Altre informazioni (da vedere più avanti)

m = 0.831 +/- 0.057 [u.m.]

c = 3.89 +/- 0.81[u.m.]

R2 = 0.91 Nota:

Nel riportare i risultati che si ottengono da una regressione lineare ricordarsi di:

1. indicare le unità di misura,

2. riportare gli errori con 1 o 2 cifre significative 3. riportare il valore di R2

σy F

(14)

C.I. - statistica, informatica e analisi 14

Calcolo della retta di regressione 3.

Avanzato!

=indice(matrice,riga,colonna)

5,2 5,1

4,2 4,1

3,2 3,1

2,2 2,1

1,2 1,1

=indice(Regr.lin(Y,X,cost,stat),riga,colonna)

Indici di riga e colonna

=indice(Regr.lin(Y,X,cost,stat),1,1)

=indice(Regr.lin(Y,X,cost,stat),4,2)

(15)

C.I. - statistica, informatica e analisi 15 SSred

SSreg

gradi di lib.

Coefficiente di determinazione

R2

Errore standard sull’intercetta: σσσσc Errore standard sulla

pendenza: σσσσm

Intercetta: c Pendenza: m

σy F

deviazione standard sulla

stima di y

εi = σi

= N-1 se intercetta nulla altrimenti = N-2

Statistica della funzione F, corso avanzato!

(16)

C.I. - statistica, informatica e analisi 16

Retta di regressione

Una retta è un buon modello per i dati?

R2=coefficiente di

determinazione 0 ≤ R2 ≤ 1

 ☺

(17)

C.I. - statistica, informatica e analisi dei dati sperimentali

17

Una retta è un buon modello per i dati?

Correlazione lineare

Coefficiente di correlazione di Pearson: r

R

2

= r

-1 ≤ r ≤ 1

Wikipedia: correlation coefficient

r=0 non significa che non c'è una correlazione tra i dati ma solo che la relazione lineare non è un buon modello

covarianza

Varianza dei valori x e y

(18)

C.I. - statistica, informatica e analisi 18

CORRELAZIONE(matrice1,matrice2)

Covarianza e correlazione lineare

COVARIANZA(matrice1,matrice2)

PEARSON(matrice1,matrice2)

R2 = r2

RQ(matrice1,matrice2)

(19)

C.I. - statistica, informatica e analisi 19

Una retta non è un buon modello per i dati?

(20)

C.I. - statistica, informatica e analisi dei dati sperimentali

20

Una retta non è un buon modello per i dati!

Linearizzazione

Da: M. Garetto,

STATISTICA. Lezioni ed esercizi – Quaderni

(21)

C.I. - statistica, informatica e analisi 21

(22)

C.I. - statistica, informatica e analisi 22

L=2cm L=5cm L=10 cm

D

Volume del foglio di alluminio di lato

L e spessore δ

Volume della pallina di diametro D

Prepariamo alcuni fogli di alluminio, quadrati, di lato L

Da ogni foglio si fa una pallina di

diametro D

Una relazione lineare lega il log.

del diametro medio al log. del lato dei foglietti

(23)

C.I. - statistica, informatica e analisi 23

c= ln (α) exp(c) = α

exp(c) = (6δ/π)1/3

δ = π ( exp(c) )

3

/ 6 = 0.0175 mm

(24)

C.I. - statistica, informatica e analisi 24

do

u,.m. = do/2 -> Nu =2, Nr = 4

u,.m. = do/4 -> Nu =4, Nr = 16

Dimensione di Hausdorff

dividendo per 2 l'unità di misura devo utilizzare Nr = 4 repliche per costruire il quadrato originale

dividendo per 4 l'unità di misura devo utilizzare Nr = 16 repliche per costruire il quadrato originale

d2=do/2

d4=do/4

Proprietà dei logaritmi!

(25)

C.I. - statistica, informatica e analisi 25

do

u,.m.= do/3 -> Nu =3, Nr = 4 u,.m.= do/9 -> Nu =9, Nr = 12 u,.m.= do/27 -> Nu =27, Nr = 48

u,.m. = do/2 -> Nu =2, Nr = 3 u,.m. = do/4 -> Nu =4, Nr = 9

(26)

C.I. - statistica, informatica e analisi 26

ao

as

Si sceglie una "forma geometrica" caratterizzata da una dimensione ao. Ad esempio un triangolo di lato ao, un cerchio di raggio ao, una sfera di raggio ao, etc... in grado di "ricoprire" il mio oggetto.

Si scelgono sottomultipli dell'unità di misura (as = ao/s) e prende una figura, simile all'originale, in scala 1/s. Si conta quindi il numero di repliche Nsdella figura in scala, necessario per ricoprire l'oggetto.

La legge di scala mi dice che si deve avere Ns ~ sD dove D è la dimensione dell'oggetto, quindi:

D ~ ln(Ns) / ln(s)

Riportando su un grafico i valori X=ln(s), Y=ln(Ns), il coefficiente angolare della retta è la dimensione frattale dell'oggetto

Box counting o ricoprimento

(27)

C.I. - statistica, informatica e analisi dei dati sperimentali

27

m = 0.8

Dim. Frattatale della superficie corticale del cervello umano: ~2.4

Risultato: la dimensione frattale delle palline è simile a quella della sup. corticale del cervello.

Nota: patologie e disfunzioni neurologiche possono essere collegate a variazioni della dim. frattale della superficie corticale del cervello

δ = π (exp(c))3 / 6 = 0.0175 mm

β β

(28)

C.I. - statistica, informatica e analisi dei dati sperimentali

28

Esempi di sistemi biologici a struttura frattale (autosimilare) nei mammiferi

(29)

C.I. - statistica, informatica e analisi 29

Riferimenti

Documenti correlati

L’attuale Decreto d’area per le Classe delle Lauree specialistiche in Medicina e Chirurgia si fa carico in vari punti della necessità di approfondire la

(3) Viene preparato un test di screening per rivelare l’alterazione del metabolismo di cui sopra e si assume il test positivo se la concentrazione rivelato è maggiore di C L

3.(4) Determinare gli intervalli di confidenza al 95% per l’altezza media degli Uomini e delle Donne e riportare i valori in una tabella della relazionec. 4.(3) Calcolare la

Condizioni di lavoro: condizioni entro le quali la risposta dello strumento rientra nelle specifiche fornite dal costruttore: ad esempio superando i limiti di peso stabiliti

Come nella geometria Euclidea la teoria di Kolmogorof è di tipo assiomatico assiomatico ovvero si basa su alcune definizioni e assiomi a partire dai quali è poi possibile dedurre

ATTENZIONE: a questo punto salvate il foglio elettronico come file Excel (estensione xls) usando ”salva con nome”.. Altrimenti alla chiusura il file sar´ a salvato come documento

Utilizzando i dati raccolti a lezione e disponibili sul sito (seguire il link Dati Esercizi In Aula): Nel file Es.04.liposoma.txt sono raccolti i dati sulla dimen- sione di

Uso del programma Gnuplot come calcolatrice graca per la presentazione di dati e funzioni algebriche.. Alcune macro utili: graca di dati, graca di funzioni, preparazione di