Laboratorio Processi Stocastici

(1)

Laboratorio

Processi Stocastici

Annalisa Pascarella

Istituto per le Applicazioni del Calcolo "M

. Picone"

Consiglio Nazionale delle Ricerche Roma

(2)

Informazioni

 e-mail:

 [email protected]

 webpage

 www.dima.unige.it/~pascarel/

 Giovedì 10 Novembre PC2 12-14

 Venerdì 11 Novembre PC2 11-13

 Lunedì 5 Dicembre PC2 14-16

(3)

Programma

 MATLAB

 esercizi vari durante il laboratorio

 MCMC

 metodi Monte Carlo,

 algoritmi per la generazione di numeri pseudo-casuali

 Metropolis-Hastings

 Simulazione processo di Poisson

(4)

MATLAB

(5)

MATLAB

 MATrix LABoratory

 Linguaggio di programmazione interpretato

 legge un comando per volta eseguendolo immediatamente

 Per avviarlo ->

icona sul desktop ^command^window

workspace

(6)

MATLAB come calcolatrice

è possibile definire variabili e operare su esse

x = 9 -> invio 4 + 7

invio

Operatori aritmetici: + - * / ^

Caratteri speciali: ; % : Variabili predefinite: i, pi, NaN, Inf

Funzioni elementari: sin, cos, log, exp

help mean

(7)

Comandi utili

 clear a

 per cancellare una variabile dal workspace

 clear all

 per cancellare tutte le variabili dal workspace

 ans

 ultima variabile memorizzata

 clc

 pulisce lo schermo

 help <nome_funzione>

(8)

Lavorare con MATLAB

 In MATLAB tutte le variabili sono trattate come matrici

 scalari -> matrici 1 x 1

 vettori riga -> matrici 1 x n v = (v₁,…, v_n)

 vettori colonna -> matrici n x 1 v = (v₁,…, v_n)^T

 matrici -> matrici m x n



















mn m

n

a a

A







1

1 11

(9)

Vettori

 Per definire un vettore riga

 Per definire un vettore colonna

 Usando :

a = [1 2 3 4 5]

a = [1, 2, 3, 4, 5]

a = [1; 2; 3; 4; 5]

a = [1 2 3 4 5] ’ a = 1:3:10

b = -5:5

(10)

Matrici

 Per definire una matrice ² ²

2 1

0

3

_

 



 



  R

A

A = [3 0; 1 2]

A = [3 0 1 2]

b1 = [3;1]

b2 = [0; 2]

b3 = [3; 0]

B = [b1, b2, b3]

3 2

0 2

1 3 0

3

_

 



 



  R

B

B(2,3)

B(2,3) = 1;

B

• per selezionare un elemento

• per modificare l’elemento

• per visualizzare B

 size(A) -> dimensioni della matrice

 per memorizzare le dimensioni -> [r c] = size(A)

(11)

Il comando :

 Importante per la manipolazione delle matrici

estrarre la riga R₂

estrarre la colonna C2

3 2

0 2

1 3 0

3

_

 



 



  R

B

B(2,:) B(:,2)

 generazione di vettori che siano delle progressione aritmetiche di passo costante

 a = [1:10] o a = 1:10

 b = 1: .2 : 4

 c = 3:0 -> non produce niente!!!!

 c = 3: -1: 1

 mediante : si possono estrarre righe e colonne

(12)

Identità-zero-uno

eye(n)

eye(3) _^

















1 0 0

0 1 0

0 0 1 I



 



 

0 0 0

0 0 Z 0

zeros(m,n) zeros(2,3)



 



 

1 1 1

1 1 Z 1

ones(m,n) ones(2,3) identità di ordine n ->

matrice nulla m x n ->

matrice m x n di 1 ->

(13)

Operazioni

Somma / Differenza A+B, A-B

Trasposta A’

Prodotto A*B #C_A = #R_B

Elemento per elemento

A.*B size(A) = size(B) Prodotto per uno

scalare

A*k

size(A)= size(B)

(14)

Script e funzioni

 Script

 parametri in ingresso non modificabili

 le variabili usate sono messe nella memoria di lavoro di MATLAB

 Funzioni

 script al quale si possono passare parametri in ingresso ed ottenerne in uscita

 sintassi

 y1,…,yn -> parametri in uscita

 x1,…,xn –> parametri in entrata

 le variabili usate all’interno sono locali

function [y1,…,yn] = nome_funzione(x1,…,xn)

(15)

Script

 E’ possibile scrivere degli script in Matlab

 cliccando su new

 File -> New -> M-file

(16)

Le funzioni

 L’m file va salvato col nome nome_funzione.m

 il nome del file deve essere identico a quello della funzione

 La funzione può essere richiamata

 dalla finestra di comando

 all’interno di uno script

 da altre funzioni

digitando [y1,…,yn]=nome_funzione(x1,…,xn)

 Per poter richiamare la funzione dobbiamo essere nella directory nella quale è salvata la funzione oppure “settare” nel path di Matlab la directory nella quale la funzione è salvata.

(17)

Cicli

 Ciclo incondizionato

 Ciclo condizionato

 Test condizionale

for i = n1:passo:n2 blocco di istruzioni end

while condizione

blocco di istruzioni end

if condizione1

blocco di istruzioni elseif condizione2 blocco di istruzioni else

blocco di istruzioni end

(18)

Operatori

 Operatori relazionali:

 < , <= , > , >= , == , = , =

 si usano per confrontare tra di loro gli elementi di 2 matrici; il risultato dell’operazione sarà

 0 se la relazione è falsa

 1 se la relazione è vera

 Operatori logici:

 & , | , 

 si usano per combinare tra loro gli operatori relazionali

 Nota

 = serve per assegnare valore ad una variabile

 == per verificare se una variabile assume un determinato valore

(19)

Input\output

 input

 sprintf

n = input(‘inserisci un intero ’);

disp(sprintf(‘n = %d’,n)) disp(‘stringa di caratteri’)

(20)

 Il comando si usa:

 per rappresentare punti nel piano

 per disegnare il grafico di una funzione

 x e y devono essere vettori di ugual misura

Grafica

 In MATLAB è possibile

 disegnare funzioni in 2D e 3D

 rappresentare graficamente dei dati

plot(x,y)

(21)

Esempio - I

 Per rappresentare dei punti nel piano

x = [1 2 3 7 -9 2];

y = [-2 -6 1 5 7 2];

plot(x,y) figure(2) plot(x,y,'*')

(22)

Esempio - II

 Per “plottare” la funzione y=sin(x)

x = [-pi:.01:pi];

y = sin(x);

plot(x,y)

definiamo

l’intervallo in cui vogliamo disegnare la funzione

definiamo la funzione disegniamo la funzione

figure(2)

plot(x,y, '-g') è possibile

inserire un terzo parametro di

input

(23)

Sintassi del comando

“plot”



 x e y sono i vettori dei dati (ascisse e ordinate dei punti)



 x e y come sopra; opzioni è una stringa opzionale che definisce il tipo di colore, di simbolo e di linea usato nel grafico.

 help plot per vedere quali sono le varie opzioni



 realizza il grafico del vettore y rispetto ai propri indici plot(x, y)

plot(x, y, 'opzioni')

plot(y)

(24)

Comandi utili - I

 per creare (richiamare) una finestra grafica

 per avere più grafici nella stessa finestra

 hold off per disattivare la funzione

 per riscalare il grafico

 per creare diversi grafici separati

in una stessa finestra

 esistono diversi comandi per “abbellire” i grafici

 title, xlabel, ylabel, legend figure(num)

hold on

axis([xmin xmax ymin ymax])

sublot(righe, colonne, sottofinestra)

(25)

Risultati

usando hold on

usando subplot figure(1); hold on; grid on

y2 = cos(x);

plot(x,y2,’r’)

title(‘seno e coseno’)

% creiamo delle sottofinestre

figure(3); subplot(1,2,1); plot(x,y); title('seno') subplot(1,2,2); plot(x,y2); title('coseno')

(26)

Esercizio

Caricare il vettore dei dati nella variabile “data”:

data = load(‘dato_per_istogramma.dat’);

size(data)

Osserviamo i dati plot(data)

plot(data, ones(size(data)) , ’ . ’)

Scrivere una funzione che crei l’istogramma di un

vettore

(27)

Algoritmo istogramma

Scelta degli estremi e della larghezza intervallo

INF DELTA SUP

Contiamo quanti elementi del vettore cadono in ogni intervallo:

creiamo un vettore il cui valore i- esimo rappresenti il numero di conteggi nell’i-esimo intervallo

(28)

Algoritmo istogramma

Per ogni elemento del vettore data(i) Per ogni intervallo

Se data(i) è compreso nei valori dell’intervallo Incrementare il contatore relativo a

quell’intervallo

Il j-esimo intervallo ha come estremi INF+(j-1)*DELTA e INF+j*DELTA

INF DELTA SUP

(29)

Algoritmo istogramma

INF = -4;

SUP = 4;

DELTA = 0.4;

NUM_INT = (SUP-INF)/DELTA; % numero di intervalli

contatore = zeros(1,NUM_INT) % inizializziamo il contatore;

for i = 1:size(data,2) % per ogni dato

for j = 1: NUM_INT % per ogni intervallo

if data(i)>INF+(j-1)*DELTA && data(i)<INF+j*DELTA contatore(j) = contatore(j)+1;

end end

end

VALORI = INF+DELTA/2 : DELTA : SUP-DELTA/2 figure

bar(VALORI, contatore)

(30)

Algoritmo istogramma (efficiente)

L’algoritmo appena scritto fa un ciclo di troppo...

INF SUP

1 2 k

Osserviamo che il singolo valore data(i) INF < data(i) < SUP

0 < data(i)-INF < SUP-INF=DELTA*NUM_INT 0 < (data(i)-INF)/DELTA < NUM_INT

(31)

Algoritmo istogramma (efficiente)

INF = -4;

SUP = 4;

DELTA = 0.4;

NUM_INT = (SUP-INF)/DELTA; % numero di intervalli

contatore = zeros(1,NUM_INT) % inizializziamo il contatore;

for i = 1:size(data,2) % per ogni dato j = ceil((data(i)-INF)/DELTA);

contatore(j) = contatore(j) + 1;

end

VALORI = INF+DELTA/2 : DELTA : SUP-DELTA/2 figure

bar(VALORI, contatore)

(32)

Istogrammi e MATLAB

Esiste un comando che fa l’istogramma delle frequenze dei valori di un vettore

hist(data)

hist(data,50) istogramma in 50 intervalli data = load(‘dato_per_istogramma.dat’)

[counts bins] = hist(data,50) i conteggi in counts, i punti medi degli intervalli in bins

(33)

Metodi Monte Carlo

(34)

Un po’ di storia

 I numeri casuali sono utilizzati per costruire simulazioni di natura probabilistica di

 fenomeni fisici: reattori nucleari, traffico stradale, aerodinamica

 problemi decisionali e finanziari: econometria, previsione Dow-Jones

 informatica: rendering, videogiochi

 Il legame che esiste tra il gioco e le simulazioni probabilistiche è sottolineato dal fatto che a tali simulazioni è dato il nome di metodi Monte Carlo

 l’idea di utilizzare in modo sistematico simulazioni di tipo probabilistico per risolvere un problema di natura fisica viene generalmente attribuita al matematico polacco Ulam, uno dei personaggi chiave nel progetto americano per la costruzione della bomba atomica durante la II guerra mondiale)

(35)

Cos’è un numero casuale?

 Lancio di un dado: l’imprevedibilità del numero ottenuto come punteggio conferisce allo stesso una forma di casualità

 Diversi metodi per generare numeri casuali

 hardware

 calcolatore: il calcolatore è un oggetto puramente deterministico e quindi

prevedibile, per cui nessun calcolatore è in grado di generare numeri puramente casuali, ma solo numeri pseudo-casuali ossia numeri generati da algoritmi

numerici deterministici in grado di

superare una serie di test statistici che conferiscono a tali numeri un’apparente casualità

(36)

Criteri

 I fattori che determinano l’accettabilità di un metodo sono essenzialmente i seguenti:

 i numeri della sequenza generata devono essere

uniformemente distribuiti (cioè devono avere la stessa probabilità di presentarsi);

 i numeri devono risultare statisticamente indipendenti;

 la sequenza deve poter essere riprodotta;

 la sequenza deve poter avere un periodo di lunghezza arbitraria;

 il metodo deve poter essere eseguito rapidamente dall’elaboratore e deve consumare poco spazio di memoria.La generazione dei numeri casuali è troppo importante per essere

lasciata al caso…

(J.Von Neumann)

(37)

Generatori

 Metodo middle-square

 genera numeri pseudo-casuali distribuiti in modo uniforme

 in tale distribuzione uniforme ogni possibile numero in un determinato intervallo è ugualmente probabile

 Il metodo LCG ha bisogno di un seme per

generare la sequenza di numeri pseudo-casuiali secondo la seguente regola deterministica

x_{n+1 =}(ax_n+c)mod m , n>=0

 con a,c ed m opportuni numeri interi costanti

 x_n+1assume valori compresi tra 0, …, m-1

(38)

Generatori e MATLAB

 I generatori di numeri casuali più recenti non sono basati sul metodo LCG, ma sono una combinazione di operazioni di spostamento di registri e manipolazione sui bit che non richiedono nessuna operazione di moltiplicazione o divisione. Questo nuovo approccio risulta estremamente veloce e garantisce periodi incredibilmente lunghi

 Nelle ultime versioni di MATLAB il periodo è 2¹⁴⁹²

 un milione di numeri casuali al secondo richiederebbe 10⁴³⁵ anni prima di ripetersi!

 data la coincidenza dell’esponente con la data della scoperta dell’America questo generatore è comunemente chiamato il “generatore di Cristoforo Colombo”

(39)

rand

 La funzione rand genera una successione di numeri casuali distribuiti uniformemente

nell’intervallo (0,1)

 La sintassi di tale funzione è

rand(n,m)

che genera una matrice n x m di numeri casuali distribuiti uniformemente

 Per vedere gli algoritmi utilizzati da MATLAB

 help rand

 Una volta avviato MATLAB, il primo numero casuale generato è sempre lo stesso:

0.95012928514718 come anche la successione di numeri casuali

 rand(‘state’,0)

(40)

Metodo Monte Carlo

 Vengono denominate le tecniche che utilizzano variabili casuali per risolvere vari problemi,

anche non di natura aleatoria.

 Vediamo l’approccio generale: supponiamo che un problema si riconduca al calcolo di un

integrale

Sia U la variabile casuale uniforme, allora



 ¹

0

) ( duu

 g

 ( )

) (

1

0

U g E du

u

g 







(41)

Metodo Monte Carlo

 Siano U₁, …, U_k variabili casuali i.i.d. come U allora g(U₁ ), …, g(U_k ) sono variabili casuali i.i.d. aventi

come media 

    







k U

g k E

U

k g

i

i) ( ) , per (

1



(42)

Metodo Monte Carlo

 L’idea è quella di estrarre un insieme i.i.d. di campioni da una pdf target p definita su uno spazio a grandi dimensioni ai quali sono associati dei pesi tale che l’integrale di una qualsiasi funzione misurabile rispetto alla pdf target p(x)

possa essere approssimato dalla somma pesata

 i pesi w_isono determinati dalla stessa pdf

 Tre approcci

 random sampling -> campiono direttamente dalla pdf target

 importance sampling

 MCMC

) ( )

(

1

i N

i

N f w f X

I





 ^X_i _i^N_₁

 ^w_i _i^N_₁





X

dx x p x f f

I X

f

E[ ( )] ( ) ( ) ( )

(43)

Random sampling

 Se è un insieme i.i.d. di campioni generato dalla pdf target p il metodo Monte Carlo approssima la pdf target con la seguente funzione di densità empirica

usando tale densità empirica si può calcolare un’approssimazione dell’integrale I

per la legge dei grandi numeri si ha la convergenza a I(f)

 ^X_i _i^N_₁





 ^N

i

N f x

f N I

1

) 1 (

) (







 ^N

i

xi

N x x

p

1

) 1 (

)

( 

(44)

Importance sampling

 L’ipotesi principale per il random sampling è che si sappia campionare da p(x), ma spesso si ha a che fare con pdf complicate. L’idea alla base dell’IS è usare una pdf dalla quale si sa campionare

Se si possono estrarre N i.i.d. campioni da q(x) e calcolare i pesi p(x)/q(x) una stima Monte Carlo di I(f) sarà data da⁽ ⁾ ¹ ⁽ ⁾ ₍⁽ ₎⁾

1 i

N i i

i

N q x

x x p

N f f

I





)} (

) ) (

( { )

) ( (

) ) (

( )

( q x

x x p

f E dx

x x q

q x x p

f f

I _q

X





(45)

Applicazioni

 Viene utilizzato per:

 simulazione di fenomeni naturali

 simulazione di apparati sperimentali

 calcolo di integrali

 Problemi di natura statistica in cui Monte Carlo viene utilizzato per l’approssimazione di integrali sono ad esempio:

 Inferenza Bayesiana → distribuzione a posteriori non appartiene a famiglie di distribuzioni note, dunque i momenti associati possono essere scritti sotto forma di integrale ma tipicamente non valutati analiticamente;

 Problemi di massimizzazione della verosimiglianza

→ problemi inferenziali in cui la verosimiglianza stessa è funzione di uno o più integrali;

(46)

Risoluzione temporale:

1 ms

Campo magnetico [fT] Campoelettrico [mV]

MEG EEG

M/EEG

(47)

Il problema inverso neuromagnetico

 Il problema inverso della MEG/EEG consiste nel ricostruire l’evoluzione temporale delle sorgenti neuronali a partire dalle misure effettuate

 Approccio statistico Bayesiano alla soluzione dei problemi inversi

) ( ),

(r E r B    )

' (r J 

fisica

matematici

(48)

Approccio Bayesiano

 Ogni variabile è considerata come una variabile aleatoria (B e J sono le v.a. dei dati e

dell’incognita mentre b e j sono le loro realizzazioni)

 La soluzione del problema inverso è la densità di probabilità (pdf) dell’incognita condizionata dalle misure:

) (

) ( )

| ) (

|

( b

j j

b b

j ^pr

post 



  

Teorema di Bayes::

)

pr ( j



)

| (b j



)

 (b

probabilità a priori: contiene l’informazione che abbiamo a priori su J

likelihood: contiene l’informazione sul problema diretto costante di normalizzazione

(49)

Esercizio - calcolo di 

 Supponiamo di lanciare N freccette ad un bersaglio formato da un quadrato di lato L contenente una circonferenza

 Assumiamo che le freccette siano lanciate casualmente all’interno del quadrato e che

quindi colpiscano il quadrato in ogni posizione con uguale probabilità

 Dopo molti lanci la frazione di freccette

che ha colpito la circonferenza sarà uguale al rapporto tra l’area della circonferenza e quella del quadrato

può essere usato per stimare 

N N L

L _c



 



4 1 4 ²

2

N N_c 4

(50)

Esercizio - calcolo di 

 Calcolare  col metodo Monte Carlo

 considerare un quadrato di lato 2 (come in figura) il cui centro coincide con l’origine di un sistema di riferimento Oxy e una circonferenza inscritta in esso

 generare 2 vettori, x e y, di numeri casuali di lunghezza N

 calcolare il numero dei punti (NC) (x,y) così generati che cadono all’interno del cerchio

 stimare  usando la formula

 ripetere per diversi valori di N N

N_c 4

(51)

Campionamento

 In generale non è sufficiente utilizzare sequenze di numeri casuali distribuiti uniformemente

 in molti problemi è necessario disporre di numeri casuali estratti da densità di probabilità diverse, quali la normale, l’esponenziale, la poissoniana, etc

 Esempio:

 Simulare l’energia di una particella con una distribuzione gaussiana intorno ad un valore medio e con una data sigma

 Varie possibilità:

 Metodo dell’inversione

 Metodo del rigetto

(52)

Generare numeri casuali con distribuzione

arbitraria

Metodo di inversione

Sia X una variabile aleatoria continua a valori in R e F : (0,1)  R , la corrispondente funzione di ripartizione cumulativa:

La variabile aleatoria U = F(X) ha una densità di probabilità uniforme nell’intervallo [0,1]

Quindi per campionare una variabile aleatoria X con distribuzione F basta campionare una variabile uniforme in [0,1] e poi considerare X=F^-

1(U)

) (

)

(x P X x

F  

y y

FF y

F X

P y

X F P y

U

P(  )  ( ( )  )  (  ^¹( ))  ^¹( ) 

(53)

Metodo

d’inversione

densità

funzione di

ripartizion e

Il teorema ci fornisce una regola per generare numeri con distribuzione

arbitraria: se

conosciamo F,

prendiamo i numeri {u_i} distribuiti secondo la legge uniforme e {F^-

1(u_i)} sono distribuiti secondo F.

(54)

Esempio: distribuzione esponenziale

La variabile X ~exp(l) ha funzione di ripartizione )

1 ( )

(x e ^x

F   ^^l

) 1

1 log(

)

1(U U

F

X  ^   

l

Generare numeri distribuiti secondo la legge esponenziale: se i numeri {u_i} sono distribuiti secondo la legge uniforme, {F^-1(u_i)} hanno F come funzione di ripartizione.

La variabile X può essere ottenuta come trasformazione di una variabile uniforme

(55)

In MALTAB...

Ora provate...

data = rand(1,1000) hist(data)

data = exprand(1,1,1000) hist(data)

poissrnd Poisson randn Gaussiana

(56)

Variabile aleatoria discreta

 Supponiamo di voler simulare una variabile

aleatoria discreta X che può assumere m valori distinti x_i, i=1,…,m con probabilità

Sia F_kla probabilità cumulativa

Si verifichi che se U è una v.a. uniforme in [0,1] allora la variabile

ha la probabilità desiderata

1 ,

, , 1 ,

)

(   





i i i

i p i n p

x X

P  







 ^k

i

i k

k

k P X x p

F

1

) (





















 m

m

m se F U F

x

F U

F se x

F U

se x

X

1

2 1

2

1 1

, ,



i i

i

i P F U F F F p

x X

P(  )  ( _₁   )   _₁ 

(57)

Variabile aleatoria discreta

 Si scriva una funzione Matlab che, dati un intero n > 0 e i vettori x = [x₁, x₂, . . . , x_m] e p = [p₁, p₂, . . . , p_m], restituisce il vettore y contenente n

campionamenti della variabile aleatoria discreta X.

 Si consideri la variabile aleatoria X tale che:

si calcolino 1000 campioni della variabile

aleatoria e si verifichi la correttezza dei risultati ottenuti confrontando media, varianza e funzione di ripartizione cumulativa (cdf) con i valori

teorici.

2 . 0 ) 1 (

25 . 0 2)

( 1

05 . 0 3)

( 1 4

. 0 4)

( 1 1

. 0 5)

( 1



X P X

P

X P X

P X

P

(58)

Metodo del rigetto

 Obiettivo: Estrarre una sequenza di numeri casuali secondo la distribuzione f(x),

nell’intervallo (x1, x2)

 Metodo:

 Generare x uniforme in (x1,x2)

 Generare y uniforme in (0,fmax)

 Valutare f(x)

 Confrontare y con f(x)

 Se y < f(x) accettare x

 Se y > f(x) ripetere da a) in poi

x₁ x₂

f_max

(59)

Metodo del rigetto

 Si può migliorare l’efficienza del metodo effettuando il campionamento non in un

“rettangolo” ma in una regione definita da una funzione g(x) maggiorante di f(x).

 Se si è in grado di generare numeri casuali distribuiti secondo g(x) per esempio con il metodo dell’inversione, la procedura

dell’inversione diventa:

 Si estrae x secondo g(x)

 Si estrae u con distribuzione uniforme tra 0 e g(x)

 Se u<f(x) si accetta x

(60)

Metodo del rigetto

 I presupposti per utilizzare questo metodo sono:

costruire un’opportuna nuova distribuzione di probabilità g da cui sappiamo come campionare, e definire una funzione “envelope” e(x) tale che e(x) = g(x)/α ≥ f (x)

 Campioniamo Y dalla distribuzione g

 Campioniamo U ∼ Unif (0, 1)

 Eliminiamo il valore Y se U < f (Y)/e(Y)

 Altrimenti, manteniamo il valore X=Y come un campionamento dalla distribuzione obiettivo f

 torniamo al punto iniziale.

 Se riprendiamo il terzo punto, è come se avessimo campionato da Unif (0, e(y)) ed

accettassimo il valore se risulta essere inferiore ad f (y)