Bastioni Gran SassoV. CortoV. Stretto

(1)

Claudio Arbib

Università dell’Aquila

Ricerca Operativa

Problemi di cammino ottimo

(2)

Sommario

• Il problema del cammino più breve

• Il problema del cammino più sicuro

• Una formulazione come PL 0-1

– Proprietà della formulazione

– Risoluzione come programmazione lineare

• Applicazione del metodo primale-duale

• Confronto con il metodo di Dijkstra

(3)

Il cammino più breve

• Trovandovi in s volete raggiungere il punto t.

Qual è la strada più breve?

s

t

Via Verdi Via Verdi

Piazza Dante

Corso Magellano Corso Magellano

Bastioni Gran Sasso

L.go Augusto

Corso Ateneo V.le T

raiano

V. Corto V. Stretto

Via Marco Polo

(4)

Il cammino più breve

• Trovandovi in s volete raggiungere il punto t.

Qual è la strada più breve?

s

t

1 2 7 14 15 19

20 18 21

12 13 11

9 5 4

3 6 8 17

16 10

(5)

Il cammino più breve

• Associando a ogni arco uv del grafo un peso c_uv pari alla distanza tra i suoi estremi, si tratta di trovare un

(s, t)-cammino di peso minimo

s

t

1 2 7 14 15 19

20 18 21

12 13 11

9 5 4

3 6 8 17

16 10

Cos’è un (s, t)-cammino?

(6)

Il cammino più breve

Per ogni X ⊆ E, il peso di X è c(X) = ∑_uv∈X c_uv ℑ = {X ⊆ E: X è un (s, t)-cammino}

min_X_∈ℑ c(X)

s

t

1 2 7 14 15 19

20 18 21

12 13 11

9 5 4

3 6 8 17

16 10

Problema di ottimizzazione

combinatoria Problema di ottimizzazione

combinatoria

(7)

Il cammino più sicuro

Se la città pullula di delinquenti, è tuttavia meglio cercare di minimizzare la probabilità di incontrarli

s

t

1 2 7 14 15 19

20 18 21

12 13 11

9 5 4

3 6 8 17

16 10

(8)

Il cammino più sicuro

Sia p_uv la probabilità di non incontrare delinquenti lungo il tratto uv.

Se le probabilità associate ad archi diversi sono indipendenti, la probabilità di non incontrarne lungo uv e vw è p_uv·p_vw

s

t

1 2 7 14 15 19

20 18 21

12 13 11

9 5 4

3 6 8 17

16 10

(9)

Il cammino più sicuro

Sia p_uv la probabilità di non incontrare delinquenti lungo il tratto uv.

Se le probabilità associate ad archi diversi sono indipendenti, la probabilità di non incontrarne lungo uv e vw è p_uv·p_vw

s

t

1 2 7 14 15 19

20 18 21

12 13 11

9 5 4

3 6 8 17

16 10

La probabilità di non incontrare delinquenti lungo il cammino verde è p_s,1· p_1,3· p_3,4· p_4,5· p_5,10· p_10,11· p_11,6· p_6,8· p_8,17· p_17,18· p_18,21· p_21,t

(10)

Il cammino più sicuro

Per ogni X ⊆ E, il peso di X è p(X) = Π_uv∈X p_uv max_X∈ℑ p(X)

s

t

1 2 7 14 15 19

20 18 21

12 13 11

9 5 4

3 6 8 17

16 10

La probabilità di non incontrare delinquenti lungo il cammino verde è p_s,1· p_1,3· p_3,4· p_4,5· p_5,10· p_10,11· p_11,6· p_6,8· p_8,17· p_17,18· p_18,21· p_21,t

(11)

Il cammino più sicuro

Per ogni X ⊆ E, il peso di X è p(X) = Π_uv∈X p_uv max_X∈ℑ p(X)

max_X∈ℑ log[p(X)]

= max_X_∈ℑ log[Π_uv_∈_X p_uv]

= max_X∈ℑ ∑_uv∈X _log(p_uv₎

= min_X_∈ℑ ∑_uv_∈_X _[–log(p_uv_)]

Ponendo c_uv = –log(p_uv) > 0

ci si riconduce al problema di trovare un (s, t)-cammino X di peso c(X) minimo

⇔⇔⇔⇔

(12)

Formulazione come PL 0-1

Sia x_uv ∈ {0, 1} con il seguente significato:

x_uv = 1 ⇒ uv ∈ al cammino X cercato x_uv = 0 ⇒ uv ∉ al cammino X cercato Il peso di X si scrive dunque

cx = ∑_uv_∈_E _c_uv_x_uv

Osserviamo ora il comportamento dell’espressione

∑_u:uv∈E _x_uv _– ∑_u:vu∈E _x_vu

al variare di v∈V

s t

a b

x_sa = 1

x_ab = 1

x_bt = 1

b c

d a

a

a a

x_uv = 0

(13)

Formulazione come PL 0-1

Per v = s vi è un solo arco di P che esce dal nodo

∑_u:uv_∈_E _x_uv _– ∑_u:vu_∈_E _x_vu _{= –}∑_u:su_∈_E _x_su _{= –1}

Per v = t vi è un solo arco di P che entra nel nodo

∑_u:uv∈E _x_uv _– ∑_u:vu∈E _x_vu ₌ ∑_u:ut∈E _x_ut _{= 1}

s t

a

b

a a

(14)

Formulazione come PL 0-1

Per v ≠ s, t se v∈W vi sono esattamente un arco uscente e uno entrante nel nodo

∑_u:uv_∈_E _x_uv _– ∑_u:vu_∈_E _x_vu = 1 – 1 = 0

se v∉W nessun arco entra o esce dal nodo

∑_u:uv_∈_E _x_uv _– ∑_u:vu_∈_E _x_vu = 0 – 0 = 0

s t

a

b

a a

(15)

Formulazione come PL 0-1

In definitiva, ogni x ∈ {0, 1}^|E| che sia vettore caratteristico di un (s, t)- cammino dovrà verificare le condizioni

∑_u:uv_∈_E _x_uv _– ∑_u:vu_∈_E _x_vu = –1 per v = s

(1) ∑_u:uv∈E _x_uv _– ∑_u:vu∈E _x_vu = +1 per v = t

∑_u:uv∈E _x_uv _– ∑_u:vu∈E _x_vu = 0 per v ≠ s, t

Viceversa, non è detto che tutti i gli x ∈ {0, 1}^|E| che verificano le condizioni (1) siano vettori caratteristici di (s, t)-cammini

s t

v

In v la (1) è soddisfatta ma gli archi blu non

formano un cammino

(16)

Formulazione come PL 0-1

In definitiva, ogni x ∈ {0, 1}^|E| che sia vettore caratteristico di un (s, t)- cammino dovrà verificare le condizioni

∑_u:uv_∈_E _x_uv _– ∑_u:vu_∈_E _x_vu = –1 per v = s

(1) ∑_u:uv∈E _x_uv _– ∑_u:vu∈E _x_vu = +1 per v = t

∑_u:uv∈E _x_uv _– ∑_u:vu∈E _x_vu = 0 per v ≠ s, t

Viceversa, non è detto che tutti i gli x ∈ {0, 1}^|E| che verificano le condizioni (1) siano vettori caratteristici di (s, t)-cammini

s t

v

In v la (1) è soddisfatta ma gli archi blu non

formano un cammino

(17)

Formulazione come PL 0-1

Per capire com’è fatto l’insieme dei vettori 0-1 che soddisfano le condizioni

∑_u:uv∈E _x_uv _– ∑_u:vu∈E _x_vu = –1 per v = s

(1) ∑_u:uv_∈_E _x_uv _– ∑_u:vu_∈_E _x_vu = +1 per v = t

∑_u:uv_∈_E _x_uv _– ∑_u:vu_∈_E _x_vu = 0 per v ≠ s, t osserviamo che in forma matriciale queste si riscrivono

Gx = e_t – e_s cioè

div(x) = e_s – e_t

s t

x è dunque la distribuzione di un flusso unitario con divergenza 1 in s,

–1 in t, e 0 altrove Poiché però una circolazione unitaria

x’ ha divergenza nulla, x + x’ è ancora soluzione del problema

(18)

Formulazione come PL 0-1

In conclusione, le soluzioni del problema

(P) min cx

Gx = e_t – e_s

0 < x < 1, intero sono distribuzioni di flusso

unitario con sorgente in s e pozzo in t

Come possiamo garantire che corrispondano a degli (s, t)-cammini?

1) Richiedendo che G sia privo di circuiti: in questo caso G non ammette circolazioni, oppure

2) Richiedendo che c_uv sia > 0 per ogni uv ∈ E: in questo caso se x + x’ è ammissibile e ottima con x’ circolazione, allora

x è ammissibile e cx < c(x + x’) dunque x è ammissibile e ottima

(19)

Formulazione come PL

Se dunque si ha c_uv > 0 per ogni uv ∈ E, osservando che la matrice G è totalmente unimodulare e che il vettore e_t – e_s è intero, si conclude che i vertici del rilassamento lineare di (P) sono tutti a componenti intere, dunque una soluzione ottima di base di

(P_R) min cx

Gx = e_t – e_s 0 < x < 1

corrisponde a un (s, t)-cammino di peso minimo

E se c ≥ 0 e G contiene circuiti?

(20)

Esempio

s t

3 5

2 6

1

7 4

13

9

12

31 8

12 14

5 12 7

4 5

flusso unitario 6

(21)

Esempio

s t

3 5

2 6

1

7 4

13

9·1

12· ¼

32·¾ 8·¼

12 14·1

5·1 12·1 7

4·¼ 5·1

flusso unitario 6

Costo della soluzione: cx = 9·1 + 5·1 + 12·1 + 14·1 + 12·¼ + + 8·¼ + 4·¼ + 32·¾ + 5·1 = 75 Eliminando la circolazione sugli archi 23, 34, 42

(22)

Esempio

s t

3 5

2 6

1

7 4

13

9·1

12· ¼

32·¾ 8·¼

12 14

5 12 7

4·¼ 5·1

flusso unitario 6

Costo della soluzione: cx = 9·1 + 5·0 + 12·0 + 14·0 + 12·¼ + + 8·¼ + 4·¼ + 32·¾ + 5·1 = 44 Eliminando la circolazione sugli archi 23, 34, 42

Un flusso unitario sul cammino 17 costa 32, mentre sul cammino 13, 35, 57 costa 12 + 8 + 4 = 24.

Spostando il flusso del primo cammino (¾) sul secondo

(23)

Esempio

s t

3 5

2 6

1

7 4

13

9·1

12· 1

32 8·1

12 14

5 12 7

4·1 5·1

flusso unitario 6

Costo della soluzione: cx = 9·1 + 5·0 + 12·0 + 14·0 + 12·1 + + 8·1 + 4·1 + 32·0 + 5·1 = 38

Eliminando la circolazione sugli archi 23, 34, 42

Un flusso unitario sul cammino 17 costa 32, mentre sul cammino 13, 35, 57 costa 12 + 8 + 4 = 24.

Spostando il flusso del primo cammino (¾) sul secondo

(24)

Esempio

s t

3 5

2 6

1

7 4

13

9·1

12· 1

32 8·1

12 14

5 12 7

4·1 5·1

flusso unitario 6

Esercizio 1 Consideriamo il rilassamento

min cx

Gx = e_t – e_s x > 0

nel quale si è rimosso il vincolo x < 1. Supponendo c > 0, esistono soluzioni ammissibili che assegnano flusso > 1 a qualche arco?

Può accadere che nessuna soluzione ottima rappresenti un (s, t)-cammino?

(25)

Risoluzione come PL

Per risolvere il problema dell’(s, t)-cammino minimo, oltre al noto

– metodo di Dijkstra

possiamo dunque ricorrere a un qualsiasi metodo di programmazione lineare, ad esempio

– al metodo del simplesso – al metodo primale-duale

Vediamo cosa comporta l’applicazione del secondo

metodo

(26)

Applicazione del Primale-Duale

Siano dati G = (V, E) e s, t ∈ V con |V| = n, |E| = m

Adottiamo per il problema primale la formulazione standard

(P) min cx

Gx = e_t – e_s

x > 0 (vedi Esercizio 1)

Poiché la matrice G ha rango n – 1 si può rimuovere una riga, ad esempio quella corrispondente al nodo s. Detta G’ la matrice risultante, P si riscrive

(P) min cx

G’x = e_t x > 0 e il duale è

(D) max ye_t = y_t

yG < c

(27)

Applicazione del Primale-Duale

Poiché la matrice G ha rango n – 1 si può rimuovere una riga, ad esempio quella corrispondente al nodo s. Detta G’ la matrice risultante, P si riscrive

(P) min cx

G’x = e_t x > 0 e il duale è

(D) max ye_t = y_t

yG’ < c con y = (y₁, y₂, …, y_t)

s

3 2

1 13 t

9

1

14 5

2 10

min 9x_s1 + 13x_s2 + 2x₁₂ + 5x₂₃ + 14x_2t + x₃₁ + 10x_3t x_s1– x₁₂ + x₃₁ = 0

x_s2 + x₁₂ – x₂₃ – x_2t = 0 x₂₃ – x₃₁ – x_3t = 0

x_2t + x_3t = 1 x_uv > 0 ∀uv∈E

(28)

Applicazione del Primale-Duale

In dettaglio il duale si scrive

(D) max y_t

y_v – y_u < c_uv ∀uv∈E dove si assume y_s = 0

s

3 2

1 13 t

9

1

14 5

2 10

min 9x_s1 + 13x_s2 + 2x₁₂ + 5x₂₃ + 14x_2t + x₃₁ + 10x_3t x_s1– x₁₂ + x₃₁ = 0

x_s2 + x₁₂ – x₂₃ – x_2t = 0 x₂₃ – x₃₁ – x_3t = 0

x_2t + x_3t = 1 x_uv > 0 ∀uv∈E

(29)

Applicazione del Primale-Duale

(D) max y_t

s

3 2

1 13 t

9

1

14 5

2 10

max y_t

y₁< 9, y₂ < 13 y₂ – y₁ < 2 y₁ – y₃ < 1 y₃ – y₂ < 5 y_t – y₂ < 14 y_t – y₃ < 10

Osserviamo che siccome c_uv > 0, y_u° = 0 ∀u∈V è una soluzione ammissibile.

0

0 0

A partire da questa costruiamo gli insiemi Z₀ = {uv∈E: y_v° – y_u° = c_uv} N₀ = {uv∈E: y_v° – y_u° < c_uv}

(30)

Applicazione del Primale-Duale

(D) max y_t

s

3 2

1 13 t

9

1

14 5

2 10

Z₀ = ∅ N₀ = E

Osserviamo che siccome c_uv > 0, y_u° = 0 ∀u∈V è una soluzione ammissibile.

0

0 0

A partire da questa costruiamo gli insiemi Z₀ = {uv∈E: y_v° – y_u° = c_uv} N₀ = {uv∈E: y_v° – y_u° < c_uv}

(31)

Applicazione del Primale-Duale

Scriviamo ora il duale ridotto associato a y°

(DR₀) max y_t

y_u < 1 ∀u∈V – {s}

y_v – y_u < 0 ∀uv∈Z₀

s

3 2

1 13 t

9

1

14 5

2 10

Z₀ = ∅ N₀ = E

0

0 0

DR₀) max y_t

y_u < 1 ∀u∈V – {s}

Se la soluzione ottima y^* di DR₀ ha valore 0 (cioè se y_t^* = 0), allora y° è ottima.

Altrimenti (cioè se y_t^* > 0) occorre alterare y° di un termine θ^*y^*.

0

1 1

1

1 y_t* = 1

(32)

Applicazione del Primale-Duale

s

3 2

1 13 t

9

1

14 5

2 10

Z₀ = ∅ N₀ = E

0

0 0

DR₀) max y_t

y_u < 1 ∀u∈V – {s}

Se la soluzione ottima y^* di DR₀ ha valore 0 (cioè se y_t^* = 0), allora y° è ottima.

Altrimenti (cioè se y_t^* > 0) occorre alterare y° di un termine θ^*y^*.

0

1 1

Si ha θ^* = min_uv∈J

0{ } = min_uv∈J

0{ }

c_uv – y°·G_uv y^*·G_uv

c_uv – y_v° + y_u° y_v^* – y_u^*

dove J₀ = {uv ∈ N₀: y_v^* – y_u^* > 0}, e siccome per uv ∈ N₀ si ha y_v^* – y_u^* = 1 θ^* = min_uv∈J

0{c_uv – y_v° + y_u°}

y_t* = 1

(33)

Applicazione del Primale-Duale

Z₀ = ∅ N₀ = E

0

0 0

Se la soluzione ottima y^* di DR₀ ha valore 0 (cioè se y_t^* = 0), allora y° è ottima.

Altrimenti (cioè se y_t^* > 0) occorre alterare y° di un termine θ^*y^*. Si ha θ^* = min_uv∈J

0{ } = min_uv∈J

0{ }

c_uv – y°·G_uv y^*·G_uv

c_uv – y_v° + y_u° y_v^* – y_u^*

dove J₀ = {uv ∈ N₀: y_v^* – y_u^* > 0}, e siccome per uv ∈ N₀ si ha y_v^* – y_u^* = 1 θ^* = min_uv∈J

0{c_uv – y_v° + y_u°}

θ^* = min{9 – 0 + 0, 13 – 0 + 0} = 9

y¹ = y° + 9y^* J₀ = {s1, s2}

0

9 9

0

1 1

s

3 2

1 1

14 5

2 10 13

9

t

(34)

Applicazione del Primale-Duale

Z₀ = ∅ N₀ = E

Osserviamo che l’insieme J₀ contiene tutti gli archi uv di G diretti da nodi con potenziale y_u^* = 0 a nodi con potenziale y_v^* = 1.

In altri termini:

il vettore y* dei potenziali ridotti divide V in due insiemi di nodi:

S = nodi a potenziale ridotto 0 T = nodi a potenziale ridotto 1

e l’insieme J₀ è formato dagli archi del taglio (archi blu) associato a questa partizione che sono diretti da S a T.

J₀ = {s1, s2}

0

9 9

0

1 1

s

3 2

1 1

14 5

2 10 13

9

t

(35)

Applicazione del Primale-Duale

Z₁ = {s1}

N₁ = E – {s1}

A partire dalla nuova soluzione y¹ si costruiscono i due insiemi Z₁ = {uv∈E: y_v¹ – y_u¹ = c_uv}

N₁ = {uv∈E: y_v¹ – y_u¹ < c_uv} e il duale ridotto

(DR₁) max y_t

y_u < 1 ∀u∈V – {s}

y_v – y_u < 0 ∀uv∈Z₁

0

9 9

0

1 1

s

3 2

1 1

14 5

2 10 13

9

t

archi di J₀ in corrispondenza ai quali si è calcolato θ^*

DR₁) max y_t

y_u < 1 ∀u∈V – {s}

y₁ – y_s < 0

Poi si procede al calcolo di una soluzione ottima y^* per DR₁.

(36)

Applicazione del Primale-Duale

Z₁ = {s1}

N₁ = E – {s1}

Osserviamo che se un nodo v è raggiungibile da s attraverso un arco di Z₁, il suo potenziale ridotto y_v^* non potrà superare 0.

Perciò una soluzione ottima di DR_k avrà valore y_t^* = 1 fin tanto che il nodo t non sarà raggiungibile da s usando archi di Z_k.

0

1 1

1 3

14 5

10

13 t

DR₁) max y_t

y_u < 1 ∀u∈V – {s}

y₁ < y_s = 0

1

2

Di qui si procede per il calcolo di θ^*= min_uv∈J

1{c_uv – y_v¹ + y_u¹} J₁ = {s2, 12}

La nuova partizione S, T di V individua il nuovo taglio J₁.

s 2

0

y_t* = 1

0

9 9

9

(37)

Applicazione del Primale-Duale

Z₁ = {s1}

N₁ = E – {s1}

Osserviamo che se un nodo v è raggiungibile da s attraverso un arco di Z₁, il suo potenziale ridotto y_v^* non potrà superare 0.

Perciò una soluzione ottima di DR_k avrà valore y_t^* = 1 fin tanto che il nodo t non sarà raggiungibile da s usando archi di Z_k.

0

1 1

1

14 5

10

0 13

1 1

1 0

0

9 9

1 9

Di qui si procede per il calcolo di θ^* = min_uv∈J

1{c_uv – y_v¹ + y_u¹} J₁ = {s2, 12}

La nuova partizione S, T di V individua il nuovo taglio J₁.

θ^* = min{13 – 9 + 0, 2 – 9 + 9} = 2

y² = y¹ + 2y^*

Notiamo che il potenziale y_u¹ dei nodi di S (cioè dei nodi a potenziale ridotto 0) non viene alterato. Questo potenziale rappresenta la distanza minima di u da s.

2

11 11

11

s 2

t

3

(38)

Applicazione del Primale-Duale

Z₂ = {s1, 12}

N₂ = E – {s1, 12}

0

1 1

1 0

1

10 13

1 0

9

1 9

J₂ = {23, 2t}

θ^* = min{c₂₃ – y₃² + y₂², c_2t – y_t² + y₂²}

s

3

DR₂) max y_t

y_u < 1 ∀u∈V–{s}

y₁ < y_s = 0 y₂ < y₁

14

= min{5 – 11 + 11, 14 – 11 + 11} = 5

11 11

11

2

16

t16

5

y³ = (0, 9, 11, 11, 11) + 5·(0, 0, 0, 1, 1)

2

0

(39)

Applicazione del Primale-Duale

Z₂ = {s1, 12}

N₂ = E – {s1, 12}

0

1 1

1 0

1

10 13

1 0

9

1 9

J₂ = {23, 2t}

θ^* = min{c₂₃ – y₃² + y₂², c_2t – y_t² + y₂²}

s

3

DR₂) max y_t

y_u < 1 ∀u∈V–{s}

y₁ < y_s = 0 y₂ < y₁

14

= min{5 – 11 + 11, 14 – 11 + 11} = 5

11 11

11

2

16

t16

5

y³ = (0, 9, 11, 11, 11) + 5·(0, 0, 0, 1, 1)

0

1

1 13

0

0 0

9

1 9

s

3

11

2

16

5

Z₃ = {s1, 12, 23}

N₃ = E – {s1, 12, 23}

J₃ = {2t, 3t}

θ^* = min{c_2t – y_t³ + y₂³, c_3t – y_t³ + y₃³} DR₃) max y_t

y_u < 1 ∀u∈V–{s}

y₁ < y_s = 0 y₂ < y₁ y₃ < y₂

y⁴ = (0, 9, 11, 16, 16) + 5·(0, 0, 0, 1, 1)

2

0 = min{14 – 16 + 11, 10 – 16 + 16} = 9

0

10 t 25

14

(40)

Applicazione del Primale-Duale

0

1

0

1 13

0

0 0

9

1 9

s

3

11

2

16

5

DR₄) max y_t

y_u < 1 ∀u∈V – {s}

y₁ < y_s = 0 y₂ < y₁

y₃ < y₂ y_t < y₂ obbliga a porre y_t^* = 0.

2

10 t 25

14

A questo stadio della computazione si ha Z₄ = {s1, 12, 23, 2t}.

Gli archi di Z₄ (blu a tratto grosso) individuano un albero dei cammini minimi dal nodo s a tutti gli altri nodi di G.

In altri termini, il nodo t è raggiungibile da s attraverso archi di Z₄, per cui il duale ridotto

0

Il metodo primale-duale si arresta e la soluzione corrente y⁴ è ottima.

(41)

Considerazioni riepilogative

Il metodo primale-duale applicato al problema dell’(s, t)-cammino minimo si comporta sostanzialmente simulando una trazione di un modello fisico inestensibile del grafo operata sui nodi s e t

Inizialmente si dispongono i nodi di G su una linea a potenziale 0

0 6 12 18 24 30

1 9

s

3 2

5 2

10 t

13 1

14

(42)

Considerazioni riepilogative

Successivamente si estende il grafo portando i nodi a distanza θ^*

0 6 12 18 24 30

1 9

s

3 2

5 2

10 t

13 1

14

(43)

9 0

Considerazioni riepilogative

1 9

s

3 2

5 2

10 t 13

1

14

6 12 18 24 30

(44)

6 9 1112 18 24 30 0

Considerazioni riepilogative

1 9

s

3 2

5 2

10 t 13

1

14

(45)

16

6 9 1112 18 24 30

0

Considerazioni riepilogative

1 9

s

3 2

5 2

10 t

13 1

14

(46)

16

6 9 1112 18 24 30

0

Considerazioni riepilogative

1 9

s

3 2

5 2

t

13 1

14

25

10

(47)

16

6 9 1112 18 24 30

0

Considerazioni riepilogative

1 9

s

3 2

5 2

t

13 1

14

Esercizio 2 Confrontare il metodo primale-duale con quello di Dijkstra

25

10