Definizione 1 Un istanza di un problema di ottimizzazione ` e rappresentata da una coppia (c, S) dove S ` e un insieme detto regione ammissibile del problema e c ` e una funzione definita su S e a valori reali:

(1)

Ottimizzazione Combinatoria

1 Introduzione

Per specificare cosa sia un problema di ottimizzazione combinatoria ne scompo- niamo la definizione nei suoi due termini. Per prima cosa definiamo cosa sia un problema di ottimizzazione.

Definizione 1 Un istanza di un problema di ottimizzazione ` e rappresentata da una coppia (c, S) dove S ` e un insieme detto regione ammissibile del problema e c ` e una funzione definita su S e a valori reali:

c : S → R

detta funzione obiettivo del problema. Lo scopo di un problema di ottimizzazione

`

e determinare un elemento x ^∗ ∈ S tale che c(x ^∗ ) ≤ c(y) ∀ y ∈ S

se il problema ` e di minimo, oppure un elemento x ^∗ ∈ S tale che c(x ^∗ ) ≥ c(y) ∀ y ∈ S

se il problema ` e di massimo. In entrambi i casi il punto x ^∗ viene detto ottimo globale del problema.

La Figura 1 ci mostra un esempio di problema di minimo con S = [0, 1], in cui

`

e evidenziato l’ottimo globale x ^∗ . Si noti fin da ora anche il punto x ⁰ . Pur non essendo un ottimo globale tale punto ` e un ottimo locale. Per ora ci accontentia- mo di una definizione informale di ottimo locale: un punto ` e un ottimo locale se non ha nelle proprie vicinanze un punto con valore della funzione obiettivo c migliore (ovvero inferiore se il problema ` e di minimo e superiore se il problema

`

e di massimo). Une definizione formale di ottimo locale verr` a data nel seguito.

Passiamo ora al secondo termine: combinatorio. Il termine restringe l’atten-

zione ai soli problemi di ottimizzazione in cui l’insieme S ` e discreto, molto

frequentemente costituito da un numero finito di elementi. Si noti quindi che

l’esempio in Figura 1, in cui S ` e l’intervallo continuo [0, 1], ` e un problema di

(2)

x’ x*

0 1

Figura 1: Un problema di ottimizzazione con S = [0, 1].

ottimizzazione ma non di ottimizzazione combinatoria.

Vedremo ora tre esempi di problemi di ottimizzazione combinatoria che, come vedremo, corrispondono anche a tre diversi gradi di difficolt` a di tali problemi.

2 Esempi di problemi di Ottimizzazione Combi- natoria

2.1 Albero di supporto a peso minimo

Prima di tutto diamo le definizione di grafo.

Definizione 2 Un grafo G ` e formato da una coppia di insiemi (V, A), dove V

(3)

`

e detto insieme dei nodi del grafo e A ` e un sottinsieme delle possibili coppie di nodi.

Il grafo G = (V, A) con

V = {a, b, c, d} A = {(a, b); (b, c); (b, d); (a, d); (c, d)}

`

e illustrato in Figura 3. Diamo ora la definizione di un particolare tipo di grafo detto albero.

Definizione 3 Sia dato un grafo G = (V, A) con card(V ) = n dove card(V ) denota la cardinalit` a (il numero di elementi) dell’insieme V . Si dice che G ` e un albero se soddisfa le seguenti condizioni (equivalenti tra loro)

1. G ` e privo di cicli e connesso (per connesso si intende che esiste almeno un cammino tra ogni coppia di nodi);

2. G ` e privo di cicli e card(A) = n − 1;

3. G ` e connesso e card(A) = n − 1;

4. esiste un unico cammino che congiunge ogni coppia di nodi.

Ad esempio, il grafo G = (V, A) con

V = {a, b, c, d, e} A = {(a, b); (b, c); (c, e); (e, d)}

illustrato in Figura 2, ` e un albero. Diamo ora la definizione di albero di supporto

E E E E E E

, ,

, , XX

XX XX

a

b

c

d

e

Figura 2: Un albero G.

di un grafo generico.

Definizione 4 Sia dato un grafo generico G = (V, A). Si definisce albero di

supporto di G un grafo parziale T = (V, A T ) di G (quindi con A T ⊆ A) che `e

un albero.

(4)

Si noti che un albero di supporto di G deve contenere tutti i nodi di G e che in virt` u del punto 2. (o del punto 3.) della Definizione 3, si dovr` a avere card(A T ) = card(V ) − 1.

Esempio 1 Sia dato il grafo G = (V, A) con

V = {a, b, c, d} A = {(a, b); (b, c); (b, d); (a, d); (c, d)}

illustrato in Figura 3. Un albero di supporto di G ´ e il sottografo T ₁ = (V, A _T

₁

) con

A T

₁

= {(b, c); (b, d); (a, d)}

un altro ` e il sottografo T ₂ = (V, A _T

₂

) con

A T

2

= {(a, b); (b, c); (c, d)}

I due alberi di supporto di G sono illustrati in Figura 3.

E E E E E E ,

, ,

, , Z ,

Z Z

Z ,

, ,

,

, E

E E E E E

#

a

b

c

d

a

b

c

d

a

b d

c

3 5

3

2 2 4

4 3

3 4 5

G

T1 T2

Figura 3: Un grafo G e due suoi alberi di supporto T 1 e T 2 .

Definiamo ora una funzione

w : A → R

che ad ogni arco e ∈ A del grafo associa un peso w(e) (in Figura 3 tale valore `e

riportato sopra ciascun arco). Nel problema dell’albero di supporto a peso mini-

mo la regione ammissibile ´ e composta da tutti i possibili alberi di supporto del

(5)

grafo G, che sono in numero finito. Per ogni albero di supporto T = (V, A _T ) ∈ S la funzione c ` e definita come somma dei pesi degli alberi dell’albero, cio´ e

c(T ) = X

e ∈A

T

w(e).

Quindi il problema dell’albero di supporto a peso minimo consiste nel determi- nare un albero di supporto T ^∗ = (V, A _T

∗

) tale che

c(T ^∗ ) ≤ c(T ) ∀ T ∈ S

La Figura 3 mostra un grafo G e due suoi alberi di supporto con valori di c rispettivamente pari a 9 e 12.

2.2 Il problema dello zaino

Sia dato un insieme {1, . . . , n} di oggetti. Ad ogni oggetto i `e associato un peso p _i > 0 ed un valore v _i > 0. Si ha inoltre a disposizione uno zaino con capacit` a (peso massimo trasportabile) pari a b > 0. La regione ammissibile ´ e formata da tutti i sottinsiemi di oggetti il cui peso complessivo non supera la capacit` a dello zaino e quindi

S = {N ⊆ {1, . . . , n} : X

i ∈N

p _i ≤ b}.

Si noti che S ` e un insieme finito. Infatti card(S) ≤ 2 ⁿ .

La funzione obiettivo ` e definita dalla somma dei valori degli oggetti nel sottin- sieme, ovvero

c(N ) = X

i ∈N

v i .

Il problema ` e un problema di massimo e consiste nel determinare un sottinsieme N ^∗ ∈ S tale che

c(N ^∗ ) ≥ c(N) ∀ N ∈ S,

cio´ e si ricerca il sottinsieme di oggetti il cui peso complessivo non superi la capacit` a dello zaino ed il cui valore complessivo sia massimo.

Esempio 2 Si consideri l’insieme {1, 2, 3, 4} di oggetti con i seguenti valori e pesi

v 1 = 8 v 2 = 6 v 3 = 10 v 4 = 1 p 1 = 7 p 2 = 7 p 3 = 13 p 4 = 4

Si supponga inoltre che la capacit` a dello zaino sia b = 16. Si ha che N 1 =

{1, 4} ∈ S con c(N 1 ) = 9, N 2 = {2, 4} ∈ S con c(N 2 ) = 7, mentre N 3 =

{1, 3} 6∈ S.

(6)

2.3 Problema del commesso viaggiatore

Prima di tutto dobbiamo dare la definizione di circuito hamiltoniano in un grafo.

Definizione 5 Dato un grafo G = (V, A), un circuito hamiltoniano ´ e un cam- mino all’interno del grafo che partendo da un nodo dello stesso tocca tutti gli altri nodi una ed una sola volta e ritorna infine al nodo di partenza.

In Figura 4 ` e rappresentato un grafo G e due suoi circuiti hamiltoniani C ₁ e C ₂ . Nel problema del commesso viaggiatore la regione ammissibile S ` e costituita da

Z Z

Q Q

1 2

3 4

4

8 2 5

2 6

1 2

3 4

5 4 2

8 C1 C2

1 2

3 4

2 6

4 2

Figura 4: Un grafo G e i suoi due circuiti hamiltoniani C 1 e C 2 .

tutti i possibili circuiti hamiltoniani del grafo. Se il grafo ` e completo (cio´ e esiste

(7)

un arco tra ogni coppia di nodi) il numero di tali circuiti ` e pari a (n − 1)!

2 = (n − 1) × (n − 2) × · · · × 3 × 2 × 1

2 , (1)

dove n ` e il numero di nodi. Ad ogni arco e ∈ A `e associato un valore che rappre- senta la ”distanza” da percorrere lungo tale arco (indicata sopra ciascun arco in Figura 4). La funzione obiettivo c associa ad ogni circuito hamiltoniano la som- ma delle ”distanze” degli n archi attraversati dal circuito e rappresenta quindi la ”distanza” complessiva percorsa lungo il circuito. Il problema del commesso viaggiatore ` e un problema di minimo in cui si cerca il circuito hamiltoniano con ”distanza” complessiva minima. In Figura 4 abbiamo che c(C ₁ ) = 19 e c(C ₂ ) = 14.

3 Difficolt` a dei problemi di ottimizzazione com- binatoria

Teoricamente tutte le istanze di ognuno dei tre problemi descritti in precedenza sono risolvibili in modo esatto. Infatti le regioni ammissibili sono tutte costituite da un numero finito di elementi e la seguente procedura, detta di enumerazione completa, risolve il problema: valutare la funzione c per ogni elemento in S e restituire l’elemento con valore di c minimo (o massimo se il problema ` e di massimo). Tuttavia una semplice osservazione metter` a in luce i limiti di questo approccio. Consideriamo il problema del commesso viaggiatore su un grafo completo con numero di nodi n = 22. In base alla formula (1) sappiamo che il numero di circuiti hamiltoniani ´ e pari a

(n − 1)!

2 = 21!

2 > 10 ¹⁹ .

Supponiamo (ottimisticamente) che la valutazione della funzione obiettivo per un singolo circuito hamiltoniano richieda un nanosecondo (10 ⁻⁹ secondi). Ne consegue che la valutazione di tutti i circuiti hamiltoniani richiede pi` u di 10 ¹⁰ secondi che corrispondono ad un tempo superiore ai 200 anni. Ci` o dimostra che sebbene sia sempre possibile teoricamente risolvere tali problemi, in pratica dobbiamo fare i conti con dei limiti temporali e quindi, da un punto di vista pratico, si parler` a di problema risolvibile con una data procedura solo nel caso in cui la procedura restituisca una soluzione in tempi ragionevoli. Ci` o rende la procedura di enumerazione completa accettabile solo per istanze di problemi di dimensioni limitate (quindi per grafi con pochi nodi per i problemi di albero di supporto a peso minimo e del commesso viaggiatore e per istanze con pochi og- getti per il problema dello zaino). La domanda successiva ` e quindi la seguente:

esistono altre procedure che consentono di risolvere in tempi ragionevoli istanze

dei tre problemi visti con dimensioni molto pi` u elevate? La risposta ´ e: dipende

(8)

dal problema. ` E in generale vero che esistono procedure pi` u efficienti dell’enu- merazione completa ma mentre per uno dei problemi (il problema dell’albero di supporto a peso minimo) si possono risolvere in tempi ragionevoli istanze di grandi dimensioni, per il problema dello zaino e, ancor pi` u, per il problema del commesso viaggiatore pu` o essere difficile risolvere anche istanze di dimensioni non troppo elevate. Tutto ci` o ha una formulazione ben precisa nella teoria della complessit` a, della quale si daranno brevi cenni di seguito.

3.1 Le classi P e N P

Ad ogni istanza I di un problema di ottimizzazione combinatoria ´ e associata una dimensione dim(I) che corrisponde alla quantit` a di memoria necessaria per memorizzare (in codifica binaria) tale istanza. Per esempio, l’istanza del proble- ma dello zaino nell’Esempio 1 ha una dimensione pari alla quantit` a di memoria necessaria per memorizzare in codice binario i pesi ed i valori degli oggetti e la capacit` a dello zaino. Consideriamo ora una procedura di risoluzione o algorit- mo A per il problema. La risoluzione dell’istanza I richieder` a un certo numero di operazioni (e quindi un certo tempo) indicato con numop A (I). Fissata una dimensione k vi saranno diverse istanze di dimensione k. L’analisi worst case definisce il tempo t A (k) necessario all’algoritmo A per risolvere istanze di dime- snsione k come il massimo tra tutti i tempi di esecuzione di istanze di dimensione k, cio´ e

t _A (k) = max

I: dim(I)=k

numop _A (I).

Tipicamente non si conosce il valore esatto della funzione t A (k) ma se ne conosce l’ordine di grandezza. Si dice che la funzione t _A (k) = O(f (k)), ovvero che t _A (k)

´

e dell’ordine di grandezza della funzione f (k), se esiste una costante u > 0 tale che

t _A (k) ≤ uf(k) ∀ k.

Costruiamo ora la Tabella 3.1 con diverse possibili funzioni f e diversi valori di k. Come si vede dalla tabella, mentre fino a f (k) = k ³ la crescita di f al crescere di k ` e ragionevole, per f (k) = 2 ^k e ancor pi` u per f (k) = k!, la crescita

`

e rapidissima. Un algoritmo per il quale t A (k) fosse dell’ordine di grandezza di 2 ^k oppure k! si dice che ha complessit` a esponenziale. ` E evidente che un tale algoritmo consente di risolvere in tempi ragionevoli solo istanze di dimensioni limitate. Per questa ragione si cercano per i problemi algoritmi di risoluzione con complessit` a polinomiale, in cui cio´ e la funzione t A ` e dell’ordine di grandezza di un polinomio k ^p per un qualche esponente p. Ovviamente, tanto maggio- re ` e l’esponente p del polinomio, quanto pi` u rapidamente cresce il numero di operazioni dell’algoritmo al crescere di k e quindi quanto pi` u piccole sono le di- mensioni dei problemi che l’algoritmo ` e in grado di risolvere in tempi ragionevoli (gi` a per p = 4 la crescita ` e piuttosto rapida). Tuttavia la crescita polinomiale

`

e sempre preferibile ad una esponenziale. A questo punto ci possiamo chiedere

(9)

f (k) k = 10 k = 20 k = 30 k = 40 k = 50

log ₂ (k) 3.32 4.32 4.90 5.32 5.64

k 10 20 30 40 50

k ² 100 400 900 1600 2500

k ³ 1000 8000 27000 64000 125000

2 ^k 1024 > 10 ⁶ > 10 ⁹ > 10 ¹² > 10 ¹⁵ k! 3628800 > 10 ¹⁸ > 10 ³² > 10 ⁴⁷ > 10 ⁶⁴ Tabella 1: Crescita di alcune funzioni f al crescere di k

se, dato un problema di ottimizzazione combinatoria, possiamo sempre trovare un algoritmo con complessit` a polinomiale che lo risolva. La risposta ´ e: forse, ma ` e molto improbabile. Vediamo di chiarire meglio questa risposta. I proble- mi di ottimizzazione combinatoria per i quali esiste un algoritmo di risoluzione con complessit` a polinomiale formano una classe indicata con P . La classe P ` e un sottinsieme di una classe indicata con N P . Semplificando, si pu` o definire la classe N P come la classe dei problemi per i quali se viene fornita la solu- zione ottima x ^∗ , il calcolo del valore ottimo c(x ^∗ ) pu` o essere fatto in tempo polinomiale. Si ritiene che la classe P sia un sottinsieme proprio della classe N P , ovvero che vi siano problemi nella classe N P che non appartengono alla classe P e quindi per i quali non esistono algoritmi di risoluzione polinomia- li. Nessuno finora ha potuto dimostrare che P ⊂ NP piuttosto che P = NP , ma la congettura pi` u accreditata ´ e che P ⊂ NP . All’interno della classe NP hanno grande importanza i cosidetti problemi N P -completi ¹ . Un problema ´ e N P -completo se l’esistenza di un algoritmo di complessit` a polinomiale per esso implicherebbe che tutti i problemi in N P sono risolvibili in tempo polinomia- le, ovvero che P = N P . I forti dubbi riguardo la possibilit` a che P = N P fanno dunque ritenere che per problemi N P -completi non esistano algoritmi di risoluzione con complessit` a polinomiale. Per tali problemi non vi sono quin- di grosse speranze di risolvere in tempi ragionevoli istanze di dimensioni elevate.

Ma torniamo ora ai nostri tre problemi. Per il problema dell’albero di sup- porto a peso minimo si possono trovare algoritmi di risoluzione con complessit` a polinomiale (ne vedremo uno nel seguito) e quindi tale problema appartiene alla

1

In realt` a per i problemi di ottimizzazione si usa la terminologia N P -difficili, mentre si parla di problemi N P -completi per i corrispondenti problemi di decisione. Il problema di decisione associato ad un problema di ottimizzazione (di minimo) si presenta nella seguente forma: data la funzione obiettivo c, la regione ammissibile S ed un valore M , esiste y ∈ S tale che c(y) ≤ M?

La difficolt` a di un problema di ottimizzazione e del relativo problema di decisione sono del

tutto equivalenti e per questa ragione si ` e semplificata la trattazione omettendo la distinzione

tra i due problemi.

(10)

classe N P . Gli altri due problemi sono invece N P -completi. Quindi, come pre- annunciato, la loro risoluzione ´ e limitata a problemi di dimensione non troppo elevate. Ma anche tra questi problemi pi` u difficili ` e possibile fare un’ulteriore distinzione. Supponiamo che per ogni istanza (c, S) del nostro problema di ot- timizzazione che supporremo di minimo (ma una trattazione del tutto analoga pu` o essere fatta per problemi di massimo) si abbia che

c(x) > 0 ∀ x ∈ S.

Dato un valore r > 0, il problema di r-approssimazione per l’istanza ´ e definito come segue: determinare x ∈ S tale che

c(x) − c(x ^∗ ) c(x ^∗ ) ≤ r,

dove x ^∗ ´ e, come al solito, l’ottimo globale del problema. Il problema di r- approssimazione quindi non cerca l’ottimo del problema ma si ”accontenta” di determinare un elemento della regione ammissibile S il cui valore di c non si di- scosti troppo (per non pi` u di rc(x ^∗ )) dal valore ottimo. Fissiamo ora un r > 0.

Ci si pu` o porre la seguente domanda: esiste un algoritmo di complessit` a polino- miale che ` e in grado di risolvere il problema di r-approssimazione? Anche qui la risposta ´ e: dipende. Per il problema dello zaino si pu` o addirittura dimostrare che per ogni r > 0 esiste un algoritmo che risolve il problema di r-approssimazione in tempo polinomiale rispetto alla dimensione k dell’istanza e rispetto a ¹ _r . Per il problema del commesso viaggiatore si pu` o invece dimostrare che, a meno che non sia vero che P = N P , non esiste un algoritmo con complessit` a polinomiale che risolva il problema di r-approssimazione per ogni r > 0. Quindi, non solo il problema di ottimizzazione ` e N P -completo ma lo sono anche i problemi di r-approssimazione per ogni r > 0. Va notato che esistono anche problemi per i quali il problema di r-approssimazione non ` e risolvibile in tempo polinomiale per valori di r piccoli ma lo ` e per valori di r sufficientemente elevati.

4 Euristiche

Il fatto che un problema sia difficile e non ci possiamo aspettare di determinare in tempi ragionevoli per ogni istanza la soluzione ottima non vuole comunque dire che si debba rinunciare ad affrontare il problema. Pur con la consapevo- lezza di avere a che fare con problemi difficili, si pu` o cercare di determinare in tempi ragionevoli una buona (anche se non necessariamente ottima) soluzione.

Per questo si utilizzano procedure euristiche. Un’euristica deve avere le due caratteristiche appena accennate:

• avere tempi di esecuzione che non crescano troppo rapidamente rispetto

alla dimensione k del problema (polinomiali con esponente non troppo

elevato);

(11)

• restituire soluzioni che sono, almeno per molte istanze del problema, otti- me o comunque vicine a quelle ottime.

Se in particolare l’euristica fornisce la garanzia di restituire sempre una soluzio- ne del problema di r-approssimazione per un qualche r > 0, viene detta anche algoritmo di r-approssimazione. Un’euristica ´ e quindi un compromesso tra il desiderio di determinare l’ottimo globale e quello di avere una soluzione in tem- pi brevi: si rinuncia alla garanzia di ottenere una soluzione ottima (garanzia fornita, ad esempio, dalla procedura di enumerazione completa ma in tempi inacettabili) ma si ottiene una risposta in tempi accettabili. Di seguito vedremo alcuni esempi di euristiche.

4.1 Algoritmo greedy

In un algoritmo greedy la soluzione viene costruita un passo per volta facendo ad ogni passo una scelta greedy (golosa) ovvero una scelta che non ` e necessaria- mente la migliore in assoluto ma ` e la migliore in quel dato momento. Un paio di esempi serviranno a chiarire meglio la strategia greedy.

Esempio 3 Abbiamo il seguente algoritmo greedy per il problema di albero di supporto a peso minimo.

Passo 1 Si ordinino tutti gli m = card(A) archi del grafo in ordine non decre- scente rispetto al peso, cio´ e

w(e 1 ) ≤ w(e 2 ) ≤ · · · ≤ w(e m −1 ) ≤ w(e m ).

Si parta con un insieme A _T di archi vuoto, cio´ e A _T = ∅. Sia k = 1 Passo 2 Se card(A T ) = card(V ) − 1 ci si arresta e si restituisce l’albero T =

(V, A T ) come soluzione. Altrimenti si vada al Passo 3.

Passo 3 Se e _k non forma cicli con gli archi in A _T , lo si aggiunga ad A _T , cio´ e si ponga A _T = A _T ∪ {e k }. Altrimenti si lasci A T invariato.

Passo 4 Si ponga k = k + 1 e si ritorni al Passo 2.

Come esercizio si pu` o applicare tale algoritmo all’esempio in Figura 5. La stra- tegia greedy appare al Passo 3. Infatti, tra tutti gli archi non ancora considerati si va a considerare quello che tra essi ha peso minimo e lo si aggiunge se non forma cicli con quelli gi` a inseriti in A T . Faccio dunque una scelta greedy che ` e la migliore per la particolare situazione in cui mi trovo (ovvero per il particolare insieme di archi A T che ho gi` a inserito nell’albero). Per questo algoritmo gree- dy ` e improprio parlare di euristica. Si pu` o infatti dimostrare che tale algoritmo greedy risolve in modo esatto il problema dell’albero di supporto a peso minimo.

Inoltre, il numero di operazioni di tale algoritmo ` e dell’ordine di m log m e quin-

di l’algoritmo ha complessit` a polinomiale. Ci` o ci consente di inserire, come gi` a

preannunciato, il problema dell’albero di supporto a peso minimo nella classe P .

(12)

" " " " " " " " "

l l

l

hhh hhh

E

E E E E E E E E E E

@

1

2 4 3 5

2 3

4

8 5 6

5 Figura 5: Un grafo G di cui si vuole determinare l’albero di supporto a costo minimo.

Ma vediamo ora un altro esempio in cui siamo meno fortunati e l’algoritmo greedy non restituisce sempre una soluzione ottima.

Esempio 4 Sia dato un problema del commesso viaggiatore che per semplicit` a supporremo su di un grafo completo G = (V, A). Un algoritmo greedy per tale problema ` e il seguente.

Passo 1 Si fissi un nodo di partenza i e lo si inserisca in un insieme W , ovvero W = {i}. Si ponga r = i.

Passo 2 Si consideri il nodo s ∈ V \W con ”distanza” minima dal nodo r, cio´e d rs = min

j ∈V \W d rj ,

dove d _ij denota la ”distanza” da percorrere lungo l’arco (i, j). Si faccia seguire r da s nel circuito.

Passo 3 Si ponga W = W ∪ {s} e r = s. Se W = V ci si arresta chiudendo il circuito andando da s al nodo iniziale i. Altrimenti si ritorni al Passo 2.

In pratica ad ogni iterazione ci si muove dall’ultimo nodo raggiunto, il nodo r, al nodo s che ` e il pi` u vicino (scelta greedy) a r tra tutti quelli non ancora visitati dal circuito. Si pu` o dimostrare che il numero di operazioni di tale algoritmo

`

e dell’ordine di n ² , dove n = card(V ). Si tratta quindi di un algoritmo con

complessit` a polinomiale. Vediamo ora di applicare l’algoritmo sull’esempio in

(13)

"

H H H H

H H H H H

H H H H

H H

H H " " "

" " " "

" "

2 2

1 2

1 M

1

2 3 4

Figura 6: Un grafo G su cui applicare l’algoritmo greedy per determinare il circuito hamiltoniano a ”distanza” minima.

Figura 6 dove M > 0. Partendo dal nodo 1 l’algoritmo si sposta verso il nodo 3.

Da questo si muove verso il nodo 2, dal nodo 2 si va verso il nodo 4 ed infine dal nodo 4 si chiude il circuito ritornando al nodo 1. L’algoritmo restituisce quindi il circuito C 1

1 → 3 → 2 → 4 → 1

con c(C 1 ) = 1 + 1 + M + 2 = 4 + M . Questa ` e la soluzione ottima solo per M ≤ 3 ma per M > 3 la soulzione ottima ´e il circuito C 2

1 → 2 → 3 → 4 → 1

con c(C ₂ ) = 2 + 1 + 2 + 2 = 7. Si pu` o anche notare che per M > 3 c(C 1 ) − c(C 2 )

c(C ₂ ) = 4 + M − 7

7 = M − 3

7 .

Al crescere di M il rapporto cresce all’infinito, mostrando quindi come gi` a tra queste piccole istanze sia sempre possibile trovarne alcune per cui questa eu- ristica non ´ e in grado di risolvere il problema di r-approssimazione per ogni r > 0. Questo non ` e altro che una conferma di quanto gi` a visto in precedenza:

per il problema del commesso viaggiatore ` e improbabile che esista una procedura

di risoluzione polinomiale che risolva il problema di r-approssimazione per ogni

istanza di tale problema. Tuttavia va anche notato che, se non abbiamo speranze

di risolvere neppure in modo approssimato tutte le istanze, ci` o non esclude che

le euristiche (la greedy come altre euristiche per tale problema) possano darci

comunque dei buoni risultati (ottimi o vicini a quelli ottimi) almeno su certe

istanze: nel nostro esempio possiamo notare che per M ≤ 3 l’euristica greedy ci

restituisce addirittura una soluzione ottima.

(14)

4.2 Ricerca locale

Per poter definire un algoritmo di ricerca locale dobbiamo introdurre il concetto di vicinanza per un elemento della regione ammissibile S.

Definizione 6 Una vicinanza N nella regione ammissibile S ` e definita come una funzione

N : S → 2 ^S

che ad ogni elemento x ∈ S associa un sottinsieme di punti di S detti vicini di x.

Dato un problema di ottimizzazione combinatoria non esiste necessariamente un’unica vicinanza per esso.

Esempio 5 Si consideri il problema del commesso viaggiatore. Dato un circuito hamiltoniano C la vicinanza N k (C) con k ≤ n `e costituita da tutti i circuiti hamiltoniani ottenibili rimuovendo k archi da C ed aggiungendo altri k archi (non necessariamente diversi dai precedenti). Per ogni k = 2, 3, . . . , n si ha una diversa vicinanza. Nell’esempio di Figura 7 con n = 5 se considero il circuito C

1 → 2 → 3 → 4 → 5 → 1 la vicinanza N 2 (C) ` e costituita dai 6 circuiti hamiltoniani

1 → 2 → 3 → 4 → 5 → 1 1 → 3 → 2 → 4 → 5 → 1 1 → 4 → 3 → 2 → 5 → 1 1 → 2 → 4 → 3 → 5 → 1 1 → 2 → 5 → 4 → 3 → 1 1 → 2 → 3 → 5 → 4 → 1

Per k = 5 si avr` a invece che N 5 (C) comprende tutti i 12 circuiti hamiltoniani.

Una volta fissata una vicinanza N ` e possibile introdurre la definizione di ottimo locale (limitata ad un problema di minimo ma facilmente estendibile a problemi di massimo).

Definizione 7 Un elemento x ∈ S si definisce ottimo locale (rispetto alla vicinanza N ) se

∀ y ∈ N(x) c(y) ≥ c(x),

cio´ e un punto ` e un ottimo (minimo) locale se ha valore della funzione obiettivo

c non peggiore (non superiore) rispetto a tutti i suoi vicini.

(15)

Z Z

Z A

A A

C C

C

#

# c

c c

c c ,

, , , , , ,

1

2 3 4

5 G

Figura 7: Un grafo completo G con 5 nodi.

Si noti che un punto di ottimo globale ´ e sempre anche un ottimo locale indi- pendentemente dalla vicinanza. Non ` e invece sempre vero il viceversa. Una vicinanza in cui ogni ottimo locale ` e anche ottimo globale viene detta vicinanza esatta. Nel problema del commesso viaggiatore la vicinanza N n (in cui ogni cir- cuito hamiltoniano ha come vicini tutti i circuiti hamiltoniani) ` e esatta, mentre la vicinanza N ₂ non ` e esatta (vi sono ottimi locali che non sono ottimi globali).

Esempio 6 Come ulteriore esempio esaminiamo il problema illustrato in Fi- gura 8 dove S ` e la griglia di punti

{(i, j) : i = 1, . . . , 5 j = 1, . . . , 5}

e la funzione obiettivo (i cui valori sono riporati all’interno dei nodi della griglia)

´

e data da

c(i, j) = 25(i − 2) ² (i − 4) ² + i + 25(j − 2) ² (j − 4) ² + j. (2) La struttura di vicinanza ` e definita nel modo seguente:

N (i, j) = {(i, h) ∈ S : j − 1 ≤ h ≤ j + 1} ∪ {(h, j) ∈ S : i − 1 ≤ h ≤ i + 1}

(nella figura ogni punto (i, j) ` e collegato ai suoi vicini tramite un arco). Si noti che l’ottimo gloable ´ e il punto (2, 2) ma vi sono anche tre ottimi locali non globali: (2, 4), (4, 2) e (4, 4). La vicinanza quindi non ` e esatta. Se definiamo un’altra vicinanza

N ⁰ (i, j) = {(i, h) ∈ S : j − 2 ≤ h ≤ j + 2} ∪ {(h, j) ∈ S : i − 2 ≤ h ≤ i + 2}

(si noti che N ⁰ (i, j) ⊃ N(i, j) per ogni coppia (i, j)), abbiamo invece un unico

ottimo locale e globale, il punto (2, 2), e quindi la vicinanza ` e esatta.

(16)

i=1

i=2

i=3

i=4

i=5

j=1 j=2 j=3 j=4 j=5

52 28 54 30 56

28

54

30

56 4 30

30

6

32

32 56 32

32

58

58 8 34

34 60

Figura 8: Un problema di ottimizzazione combinatoria con una possibile struttura di vicinanza.

Dato un problema di ottimizzazione combinatoria (c, S) ed una vicinanza N per esso, possiamo introdurre un algoritmo di ricerca locale.

Passo 1 Sia x 0 ∈ S e si ponga k = 0.

Passo 2 Se per ogni y ∈ N(x k ) si ha c(y) ≥ c(x k ), ovvero se x k ` e un ottimo locale, allora ci arrestiamo restituendo x k . Altrimenti andiamo al Passo 3.

Passo 3 Si selezioni y ∈ N(x k ) tale che c(y) < c(x k ) e si ponga x k+1 = y.

Passo 4 Si ponga k = k + 1 e si ritorni al Passo 2.

(17)

Per esempio nel problema di Figura 8 posso partire con x ₀ = (5, 5). Da qui posso spostarmi in x 1 = (4, 5) e da qui in x 2 = (4, 4). Essendo x 2 un ottimo locale mi arresto e resituisco il punto x 2 . Se la vicinanza ` e esatta, l’algoritmo di ricerca locale mi restituisce l’ottimo globale. Se non ` e esatta pu` o succedere che mi venga restituito un ottimo locale ma non globale. Nel nostro esempio ´ e esattamente ci` o che accade: ci viene restituito il punto x 2 = (4, 4) che ` e un otti- mo locale ma non globale. Da quanto detto sembrerebbe auspicabile utilizzare sempre vicinanze esatte. Ad esempio, nel problema del commesso viaggiatore sembrerebe auspicabile utilizzare la vicinanza esatta N n piuttosto che quella non esatta N 2 . Ma non dobbiamo dimenticare che a noi non interessa soltanto il risultato di un algoritmo ma anche il tempo necessario per la sua esecuzione.

Nel caso degli algoritmi di ricerca locale il tempo di esecuzione ` e strettamente legato ai tempi necessari per esplorare i vicini del punto corrente ai Passi 2 e 3 dell’algoritmo. Nei problemi pi` u difficili le vicinanze esatte hanno anche di- mensioni molto elevate e la loro esplorazione richiede tempi molto elevati. Ad esempio, la vicinanza N _n del commesso viaggiatore ´ e tale che ogni circuito abbia come vicini tutti i circuiti hamiltoniani e quindi l’esplorazione dei vicini di un circuito si riduce all’enumerazione completa di tutti i circuiti che, come gi` a visto,

`

e eseguibile in tempi ragionevoli solo per istanze molto piccole. Molto minore ´ e il numero di vicini se si usa la vicinanza N 2 (tale numero ` e dell’ordine di n ² ).

D’altra parte usando la vicinanza N 2 non si ha alcuna garanzia che la ricerca locale restituisca un ottimo globale. La scelta di una vicinanza dovr` a basarsi su un compromesso tra tempi di esecuzione e qualit` a della soluzione restituita dalla ricerca locale. Studi sperimentali indicano che la vicinanza N 3 fornisce risultati molto migliori rispetto alla N 2 , seppure in tempi pi` u elevati, mentre i risultati ottenuti con la vicinanza N 4 non sono di molto migliori rispetto a quelli ottenibili con la N ₃ nonostante i pi` u elevati tempi di esecuzione.

4.3 Simulated Annealing

Gli algoritmi Simulated Annealing (SA nel seguito) sono basati su un’analogia con un fenomeno fisico: mentre a temperature elevate le molecole in un liquido tendono a muoversi liberamente, se la temperatura viene decrementata in modo sufficientemente lento, la mobilit` a termica delle molecole viene persa e tendono a formare un cristallo puro che corrisponde anche ad uno stato di minima energia.

Se la temperatura viene decrementata troppo velocemente si parla di quenching

e lo stato finale ` e uno stato policristallino od amorfo con un’energia pi` u elevata di

quella del cristallo puro. Stabilendo un’analogia tra configurazioni di un sistema

fisico ed elementi della regione ammissibile da un lato e tra energia del sistema

e funzione obiettivo dall’altro, ovvero trattando il problema di ottimizzazione

come un particolare sistema fisico, si ` e arrivati a formulare gli algoritmi SA per

problemi di ottimizzazione combinatoria attraverso la simulazione del processo

fisico. Come nel processo fisico una lenta decrescita della temperatura conduce

allo stato di minima energia, allo stesso modo nel problema di ottimizzazione

(18)

combinatoria vogliamo arrivare in un punto (l’ottimo globale) con valore minimo della funzione obiettivo. La struttura degli algoritmi SA ` e la seguente.

Passo 1 Sia x 0 ∈ S e si fissi k = 0.

Passo 2 Si generi in modo casuale un punto y k+1 ∈ N(x k ).

Passo 3 Si ponga x k+1 = y k+1 con probabilit` a pari a min

exp c(x _k ) − c(y k+1 ) T k

, 1

, (3)

dove T _k ` e un parametro non negativo che, per analogia con il fenomeno fisico, viene chiamato temperatura. Altrimenti si ponga x _k+1 = x _k . Nel primo caso si dice che il punto y _k+1 viene accettato come nuovo punto, nel secondo che viene rigettato.

Passo 4 (Cooling Schedule) Si aggiorni il valore T k+1 della temperatura.

Passo 5 Si verifichi un criterio di arresto (ad esempio ci si arresti se il numero k di iterazioni ` e superiore ad un numero prefissato M AXIT ER di ite- razioni). Se il criterio ´ e soddisfatto ci si arresti e si restituisca il miglior elemento di S osservato durante l’esecuzione dell’algoritmo. Se invece non

` e soddisfatto si ponga k = k + 1 e si ritorni al Passo 2.

La probabilit` a (3) viene detta funzione di accettazione di Metropolis. In essa si pu` o notare che ci si sposta sempre in un punto y k+1 se questo ha un valore di c inferiore rispetto al punto corrente x _k , esattamente come avviene in una ricerca locale. Ma la novit` a rispetto alla ricerca locale ´ e che ci si pu` o spostare anche in punti peggiori con una probabilit` a che ` e tanto pi` u bassa quanto peggiore ` e il punto y _k+1 rispetto al punto corrente x _k . Si noti inoltre che tale probabilit` a

´

e controllata dal parametro temperatura: per valori elevati della temperatura ` e molto probabile accettare anche punti di molto peggiori, ma man mano che si decresce la temperatura la probabilit` a di accettare un punto peggiore diventa sempre minore. La ragione per cui si accettano anche punti con valori della funzione obiettivo peggiori ` e che questo ` e il solo modo di sfuggire ad ottimi locali non globali. Nella ricerca locale applicata all’esempio in Figura 8 abbiamo visto come una volta giunti nell’ottimo locale x 2 non siamo pi` u in grado di procedere e siamo costretti ad arrestarci (siamo intrappolati nell’ottimo locale).

In un algoritmo SA possiamo invece sfuggire da un ottimo locale accettando anche punti peggiori rispetto a quello corrente. Per questa ragione tali algoritmi vengono detti hill-climbing, scavalcano le ”colline” che separano tra loro gli ottimi locali.

Una componente essenziale degli algoritmi SA ` e il Passo 4 detto di cooling

schedule, cio´ e il passo in cui si aggiorna la temperatura. Tipicamente si inizia

con una temperatura elevata e di seguito la temperatura viene diminuita nel

(19)

corso delle iterazioni dell’algoritmo. Se potessimo eseguire l’algoritmo per un tempo infinito allora si pu` o dimostrare che con una probabilt` a pari a 1 esso sarebbe in grado di individuare l’ottimo globale, a patto di far decrescere la temperatura in modo sufficientemente lento, proprio come avviene nel fenomeno fisico. In particolare si deve avere ad ogni iterazione k che

T k ≥ M log(k) ,

dove M ` e una costante dipendente dal problema. Una decrescita pi` u rapida (il quenching del fenomeno fisico) pu` o fare in modo che si rimanga intrappolati in un ottimo locale ma non globale. In realt` a sappiamo bene che non si ha mai a disposizione un tempo infinito e neppure molto elevato. Quindi ad una scelta che garantirebbe l’individuazione dell’ottimo globale ma in tempi troppo elevati, si preferisce spesso una scelta di temperature che decrescono pi` u rapidamente.

Tale scelta non esclude di rimanere intrappolati in ottimi locali, ma consente di giungere in tempi pi` u brevi ad una buona soluzione. Non esploreremo oltre la questione delle temperature, precisando per` o che scelte come quale temperatura iniziale utilizzare, quando ridurre la temperatura e di quanto ridurla, sono molto delicate per il buon funzionamento dell’algoritmo e sono tipicamente legate al problema da risolvere. ` E interessante anche osservare quello che succede usando una temperatura costante T k = T . Si pu` o dimostrare che, sotto opportune ipotesi, in condizioni stazionarie la probabilit` a di trovarsi in un punto x ∈ S `e data dalla seguente formula

exp n _c(x

∗

) −c(x) T

o P

y ∈S exp n _c(x

_∗

₎

−c(y) T

o ,

dove x ^∗ denota, come al solito, l’ottimo globale.

4.4 Algoritmi genetici

Diamo ora una breve descrizione di un altro approccio euristico, gli algoritmi

genetici. Anche questi algoritmi nascono da un’analogia, l’analogia con il con-

cetto darwiniano di selezione naturale. Ad una data iterazione k tali algoritmi

lavorano su una ”popolazione” P k di elementi della regione ammissibile S. Da

tale popolazione vengono ”generati” nuovi elementi di S attraverso i processi

di mutazione, che genera nuovi elementi di S modificando singoli elementi della

popolazione P k , e di ricombinazione, che forma nuovi elementi di S mettendo as-

sieme ”pezzi” di coppie di elementi di P k (pi` u in generale la ricombinazione pu` o

riguardare non solo coppie di elementi di P k ma anche pi` u di due elementi della

popolazione; qui ci restringiamo al caso, molto frequente, di ricombinazione di

due elementi). Indicando con O _k i nuovi elementi di S generati tramite muta-

zione e ricombinazione, abbiamo una popolazione allargata P _k ∪ O k . A questo

(20)

punto interviene il processo di selezione: all’iterazione successiva arriver` a un sottinsieme P k+1 di P k ∪ O k , ovvero solo alcuni degli elementi in P k ∪ O k ”so- pravviveranno” e faranno parte della popolazione P k+1 all’iterazione k+1. Nella scelta delle coppie da ricombinare ed anche nella selezione si tendono a favorire elementi della popolazione con un elevato valore di fitness. Come ovvia misura di fitness si pu` o pensare al valore della funzione obiettivo c : tanto pi` u piccolo ` e il valore di c per un elemento in un problema di minimo (tanto pi` u grande in un problema di massimo), quanto maggiore ` e il valore di fitness di tale elemento.

Siamo ora pronti a fornire lo schema di un generico algoritmo genetico.

Passo 1 Si generi una popolazione P 0 ⊂ S e si ponga k = 0.

Passo 2 (mutazione) Si scelgano alcuni elementi in P _k e si generino tramite mutazione nuovi elementi di S. Si inseriscano tali nuovi elementi in un insieme O _k .

Passo 3 (ricombinazione) Si scelgano coppie di elementi in P _k (tipicamente la scelta avviene in modo casuale ma favorendo elementi con un migliore valore di fitness) e si ricombinino tali coppie generando nuovi elementi di S. Si aggiungano tali nuovi elementi in O k .

Passo 4 (selezione) Si determini P k+1 selezionando alcuni degli elementi in P k ∪ O k (tipicamente in P k+1 vengono conservati, tra gli altri, anche un certo numero di elementi con il miglior valore di fitness tra tutti quelli in P k ∪ O k ).

Passo 5 Si verifichi un criterio di arresto. Se ` e soddisfatto ci si arresti re- stituendo la miglior soluzione trovata durante l’esecuzione dell’algoritmo.

Altrimenti si ponga k = k + 1 e si ritorni al Passo 2.

Per illustrare brevemente i processi di mutazione e ricombinazione, possiamo considerare il problema illustrato in Figura 8. Per tale problema il processo di mutazione pu` o essere considerato semplicemente come la generazione di un vi- cino dell’elemento su cui agisce la mutazione. Quindi una mutazione che agisce sull’elemento (4, 5) pu` o generare, ad esempio, l’elemento (4, 4). Pi` u significativa

´

e la ricombinazione. Supponiamo di avere una coppia di elementi (i, j) e (h, k).

Il processo di ricombinazione pu` o agire generando a partire da tale coppia di

elementi, due nuovi elementi: uno con la prima componente del primo elemento

e la seconda del secondo, quindi (i, k) e l’altro con la prima componente del

secondo elemento e la seconda del primo, quindi (h, j). Per esempio se la cop-

pia di elementi ´ e (2, 5) e (5, 2), i due nuovi elementi saranno (2, 2) e (5, 5). ` e

importante notare che mentre i due elementi (2, 5) e (5, 2) sono lontani dall’ot-

timo globale, uno dei loro ”figli” ´ e l’ottimo globale stesso (2, 2). Quindi mentre

nelle ricerche locali, negli algoritmi SA e nella mutazione stessa degli algoritmi

genetici ci possiamo solo spostare in punti vicini, con la ricombinazione possia-

mo anche balzare in un solo colpo in una zona molto lontana da entrambi gli

(21)

elementi della coppia. In certi casi il processo di ricombinazione fornisce dei grossi vantaggi. Questo succede in particolare quando il problema gode di una certa separabilit` a. Non si vuole qui approfondire cosa si intenda per separabilit` a ma ne possiamo dare una nozione intuitiva attraverso il problema di Figura 8.

Se ne osserviamo la funzione obiettivo (2), si nota che essa ` e formata da due termini, uno, (i − 2) ² (i − 4) ² + i, dove compare la sola prima componente degli elementi (i, j) di S, e l’altro, (j − 2) ² (j − 4) ² + j, dove compare la sola seconda componente. In questo caso quindi intendiamo per separabilit` a il fatto che la funzione obiettivo pu` o essere scomposta in due parti dove le componenti che formano gli elementi di S compaiono separatamente. Se osserviamo i due ele- menti (2, 5) e (5, 2) si pu` o notare che il primo elemento ha la prima componente ottima rispetto al primo termine (i − 2) ² (i − 4) ² + i ma non rispetto al secondo termine (j − 2) ² (j − 4) ² + j, mentre per il secondo elemento vale esattamente il viceversa. A questo punto la ricombinazione, mettendo assieme il pezzo buo- no del primo elemento (la prima componente) ed il pezzo buono del secondo (la seconda componente) ` e in grado di generare un nuovo elemento migliore di entrambi (in questo caso addirittura l’ottimo globale).

5 Algoritmi esatti

Per problemi difficili come il problema dello zaino o il problema del commesso viaggiatore sappiamo, in base ai risultati presentati in precedenza, che ` e molto improbabile essere in grado di risolvere istanze del problema di dimensioni ele- vate in tempi ragionevoli. Tuttavia esistono algoritmi che restituiscono l’ottimo globale e che sono molto pi` u efficienti della semplice enumerazione completa.

Tipicamente questi algoritmi si basano sul concetto di enumerazione implicita delle soluzioni, utilizzano cio´ e metodi che consentono di scartare sottinsiemi di elementi di S senza dover valutare per ciascuno di essi la funzione obiettivo c, avendo stabilito che in tali sottinsiemi non vi possono essere soluzioni migliori rispetto alla miglior soluzione nota. Vedremo ora due classi di algoritmi esatti:

gli algoritmi branch-and-bound e quelli di programmazione dinamica.

5.1 Branch-and-bound

Daremo una descrizione di un generico algoritmo branch-and-bound e, di se-

guito, un esempio di tale algoritmo applicato al problema dello zaino. Essendo

quest’ultimo un problema di massimo, descriveremo anche l’algoritmo generi-

co per problemi di massimo. Di seguito segnaleremo le minime variazioni che

vanno introdotte per problemi di minimo. Cominceremo descrivendo le singole

componenti di un algoritmo branch-and-bound.

(22)

5.1.1 Calcolo di un upper bound

Supponiamo di avere un sottinsieme T ⊆ S. Una limitazione superiore o upper bound per T ´ e un valore U (T ) con la seguente propriet` a

U (T ) ≥ c(y) ∀ y ∈ T.

Il valore U (T ) viene calcolato tramite una procedura che deve avere come pro- priet` a quella di poter essere eseguita in tempi brevi (in particolare, il calcolo degli upper bound deve richiedere un tempo molto inferiore rispetto al tempo ne- cessario per risolvere l’intero problema). Tipicamente la scelta di una procedura per il calcolo del’upper bound ` e fortemente legata al particolare problema che si sta risolvendo. Inoltre, non esiste un’unica procedura per un dato problema.

5.1.2 Calcolo del lower bound

Vogliamo ora calcolare un limite inferiore o lower bound per il valore ottimo del nostro problema, ovvero un valore LB con la propriet` a che

LB ≤ c(x ^∗ ).

Si pu` o notare che se prendiamo un qualsiasi elemento y ∈ S e valutiamo in esso la funzione c, il valore c(y) ´ e gi` a un lower bound, dal momento che c(y) ≤ c(x ^∗ ). Durante l’esecuzione di un algoritmo branch-and-bound la funzione c viene valutata per molti elementi di S e come lower bound possiamo prendere il massimo dei valori c per tali elementi. Resta da chiarire da dove ricaviamo gli elementi di S in cui valutare la funzione c durante l’esecuzione dell’algoritmo.

Se si ha a disposizione un’euristica ` e buona norma valutare c nel risultato di tale euristica. Inoltre, durante lo stesso calcolo degli upper bound si pu` o individuare uno o pi` u elementi di S e valutare in essi c.

5.1.3 Branching

L’operazione di branching consiste nel rimpiazzare un insieme T ⊆ S con una sua partizione T 1 , . . . , T m . Si ricordi che T 1 , . . . , T m formano una partizione di T se

T = ∪ ^m i=1 T i T i ∩ T j = ∅ ∀ i 6= j.

La partizione pu` o essere rappresentata tramite una struttura ad albero come in Figura 9: l’insieme T ` e un nodo dell’albero da cui partono i rami (da qui il nome branching) verso i nodi della partizione, che vengono anche detti nodi successori o nodi figli del nodo T .

5.1.4 Cancellazione di sottinsiemi

Veniamo ora al punto chiave degli algoritmi di branch-and-bound, ovvero la

cancellazione di sottinsiemi. Supponiamo che per un dato sottinsieme, T ₂ ad

(23)

@

...

T

T1 T2 Tm

Figura 9: Il passaggio da un insieme ad una sua partizione illustrato tramite una struttura ad albero.

esempio, si abbia

U (T ₂ ) ≤ LB.

Ma questo vuol dire che

∀ y ∈ T 2 c(y) ≤ U(T 2 ) ≤ LB,

e cio´ e tra tutti gli elementi in T ₂ non ne possiamo trovare alcuno con valore di c superiore a LB, ovvero al miglior valore di c osservato fino a questo momento. A questo punto posso cancellare il sottinsieme T ₂ (si veda la Figura 10). In questo senso si parla di enumerazione implicita: il confronto tra upper bound U (T 2 ) del sottinsieme e lower bound LB ci consente di scartare tutti gli elementi in T 2

senza dover calcolare la funzione c in essi.

5.1.5 L’algoritmo branch-and-bound

Siamo ora pronti per mettere insieme le componenti descritte sopra e formulare il generico algoritmo di branch-and-bound.

Passo 1 Si ponga C = {S} (l’insieme C conterr`a sempre i sottinsiemi ancora

da tenere in considerazione e inizialmente contiene l’intero insieme S). Si

ponga k = 1. Si calcoli U (S) e si calcoli un valore per LB (eventualmente

utilizzando anche i risultati di un’euristica, se disponibile).

(24)

@

@ , , , , , , , , , ,

...

T

T1 T2 Tm

Figura 10: La cancellazione del sottinsieme T ₂ nella struttura ad albero.

Passo 2 (Selezione di un sottinsieme) Si selezioni un sottinsieme T ∈ C.

Tra le varie regole di selezione citiamo qui quella di selezionare il sottin- sieme T in C con il valore di upper bound pi`u elevato, cio´e

U (T ) = max

Q ∈C U (Q).

Passo 3 (Branching) Si sostituisca l’insieme T in C con la sua partizione in m k sottinsiemi T 1 , . . . , T m

_k

, ovvero

C = C ∪ {T 1 , . . . , T m

_k

} \ {T }.

Passo 4 (Upper bounding) Si calcoli un upper bound U (T i ), i = 1, . . . , m k

per ogni sottinsieme della partizione.

Passo 5 (Lower bounding) Si aggiorni, eventualmente, il valore LB (si ricor- di che il valore LB corrisponde sempre al massimo dei valori di c osservati durante l’esecuzione dell’algoritmo).

Passo 6 (Cancellazione sottinsiemi) Si escludano da C tutti i sottinsiemi Q per cui U (Q) ≤ LB, ovvero

C = C \ {Q : U(Q) ≤ LB}.

(25)

Passo 7 Se C = ∅: stop, il valore LB coincide con il valore ottimo c(x ^∗ ).

Altrimenti si ponga k = k + 1 e si ritorni al Passo 2.

Va fatto un breve commento circa il Passo 7. Questo dice che se C = ∅ si ha che LB ` e il valore ottimo del nostro problema. Questa affermazione ` e una conseguenza del fatto che, nel momento in cui C = ∅, tutti i sottinsiemi cancellati al Passo 6 formano una partizione dell’intero insieme S. Quindi tra di essi ve ne ´ e certamente uno, indicato con T ^∗ , che contiene x ^∗ . Ma poich´ e T ^∗ ` e stato cancellato si dovr` a avere

c(x ^∗ ) ≤ U(T ^∗ ) ≤ LB ≤ c(x ^∗ ), da cui segue immediatamente che LB = c(x ^∗ ).

Infine, dobbiamo brevemente commentare le modifiche da apportare per tratta- re problemi di minimo. In tali problemi si dovranno semplicemente invertire i ruoli di upper e lower bound: ad un sottinsieme Q ⊆ S dovr`a essere associato un valore di lower bound L(Q); al posto del valore LB avremo un valore U B con la propriet` a U B ≥ c(x ^∗ ); il sottinsieme Q viene cancellato se ` e vero che L(Q) ≥ UB.

5.2 Un algoritmo branch-and-bound per il problema dello zaino

Vediamo ora un esempio di algoritmo branch-and-bound per il problema dello zaino. Rispetto allo schema generale visto in precedenza dobbiamo solo specifi- care alcuni particolari come il calcolo dell’upper bound e la regola per effettuare il branching.

Descriviamo ora una procedura per il calcolo dell’upper bound su sottinsiemi di S con forma speciale e cio´ e

S(I ₀ , I ₁ ) = {N ∈ S : l’oggetto i 6∈ N ∀ i ∈ I 0 ,

l’oggetto i ∈ N ∀ i ∈ I 1 } (4) dove I ₀ , I ₁ ⊆ {1, . . . , n} e I 0 ∩ I 1 = ∅. In altre parole S(I 0 , I ₁ ) contiene tutti gli elementi di S che non contengono gli oggetti in I ₀ e contengono gli oggetti in I 1 . Possono invece indifferentemente contenere o non contenere gli oggetti nell’insieme

I f = {1, . . . , n} \ (I 0 ∪ I 1 ).

Supporremo inoltre che tutti gli oggetti siano stati ordinati in modo non cre- scente rispetto al rapporto valore/peso ^v _p

ⁱ

i

, ovvero v 1

p ₁ ≥ v 2

p ₂ ≥ · · · ≥ v n

p _n .

(26)

Vogliamo ora calcolare U (S(I ₀ , I ₁ )). Utilizzeremo una procedura P che avr` a i seguenti input e output.

INPUT • L’insieme I f = {i 1 , . . . , i k } con i 1 ≤ · · · ≤ i k ;

• il valore b − P

i ∈I

1

p i , ovvero la capacit` a residua dello zaino una volta inseriti gli oggeti in I 1 .

OUTPUT • Il valore U(S(I 0 , I 1 ));

• un elemento di S con il relativo valore della funzione c.

Vediamo ora di descrivere tale procedura.

P [I _f , b − P

i ∈I

1

p _i ]

Passo 1 Si sottraggano successivamente a b − P

i ∈I

1

p _i i pesi degli oggetti in I _f b − X

i ∈I

1

p _i − p i

1

b − X

i ∈I

1

p _i − p i

1

− p i

2

.. . arrestandoci se

Caso A si arriva ad un valore negativo, ovvero esiste r ∈ {1, . . . , k − 1}

tale che

b − X

i ∈I

1

p i − p i

₁

− · · · − p i

_r

≥ 0 ma

b − X

i ∈I

1

p i − p i

1

− · · · − p i

r

− p i

r+1

< 0.

Caso B Si sono sottratti i pesi di tutti gli oggetti in I _f senza mai arrivare ad un valore negativo.

Passo 2 Se ci si trova nel caso A si restituiscano come output:

• U (S(I 0 , I 1 )) = X

i ∈I

1

v i +

r

X

h=1

v i

_h

+ v i

_r+1

× b − P

i ∈I

1

p _i − P r h=1 p _i

_h

p _i

_r+1

.

(27)

• l’elemento N ∈ S definito come segue N = I 1 ∪ {i 1 , . . . , i r }, con il relativo valore

c(N ) = X

i ∈I

1

v i +

r

X

h=1

v i

_h

Nel caso B l’output sar` a:

• U (S(I 0 , I 1 )) = X

i ∈I

1

v i +

k

X

h=1

v i

_h

.

• l’elemento N ∈ S definito come segue N = I 1 ∪ I f , con il relativo valore

c(N ) = X

i ∈I

1

v i +

k

X

h=1

v i

_h

Possiamo notare che questa procedura ci consente di calcolare un upper bound U (S) per S. Si ha infatti che l’insieme S ha la forma (4): ` e sufficiente conside- rare I ₀ = I ₁ = ∅.

Vediamo ora di descrivere l’operazione di branching. Dapprima la descriviamo per l’insieme S e poi l’estendiamo agli altri sottinsiemi generati dall’algoritmo.

Durante la procedura per il calcolo di U (S) tramite la procedura P troviamo nel caso A (il caso B ` e un caso banale in cui tutti gli oggetti possono essere inseriti nello zaino) un indice i r+1 che ´ e il primo oggetto per cui la sottrazione successiva dei pesi assume valore negativo. La regola di branching prescrive di suddividere S nei due sottinsiemi

S( {i r+1 }, ∅) e S(∅, {i r+1 }),

ovvero in un sootinsieme della partizione si aggiunge l’oggetto i r+1 all’insieme I 0 , nell’altro lo si aggiunge all’insieme I 1 . Quanto visto per l’insieme S pu` o essere esteso a tutti i sottinsiemi di forma (4): dato un sottinsieme S(I ₀ , I ₁ ) l’oggetto i _r+1 che appare nel calcolo dell’upper bound nel caso A ² viene aggiunto in I ₀ in

2

se ci si trova nel caso B si pu` o dimostrare che il sottinsieme viene certamente cancellato

e quindi non dobbiamo preoccuparci di fare branching su di esso

(28)

un sottinsieme della partizione di S(I ₀ , I ₁ ) e in I ₁ nell’altro sottinsieme, ovvero la partizione di S(I 0 , I 1 ) sar` a data dai seguenti sottinsiemi

S(I 0 ∪ {i r+1 }, I 1 ) e S(I 0 , I 1 ∪ {i r+1 }).

Si noti che con questa regola di branching tutti i sottinsiemi che appariranno nell’insieme C saranno del tipo S(I 0 , I 1 ) e quindi un upper bound per essi potr` a sempre essere calcolato tramite la procedura P . Per chiarire ulteriormente il funzionamento dell’algoritmo lo applichiamo ora all’Esempio 2.

Esempio 7 Si noti che gli oggetti sono ordinati in modo non crescente rispetto a ^v _p

ⁱ

i

.

v 1

p 1

= 8 7 > v 2

p 2

= 6 7 > v 3

p 3

= 10 13 > v 4

p 4

= 1 4 .

Calcoliamo U (S) tramite la procedura P con input I f = {1, 2, 3, 4} e b = 16. Si ha:

b − p 1 = 9 b − p 1 − p 2 = 2 b − p 1 − p 2 − p 3 = −11, e quindi i _r+1 = 3. La procedura P restituisce

U (S) = 8 + 6 + 10 × 2 13 = 202

13 ,

e l’elemento N 1 = {1, 2} ∈ S con valore di c pari a 14. Possiamo quindi porre LB = 14. Al momento si ha C = {S}.

A questo punto partizioniamo S nei due sottinsiemi S( {3}, ∅) e S(∅, {3}) come illustrato in Figura 11. Avremo quindi C = {S({3}, ∅), S(∅, {3})}. Applichiamo ora la procedura P per calcolare gli upper bound per S( {3}, ∅) e S(∅, {3}).

Per S( {3}, ∅) avremo come input I f = {1, 2, 4} e b = 16, da cui b − p 1 = 9 b − p 1 − p 2 = 2 b − p 1 − p 2 − p 4 = −2, con i r+1 = 4. La procedura restituisce quindi come output

U (S( {3}, ∅)) = 8 + 6 + 1 × 2 4 = 29

2 ,

e l’elemento N 1 = {1, 2} per il quale `e gi`a stata valutata la funzione c e che quindi non consente di migliorare il valore LB.

Per S( ∅, {3}) avremo come input I f = {1, 2, 4} e b − p 3 = 3, da cui b − p 3 − p 1 = −4,

con i _r+1 = 1. La procedura restituisce quindi come output U (S( ∅, {3})) = 10 + 8 × 3

7 = 94

7 ,

(29)

@

S( {3},0) S(0, {3})

S U(S)=202/13 LB=14

Figura 11: Albero di branch-and-bound dopo la prima iterazione.

e l’elemento N ₂ = {3} con il relativo valore c(N 2 ) = 10 che non consente di migliorare il valore LB.

Notiamo immediatamente che

U (S( ∅, {3})) = 94

7 < 14 = LB,

e quindi possiamo cancellare il sottinsieme S( ∅, {3}). Quindi a questo punto si ha C = {S({3}, ∅)}. Ci resta dunque soltanto il sottinsieme S({3}, ∅) che partizioniamo nei due sottinsiemi S( {3, 4}, ∅) e S({3}, {4}) (si ricordi che nel calcolo di U (S( {3}, ∅) si era trovato i r+1 = 4). A questo punto abbiamo C = {S({3, 4}, ∅), S({3}, {4})}. La situazione `e riassunta in Figura 12. Dobbiamo ora calcolare l’upper bound per i due nuovi sottinsiemi.

Per S( {3, 4}, ∅) avremo come input I f = {1, 2} e b = 16, da cui b − p 1 = 9 b − p 1 − p 2 = 2.

Ci troviamo quindi nel caso B e la procedura restituisce quindi come output U (S( {3, 4}, ∅)) = 8 + 6 = 14,

e l’elemento N ₁ = {1, 2} per il quale `e gi`a stata valutata la funzione c e che

quindi non consente di migliorare il valore LB.

(30)

Per S( {3}, {4}) avremo come input I f = {1, 2} e b − p 4 = 12, da cui b − p 4 − p 1 = 5 b − p 4 − p 1 − p 2 = −2,

con i r+1 = 2. La procedura restituisce quindi come output U (S( {3}, {4})) = 1 + 8 + 6 × 5

7 = 93 7 ,

e l’elemento N ₃ = {1, 4} con c(N 3 ) = 9 che non consente di migliorare il valore LB.

Possiamo notare che

U (S( {3, 4}, ∅)) = 14 ≤ 14 = LB, e che

U (S( {3}, {4})) = 93

7 < 14 = LB.

Possiamo cancellare entrambi i sottinsiemi ed avremo quindi C = ∅ (si veda anche la Figura 13, notando come i sottinsiemi cancellati formino una partizione della regione ammissibile S). Ci` o ci permette di concludere che il valore ottimo del nostro problema ` e LB = 14 e la soluzione ottima ` e l’elemento N 1 = {1, 2}.

5.3 Programmazione dinamica

La programmazione dinamica ` e un altro approccio che consente di risolvere problemi in modo esatto. Considereremo solo problemi di massimo ma piccole modifiche consentono di applicare tale approccio anche a problemi di minimo.

La programmazione dinamica ` e applicabile a problemi con determinate propriet` a che andremo ora ad elencare.

1. Il problema pu` o essere suddiviso in n blocchi.

2. In ogni blocco k, k = 1, . . . , n ci si trova in uno degli stati s k appartenenti all’insieme di stati Stati _k .

3. In ogni blocco k si deve prendere una decisione d k appartenente ad un insieme di possibili decisioni D k . L’insieme di possibili decisioni pu` o dipendere dallo stato s k , ovvero D k = D k (s k ).

4. Se al blocco k si prende la decisione d _k e ci si trova nello stato s _k , il blocco k fornisce un contributo alla funzione obiettivo c del problema pari a u(d k , s k ). La funzione obiettivo c sar` a pari alla somma dei contributi degli n blocchi (esistono anche varianti in cui i contributi non si sommano ma si moltiplicano tra loro ma qui ne omettiamo la trattazione).

5. Se al blocco k ci si trova nello stato s _k e si prende la decisione d _k , al blocco

k + 1 ci troveremo nello stato s _k+1 = t(d _k , s _k ). La funzione t viene detta

funzione di transizione (la Figura 14 illustra la transizione).

Definizione 1 Un istanza di un problema di ottimizzazione ` e rappresentata da una coppia (c, S) dove S ` e un insieme detto regione ammissibile del problema e c ` e una funzione definita su S e a valori reali:

Ottimizzazione Combinatoria

1 Introduzione

Per specificare cosa sia un problema di ottimizzazione combinatoria ne scompo- niamo la definizione nei suoi due termini. Per prima cosa definiamo cosa sia un problema di ottimizzazione.

Definizione 1 Un istanza di un problema di ottimizzazione ` e rappresentata da una coppia (c, S) dove S ` e un insieme detto regione ammissibile del problema e c ` e una funzione definita su S e a valori reali:

c : S → R

detta funzione obiettivo del problema. Lo scopo di un problema di ottimizzazione

`

e determinare un elemento x ∗ ∈ S tale che c(x ∗ ) ≤ c(y) ∀ y ∈ S

se il problema ` e di minimo, oppure un elemento x ∗ ∈ S tale che c(x ∗ ) ≥ c(y) ∀ y ∈ S

se il problema ` e di massimo. In entrambi i casi il punto x ∗ viene detto ottimo globale del problema.

La Figura 1 ci mostra un esempio di problema di minimo con S = [0, 1], in cui

`

`

e di massimo). Une definizione formale di ottimo locale verr` a data nel seguito.

Passiamo ora al secondo termine: combinatorio. Il termine restringe l’atten-

zione ai soli problemi di ottimizzazione in cui l’insieme S ` e discreto, molto

frequentemente costituito da un numero finito di elementi. Si noti quindi che

l’esempio in Figura 1, in cui S ` e l’intervallo continuo [0, 1], ` e un problema di

x’ x*

0 1

Figura 1: Un problema di ottimizzazione con S = [0, 1].

ottimizzazione ma non di ottimizzazione combinatoria.

Vedremo ora tre esempi di problemi di ottimizzazione combinatoria che, come vedremo, corrispondono anche a tre diversi gradi di difficolt` a di tali problemi.

2 Esempi di problemi di Ottimizzazione Combi- natoria

2.1 Albero di supporto a peso minimo

Prima di tutto diamo le definizione di grafo.

Definizione 2 Un grafo G ` e formato da una coppia di insiemi (V, A), dove V

`

e detto insieme dei nodi del grafo e A ` e un sottinsieme delle possibili coppie di nodi.

Il grafo G = (V, A) con

V = {a, b, c, d} A = {(a, b); (b, c); (b, d); (a, d); (c, d)}

`

e illustrato in Figura 3. Diamo ora la definizione di un particolare tipo di grafo detto albero.

Definizione 3 Sia dato un grafo G = (V, A) con card(V ) = n dove card(V ) denota la cardinalit` a (il numero di elementi) dell’insieme V . Si dice che G ` e un albero se soddisfa le seguenti condizioni (equivalenti tra loro)

1. G ` e privo di cicli e connesso (per connesso si intende che esiste almeno un cammino tra ogni coppia di nodi);

2. G ` e privo di cicli e card(A) = n − 1;

3. G ` e connesso e card(A) = n − 1;

4. esiste un unico cammino che congiunge ogni coppia di nodi.

Ad esempio, il grafo G = (V, A) con

V = {a, b, c, d, e} A = {(a, b); (b, c); (c, e); (e, d)}

illustrato in Figura 2, ` e un albero. Diamo ora la definizione di albero di supporto

E E E E E E

, ,

, ,

, ,

, , XX

XX XX















a

b

c

d

e

Figura 2: Un albero G.

di un grafo generico.

Definizione 4 Sia dato un grafo generico G = (V, A). Si definisce albero di

supporto di G un grafo parziale T = (V, A T ) di G (quindi con A T ⊆ A) che `e

un albero.

Si noti che un albero di supporto di G deve contenere tutti i nodi di G e che in virt` u del punto 2. (o del punto 3.) della Definizione 3, si dovr` a avere card(A T ) = card(V ) − 1.

Esempio 1 Sia dato il grafo G = (V, A) con

V = {a, b, c, d} A = {(a, b); (b, c); (b, d); (a, d); (c, d)}

illustrato in Figura 3. Un albero di supporto di G ´ e il sottografo T 1 = (V, A T

) con

A T

= {(b, c); (b, d); (a, d)}

un altro ` e il sottografo T 2 = (V, A T

) con

A T

= {(a, b); (b, c); (c, d)}

I due alberi di supporto di G sono illustrati in Figura 3.

E E E E E E ,

, ,

, ,

e determinare un elemento x ^∗ ∈ S tale che c(x ^∗ ) ≤ c(y) ∀ y ∈ S

se il problema ` e di minimo, oppure un elemento x ^∗ ∈ S tale che c(x ^∗ ) ≥ c(y) ∀ y ∈ S

se il problema ` e di massimo. In entrambi i casi il punto x ^∗ viene detto ottimo globale del problema.

illustrato in Figura 3. Un albero di supporto di G ´ e il sottografo T ₁ = (V, A _T

un altro ` e il sottografo T ₂ = (V, A _T

grafo G, che sono in numero finito. Per ogni albero di supporto T = (V, A _T ) ∈ S la funzione c ` e definita come somma dei pesi degli alberi dell’albero, cio´ e

Quindi il problema dell’albero di supporto a peso minimo consiste nel determi- nare un albero di supporto T ^∗ = (V, A _T

c(T ^∗ ) ≤ c(T ) ∀ T ∈ S

p _i ≤ b}.

Si noti che S ` e un insieme finito. Infatti card(S) ≤ 2 ⁿ .