4. Metodi di ottimizzazione Indiretti per traiettorie spaziali
4.1 Teoria del controllo Ottimale
33
34 ๐(๐ฅ(๐โ1)+, ๐ฅ๐โ, ๐ก(๐โ1)+, ๐ก๐โ) = 0 ๐ = 1, . . . , ๐ (4.2)
Il problema di ottimo consiste nella ricerca dei valori massimi o minimi relativi di un funzionale che รจ descritto come segue nella sua forma generale:
๐ฝ = ฯ(x(jโ1)+, ๐ฅ๐โ, ๐ก(๐โ1)+, ๐ก๐โ) + (4.3) + โ โซ ฮฆ(๐ฅ(๐ก), ๐ข(๐ก), ๐ก) ๐๐ก ๐ = 1, . . . , ๐
๐ก๐โ
๐ก(๐โ1)โ
๐
Il funzionale J รจ la somma di due componenti:
โข La funzione ฯ che dipende dai valori del vettore delle variabili e della variabile tempo ai contorni.
โข Lโintegrale della funzione ฮฆ che dipende dal tempo e dai valori assunti in ogni punto da variabili e controlli.
โข ร possibile, introducendo opportune variabili ausiliarie, ricondursi alla formulazione di Lagrange, per cui ฯ = 0, o alla formulazione di Mayer, con ฮฆ = 0, questโultima รจ
quella utilizzata in questa tesi.
Si riscrive il funzionale introducendo i moltiplicatori di Lagrange, costanti ๐ associate alle condizioni al contorno, e variabili ๐, le quali sono variabili aggiuntive. Si ottiene dunque:
๐ฝโ= ๐ + ๐๐๐ + โ(๐(๐โ1)๐ +๐ฅ(๐โ1)+โ ๐๐๐โ๐ฅ๐โ ) +
๐
(4.4)
+ โ โซ (ฮฆ + ฮปT๐ โ ๐ฬ๐๐ฅ)๐๐ก
๐ก๐โ
๐ก(๐โ1)+
๐ = 1 , โฆ , ๐
๐
Differenziando si ottiene il differenziale del funzionale stesso:
๐ฟ๐ฝโ= (โ๐ป(๐โ1)++ ๐ฟ๐
๐ฟ๐ก(๐โ1)+ + ๐๐ ๐ฟ๐
๐ฟ๐ก(๐โ1)+) ๐ฟ๐ก(๐โ1)++ (4.3)
+ (๐ป๐โ+ ๐ฟ๐
๐ฟ๐ก๐โ+ ๐๐ ๐ฟ๐
๐ฟ๐ก๐โ) ๐ฟ๐ก๐โ + + (๐(๐โ1)๐ ++ ๐ฟ๐
๐ฟ๐ฅ(๐โ1)++ ๐๐ ๐ฟ๐
๐ฟ๐ฅ(๐โ1)+ ) ๐ฟ๐ฅ(๐โ1)++ + (โ๐๐๐โ+ ๐ฟ๐
๐ฟ๐ฅ๐โ + ๐๐ ๐ฟ๐
๐ฟ๐ฅ๐โ) ๐ฟ๐ฅ๐โ+
+ โ โซ ((๐ฟ๐ป
๐ฟ๐ฅ + ๐ฬ๐) ๐ฟ๐ฅ +๐ฟ๐ป
๐ฟ๐ข๐ฟ๐ข) ๐๐ก ๐ = 1, โฆ , ๐
๐ก๐โ
๐ก(๐โ1)+
๐
Dove si definisce H come lโHamiltoniano del sistema:
๐ป = ฮฆ + ๐๐๐ (4. 4)
35 Per la ricerca dellโottimo รจ necessaria la condizione di stazionarietร del funzionale e dunque lโannullarsi della sua variazione prima per qualunque variazione ๐ฟ๐ฅ, ๐ฟ๐ข, ๐ฟ๐ฅ(๐โ1)+, ๐ฟ๐ฅ๐โ, ๐ฟ๐ก(๐โ1)+, ๐ฟ๐ก๐โ , nella misura in cui รจ compatibile con le equazioni differenziali e le condizioni al contorno. Lโintroduzione di โvariabiliโ e โcostantiโ permette, scegliendole in modo conveniente, di annullare contemporaneamente il coefficiente di ciascuna delle variazioni nellโequazione (4.5), garantendo cosรฌ la stazionarietร del funzionale, quindi ๐ฟ๐ฝโ= 0. Se si annullano i coefficienti di x e u nel termine integrale possono essere derivate due importanti relazioni:
โข Equazioni differenziali di Eulero-Lagrange per le variabili aggiunte:
๐๐
๐๐ก = โ (๐ฟ๐ป ๐ฟ๐ฅ)
๐ (4. 5)
โข Equazioni algebriche per i controlli:
(๐ฟ๐ป ๐ฟ๐ข)
๐
= 0
(4. 6)
Le leggi di controllo presentano una proprietร interessante, ovvero la loro indipendenza formale dal punto stazionario ricercato, quindi la ricerca dei massimi o minimi di J sono formalmente indipendenti. ร necessario mostrare attenzione ai controlli vincolati, poichรฉ questi potrebbero essere limitati da un particolare dominio ammissibile. Ad esempio, la spinta fornita da un propulsore deve essere compresa tra il valore minimo 0 e quello massimo di Tmax, e dunque essere sempre positiva. In questa trattazione non sono considerati i vincoli dei controlli variabili nel tempo o dipendenti da variabili del vettore di stato. Ogni condizione limite sui controlli รจ dunque costante ed esplicita. Se รจ presente tale vincolo, il valore ottimale del controllo vincolato in ogni punto della traiettoria รจ quello che appartenendo al dominio di ammissibilitร , rende massimo, se si cercano i massimi di J, o minimo, se si ricercano i minimi di H, in quel punto. Questo comportamento รจ espresso dal Principio di Massima di Pontryagin, che porta a due possibilitร :
โข Il valore ottimale del controllo รจ quello fornito nellโequazione (4.8) se rientra nel dominio di ammissibilitร . Il controllo risulta localmente non vincolato poichรฉ in quel punto il vincolo non influenza il sistema.
โข Il valore ottimale del controllo si trova agli estremi del dominio. Il controllo assume il valore massimo o minimo, se fornito dallโequazione (4.8) non rientra nel dominio di ammissibilitร . In questo caso il controllo risulta vincolato.
Se lโHamiltoniano รจ lineare rispetto ad uno dei controlli vincolati, il sistema presenta una particolaritร . Nellโequazione (4.8) รจ possibile notare che il controllo non compare in modo esplicito e dunque non puรฒ essere determinato. Si hanno anche in questo caso due possibilitร :
โข Se nellโequazione (4.6) il coefficiente di controllo non รจ nullo, allora H รจ massimizzato assumendo il valore massimo per il controllo se รจ positivo o minimo se รจ negativo. Questo risultato รจ in accordo con il Principio di Massimo di Pontryagin e prende il nome di controllo โbang-bangโ.
36
โข Se nellโequazione (4.6) il coefficiente di controllo รจ nullo allโinterno di un arco singolare, รจ necessario imporre lโannullamento di tutte le derivate successive del coefficiente rispetto al tempo, finchรฉ una di esse non contiene esplicitamente il controllo. Il controllo ottimale รจ dunque ottenuto ponendo uguale a zero lโultima derivata. Si stabilisce che il grado della derivata necessaria รจ sempre pari. Chiamando il grado n della derivata, lโordine dellโarco singolare รจ n/2.
Per le condizioni al contorno mancanti รจ conveniente fare riferimento al j-esimo contorno scrivendo le condizioni che derivano dal considerare come estremo finale del (j-1)-esimo sottointervallo o come estremo iniziale del j-esimo sottointervallo. Annullando nellโordine i coefficienti di ๐ฟ๐ฅ๐โ, ๐ฟ๐ฅ๐+, ๐ฟ๐ก๐โ. ๐ฟ๐ก๐+, nellโespressione (4.5) si ottiene:
โ๐๐๐โ+ ๐ฟ๐
๐ฟ๐ฅ๐โ+ ๐๐[ ๐ฟ๐ ๐ฟ๐ฅ
๐โ
] = 0 ๐ = 1, โฆ , ๐ (4.7)
๐๐๐++ ๐ฟ๐
๐ฟ๐ฅ๐++ ๐๐[๐ฟ๐ ๐ฟ๐ฅ
๐+
] = 0 ๐ = 1, โฆ , ๐ โ 1 (4.8)
๐ป๐๐โ+ ๐ฟ๐
๐ฟ๐ก๐โ + ๐๐ ๐ฟ๐
๐ฟ๐ก๐โ = 0 ๐ = 1, โฆ , ๐ (4.9)
โ๐ป๐๐++ ๐ฟ๐
๐ฟ๐ก๐++ ๐๐ ๐ฟ๐
๐ฟ๐ก๐+ = 0 ๐ = 1, โฆ , ๐ โ 1 (4.10)
Dove ๐โ ๐ ๐+ sono i valori assunti subito prima e subito dopo il punto j. ร fondamentale distinguere i due istante, perchรฉ, come giร introdotto, si puรฒ verificare una discontinuitร nei punti di giunzione degli archi. Le equazioni (4.9) e (4.11) non hanno un significato allโinizio della traiettoria (j=0), mentre le equazioni (4.10) e (4.12) non lo hanno al suo termine (j=n). Se si eliminano le costanti aggiunte ๐ dalle equazioni (4.9) (4.12) si ottengono le condizioni al contorno di ottimo che possono essere definite come:
๐ (๐ฅ(๐โ1)+, ๐ฅ๐โ, ๐(๐โ1)+, ๐๐โ, ๐ก(๐โ1)+, ๐ก๐โ) = 0 ๐ = 1, โฆ , ๐ (4.11)
Il sistema differenziale completo รจ dato dunque dalle equazioni (4.1) (4.2) (4.7) (4.13).
Se si considera una generica variabile di stato x, e sottoposta a particolari condizioni al contorno, le equazioni (4.9) e (4.10) danno valori ottimali particolari per la relativa variabile aggiunta corrispondente ๐๐ฅ:
โข Se il valore della variabile di stato x รจ assegnato allโistante iniziale, ovvero il vettore delle condizioni imposte ๐ contiene lโequazione ๐ฅ0โ ๐ = 0 con a valore esplicito, sulla corrispondente variabile aggiusta non sono presenti condizioni. Pertanto, il valore iniziale della variabile aggiunta ๐๐ฅ0 รจ libero. Si ha una analoga situazione nellโistante finale, se una variabile di stato รจ esplicitamente definita in quel punto.
37
โข Se il valore della variabile di stato ๐ฅ0 non appare nรฉ nella funzione ๐ nรฉ nelle condizioni al contorno, la relativa variabile aggiunta รจ nulla allโistante iniziale ๐๐ฅ0= 0.
Anche in questo caso si ha analoga soluzione nellโistante finale.
โข Se una variabile di stato รจ continua e non assegnata al punto interno ๐ , e dunque ๐ contiene lโequazione ๐ฅ๐+ = ๐ฅ๐โ, la relativa variabile aggiunta รจ anchโessa continua, dunque ๐๐ฅ๐+ = ๐๐ฅ๐โ.
โข Se una variabile di stato รจ continua e assegnata a un contorno interno, ovvero ๐ ha al suo interno le equazioni ๐ฅ๐+ = ๐ฅ๐โ= ๐, la relativa variabile aggiunta possiede una discontinuitร che viene detta libera, ovvero i valori di ๐๐ฅ๐+ e di ๐๐ฅ๐โsono tra loro indipendenti e devono essere determinati dalla procedura di ottimizzazione.
In egual modo, se H non dipende in modo esplicito dal tempo, le equazioni (4.11) e (4.12) possono fornire delle condizioni al contorno particolari:
โข Se il tempo iniziale ๐ก0 non compare in modo esplicito nelle condizioni al contorno e nella funzione ๐ , lโHamiltoniano รจ nullo nellโistante inziale. Si ha lo stesso risultato al tempo finale se non compare in maniera esplicita in ๐ ๐ ๐.
โข Se il tempo intermedio ๐ก๐ non compare in modo esplicito nella funzione ๐, e dunque รจ presente il tempo solo nella condizione di continuitร ๐ก๐+ = ๐ก๐โ, allora lโHamiltoniano รจ continuo in j , ๐ป๐+ = ๐ป๐โ.
โข Se il tempo intermedio ๐ก๐ รจ assegnato, dunque ๐ ha al suo interno le equazioni ๐ก๐+ = ๐ก๐โ = ๐ , lโHamiltoniano in quel punto ha una discontinuitร libera.