5.4 Identicazione black-box mediante modelli ingresso/uscita . 34
5.4.2 Teoria per l'identicazione di modelli ingresso/uscita 35
5.4.2.1 Modelli ARX, ARMAX e Box-Jenkins
Nei modelli ingresso/uscita a scatola nera l'andamento dell'uscita viene legato a quello degli ingressi mediante un'equazione alle dierenze al cui interno viene precisata sia l'inuenza di valori passati di input e output nel determinare il valore attuale dell'uscita che un termine aggiuntivo di errore, utile nel descrivere disturbi e non linearità del processo vero. Nei modelli ARX
y (t) = a1y (t − 1) + ... + anay (t − na) + b1u (t − 1) + ... + bnbu (t − nb) + ξ (t)
il termine di errore ξ viene scelto come semplice rumore bianco a me-dia nulla; così facendo si sottintende di cogliere con il modello la struttu-ra vestruttu-ra del processo, a meno di disturbi di fondo di castruttu-rattere totalmen-te imprevedibile. Il modello ARX è rappresentato in forma operatoriale dall'equazione: A z−1 y (t) = B z−1 u (t − 1) + ξ (t) con A z−1 = 1 − a1z−1− ... − anaz−na e B z−1 = b1+ b2z−1+ ... + bnbz−nb+1
in cui z−1 indica l'operatore di ritardo ad un campione.
In altri tipi di modelli IN/OUT, quali gli ARMAX ed i Box-Jenkins, il termine di errore presenta per contro una struttura colorata; in questo caso l'idea è che in uscita non intervengano solo disturbi bianchi, ma errori dovuti al ltraggio di rumori (bianchi) agenti a monte o comunque in qual-che altro punto del processo da identicare. Una modellizzazione siatta ha il vantaggio di conglobare tipiche situazioni reali nelle quali una sorgente di disturbo può agire in qualsiasi punto dell'impianto, non necessariamente nella misura nale. Il rovescio della medaglia è rappresentato dall'elevato onere computazionale richiesto durante l'identicazione.
Il modello ARMAX è rappresentato, in forma operatoriale, dall'eq.(5.4) A z−1 y (t) = B z−1 u (t − 1) + C z−1 ξ (t) (5.4) mentre l'ancora più generale Box-Jenkins dall'eq.(5.5)
y (t) = B z
−1 F (z−1)u (t) +
C z−1
dove A, B, C, D, F sono polinomi nell'indeterminata z−1i cui coecienti costituiscono i parametri da identicare5.
Al di là delle dierenze analitiche dei vari modelli, il procedimento che porta all'identicazione dei parametri delle equazioni alle dierenze fa uso comune dell'approccio predittivo. Il modello scelto viene cioè scritto in forma di predittore ottimo ad un passo di campionamento e successivamente vengono computati gli errori di predizione tra uscita misurata e quella predetta dal modello. I parametri sono determinati al ne di minimizzare l'errore quadratico medio di predizione (loss function).
5.4.2.2 Calcolo del predittore ad un passo
Si consideri il modello più generale possibile, descritto operatorialmente dall'equazione alle dierenze
y (t) = G z−1 u (t − 1) + W z−1 ξ (t) (5.6) in cui si è convenuto indicare con G e W due funzioni di trasferimento. Questa scrittura contempla sia il caso ARX
G z−1 =B z
−1 A (z−1), W z
−1 = 1 A (z−1) che il caso ARMAX
G z−1 =B z −1 A (z−1), W z −1 =C z −1 A (z−1) e Box-Jenkins G z−1 = B z −1 F (z−1), W z −1 =C z −1 D (z−1).
Imponendo la limitatezza della quantità W z−1 ξ (t), come deve essere quando si vuole che il modello (5.6) denisca in modo sensato il legame ingresso/uscita, ci si può sempre ricondurre ad una riscrittura in cui W abbia numeratore e denominatore stabili, coprimi, monici e di ugual grado. Si ipotizzi di essere proprio in questa situazione e si dividano ambo i membri dell'eq.(5.6) per W sommando e sottraendo y(t); si ha allora
y (t) = 1 − 1 W (z−1) y (t) + G z −1 W (z−1)u (t − 1) + ξ (t) in cui il termine
5L'operatore z−1 denisce il ritardo ad un passo di campionamento: la scrittura operatoriale z−1v (t)rappresenta pertanto il valore v (t − 1) del segnale.
1 − 1
W (z−1)
y (t)
dipende in realtà solo dai valori dell'uscita y antecedenti il tempo t. Que-sto segue dal fatto che la lunga divisione dei polinomi a numeratore e de-nominatore di W porta ad avere 1
W (z−1) = 1 + α1z−1+ α2z−2 + ... con opportuni αi. Di conseguenza 1 − 1 W (z−1) y (t) = α1z−1+ α2z−2+ ... y (t) da cui emerge l'indipendenza da y (t). Anche il termine
G z−1
W (z−1)u (t − 1)
è funzione di soli valori passati (dell'ingresso stavolta). Rammentando la bianchezza di ξ (t), la conoscenza di valori passati di ingressi ed uscita non serve in alcun modo alla sua valutazione; dunque il predittore ottimo ad un passo per il generico modello denito dall'eq.(5.6), è semplicemente
ˆ y (t|t − 1) = 1 − 1 W (z−1) y (t) + G z −1 W (z−1)u (t − 1) . (5.7) 5.4.2.3 Errore di predizione e minimizzazione della loss function L'eq.(5.7) viene utilizzata per costruire gli errori di predizione tra uscita misurata e quella predetta dal modello sulla base di misure passate. L'errore o residuo di predizione è denito come
ε (t) = y (t) − ˆy (t|t − 1)
ed un buon criterio nella scelta dei parametri del modello è la minimiz-zazione della loss function
JN(θ) = 1 N N X t=1 ε (t)2 (5.8)
in cui N rappresenta il numero di misure raccolte sull'impianto per le quali è stato possibile computare l'errore di predizione, mentre θ indica il vettore dei parametri del modello (coecienti dei polinomi) e ricorda come l'indice di costo sia funzione del modello.
Nel caso di modelli ARX, per i quali il predittore (5.7) è lineare nei parametri, l'algoritmo di ottimizzazione della quantità (5.8) non presenta particolari dicoltà e va sotto il nome di metodo dei minimi quadrati (Least
Square, LS). Quando invece si passa ad una struttura ARMAX o Box-Jenkins, l'espressione del predittore perde in linearità e la minimizzazione della loss function richiede algoritmi più complessi (ad es. il metodo di Newton della discesa del gradiente).
La bontà di un modello non può però basarsi solamente sulla minimiz-zazione della (5.8). Avere un errore ε basso non è infatti suciente. Si pensi[19] al caso di errori bassi ad ogni istante temporale ma di media non nulla; in tale circostanza vi sarebbe un errore sistematico tra realtà e mo-dello e le predizioni risulterebbero dare un valore sempre più alto, o sempre più basso, rispetto alla misura vera. Oppure si guardi al caso di un errore ε limitato, di media nulla, ma di segno alterno: agli istanti pari positivo e per i campioni dispari negativo: un simile comportamento non caratte-rizza un buon modello in quanto esiste una dinamica nel residuo, cioè un legame tra i suoi campioni e si potrebbe, con un diverso modello, arrivare a previsioni più accurate; difatti la conoscenza dell'errore al tempo attuale permetterebbe di avere informazioni aggiuntive sulla dinamica futura del segnale di uscita.
Un modello non solo deve essere caratterizzato da un errore quadrati-co medio quadrati-contenuto ma deve presentare in aggiunta un residuo privo di regolarità: anché ciò accada i suoi campioni devono essere fra loro com-pletamente incorrelati. In termini probabilistici si chiede che il residuo sia un rumore bianco a media nulla. Per questo, dopo aver identicato il mo-dello di un sistema, ne va testata l'aderenza a dati possibilmente diversi da quelli utilizzati nella stima e contemporaneamente va eettuato un test di bianchezza sul residuo. Il modo in cui quest'ultima analisi può essere condotta è di vericare se le autocorrelazioni dell'errore di predizione sono pressoché nulle per vari ritardi (lag) dei suoi campioni (eccetto il ritardo nullo, che dà la varianza del residuo). Autocorrelazioni nulle signica infat-ti assenza di legami tra i vari campioni del segnale, condizione equivalente a chiedere una totale imprevedibilità nel suo andamento (bianchezza).