• Non ci sono risultati.

Diagnostica autoadattativa di sistemi autoregressivi: applicazione all'impianto di rareddamento di un autoveicolo

N/A
N/A
Protected

Academic year: 2021

Condividi "Diagnostica autoadattativa di sistemi autoregressivi: applicazione all'impianto di rareddamento di un autoveicolo"

Copied!
138
0
0

Testo completo

(1)
(2)
(3)

Indice

1 Premessa 7

2 Introduzione 9

3 Stato dell'arte 11

4 Principio di funzionamento dell'impianto di rareddamento degli

autoveicoli 17

4.1 Introduzione . . . 17

4.2 Circuito di rareddamento . . . 17

4.3 Individuazione delle relazioni causa/eetto del sistema . . . 18

5 Identicazione del sistema di rareddamento 21 5.1 Introduzione . . . 21

5.2 Rilevazione dei dati dal sistema . . . 22

5.2.1 Lo standard CAN-bus . . . 22

5.2.2 Scelta del periodo di campionamento . . . 26

5.2.2.1 Densità spettrale di potenza . . . 26

5.2.2.2 Calcolo dello spettro dei segnali estratti dal-l'autoveicolo . . . 28

5.3 Identicazione gray-box: modello in spazio di stato e ltro di Kalman . . . 30

5.3.1 Modello sico . . . 30

5.3.2 Diagnostica mediante ltro di Kalman . . . 32

5.4 Identicazione black-box mediante modelli ingresso/uscita . 34 5.4.1 Introduzione . . . 34

5.4.2 Teoria per l'identicazione di modelli ingresso/uscita 35 5.4.2.1 Modelli ARX, ARMAX e Box-Jenkins . . . 35

5.4.2.2 Calcolo del predittore ad un passo . . . 36

5.4.2.3 Errore di predizione e minimizzazione della loss function . . . 37

5.4.3 Modelli ottenuti con campionamento a 0.32 secondi 38 5.4.4 Modelli ottenuti con campionamento a 1 secondo . . 42

5.5 Identicazione black-box mediante modelli di stato . . . 43

5.5.1 Introduzione . . . 43

(4)

5.5.3 Aspetti relativi alla determinazione dell'ordine di

sta-to a partire da misure rumorose . . . 46

5.5.4 Identicazione di un modello di stato per il sistema di rareddamento . . . 46

5.6 Identicazione black-box di serie temporali . . . 49

5.6.1 Introduzione . . . 49

5.6.1.1 Identicazione di modelli AR . . . 49

5.6.1.2 Identicazione di modelli MA . . . 51

5.6.1.3 Identicazione di modelli ARMA . . . 52

5.6.1.4 Scelta della classe di modelli per serie tem-porali . . . 53

5.6.1.5 Scelta dell'ordine nei modelli AR: AIC e MDL 55 5.6.1.6 Capacità di generalizzazione del modello AR(1) 57 5.6.2 Costruzione di modelli per la temperatura del liquido di rareddamento . . . 60

5.6.2.1 Modelli ARMA per la temperatura dell'acqua 60 5.6.2.2 Modelli AR per la temperatura dell'acqua . 65 6 Diagnostica autoadattativa del sistema di rareddamento 71 6.1 Introduzione . . . 71

6.2 Idee generali nella scelta delle tecniche diagnostiche . . . 71

6.2.1 Guasti e variazioni parametriche . . . 73

6.2.2 Guasti e perdita di bianchezza . . . 75

6.3 Identicazione on-line dei parametri di un modello . . . 77

6.3.1 Minimi quadrati ricorsivi . . . 77

6.3.2 Minimi quadrati ricorsivi con fattore di oblio . . . . 81

6.4 Test di bianchezza del residuo di modello . . . 84

6.4.1 Test dei cambi di segno . . . 84

6.4.2 Test di Anderson . . . 85

6.4.3 Test del correlogramma . . . 87

6.5 Diagnostica in linea ed autoadattatività . . . 88

6.5.1 Strategia a memoria statica . . . 89

6.5.2 Strategia a memoria autoadattativa . . . 89

6.5.2.1 Bianchezza e derivata del correlogramma . 91 7 Realizzazione software dell'apparato diagnostico 99 7.1 Introduzione . . . 99

7.2 Diagnostica parametrica . . . 99

7.2.1 Rimozione della media e calcolo ricorsivo del parametro101 7.2.2 Aggiornamento adattativo del parametro nominale . 103 7.2.3 Blocco decisionale di diagnosi parametrica . . . 103

7.3 Diagnostica di bianchezza . . . 104

7.3.1 Calcolo del correlogramma . . . 105

(5)

7.3.3 Aggiornamento adattativo della derivata nominale . 106

7.3.4 Blocco per la diagnosi di bianchezza . . . 107

7.4 Ulteriori elementi della realizzazione software . . . 107

7.4.1 Blocco AR_Transient_Neglect . . . 107

7.4.2 Blocco Running Detrend . . . 108

7.4.3 Blocco RecursiveEstimator . . . 108 7.4.4 Blocco SteadyDetection . . . 108 7.4.5 Blocco AR_AlfaNom . . . 109 7.4.6 Blocco AR_Parameter_Diagnosis . . . 109 7.4.7 Blocco AR_CorrelogramDer . . . 110 7.4.8 Blocco AR_CorrelogramDerNom . . . 110 7.4.9 Blocco AR_Whiteness_Diagnosis . . . 110 8 Simulazioni 113 8.1 Introduzione . . . 113

8.2 Descrizione dei dati utilizzati nella simulazione . . . 113

8.2.1 Storia della temperatura di rareddamento . . . 113

8.2.2 Analisi dei diagrammi velocità-potenza della vettura 116 8.3 Simulazione della diagnostica parametrica . . . 117

8.4 Simulazione della diagnostica di bianchezza . . . 121

8.5 Commento ai risultati ottenuti . . . 124

9 Conclusioni e sviluppi futuri 127 10 Appendici 129 10.1 Algoritmo di Durbin-Levinson . . . 129

(6)
(7)

1 Premessa

Questa tesi è frutto del periodo che mi ha visto ospite dell'azienda veneziana S.A.T.E. nell'anno accademico 2014/2015.

Il lavoro si inserisce in un progetto di diagnostica per sottosistemi di autoveicoli: nello specico la tesi aronta il problema della previsione di guasti all'impianto di rareddamento di una vettura sfruttando tecniche di modellizzazione a scatola nera a partire dai dati acquisiti sul sistema.

(8)
(9)

2 Introduzione

Se no alla prima metà del secolo scorso la grande ambizione delle scienze matematiche in generale, e di quelle ingegneristiche in particolare, era la deduzione di modelli atti a descrivere un qualsivoglia fenomeno reale, dagli anni '70 l'attenzione si è spostata verso un nuovo orizzonte: la diagnostica di sistemi sici mediante tecniche modellistiche.

Senza ombra di dubbio l'approccio modellistico alla diagnostica dei si-stemi (model-based diagnostic) si è sviluppato sulla base delle tecniche di identicazione dei modelli allo stato dell'arte.

Pertanto lo studio dell'identicazione dei modelli è servito non solo a dettare le procedure per la messa in equazioni dei fenomeni, ma ha rappresentato la concausa nella nascita dell'era moderna della diagnostica. La stessa nozione di diagnosi ha vissuto una graduale evoluzione. In principio intesa come semplice monitoraggio del sistema in questione, ben presto ha rinnovato le sue vesti per diventare ambizioso sinonimo di rilevazione precoce di guasti. Questa distinzione non riguarda solamente la diversa scala temporale insita nel problema ma trova fondamento nelle complementari tecniche richieste nei due problemi. E' intuitivo pensare che un semplice monitoraggio non chieda altro che una visione esterna del feno-meno sotto controllo; feno-meno banale è invece l'idea alla base di una previsione dei malfunzionamenti in un sistema, la quale necessita di una conoscenza molto più robusta del processo, ossia di una visione interna del fenomeno, capace di condensare in sé tutto quel complesso di relazioni causa-eetto, di parametri e di ritardi intrinseci il cui risultato è appunto la dinamica di processo. Il modo per costruire tale conoscenza è quello di ricavare una rappresentazione matematica (modello) capace di simulare accuratamente il processo su cui la diagnostica deve essere progettata.

In questa tesi verrà preso in considerazione proprio il problema della diagnostica inteso come capacità di prevedere dei malfunzionamenti prima che questi abbiano un carattere irreversibile sul sistema. Il contesto di applicazione è quello dell'impianto di rareddamento di un autoveicolo.

(10)

sico o gray-box), si sostituirà la consapevolezza che una rappresentazione sintetica, in grado di approssimare il comportamento del processo senza attribuire necessariamente un signicato sico ai parametri del modello, comporta minori dicoltà progettuali (modelli a scatola nera o black-box: saranno analizzati grazie al software Matlab, modelli ARMAX, di stato, AR e ARMA). Questa fase di modellistica, anche detta processo di identica-zione, è necessaria per dedurre la classe di rappresentazioni, intesa come il tipo e l'ordine del modello, maggiormente adatta alla simulazione del si-stema di rareddamento. Per questa scelta ci si baserà su leggi siche o, in seguito, su misure precedentemente raccolte dal sistema reale durante alcune sessioni di test. In altri termini la scelta della struttura del modello sarà eseguita o-line.

La trattazione teorica delle (due) tecniche diagnostiche applicate al si-stema di refrigerazione sarà oggetto del capitolo 6; in quella sede saranno descritte la diagnostica parametrica (nella quale la decisione dello stato di salute dell'impianto si valuta dallo scostamento tra i valori dei parametri del modello stimati nel corso del funzionamento e quelli nominali di buon fun-zionamento) e la diagnostica di bianchezza (per la quale la decisione sullo stato di salute viene basata sulle proprietà statistiche dell'errore tra le mi-sure reali e le simulazioni del modello). Verrà inoltre discussa la possibilità di minimizzare i test o-line per la determinazione dei parametri nomi-nali, rimandando la loro stima ad un contesto on-line parallelo all'azione diagnostica (autoadattatività dello schema diagnostico).

Nel capitolo 7 saranno fornite informazioni generali per l'implementazio-ne software delle tecniche di diagnosi (tramite Simulink). Queste ultime verranno poi testate sulla storia di un reale impianto di rareddamento di un autoveicolo, comprensivo di guasti con diversa entità e tipologia (capi-tolo 8). Lo schema di gura 2.1 mostra il percorso logico arontato nella tesi.

(11)

3 Stato dell'arte

La diagnostica di processi industriali ha assunto un notevole interesse a partire dagli anni '70 quando l'avanzamento nello studio delle tecniche di stima, ltraggio ed identicazione cominciava a consentire una trattazione analitica rigorosa del problema.

Dicile comunque individuare un pioniere di questa materia che rappre-senta forse la terza branca dell'automatica, a metà strada tra le questioni inerenti l'identicazione e quelle relative al design del controllo. Se è vero infatti che non può esistere una robusta diagnostica senza il ricorso all'iden-ticazione di un modello statico, dinamico o probabilistico del processo, è altrettanto assodato che il progetto di uno schema di controllo a retroazione non può prescindere da un'accurata analisi delle problematiche inerenti il guasto di attuatori, di componenti del processo e di sensori.

Non è tuttavia errato individuare in R. E. Kalman una gura decisiva nello sviluppo delle tecniche di diagnostica. Il suo apporto alla stima dello stato per processi dinamici descritti in spazio di stato, venne infatti ben presto sfruttato da Deyst e Deckert[1] nel rilevamento di anomalie in siste-mi di controllo per ambito aerospaziale. L'idea in sé era quella di modellare i bruschi malfunzionamenti all'attuazione o nei sensori di uscita con delle variazioni nei valori della matrice di stato del processo o con un incremento della varianza del rumore di misura; una stima degli stati e dell'uscita eet-tuata tramite il ltro di Kalman è poi in grado di catturare gli scostamenti delle variabili dai loro andamenti nominali.

Il principale svantaggio di un simile modo di procedere è però insito nella natura stessa delle equazioni ricorsive del ltro stimatore come già eviden-ziato da Fagin[2], Tarn e Zaborszky[3] e da Jazwinski[4], i quali provarono come l'usuale ltro di Kalman tenda ad essere, alla lunga, poco reattivo ai nuovi dati e dunque insensibile a quei guasti che si manifestino dopo una lunga storia del processo.

(12)

i molteplici sensori di uscita, quello aetto da un'anomalia, risaltata nella corrispondente componente del residuo. La maggiore limitazione del meto-do di Beard e Jones stava nel ristretto campo di applicabilità del metometo-do, valido solamente per sistemi lineari e tempo-invarianti, come osservato da Willsky[7].

Un'estensione del metodo a sistemi tempo-varianti fu argomento degli articoli di Davis[8] e di Chien[9], i quali formularono il problema diagno-stico in termini probabilistici: il processo da monitorare veniva modellato da un'equazione dierenziale stocastica con parametri aleatori e tempo-varianti. La probabilità di guasto era computata in base alla variazione nella distribuzione statistica dei parametri nel tempo.

Di orientazione probabilistica fu anche il lavoro di Mehra e Peschon[10], in cui vengono suggeriti un certo numero di test statistici da applicare alle innovazioni del processo di interesse diagnostico. Tra questi emerge il test chi-quadro che deve il suo nome alla distribuzione di probabilità di una variabile aleatoria legata alle cross-correlazioni del residuo di modello. Una versione modicata del test d'ipotesi chi-quadro è implementata in questa tesi allo scopo della previsione di anomalie nel sistema di rareddamento tramite la tecnica di bianchezza.

Sebbene i test proposti da Mehra e Peschon siano stati catalogati dalla letteratura come semplici metodi di allarme, utili nell'evidenziare l'insor-gere di anomalie ma inadatti all'isolamento delle stesse, la loro semplicità implementativa ne assicura una sempre rinnovata competitività in quelle applicazioni dove una precoce rilevazione di malfunzionamenti è più impor-tante del dare una precisa collocazione sica al guasto. Qualora invece la questione dell'isolamento rivesta maggiore interesse l'approccio statistico non è suciente e deve essere sostituito, o comunque aancato, da una conoscenza sica più profonda del processo in essere.

(13)

dia-rappresentare fedelmente la dinamica del processo (gura 3.1).

Figura 3.1:Schema diagnostico generale (diagnosi basata sul modello).

Lo scostamento tra la realtà indicata dalle misure raccolte sul campo e quella derivante dalla simulazione del modello è visto come variabile sinto-matica della diagnosi. Quali debbano essere nel dettaglio le grandezze da confrontare per formare le variabili sintomatiche è a discrezione del pro-gettista: in letteratura numerosi sono gli esempi in cui il guasto è rilevato semplicemente sulla base dell'entità dell'errore tra uscita reale del sistema e quella simulata dal modello (entità del residuo, metodo delle equazioni di parità). In quest'ultimo caso, dette rispettivamente GP(s)e GM(s)le

funzioni di trasferimento del processo reale e del modello che lo simula, viene assunta come variabile diagnostica sintomatica il residuo modello-processo denito come ε (s) , GP(s) − GM(s) . Durante un corretto

fun-zionamento del sistema, a patto che il modello sia sucientemente accu-rato (GP ≈ GM), risulta ε ≈ 0. Quando sul sistema agiscono dei guasti

additivi in ingresso (fu) o in uscita (fy, si veda la gura 3.2) l'entità del

residuo muta proporzionalmente all'ampiezza del guasto secondo la relazio-ne ε (s) = GPfu(s) + fy(s) . Il metodo delle equazioni di parità è dunque

indicato per la rilevazione di anomalie di tipo additivo agenti all'ingresso o sui sensori di uscita dell'impianto[13].

(14)

adottato per la stima dei parametri, sia nominali (o-line) che ricorsivi, è quello della minimizzazione dello scarto quadratico medio tra misure reali di uscita e quelle simulate o predette dal modello.

Figura 3.2:Schema diagnostico delle equazioni di parità.

Figura 3.3:Schema di diagnostica parametrica[13].

(15)

dell'errore, valutandone la dinamica, non semplicemente l'ampiezza. A tale tecnica sarà dato il nome di diagnostica di bianchezza, in accordo con la struttura (bianca) posseduta dal residuo nel caso di una buona modelliz-zazione del processo reale. Benché in letteratura esistano tecniche basate sull'analisi della distribuzione di probabilità del residuo[10], sarà necessario in questo lavoro adattarle al caso di misure molto imprecise dei sensori di uscita, situazione nella quale si colloca l'impianto di rareddamento.

(16)
(17)

4 Principio di funzionamento

dell'impianto di

rareddamento degli

autoveicoli

4.1 Introduzione

Nel presente capitolo si desidera introdurre molto brevemente il principio di funzionamento del sistema di rareddamento di un'autovettura, oggetto della diagnostica. In tal modo sarà facilitata una scelta preliminare dei segnali utili alla costruzione dei modelli.

La sezione 4.2 è dedicata ad una rapida descrizione delle componenti dell'impianto di rareddamento e del modo in cui viene gestito il rared-damento delle componenti vitali del veicolo. In sezione 4.3 si individuano le variabili siche che inuenzano il processo di rareddamento.

4.2 Circuito di rareddamento

La funzione fondamentale dell'impianto di rareddamento di un autoveico-lo è quella di evitare che testata, pistoni, cilindri e le altre parti costitutive il motore, raggiungano temperature troppo elevate; il rischio in quest'ulti-mo caso è il grippaggio dei pistoni nei cilindri. Nella maggior parte degli autoveicoli il rareddamento avviene mediante circolazione di un liquido re-frigerante avente caratteristiche anticorrosive, basso punto di congelamento ed elevata temperatura di ebollizione.

Nel corso dell'utilizzo di un autoveicolo, il motore converte l'energia chi-mica del carburante producendo calore. Una parte di questo è assorbito dai cilindri e dai pistoni che così vedono incrementata la loro temperatura. Allo scopo di asportare calore dal motore, i cilindri sono circondati da intercapedini nelle quali circola il liquido refrigerante proveniente dal ser-batoio basso del radiatore. Il movimento del liquido verso tutti i cilindri è assicurato dalla spinta di una pompa attivata dall'azione del motore.

(18)

vie-ne rareddato dalla corrente d'aria gevie-nerata dal movimento del veicolo e dall'elettroventilatore comandato dalla valvola termostatica (gura 4.1).

Figura 4.1:Impianto di rareddamento di un autoveicolo[23].

Può capitare però che l'elevata temperatura del liquido causi un'eccessiva pressione all'imbocco superiore del radiatore, impedendo così al refrigeran-te di uire verso il basso. Per questo motivo l'impianto di rareddamento è dotato di una valvola regolatrice di pressione la cui funzione è mantenere un corretto livello di pressurizzazione nel serbatoio superiore del radiatore, facendolo comunicare con il vaso di espansione (rareddamento a circuito sigillato con vaso di espansione). In tal modo il liquido, dilatato dal calo-re, viene convogliato al vaso di espansione per poi deuire nuovamente al radiatore quando dotato di una pressione inferiore.

La misura della temperatura del liquido refrigerante viene eettuata tra-mite un termistore NTC (Negative Temperature Coecient) costruito in materiale semiconduttore. Le letture eettuate dal sensore sono inviate al-la centralina elettronica dell'autoveicolo e utilizzate per decidere momento e durata dell'iniezione del carburante nei cilindri.

4.3 Individuazione delle relazioni causa/eetto

del sistema

(19)

che una maggiore velocità comporta un consistente ausso di aria nel ra-diatore, con la conseguente diminuzione della temperatura del liquido; alla stessa maniera c'è da aspettarsi un legame tra la temperatura del refrige-rante e le temperature del motore (cilindri, pistoni) e dell'ambiente esterno alla vettura con cui è a contatto.

A sua volta la temperatura del motore è determinata dal meccanismo di combustione e dunque da quel complesso di grandezze quali la coppia motrice, il numero di giri motore e la posizione della farfalla (accelerazio-ne impressa al veicolo) che riassumono il funzionamento istanta(accelerazio-neo della macchina determinando la quantità di carburante nei cilindri.

Dato che lo scopo della diagnostica è la previsione di malfunzionamenti all'impianto di rareddamento, è intuitivo considerare come segnale sin-tomatico di uscita la temperatura del liquido refrigerante e come segnali ausiliari in grado di inuenzarla, la velocità del veicolo, la temperatura esterna e quella del motore. Tipicamente quest'ultimo dato non è però disponibile e va sostituito da quelle grandezze misurabili che concorrono, come detto, a determinarlo: velocità del motore (giri), coppia motrice e posizione della farfalla.

Nei modelli matematici a scatola nera che saranno presi in considerazio-ne più avanti considerazio-nella tesi, sarà costume indicare la temperatura del liquido refrigerante, variabile di uscita, con la lettera y, mentre i cinque ingressi in grado di inuenzarla con le lettere uii = 1, ..., 5. Per maggiori dettagli si

veda la tabella 4.1.

Grandezza sica dell'impianto Tipo Simbologia adottata

Velocità ingresso u1

Coppia ingresso u2

Giri motore ingresso u3

Posizione farfalla ingresso u4

Temperatura esterna (aria) ingresso u5

Temperatura refrigerante (acqua) uscita y

(20)
(21)

5 Identicazione del sistema di

rareddamento

5.1 Introduzione

La messa a punto di un apparato diagnostico model-based richiede l'identi-cazione di un modello matematico per il sistema in questione.

Quest'ultima fase è condotta o-line, sulla base di conoscenze siche o tramite raccolta di dati sul campo per una successiva elaborazione.

L'obiettivo è l'individuazione della struttura (tipo di modello o classe) e della complessità (ordine) delle relazioni matematiche atte a rappresentare il sistema. Il valore puntuale dei parametri della rappresentazione mate-matica può essere invece oggetto di una stima ricorsiva da dati misurati on-line; questa soluzione, anzi, è una delle chiavi per rilevare dei guasti all'impianto.

Vi sono molteplici approcci nel contesto dell'identicazione. Questo ca-pitolo ne introdurrà alcuni richiamandone le idee di fondo e discutendo-ne pregi e difetti gediscutendo-nerali nonché vantaggi e svantaggi d'uso discutendo-nel caso di interesse.

In particolare si cercherà dapprima di identicare un modello sico non li-neare per l'impianto di rareddamento, sfruttando le relazioni causa/eetto individuate nella sezione 4.3, e se ne discuteranno le dicoltà implementati-ve (sezione 5.3). Successivamente, nelle sezioni 5.4 e 5.5, saranno introdotte delle tecniche alternative, quali le black-box ingresso/uscita o a variabili di stato, accettando di rinunciare al signicato sico delle rappresentazioni per ottenere relazioni lineari sottoforma di equazioni alle dierenze (modelli ARMAX o in spazio di stato). Inne si valuterà una seconda rappresen-tazione black-box, priva di variabili in ingresso: i cosiddetti modelli auto-regressivi e autoauto-regressivi a media mobile (AR e ARMA), le cui proprietà sono di descrivere il segnale sintomatico semplicemente come combinazione lineare di valori presi dalla sua storia passata (analisi delle serie temporali, sezione 5.6).

(22)

di campionamento ed il grado di accuratezza con il quale i dati sono rilevati (sezione 5.2). Del resto, denominatore comune nella tesi è ridurre l'intero processo di identicazione o-line a quattro fasi, strettamente legate alle misure eettuate sul sistema e applicabili a contesti del tutto generali:

1. Suddivisione delle misure raccolte sul campo in dati di identicazione e di validazione

2. Determinazione di classe, ordine e parametri del modello matematico che meglio spiega i dati di identicazione

3. Test di aderenza del modello sui dati di validazione (t)

4. Controllo delle caratteristiche statistiche dell'errore di modello (resi-duo o scostamento tra misure reali e valori simulati dal modello) su dati di validazione (test di bianchezza).

Una volta determinata la struttura del modello che ben rappresenta il siste-ma, la fase di diagnostica vera e propria sarà eseguita on-line e prevederà le seguenti fasi:

1. Acquisizione dei dati on-line dal sistema

2. Stima ricorsiva dei parametri del modello (la cui struttura è stata determinata nella fase o-line)

3. Monitoraggio dell'andamento dei parametri stimati nel tempo (dia-gnostica parametrica)

4. Monitoraggio delle caratteristiche statistiche dell'errore di modello (diagnostica di bianchezza)

5.2 Rilevazione dei dati dal sistema

5.2.1 Lo standard CAN-bus

L'acquisizione dei dati costituisce, come detto, il passo base in ogni proce-dimento di identicazione a scatola nera; non sono tuttavia rari i casi in cui si renda necessario anche per modelli dedotti dalla sica laddove alcuni dei parametri non siano noti con precisione.

(23)

Tutti i segnali utilizzati per questa tesi sono stati raccolti secondo lo standard CAN-bus nel corso del funzionamento annuale di un autoveicolo e organizzati in sessioni1 che ne individuano data e durata della rilevazione.

Per quanto concerne l'identicazione del modello dai dati ci si è assicurati di utilizzare sessioni che da un lato contenessero un numero sucientemente alto di dati e dall'altro riferissero a vari periodi nel corso dell'anno; ciò ha mirato a preservare quanto più possibile la natura generale del modello ricavato, allenandolo su tipici valori di temperatura esterna.

Quantità di dati a disposizione e condizione atmosferica in cui vengono raccolti non sono tuttavia gli unici criteri da tenere in considerazione per la scelta dell'insieme dei dati di test. Anche la qualità dei dati andrebbe pon-derata attentamente. Generalmente, in presenza di ingressi, è consigliabile stimolare il processo mediante segnali sucientemente irregolari (persisten-temente eccitanti) così da avere una sollecitazione frequenziale completa che impedisca di pervenire a modelli troppo specici. Il rumore bianco, forma d'onda del tutto imprevedibile, è preferibile ad altri come input per sol-lecitare il sistema (per questo lo si dice persistentemente eccitante di ogni ordine). Quando si è tuttavia interessati ad identicare sistemi solo in un certo range di frequenze, l'andamento degli ingressi andrebbe progettato in modo da avere distribuzione in frequenza non nulla perlomeno nell'intervallo di interesse.

Nel contesto dell'identicazione industriale si ha raramente la possibilità di agire a proprio piacimento sul processo e ci si deve adeguare a quelli che sono i dati registrati nel corso di un esperimento senza poter imporre in-gressi particolari. Per di più la fase di raccolta dati sul campo assume spes-so un carattere economicamente onerospes-so ed una sua eventuale ripetizione potrebbe essere inaccettabile.

Pur non avendo potuto progettare gli esperimenti sull'impianto di rared-damento in questione, si ritiene che la lunga storia descritta nelle misure memorizzate sia tale da contemplare un ampio spettro di regimi di funzio-namento; ciò risulta chiaro anche da una semplice esamina graca di una sessione di dati: se questa è sucientemente lunga in termini di durata del-la raccolta dati e l'uso che è stato fatto del veicolo ha costretto i segnali di velocità, coppia, giri motore e posizione della farfalla (legata alla posizione del pedale dell'acceleratore) a variare fortemente nel corso della sessione, si può ritenere di essere in presenza di un grado di eccitazione soddisfacente. La gura 5.1 mostra gli andamenti temporali dei sei segnali rilevati tra-mite CAN-bus relativamente ad una sessione autunnale di utilizzo dell'au-toveicolo: le ampie escursioni dei segnali di ingresso costretti a variare su quasi tutto il range possibile (eccetto naturalmente quello di temperatura

1Per sessione si intende l'insieme di dati raccolti nel periodo di tempo che intercorre

(24)
(25)

(a)Velocità del veicolo (b)Coppia del motore espressa in % del valore massimo erogabile

(c)Giri motore (d)Posizione della farfalla (in % rispetto all'apertura massima)

(e)Temperatura esterna (aria) (f)Temperatura del liquido refrigerante (acqua)

(26)

5.2.2 Scelta del periodo di campionamento

La tabella 5.1 mostra quali siano stati i parametri utilizzati dal sistema di acquisizione nella discretizzazione dei segnali generati nel corso della guida. In particolare la discretizzazione dell'asse dei tempi avviene con un passo di Ts = 10ms mentre la livellazione delle misure sottostà ad una

quantizzazione specica del segnale.

Segnale Unità di misura Periodo camp. [ms] Passo di quantizzazione Velocità veicolo [km/h] 10 0.0625 km/h Coppia motrice [% of max] 10 0.392%

Giri motore [rpm] 10 1 rpm

Posizione farfalla [% of max] 10 0.392% Temperatura esterna [°C] 100 0.5°C Temperatura liquido [°C] 10 1°C

Tabella 5.1: Segnali acquisiti tramite CAN-bus per l'identicazione dell'impianto di rareddamento.

Il tempo di campionamento imposto dal CAN-bus risulta inutilmente raf-nato per l'impianto di rareddamento dell'autoveicolo, che di per sé ha un comportamento passa-basso. La natura dei segnali in gioco è tale da con-sentire maggior essibilità sul campionamento senza che ciò pregiudichi il contenuto informativo dei dati. Inoltre un campionamento più rado verreb-be incontro a quel bisogno di disporre di dati eccitanti nella sollecitazione del processo. In eetti, se si pensa alla maggior parte dei segnali utilizzati, lentamente tempo varianti, è alquanto inutile usare nel corso dell'identi-cazione coppie ingresso/uscita distanziate di soli 10ms l'una dall'altra, che risulterebbero il più delle volte identiche tra loro causando una ridondanza d'informazione di eetto per nulla innocuo nel corso della modellizzazio-ne. In altre parole sarebbe come sollecitare il sistema con ingressi costanti su un numero notevole di campioni, nendo con avere un basso indice di eccitazione.

Una via rigorosa da intraprendere in questa scelta del periodo di ri-campionamento (sottori-campionamento) passa per lo studio delle proprietà spettrali dei segnali raccolti.

5.2.2.1 Densità spettrale di potenza

(27)

circa il periodo di campionamento minimo da scegliere per la ricostruzione fedele del segnale, come ben noto dal teorema di Shannon: la frequenza di campionamento deve uguagliare almeno il doppio della banda del segnale.

Pertanto uno degli obiettivi dell'analisi di Fourier è quello di denire dei criteri per la scelta del campionamento; ciò passa inevitabilmente per la stima della banda del segnale e quindi del suo spettro frequenziale. In ambito statistico esiste una seconda denizione di spettro, denita a partire dalle autocorrelazioni della forma d'onda, che si dimostra essere del tutto equivalente all'usuale trasformata di Fourier. Questa seconda denizione va sotto il nome di densità spettrale di potenza ed è la trasformata di Fourier della funzione di correlazione del segnale stocastico v (t):

Γ (ω) = +∞ X τ =−∞ γ (τ ) exp (−jωτ ) ω ∈ [−π π] (5.1) dove γ (τ ) , E [(v (t) − m) (v (t + τ ) − m)]

indica la funzione correlazione del segnale e m , E [v (t)] il suo valor medio.

L'andamento della quantità (reale e pari) denita dall'eq.(5.1) è utile nel comprendere la distribuzione della variabilità del processo in frequenza. Tuttavia il calcolo esatto richiederebbe una somma di inniti termini dati da tutte le correlazioni valutate per ogni possibile ritardo τ ∈ Z, cosa impossibile a livello pratico.

Sono disponibili numerose tecniche di approssimazione orientate alla sti-ma della quantità (5.1). Tali tecniche adattano la formula (5.1) al caso di un numero nito di campioni (N < ∞), sostituendola con la stima

ˆ ΓN(ω) = N −1 X τ =−(N −1) ˆ γN(τ ) exp (−jωτ ) (5.2) dove ˆ γN(τ ) = 1 N N −|τ | X t=1 v (t) v (t + τ ) − (N − 1) ≤ τ ≤ (N − 1) .

L'eq. (5.2) denisce il periodogramma esteso la cui caratteristica è di tendere, in media, allo spettro vero denito dalla (5.1). Si dimostra però che la stima indotta dal periodogramma esteso presenta delle uttuazioni permanenti attorno al valore vero di ampiezza non trascurabile, anche per N molto grande.

(28)

numero r di sottosequenze, dotate di ¯N dati ciascuna. Per ognuna delle sottosequenze viene calcolato il periodogramma esteso mediante l'eq. (5.2):

v (1) , ..., v ¯N ⇒ ˆΓN¯(ω)1

v ¯N + 1 , ..., v 2 ¯N ⇒ ˆΓN¯(ω)2

...

v (r − 1) ¯N + 1 , ..., v (N ) ⇒ ˆΓN¯(ω)r;

gli r periodogrammi così ottenuti sono mediati con l'eetto di smussare molto la stima ottenuta, eliminando il problema delle ampie uttuazioni:

ˆ Γ (ω) = 1 r r X i=1 ˆ ΓN¯(ω)i.

5.2.2.2 Calcolo dello spettro dei segnali estratti dall'autoveicolo La tecnica di Bartlett è stata implementata per stimare la distribuzione spettrale dei segnali di ingresso e uscita dell'impianto di rareddamento dell'autoveicolo. Come spiegato precedentemente lo scopo ultimo della sti-ma spettrale è la deduzione di un periodo di subcampionamento che, senza comportare perdita di informazione, renda gli input maggiormente eccitan-ti. Un'analisi spettrale permette di dedurne in primo luogo la banda e, da questa, tramite il teorema del campionamento, un compatibile sottocam-pionamento. Al termine di questa selezione dei dati il numero di misure risulterà notevolmente ridotto senza importanti conseguenze nel contenuto informativo.

Il risultato della stima spettrale condotta tramite metodo di Bartlett con ¯

(29)

(a)Periodogramma della velocità del veicolo (b)Periodogramma della coppia motrice

(c)Periodogramma dei giri motore (d)Periodogramma della posizione della farfalla

(e)Periodogramma della temperatura esterna(f)Periodogramma della temperatura del liqui-do refrigerante

(30)

L'esamina graca dei periodogrammi permette una stima della banda dei segnali rilevati dal CAN-bus ogni 10ms. Come mostra la gura 5.2, i segnali sono tutti a banda limitata e descritti da uno spettro a basse frequenze; i valori di banda dedotti gracamente e quelli di frequenza di subcampionamento sono riportati in tabella 5.2:

Segnale Banda [rad/s] Banda [Hz] Min. freq. camp.[Hz] Periodo camp. [s]

Velocità 4.91 0.78 1.560 0.64 Coppia 9.82 1.56 3.125 0.32 Giri motore 4.91 0.78 1.560 0.64 Posizione farfalla 9.82 1.56 3.125 0.32 Temperatura esterna 4.91 0.78 1.560 0.64 Temperatura liquido 4.91 0.78 1.560 0.64

Tabella 5.2: Bande e massimo periodo di campionamento ammesso per i singoli segnali: la minima frequenza di campionamento è stata calcolata come il doppio della banda (teorema di Shannon).

Il periodo di subcampionamento consigliato per un'identicazione ingres-so/uscita è pertanto 0.32s. Come si vedrà nel proseguo, le identicazioni condotte con tale periodo di campionamento non porteranno tuttavia a modelli migliori rispetto a quelli che si possono ottenere aumentando ul-teriormente il campionamento no ad 1s; la gura 5.2 testimonia che un simile incremento non provoca infatti l'esclusione di componenti armoniche dominanti dai segnali: infatti ad un campionamento di 1s corrisponde una banda di 3, 14 rad/s ed il contenuto armonico dominante è concentrato al di sotto di tale pulsazione. Il fatto di aumentare il tempo di campionamento, oltre ad anare l'eccitazione, permette agli algoritmi di identicazione di lavorare più velocemente, avendo meno dati da considerare.

5.3 Identicazione gray-box: modello in spazio

di stato e ltro di Kalman

5.3.1 Modello sico

(31)

Grandezza termica Grandezza elettrica

calore corrente

dierenza di temperatura tensione capacità termica capacità elettrica resistenza termica resistenza elettrica

Tabella 5.3:Equivalenze tra circuiti termici e reti elettriche.

La rete che descrive il comportamento sico dell'impianto di raredda-mento è descritta dalla gura 5.3.

Figura 5.3:Circuito termico dell'impianto di rareddamento. Il signicato delle grandezze circuitali è riassunto in tabella 5.4.

Simbolo Descrizione

Qin Calore entrante nel sistema (dovuto alla combustione)

Tm Temperatura del motore

Tw Temperatura del liquido refrigerante

Ta Temperatura dell'aria esterna

Cm Capacità termica del motore

Cw Capacità termica del liquido refrigerante

R1 Resistenza termica dell'interfaccia motore-liquido

R2 Resistenza termica dell'interfaccia motore-aria

R3 Resistenza termica dell'interfaccia liquido-aria

Tabella 5.4:Signicato delle grandezze siche del circuito termico.

(32)

termica Cm); una parte di esso viene ceduta al liquido di rareddamento

(attraverso R1) ed una terza percentuale risulterà dispersa in aria grazie

all'interfaccia diretta tra motore ed aria (R2). Essendo poi anche il

refri-gerante a diretto contatto con l'aria, oltre che con il motore, una parte del calore proveniente dall'interfaccia schematizzata da R1 sarà ceduta

al-l'esterno attraverso la resistenza termica R3: la rimanente porzione verrà

invece accumulata dal liquido (Cw) che vedrà in questo modo modicata la

propria temperatura Tw.

Le equazioni dierenziali che regolano la dinamica delle temperature di motore e liquido refrigerante sono inne facilmente ottenibili dall'equiva-lenza termo-elettrica (tabella 5.3) e dai principi di Kirchho:

   dTm dt = 1 Cm h Qin−TmR−Tw 1 − Tm−Ta R2 i dTw dt = 1 Cw h Tm−Tw R1 − Tw−Ta R3 i . (5.3)

Il sistema (5.3) è già scritto in forma di stato: le variabili interne sono le temperature del motore e dell'acqua2, mentre gli ingressi esogeni sono dati

dal calore entrante Qin e dalla temperatura esterna Ta. A queste

equazio-ni va aggiunta quella di uscita costituita dalla misura della temperatura dell'acqua eettuata da un termistore NTC:

y (t) = Tw(t) + v (t)

in cui v (t) indica gli errori di misura propri del sensore.

Non è invece prevista una misura diretta della temperatura del motore.

5.3.2 Diagnostica mediante ltro di Kalman

A ni diagnostici, una volta che il sistema sia posto in spazio di stato è immediata l'applicazione di un ltro di Kalman per il monitoraggio delle variabili nel tempo.

Nella sua versione storica, il ltraggio e la predizione alla Kalman han-no come obiettivo quello di stimare ricorsivamente lo stato del sistema a partire da misure dell'uscita. Nel caso qui proposto il problema si ricondur-rebbe alla stima delle temperature di motore e liquido refrigerante a partire da misure rumorose eettuate su quest'ultima. Così facendo si potrebbe ottenere un'istantanea interna del sistema: verrebbero stimate sia la tem-peratura del liquido che quella del motore, consentendo un monitoraggio approfondito del sistema.

2Nel corso della tesi si userà spesso come sinonimo di liquido refrigerante o di

(33)

Osservando tuttavia il sistema (5.3) appaiono ovvie delle dicoltà che sconsigliano questo modo di procedere.

In primo luogo sorge il problema della misura degli ingressi: se in eetti la temperatura esterna Tapuò essere misurata tramite dei sensori, impossibile

è avere una conoscenza esatta della quantità di carburante entrante Qin.

Quest'ultimo è infatti il risultato del funzionamento istantaneo della vettu-ra, legato alla posizione della farfalla, alla coppia istantanea erogata, non-ché alla velocità del motore. In termini sistemistici Qinandrebbe pertanto

considerato come una terza variabile interna del sistema di rareddamento legata in maniera non lineare ai nuovi ingressi appena richiamati (posizio-ne farfalla, coppia e giri). In particolare il calore entrante è funzio(posizio-ne del prodotto tra coppia e giri. Quand'anche quest'ultima fonte di non linearità fosse eliminata considerando come ingresso il prodotto coppia-giri, rimar-rebbe valida la dipendenza non lineare di Qindalla posizione della farfalla.

A questo andrebbe aggiunto poi l'eetto di una retroazione dal sensore di temperatura del liquido la cui misura viene sfruttata dalla centralina per regolare l'iniezione stessa del carburante, e dunque Qin.

Seguendo questa strada il modello con cui simulare il comportamento rea-le del processo diverrebbe altamente non lineare e si renderebbe necessario un ricorso alla versione estesa del ltro di Kalman.

Nasce poi un'altra questione: sebbene la teoria del ltro di Kalman esteso goda oggi di ampia considerazione, resta, ineliminabile, un evidente collo di bottiglia nella sua implementazione ricorsiva: la soluzione dell'equazione alle dierenze di Riccati per l'aggiornamento del guadagno del ltro. Non solo: nel sistema (5.3) i parametri R1, R2, R3 non sono realmente noti.

Andrebbero stimati al pari delle variabili interne Tm e Tw e per la loro

stima sarebbe necessario estendere la dimensione dello stato introducendo tre equazioni ttizie rispecchianti la natura incerta dei parametri3.

L'au-mento della dimensione del vettore di stato rappresenterebbe un'ulteriore grado di non linearità e si vedrebbe aggravato quel collo di bottiglia rap-presentato dall'equazione ricorsiva di Riccati. In un apparato diagnostico in cui la velocità computazionale è un elemento essenziale queste dicoltà algoritmiche non sono accettabili. Nelle prossime sezioni sarà pertanto ab-bandonata questa via sica e con essa la possibilità di pervenire ad un preciso isolamento del guasto4.

3Le tre equazioni di stato ttizie da aggiungere sarebbero le seguenti:

Ri(t + 1) = Ri(t) + vi(t) i = 1, 2, 3

con vitermine di rumore usato come dichiarazione di incertezza del parametro Ri. 4In eetti, implementando il ltro esteso di Kalman si potrebbero avere informazioni

precise sulla locazione del guasto; ad esempio se l'andamento del parametro R1(t)

(34)

5.4 Identicazione black-box mediante modelli

ingresso/uscita

5.4.1 Introduzione

Il tentativo di estrapolare un modello sico fatto nella sezione 5.3, seppur rivelatosi ineciente, ha avuto il merito di porre in evidenza il legame ma-tematico sussistente tra l'oggetto della diagnostica (temperatura del liquido refrigerante) ed una serie di altre grandezze dell'impianto. Quella che ne è complessivamente derivata è un'equazione dierenziale non lineare del tipo

dTw

dt = f (giri motore, posizione f arf alla, coppia, velocit`a veicolo, Ta, Tw) .

In un procedimento di modellistica basato sulla raccolta di misure dal-l'impianto, e quindi su un campionamento dei segnali agenti sul sistema, il linguaggio naturale più utile, che rispecchi il campionamento cui è sogget-to l'impiansogget-to, è tuttavia quello delle equazioni alle dierenze. Queste altro non sono che una discretizzazione delle equazioni dierenziali e considerano l'evoluzione del sistema avvenire solamente durante gli istanti di campio-namento. Così se è vero che le equazioni dierenziali sono il linguaggio dei processi sici a tempo continuo, è altrettanto corretto aermare che i modelli ad equazioni alle dierenze sono lo strumento per l'analisi dei medesimi sistemi a segnali campionati.

Il passaggio da un'equazione dierenziale alla sua versione alle dierenze si eettua approssimando l'operatore di derivata come rapporto incremen-tale no ad ottenere un'equazione nella quale il valore futuro dell'uscita incognita resta univocamente determinato dal suo presente e passato non-ché dai valori presenti e passati delle variabili esogene agenti sull'impianto (ingressi).

(35)

5.4.2 Teoria per l'identicazione di modelli

ingresso/uscita

5.4.2.1 Modelli ARX, ARMAX e Box-Jenkins

Nei modelli ingresso/uscita a scatola nera l'andamento dell'uscita viene legato a quello degli ingressi mediante un'equazione alle dierenze al cui interno viene precisata sia l'inuenza di valori passati di input e output nel determinare il valore attuale dell'uscita che un termine aggiuntivo di errore, utile nel descrivere disturbi e non linearità del processo vero. Nei modelli ARX

y (t) = a1y (t − 1) + ... + anay (t − na) + b1u (t − 1) + ... + bnbu (t − nb) + ξ (t)

il termine di errore ξ viene scelto come semplice rumore bianco a me-dia nulla; così facendo si sottintende di cogliere con il modello la struttu-ra vestruttu-ra del processo, a meno di disturbi di fondo di castruttu-rattere totalmen-te imprevedibile. Il modello ARX è rappresentato in forma operatoriale dall'equazione: A z−1 y (t) = B z−1 u (t − 1) + ξ (t) con A z−1 = 1 − a1z−1− ... − anaz −na e B z−1 = b1+ b2z−1+ ... + bnbz −nb+1

in cui z−1 indica l'operatore di ritardo ad un campione.

In altri tipi di modelli IN/OUT, quali gli ARMAX ed i Box-Jenkins, il termine di errore presenta per contro una struttura colorata; in questo caso l'idea è che in uscita non intervengano solo disturbi bianchi, ma errori dovuti al ltraggio di rumori (bianchi) agenti a monte o comunque in qual-che altro punto del processo da identicare. Una modellizzazione siatta ha il vantaggio di conglobare tipiche situazioni reali nelle quali una sorgente di disturbo può agire in qualsiasi punto dell'impianto, non necessariamente nella misura nale. Il rovescio della medaglia è rappresentato dall'elevato onere computazionale richiesto durante l'identicazione.

Il modello ARMAX è rappresentato, in forma operatoriale, dall'eq.(5.4) A z−1 y (t) = B z−1 u (t − 1) + C z−1 ξ (t) (5.4)

mentre l'ancora più generale Box-Jenkins dall'eq.(5.5) y (t) = B z

−1 F (z−1)u (t) +

C z−1

(36)

dove A, B, C, D, F sono polinomi nell'indeterminata z−1i cui coecienti

costituiscono i parametri da identicare5.

Al di là delle dierenze analitiche dei vari modelli, il procedimento che porta all'identicazione dei parametri delle equazioni alle dierenze fa uso comune dell'approccio predittivo. Il modello scelto viene cioè scritto in forma di predittore ottimo ad un passo di campionamento e successivamente vengono computati gli errori di predizione tra uscita misurata e quella predetta dal modello. I parametri sono determinati al ne di minimizzare l'errore quadratico medio di predizione (loss function).

5.4.2.2 Calcolo del predittore ad un passo

Si consideri il modello più generale possibile, descritto operatorialmente dall'equazione alle dierenze

y (t) = G z−1 u (t − 1) + W z−1 ξ (t) (5.6) in cui si è convenuto indicare con G e W due funzioni di trasferimento. Questa scrittura contempla sia il caso ARX

G z−1 =B z

−1 A (z−1), W z

−1 = 1

A (z−1)

che il caso ARMAX

G z−1 =B z −1 A (z−1), W z −1 =C z−1  A (z−1) e Box-Jenkins G z−1 = B z −1 F (z−1), W z −1 =C z−1  D (z−1).

Imponendo la limitatezza della quantità W z−1 ξ (t), come deve essere

quando si vuole che il modello (5.6) denisca in modo sensato il legame ingresso/uscita, ci si può sempre ricondurre ad una riscrittura in cui W abbia numeratore e denominatore stabili, coprimi, monici e di ugual grado. Si ipotizzi di essere proprio in questa situazione e si dividano ambo i membri dell'eq.(5.6) per W sommando e sottraendo y(t); si ha allora

y (t) =  1 − 1 W (z−1)  y (t) + G z −1 W (z−1)u (t − 1) + ξ (t) in cui il termine

5L'operatore z−1 denisce il ritardo ad un passo di campionamento: la scrittura

(37)



1 − 1

W (z−1)

 y (t)

dipende in realtà solo dai valori dell'uscita y antecedenti il tempo t. Que-sto segue dal fatto che la lunga divisione dei polinomi a numeratore e de-nominatore di W porta ad avere 1

W (z−1) = 1 + α1z−1+ α2z−2 + ... con opportuni αi. Di conseguenza  1 − 1 W (z−1)  y (t) = α1z−1+ α2z−2+ ... y (t)

da cui emerge l'indipendenza da y (t). Anche il termine G z−1

W (z−1)u (t − 1)

è funzione di soli valori passati (dell'ingresso stavolta). Rammentando la bianchezza di ξ (t), la conoscenza di valori passati di ingressi ed uscita non serve in alcun modo alla sua valutazione; dunque il predittore ottimo ad un passo per il generico modello denito dall'eq.(5.6), è semplicemente

ˆ y (t|t − 1) =  1 − 1 W (z−1)  y (t) + G z −1 W (z−1)u (t − 1) . (5.7)

5.4.2.3 Errore di predizione e minimizzazione della loss function L'eq.(5.7) viene utilizzata per costruire gli errori di predizione tra uscita misurata e quella predetta dal modello sulla base di misure passate. L'errore o residuo di predizione è denito come

ε (t) = y (t) − ˆy (t|t − 1)

ed un buon criterio nella scelta dei parametri del modello è la minimiz-zazione della loss function

JN(θ) = 1 N N X t=1 ε (t)2 (5.8)

in cui N rappresenta il numero di misure raccolte sull'impianto per le quali è stato possibile computare l'errore di predizione, mentre θ indica il vettore dei parametri del modello (coecienti dei polinomi) e ricorda come l'indice di costo sia funzione del modello.

(38)

Square, LS). Quando invece si passa ad una struttura ARMAX o Box-Jenkins, l'espressione del predittore perde in linearità e la minimizzazione della loss function richiede algoritmi più complessi (ad es. il metodo di Newton della discesa del gradiente).

La bontà di un modello non può però basarsi solamente sulla minimiz-zazione della (5.8). Avere un errore ε basso non è infatti suciente. Si pensi[19] al caso di errori bassi ad ogni istante temporale ma di media non nulla; in tale circostanza vi sarebbe un errore sistematico tra realtà e mo-dello e le predizioni risulterebbero dare un valore sempre più alto, o sempre più basso, rispetto alla misura vera. Oppure si guardi al caso di un errore ε limitato, di media nulla, ma di segno alterno: agli istanti pari positivo e per i campioni dispari negativo: un simile comportamento non caratte-rizza un buon modello in quanto esiste una dinamica nel residuo, cioè un legame tra i suoi campioni e si potrebbe, con un diverso modello, arrivare a previsioni più accurate; difatti la conoscenza dell'errore al tempo attuale permetterebbe di avere informazioni aggiuntive sulla dinamica futura del segnale di uscita.

Un modello non solo deve essere caratterizzato da un errore quadrati-co medio quadrati-contenuto ma deve presentare in aggiunta un residuo privo di regolarità: anché ciò accada i suoi campioni devono essere fra loro com-pletamente incorrelati. In termini probabilistici si chiede che il residuo sia un rumore bianco a media nulla. Per questo, dopo aver identicato il mo-dello di un sistema, ne va testata l'aderenza a dati possibilmente diversi da quelli utilizzati nella stima e contemporaneamente va eettuato un test di bianchezza sul residuo. Il modo in cui quest'ultima analisi può essere condotta è di vericare se le autocorrelazioni dell'errore di predizione sono pressoché nulle per vari ritardi (lag) dei suoi campioni (eccetto il ritardo nullo, che dà la varianza del residuo). Autocorrelazioni nulle signica infat-ti assenza di legami tra i vari campioni del segnale, condizione equivalente a chiedere una totale imprevedibilità nel suo andamento (bianchezza).

5.4.3 Modelli ottenuti con campionamento a 0.32 secondi

(39)

capace di variare solamente di qualche grado o decimo di grado: un mo-dello costruito su questi dati originali nirebbe con il considerare costanti tutti i valori misurati visti i lievi scostamenti attorno alla media rispetto all'ampiezza complessiva del segnale. L'operazione di sottrazione della me-dia (detrend) ha invece l'eetto di centrare l'intero segnale attorno allo zero risaltando le oscillazioni rispetto alla nuova scala delle ampiezze.

Altra operazione preliminare sui dati è stata quella di dividerli in due insiemi: dati per l'identicazione e dati per la validazione del modello; la prima parte è usata dagli algoritmi di ottimizzazione nel minimizzare la quantità (5.8), ossia per il calcolo dei parametri del modello. Quest'ul-timo è stato poi testato sul secondo slot di dati sia per quanto riguarda il t ai nuovi valori6, ossia l'aderenza del modello a misure non utilizzate

per l'identicazione, sia per quanto concerne la bianchezza del residuo di predizione.

La gura 5.4 illustra le prestazioni del modello ARMAX (multi-input)

A z−1 y (t) = =  B1 z−1 B2 z−1 . . B5 z−1       u1(t − nk1) u2(t − nk2) . . u5(t − nk5)      + + C z−1 ξ (t) (5.9)

con gradi dei polinomi A z−1 , B z−1 , C z−1e ritardi dell'ingresso (nk=nk1 nk2 nk3 nk4 nk5  ) rispettivamente na = 2, nb=  2 2 2 2 2  , nc= 2, nk=1 1 1 1 1 . (5.10) Qui e nel proseguo, come già descritto in tabella 4.1, si è convenuto indi-care con la lettera y la temperatura del refrigerante (uscita) e con u1, ..., u5,

nell'ordine, i cinque ingressi del sistema: velocità del veicolo, coppia, giri motore, posizione della farfalla e temperatura dell'aria esterna.

La scelta del modello e degli ordini dei polinomi è stata qui compiuta per successivi tentativi: la rappresentazione ARMAX con gli ordini poli-nomiali deniti in (5.10) si è dimostrato essere il miglior modello in/out in

6L'indice di aderenza di un modello ai dati, in inglese t, viene calcolato con la formula

F IT = 100 

1 − ||y − ˆy|| ||y − my||



dove y indica il vettore delle misure di uscita, ˆy il vettore delle predizioni eettuate del modello (predittore ottimo) e myla media campionaria dei dati di uscita. ||  || è

(40)

termini di aderenza ai dati, bianchezza residuale e complessità7, nel caso di

subcampionamento a 0.32 s.

(a)Confronto tra la temperatura del refrigerante misurata e la predizione del modello.

(b)Bianchezza del residuo di predizione.

Figura 5.4:Prestazioni del modello ARMAX nel caso di sottocampionamento a 0.32 secondi.

7Per complessità di un modello si intende il numero di parametri da identicare,

(41)

La gura 5.4b mostra come il residuo di predizione del modello presen-ti otpresen-time caratterispresen-tiche di bianchezza, con autocorrelazioni prapresen-ticamen- praticamen-te nulle (cioè all'inpraticamen-terno della fascia gialla di tolleranza8, rappresentante

l'intervallo di condenza del 99%); allo stesso tempo però, le stime della temperatura del liquido refrigerante si discostano signicativamente dalle misure (gura 5.4a).

8Il primo campione di correlazione rappresenta la varianza del residuo, normalizzata per

(42)

5.4.4 Modelli ottenuti con campionamento a 1 secondo

(a)Confronto tra la temperatura del refrigerante misurata e la predizione del modello

(b)Bianchezza del residuo di predizione

Figura 5.5:Prestazioni del modello ARMAX nel caso di sovracampionamento a 1 secondo

L'identicazione è stata ripetuta dopo un ulteriore subcampionamento dei dati, passando da 0.32 ad 1 secondo. La gura 5.5 mostra le performance raggiunte dal modello ARMAX (5.9) con i seguenti gradi polinomiali:

(43)

dedotti, come in precedenza, per successivi tentativi e da confronti tra modelli di varie classi e ordini.

Come era lecito attendersi, l'ulteriore sottocampionamento dei segnali non degrada le prestazioni; dalla gura 5.5b si nota come la bianchezza sia ancora una volta assicurata mentre l'aderenza ai dati, seppur incrementata, non è soddisfacente (gura 5.5a).

L'invarianza delle prestazioni di modello al variare del subcampionamen-to da 0.32s a 1s consente di accettare quest'ultimo come quansubcampionamen-to temporale nella memorizzazione di dati per l'identicazione.

5.5 Identicazione black-box mediante modelli

di stato

5.5.1 Introduzione

I modelli ARX, ARMAX e Box-Jenkins sono delle rappresentazioni ester-ne nelle quali solamente variabili esogene, vale a dire ingressi ed uscite, compaiono nelle equazioni. Questi sono i modelli capostipiti della teoria dell'identicazione, noti n dai contributi al ltraggio di Wiener, Gauss e di Box e Jenkins. Più recentemente, ed intensivamente negli anni '80, sono stati presentati alla comunità scientica nuovi metodi di identicazione per modelli a rappresentazione interna. In questi ultimi si fa ricorso a delle variabili ausiliarie rappresentative del cosiddetto stato del modello al ne di descrivere il legame input/output. Quello che ne risulta è il modello di stato lineare:

(

x (t + 1) = F x (t) + Gu (t)

y (t) = Hx (t) (5.11)

dove lo stato, vettore n − dimensionale con n detto ordine del modello, è indicato con x; al solito u e y indicano rispettivamente ingresso ed uscita. Il problema dell'identicazione di modelli di stato[16] è così posto: date delle misure di ingressi e uscite, determinare le matrici F , G, H in (5.11) che meglio spieghino i dati raccolti. Il modo in cui tale identicazione è portata a termine dierisce notevolmente da quello utilizzato per i modelli ingresso/uscita e prende il nome di identicazione su sottospazi.

(44)

5.5.2 Cenni all'identicazione su sottospazi

Risolvendo (5.11) ricorsivamente si riesce agevolmente a ricondursi alla formula

y (t + i) = HFix (t) + HFi−1Gu (t) + HFi−2Gu (t + 1) + ... + HGu (t + i − 1) . (5.12)

Denendo Yr(t) =      y (t) y (t + 1) ... y (t + r − 1)      Ur(t) =      u (t) u (t + 1) ... u (t + r − 1)     

la (5.12) può essere riscritta come

Yr(t) =      H HF ... HFr−1      x (t) +        0 0 0 ... 0 0 HG 0 0 ... 0 0 HF G HG 0 ... 0 0 ... ... ... ... HFr−2G ... HG 0        Ur(t) (5.13) in cui la matrice O(r)=      H HF ... HFr−1     

è la matrice di osservabilità a r passi del modello (5.11). Posto

S(r) =        0 0 0 ... 0 0 HG 0 0 ... 0 0 HF G HG 0 ... 0 0 ... ... ... ... HFr−2G ... HG 0        la (5.13) diventa Yr(t) = O(r)x (t) + S(r)Ur(t) (5.14) nelle incognite O(r) e S(r).

Noti che siano Yr, Ur e x (t), in linea teorica da quest'ultima equazione

(45)

Tuttavia la (5.14) è un sistema sottodeterminato, con più incognite che equazioni; inoltre la quantità x (t) è ignota.

Risolvere le sopracitate questioni di indeterminatezza non è però impos-sibile: è suciente denire le matrici:

Y =        y (1) y (2) ... y (N − r) y (2) y (3) ... . y (3) y (4) ... . .. . ... ... . y (r) y (r + 1) ... y (N )        , U =        u (1) u (2) ... u (N − r) u (2) u (3) ... . u (3) u (4) ... . .. . ... ... . u (r) u (r + 1) ... u (N )        X =x (1) x (2) ... x (N − r) e riscrivere la (5.14) in forma replicata:

Y = O(r)X + S(r)U .

Denendo la matrice P = I − UTU UT−1U con UUT supposta

in-vertibile e post-moltiplicandola ai membri della relazione appena ricavata, si ha

Y P = O(r)XP .

Nell'ipotesi UUT invertibile si può dimostrare che il numero di colonne

linearmente indipendenti di O(r)coincide con il numero di colonne

indipen-denti in O(r)XP e dunque con quello di Y P . Pertanto si può determinare il

rango numerico della matrice Y P che coincide con il rango di O(r)e dunque

con l'ordine n del modello (da qui il fatto che l'ordine rimane determina-to dalle misure). Le n colonne indipendenti permetdetermina-tono di determinare, a meno di cambi di base, la matrice di osservabilità O(n)che sulla prima riga

contiene la matrice H del modello. La F è ricavabile eliminando da O(n)

la prima riga e aggiungendone una in fondo:

O(n)↑=      HF ... HFn−1 HFn     

per cui risulta O(n)↑= O(n)F ⇒ F =O(n)−1 O(n)↑.

La determinazione di G è invece un problema di regressione lineare: per i = 0l'eq.(5.12) può infatti essere scritta come

(46)

α (t) = Hu (t − 1) + HF u (t − 2) + ... + HFt−1u (1) e

β (t) = HFt−1

sono termini a questo punto noti ed il calcolo di G è ricondotto alla formula dei minimi quadrati.

5.5.3 Aspetti relativi alla determinazione dell'ordine di

stato a partire da misure rumorose

Nei casi reali, con misure aette da inevitabilmente da disturbi, la ma-trice Y P presenterà in generale rango pieno e non il desiderato rango n. Un'applicazione alla lettera dell'identicazione su sottospazi descritta nella sezione precedente porterebbe alla costruzione di modelli di stato di di-mensione esagerata che descriverebbero anche la dinamica degli errori di misura (questione della sovraparametrizzazione). Per evitare il problema molti software permettono di scomporre la matrice Y P nel prodotto di tre matrici reali secondo la tecnica SVD (Singular Value Decomposition). Di questi tre fattori quello centrale presenta sulla diagonale principale i cosid-detti valori singolari della matrice: si tratta di quantità reali non negative, poste in ordine decrescente. Il numero di tali elementi diagonali non nulli si dimostra coincidere con il rango della Y P . Sebbene, come detto, una simile scomposizione porti in generale ad elementi non nulli sull'intera diagonale, è possibile isolare quelli con valore basso rispetto ai rimanenti ed arrivare a denire il rango numerico della Y P come il numero di valori singolari sensibilmente grandi. Il rango numerico è dunque il valore solitamente scelto come ordine del modello di stato.

5.5.4 Identicazione di un modello di stato per il sistema

di rareddamento

La tecnica di identicazione su sottospazi è stata testata sul sistema di rareddamento oggetto della presente tesi, relativamente ad una sessione di dati raccolta in periodo autunnale. Le misure sono state divise in dati per l'identicazione, adoperati per le stime di ordine e matrici, e per la validazione.

(47)

Figura 5.6:Andamento dei valori singolari di Y P relativamente a misure eettuate sul sistema di rareddamento sottocampionato ad 1 secondo; il graco è stato ottenuto tramite la funzionalità n4sid del System Identication Toolbox di Matlab.

(a) Aderenza del modello alle misure reali (private della media) della temperatura del liquido refrigerante.

(b) Test di bianchezza del residuo di predizione.

(48)

Va comunque detto che l'identicazione su sottospazi non permette di ottenere una classe di modelli più ampia rispetto a quanto già non riesca a fare l'approccio input/output privo di stato. Questo è chiaro dalla teo-ria della realizzazione: ogni sistema lineare scritto in spazio di stato può essere portato in forma ingresso/uscita e, viceversa, esiste sempre una ter-na (F, G, H) per cui un processo descritto da un'equazione alle dierenze esogena possa essere rappresentato in spazio di stato. Alla luce di ciò emerge naturale l'impossibilità di ottenere prestazioni migliori passando da modelli ARX/ARMAX ecc. a rappresentazioni interne: ciò è testimoniato dal comportamento ottenuto nei casi di gura 5.5 e 5.7 per i quali t e caratteristiche dei residui sono del tutto analoghi.

I tentativi fatti nel modellizzare il sistema di rareddamento con model-li a scatola nera del tipo ingresso/uscita o in spazio di stato, non hanno portato a risultati del tutto soddisfacenti. Tali modelli riescono a catturare l'intera dinamica del processo (bianchezza dell'errore) ma non mostrano al contempo aderenza ai dati di uscita (t bassi). Questo fatto è da imputare alla quantizzazione di 1°C introdotta dal sensore di uscita su una tempera-tura, quella del refrigerante, che varia, almeno a regime, in un range di una decina gradi. Alla natura livellata dell'uscita corrisponde una predizione del modello non soggetta allo stesso grado di quantizzazione, perché fun-zione anche di ingressi misurati con maggior dettaglio: ciò causa aderenze vistosamente basse tra misure e predizioni. Come si vede dalle gure 5.5a e 5.7a, la temperatura stimata simula abbastanza bene l'andamento di quel-la misurata presentando però un carattere oscilquel-latorio che abbassa il t. Il fatto che tali oscillazioni non abbiano ampiezze e frequenze regolari e si mantengano alle volte a valori superiori, altre volte a valori inferiori a quelli misurati, fa sì che sia conservata la bianchezza dell'errore di predizione.

Sebbene il modello ingresso/uscita sembri seguire veramente quella che è l'uscita vera9 dell'impianto, non avendo riscontro pratico nei dati è bene

guardare con didenza ai risultati ottenuti e cercare, per quanto possibile, un miglior compromesso tra bianchezza e aderenza a quelle che sono misure e non valori virtuali.

L'accettare, in un certo senso, la cattiva risoluzione dello strumento di misura ha portato alla ricerca di modelli diversi dai precedenti, basati so-lo sul segnale di uscita; dall'identicazione input/output si è così passati all'identicazione della sola serie temporale di uscita, presentata nella pros-sima sezione. Sulla stima ricorsiva di un modello autoregressivo per la serie temporale di temperatura del liquido refrigerante è stata poi basata la diagnostica dell'impianto di rareddamento.

(49)

5.6 Identicazione black-box di serie temporali

5.6.1 Introduzione

Il problema dell'identicazione delle serie temporali ha come obiettivo la costruzione di un modello che descriva l'evoluzione temporale della variabile misurata rappresentando il modo con cui le misure passate inuenzano quella corrente.

Tra i modelli di serie temporali, in questa tesi si considerano quelli lineari in cui il valore del segnale al tempo t è combinazione lineare dei suoi cam-pioni ad istanti precedenti. L'unica variabile esogena presente in queste rappresentazioni è al solito un termine di disturbo, grazie al quale si accet-ta il fatto che l'evoluzione non sia puramente deterministica, ovvero una semplice combinazione lineare di valori passati dell'uscita, bensì presenti caratteristiche aleatorie dovute ad errori di non linearità.

L'attenzione è qui rivolta alla classe di modelli autoregressivi (AR), a media mobile (MA) e alla combinazione di questi (modelli ARMA).

Una prima analisi della serie temporale, al ne di dedurre quale classe di modelli sia più adatta alla rappresentazione, sarà eseguita tramite l'algorit-mo di Durbin-Levinson mentre i metodi di Akaike (AIC, Akaike Information Criterion) e di Kolmogorov sulla minima complessità di descrizione (MDL, Minimum Description Length) rappresentano l'approccio nale nella scelta dell'ordine (numero parametri) all'interno della classe selezionata.

5.6.1.1 Identicazione di modelli AR

La struttura dei modelli AR è descritta da un'equazione alle dierenze del tipo

y (t) = a1y (t − 1) + a2y (t − 2) + ... + anay (t − na) + ξ (t) (5.15)

nella quale il valore attuale dell'uscita y (t) è legato linearmente al suo passato no ad un massimo di na passi di campionamento e ad un termine

erratico ξ (t) bianco a media nulla e varianza λ2. n

a è l'ordine del modello,

mentre a1, ..., ana sono i parametri da identicare; a questi si aggiunge la

varianza λ2. L'eq. (5.15), indicata con la scrittura compatta AR(n

a), viene

anche riscritta come

A z−1 y (t) = ξ (t) dove si è posto

A z−1 = 1 + a1z−1+ a2z−2+ ... + anaz

−na.

(50)

ˆ

y (t|t − 1) = 1 − A z−1 y (t) = a1y (t − 1) + ... + anay (t − na) .

Il calcolo dei parametri avviene per mezzo della minimizzazione della loss function JN = 1 N N X t=1 ε (t)2= 1 N N X t=1 (y (t) − ˆy (t|t − 1))2

sulle N misure raccolte per l'identicazione. Per farlo si ricorre al cosid-detto metodo dei minimi quadrati, di seguito descritto.

Deniti i seguenti vettori di parametri e misure

θ =      a1 a2 ... ana      , ϕ (t) =      y (t − 1) y (t − 2) ... y (t − na)     

il modello (5.15) è riscrivibile nella forma compatta y (t) = ϕ (t)Tθ + ξ (t) mentre il predittore diventa

ˆ

y (t|t − 1) = ϕ (t)Tθ. Il residuo di predizione si riscrive come

ε (t) = y (t) − ϕ (t)Tθ

con y (t) indicante la misura raccolta al tempo corrente t.

Anche la loss function è riscrivibile in funzione dei vettori introdotti. Precisamente JN(θ) = 1 N N X t=1  y (t) − ϕ (t)Tθ 2 .

I punti di minimo di questa quantità scalare si ottengono annullandone la derivata rispetto al vettore dei parametri da cui dipende. Ne risulta il sistema di equazioni "N X t=1 ϕ (t) ϕ (t)T # θ = N X t=1 ϕ (t) y (t)

(51)

SN = N

X

t=1

ϕ (t) ϕ (t)T

è non singolare (condizione di identicabilità del modello). Se questa è la situazione, l'unica soluzione è data da

θ =      a1 a2 ... ana      = S−1N N X t=1 ϕ (t) y (t) . (5.16)

Nel caso di un modello AR di ordine na= 1, θ, ϕ e SN sono scalari e la

(5.16) si riduce a θ = a1= PN t=1y (t − 1) y (t) PN t=1y (t − 1) 2 . (5.17)

Capitolo a parte va aperto per la scelta dell'ordine na del modello. In n

dei conti esso è, come detto, un parametro aggiuntivo ignoto che andrebbe determinato prima di tutti gli altri. Un modo di procedere alla scelta dell'ordine è banalmente quello di identicare diversi modelli di vari ordini e confrontarne le prestazioni su dati di validazione; si parla in questo caso di cross-validazione. Negli anni i contributi alla soluzione del problema di scelta dell'ordine si sono comunque susseguiti ed agli studi di Yule, Walker, Durbin e Levinson, si sono presto aancati quelli di Akaike e Kolmogorov, fautori di due criteri per la determinazione degli ordini ottimali in modelli AR e ARX (anche multi-input).

Così, pur avendo potuto procedere alla ricerca dell'ordine ottimale na

mediante cross-validazione, si è qui preferito mantenere uno sfondo di rigo-rosità teorica.

5.6.1.2 Identicazione di modelli MA

I modelli MA (media mobile, in inglese Moving Average) rappresentano la serie temporale con un'equazione priva di campioni passati del segnale, dove l'uscita è semplicemente funzione di un rumore bianco a media nulla (ξ). In particolare, il valore attuale del segnale è ottenuto come combina-zione lineare (media) del valore presente e del passato, no a nc istanti di

campionamento, del rumore stesso:

y (t) = ξ (t) + c1ξ (t − 1) + ... + cncξ (t − nc) . (5.18)

L'eq.(5.18) è rappresentabile con la scrittura MA(nc) dove nc è l'ordine

(52)

y (t) = C z−1 ξ (t) dove C z−1 = 1 + c

1z−1+ ... + cncz

−nc.

Dall'eq.(5.7) il predittore ottimo per il modello MA è denito dall'espres-sione

ˆ

y (t|t − 1) = C z

−1 − 1

C (z−1) y (t)

non lineare nei parametri c1, ..., cnc; la minimizzazione della loss function

1 N N X t=1 (y (t) − ˆy (t|t − 1))2

diviene così un problema di ottimizzazione non lineare; in particolare non è più valida la formula dei minimi quadrati determinata per gli AR e per la stima parametrica vanno utilizzati metodi iterativi quali quello di Newton sulla discesa del gradiente[16].

La natura bianca di ξ nel modello (5.18) fa sì che la funzione di correla-zione

γ (τ ) = E [y (t) y (t + τ )]

sia nulla per τ > nc. Un modo per capire se una data serie storica

{y (t)}t=1,...,N è rappresentabile con un'equazione del tipo (5.18) è allora quello di calcolarne la correlazione campionaria10

ˆ γ (τ ) = 1 N N −τ X t=1 y (t) y (t + τ )

per diversi valori interi del lag τ e vericare se da un certo ritardo in poi questa si annulla (almeno approssimativamente). Detto τ = nc l'eventuale

ultimo campione non nullo di correlazione campionaria, si è nella situazione in cui la serie temporale obbedisce ad un modello MA(nc). In caso contrario

per il segnale va cercato un modello alternativo, quale l'AR o l'ARMA. 5.6.1.3 Identicazione di modelli ARMA

Qualora si decida di rappresentare la serie temporale come combinazioni di alcuni suoi valori passati a cui si sommi un errore colorato, l'equazione alle dierenze appropriata è:

10Campionaria nel senso che rappresenta una stima della funzione di correlazione vera,

Riferimenti

Documenti correlati

La pubblicazione può essere statica (i dati estratti dal database diventano una pagina web, HTML, statica, un file statico di tipo snapshot)o dinamica (l’utente vede i dati

Le pubbliche relazioni con le Aziende Sponsor, lo Staff della Nazionale e tutte le figure della Federazione Italiana di Rugby vengono coltivate anche durante le cene di

Per molto tempo le istiocitosi a cellule di Langerhans (Langerhans Cell Histiocytosis = LCH) e le istiocitosi a cellule Non-Langerhans (Non-Langerhans Cell Histiocytosis = NLCH)

Disegnare in mo- do qualitativo l’andamento della funzione descrittiva F (X) della non linearit`a N.L. assegnata, prendendo l’origine come punto di lavoro.. .) l’esi- stenza o meno

Soluzione. .) l’esi- stenza o meno di cicli limite nel sistema retroazionato al variare del guadagno K &gt;

[r]

Gli impianti a stabilità angolare, considerato il vincolo meccanico tra vi- te e placca, prevedono una stabilità più duratura pertanto una poten- ziale protezione da stimolo

Come sottoli- neato dal Rapporto Annuale dell'Istat le variazioni dimen- sionali delle classi occupazionali sono in gran parte respon- sabili del fatto che tutte le generazioni