• Non ci sono risultati.

Tradizionalmente per risolvere applicazioni legate alla previsione di serie stori- che si è ampiamente fatto ricorso ai più popolari metodi statistici lineari, in spe- cial modo alla classe dei modelli autoregressivi integrati a media mobile (ARI- MA). Il motivo deriva dal fatto che essi sono relativamente facili da sviluppare e implementare e sono inoltre semplici da comprendere e interpretare (Guoqiang Peter Zhang 2001). É evidente che sono tutte caratteristiche desiderabili, special- mente in situazioni in cui si devono effettuare previsioni di una moltitudine di se- rie storiche e/o in cui la ricerca di un grado ottimo di precisione della previsione non è una requisito così fondamentale.

I modelli lineari sono tuttavia soggetti a una forte limitazione derivante dalla considerazione che molti problemi complessi nel mondo reale sono spesso non lineari (Granger, Terasvirta et al. 1993). Molte serie storiche osservate infatti esi- biscono caratteristiche che non possono essere spiegate da un modello lineare. Ad esempio, le serie storiche finanziarie sono spesso caratterizzate da periodi di stabilità seguiti da periodi di elevata volatilità, da asimmetria, dalla presen- za di valori anomali improvvisi e irregolari e dalla probabile presenza di regimi all’interno dei quali il processo sottostante sembra comportarsi diversamente. É chiaro, quindi, che applicare un modello lineare ad una serie storica sarebbe to- talmente inappropriato qualora essa fosse in realtà generata da un processo non lineare. In altri termini, un modello che a priori assume che il processo sottostante sia lineare non può essere in grado di spiegare e cogliere adeguatamente strutture non lineari presenti nelle serie reali. Difatti, si ottengono spesso risultati non sod- disfacenti quando si impiegano modelli lineari per approssimare problemi com- plessi non lineari, soprattutto quando l’orizzonte di previsione è relativamente lungo (Guoqiang Peter Zhang 2001).

A tal proposito, per comprendere il comportamento di alcuni sistemi non li- neari sono stati proposti in letteratura una varietà di modelli non lineari. Tra questi si citano in primo luogo i modelli non lineari parametrici, come ad esem- pio i modelli bilineari, i modelli autoregressivi a soglia (TAR), i modelli STAR (Smooth Transition Autoregressive) e i modelli Markov-switching (MS). In ogni caso, tali modelli sono nondimeno soggetti ad alcune problematiche. In primo luogo

la costruzione di un appropriato modello non lineare per una data serie storica rispetto a un modello lineare rappresenta un compito alquanto complesso tenuto conto che «vi sono più possibilità, più parametri e che più errori quindi si pos- sono commettere» (Granger 1993). Un’ulteriore limitazione, più rilevante, è che sebbene possano essere utili per taluni problemi particolari e data set, non sono applicabili alla generalità dei problemi (G Peter Zhang, Patuwo e Hu 2001). Ad esempio, la classe dei modelli ARCH e GARCH è stata sviluppata esclusivamen- te allo scopo di descrivere la varianza condizionata del processo. In tal senso, considerando che possono esistere una moltitudine di strutture non lineari e che questi modelli sono stati sviluppati principalmente per rappresentare particolari forme di non linearità, risulta evidente che un modello non lineare parametrico che specifica a priori un’esplicita relazione tra i dati potrebbe non essere abba- stanza generale per riuscire a cogliere tutta la non linearità presente, soprattutto quando si ha una conoscenza limitata del processo sottostante. Conseguente- mente, tale tipologia di modelli potrebbe essere non così utile per modellare serie storiche finanziarie, dato che è alquanto difficile scegliere a priori la funzione non lineare da impiegare.

Un approccio alternativo non lineare che supera in parte le limitazioni dei più comuni metodi parametrici è quello rappresentato dalle rete neurali artificiali (Artificial Neural Network - ANN). Le reti neurali artificiali nell’ambito dell’ana- lisi di serie storiche si contraddistinguono per alcune proprietà e caratteristiche peculiari, individuate sistematicamente da G. Zhang, Patuwo e Hu (1998), che le rendono oggetto di notevole interesse anche in applicazioni finalizzate alla previsione. In primo luogo, a differenza dei più tradizionali modelli, compresi quelli non lineari citati precedentemente, che richiedono di esplicitare a priori una relazione tra variabili, le reti neurali appartengono alla classe dei metodi non parametrici: non necessitano di specificare alcuna assunzione a priori cir- ca la struttura del modello sottostante e colgono le relazioni funzionali tra i dati attraverso gli stessi dati e l’esperienza. Essendo modelli che si fondano quindi su un approccio data-driven, sono conseguentemente adatti ed efficaci quando si hanno a disposizione osservazioni e dati relativi al problema in esame in quanti- tà sufficiente e in situazioni in cui, come spesso succede quando si trattano serie reali, non si conosce o è difficile descrivere la forma del processo generatore dei

CAPITOLO 2. MODELLI LINEARI ARIMA E RETI NEURALI ARTIFICIALI

dati. In secondo luogo è stato dimostrato empiricamente che una rete neurale è un approssimatore universale di funzioni. Essendo in grado di approssimare qualsiasi funzione continua complessa dato un grado di accuratezza desiderato, una ANN si rileva essere uno strumento alquanto flessibile per la sua capacità di stimare per un’ampia categoria di problemi la sottostante relazione funzionale non lineare esistente tra input e output. Si noti, tuttavia, che non vi è modo di comprendere chiaramente, esaminando i risultati generati dalla rete, quale sia la struttura della funzione approssimata. Per l’oggettiva difficoltà ad interpretare i risultati generati dalla rete e per l’impossibilità di analizzare in modo certo le relazioni che intercorrono tra input e output, si classificano le ANN come metodi black box. Un’ultima motivazione che spinge ad utilizzare la ANN è che spesso è in grado di generalizzare, ovvero è in grado di dedurre correttamente l’anda- mento futuro delle variabili output, anche quando il campione di dati utilizzato in una fase antecedente per costruire e addestrare la rete contiene rumore.