• Non ci sono risultati.

Combinazione di previsioni di serie storiche finanziarie

N/A
N/A
Protected

Academic year: 2021

Condividi "Combinazione di previsioni di serie storiche finanziarie"

Copied!
148
0
0

Testo completo

(1)

in Economia e Finanza

Economics and Finance

Tesi di Laurea

Combinazioni di previsioni di serie

storiche finanziarie

Relatore

Ch. Prof. Claudio Pizzi

Laureanda

Elisa Nadalon

Matricola 832983

Anno Accademico

2014-2015

(2)
(3)
(4)
(5)

Indice i

Elenco delle tabelle iii

Elenco delle figure vii

Introduzione 1

1 Lo stato dell’arte 5

1.1 Motivazioni . . . 5

1.2 Evoluzione degli studi sulla combinazione di previsioni . . . 6

1.3 Le serie storiche finanziarie . . . 18

2 Il modello proposto 21 2.1 Una panoramica generale . . . 21

2.2 Gli indicatori di analisi tecnica . . . 23

2.2.1 Simple Moving Average (SMA) ed Exponential Moving Ave-rage (EMA) . . . 25

2.2.2 Bande di Bollinger . . . 27

2.2.3 Relative Strength Index (RSI) . . . 29

2.3 La regressione locale . . . 31

2.4 Il Particle Swarm Optimization (PSO) . . . 37

2.5 Gli indici di mercato . . . 42

2.6 L’analisi e i risultati del modello . . . 43

2.7 Il vincolo sui pesi . . . 54

3 Evoluzioni del modello 57 3.1 La componente autoregressiva di ordine 1 . . . 57

3.2 La componente autoregressiva di ordine 5 . . . 64

3.3 La previsione one step ahead . . . 72

3.4 I rendimenti . . . 78

4 L’Analisi discriminante e il PSO 87 4.1 L’analisi discriminante . . . 87

4.2 Ottimizzazione dell’uso del PSO . . . 93

(6)

Conclusioni 99

Bibliografia 103

Appendici 108

A Analisi dei rendimenti 109

A.1 FTSE MIB . . . 109

A.2 DAX 30 . . . 111

A.3 NASDAQ 100 . . . 113

A.4 FTSE 100 . . . 115

B I rendimenti nel modello ibrido 117

C Parametri stimati dal PSO 129

(7)

1.1 Valutazione previsiva in termini di R2 delle singole previsioni

con-frontata con quella delle previsioni combinate a due a due. Fonte: A.

E. BOPP, 1985 [2] . . . 6

1.2 Valutazione previsiva in termini di errore quadratico medio e di

devia-zione media assoluta del modello ibrido. Fonte: G. P. ZHANG, 2003

[11] . . . 13

2.1 Alcuni comuni tipi di funzioni kernel. Fonte: A. AZZALINI EB. SCAR

-PA, 2004 [33] . . . 33

2.2 Parametri del PSO per differenti configurazioni del problema. Fonte:

M. ERIK EH. PEDERSON, 2010 [39] . . . 41

2.3 Numerosità campionaria delle quattro serie storiche in esame . . . 41

2.4 Previsioni di Buy o Sell del periodo t2 effettuate dai tre indicatori di

analisi tecnica per le quattro serie storiche in esame . . . 44

2.5 Valori della costante Cv,p(K). Fonte: J. FAN E I. GIJBELS, 1996 [36] . . . 46

2.6 Parametri e relativi errori della regressione locale polinomiale

calcola-ta sulle quattro serie storiche degli indici di mercato . . . 48

2.7 Previsione di Buy o Sell per t2relative alle quattro serie storiche in esame 50

2.8 Combinazione delle previsioni delle quattro serie storiche degli indici

di mercato in esame generate sul training set . . . 52

2.9 Combinazione delle previsioni delle quattro serie storiche degli indici

di mercato in esame generate sul test set . . . 52

2.10 Confronto tra combinazione di previsioni con e senza vincolo per le

quattro serie storiche in esame . . . 54

2.11 Combinazione delle previsioni delle quattro serie storiche degli indici

di mercato in esame generate sul training set con vincolo sui pesi . . . . 55

2.12 Combinazione delle previsioni delle quattro serie storiche degli indici

di mercato in esame generate sul test set con vincolo sui pesi . . . 55

3.1 Previsione di Buy o Sell per t2 delle quattro serie storiche in esame

inserendo nella LOWESS, oltre al trend temporale, una componente

autoregressiva di ordine 1 . . . 59

3.2 Combinazione delle previsioni delle quattro serie storiche degli

indi-ci di mercato in esame generate sul training set considerando il trend

temporale e la componente autoregressiva di ordine 1 . . . 61

(8)

3.3 Combinazione delle previsioni delle quattro serie storiche degli in-dici di mercato in esame generate sul test set considerando il trend

temporale e la componente autoregressiva di ordine 1 . . . 61

3.4 Combinazione delle previsioni delle quattro serie storiche degli indici

di mercato in esame generate sul training set inserendo una

compo-nente autoregressiva di ordine 1 e imponendo un vincolo sui pesi . . . 63

3.5 Combinazione delle previsioni delle quattro serie storiche degli indici

di mercato in esame generate sul test set inserendo una componente

autoregressiva di ordine 1 e imponendo un vincolo sui pesi . . . 63

3.6 Confronto tra combinazione di previsioni con e senza vincolo per le

quattro serie storiche in esame considerando il trend temporale e la

componente autoregressiva di ordine 1 . . . 64

3.7 Previsione di Buy o Sell per t2 delle quattro serie storiche in esame

inserendo nella LOWESS una componente autoregressiva di ordine 5,

oltre al trend temporale . . . 66

3.8 Combinazione delle previsioni delle quattro serie storiche degli

in-dici di mercato in esame generate sul training set nella LOWESS una

componente autoregressiva di ordine 5, oltre al trend temporale . . . . 67

3.9 Combinazione delle previsioni delle quattro serie storiche degli indici

di mercato in esame generate sul test set nella LOWESS una

compo-nente autoregressiva di ordine 5, oltre al trend temporale . . . 67

3.10 Confronto tra combinazione di previsioni con e senza vincolo per le quattro serie storiche in esame inserendo nella LOWESS sia il trend

temporale che la componente autoregressiva di ordine 5 . . . 69

3.11 Combinazione delle previsioni delle quattro serie storiche degli indici di mercato in esame generate sul training set inserendo una

compo-nente autoregressiva di ordine 5 e imponendo un vincolo sui pesi . . . 70

3.12 Combinazione delle previsioni delle quattro serie storiche degli indici di mercato in esame generate sul test set inserendo una componente

autoregressiva di ordine 5 e e imponendo un vincolo sui pesi . . . 70

3.13 Confronto tra le combinazioni di previsioni ottenute considerando sia il trend temporale sia le componenti autoregressive di ordine 1 e di

ordine 5 per le quattro serie storiche in esame . . . 71

3.14 Pesi ottimali generati dal PSO sul periodo di training set attribuiti alle

previsioni statiche . . . 74

3.15 Bontà delle combinazioni di previsioni statiche ottenute sul test set . . 74

3.16 Pesi ottimali generati dal PSO sul periodo di training set attribuiti alle previsioni statiche inserendo nella LOWESS, oltre al trend temporale,

una componente autoregressiva di ordine 1 . . . 75

3.17 Bontà delle combinazioni di previsioni statiche ottenute sul test set inserendo nella LOWESS, oltre al trend temporale, una componente

autoregressiva di ordine 1 . . . 75

3.18 Pesi ottimali generati dal PSO sul periodo di training set attribuiti alle previsioni statiche inserendo nella LOWESS, oltre al trend temporale,

(9)

3.19 Bontà delle combinazioni di previsioni statiche ottenute sul test set inserendo nella LOWESS, oltre al trend temporale, una componente

autoregressiva di ordine 5 . . . 76

3.20 Confronto tra le combinazioni di previsioni one step ahead ottenute con-siderando il trend temporale, la componente autoregressiva di ordine

1 e di ordine 5 per le quattro serie storiche in esame . . . 77

3.21 P-value dei test ADF effettuati sulle quattro serie storiche in esame

dove l’ipotesi nulla è la presenza di radice unitaria . . . 78

3.22 Confronto tra le combinazioni di previsioni ottenute ottenute utiliz-zando i rendimenti delle quattro serie storiche in esame e consideran-do il trend temporale, la componente autoregressiva di ordine 1 e di

ordine 5 . . . 80

3.23 Confronto tra le combinazioni di previsioni one step ahead ottenute uti-lizzando i rendimenti delle quattro serie storiche in esame e conside-rando il trend temporale, la componente autoregressiva di ordine 1 e

di ordine 5 . . . 81

3.24 Pesi ottimali selezionati dal PSO sul periodo di training set: γ1 per la

LOWESS, γ2per l’EMA, γ3 per le BBANDS e γ4 per l’RSI . . . 82

4.1 Pesi ottimali generati avvalendosi dell’analisi discriminante sul

perio-do di test set attribuiti alle previsioni statiche e relativa bontà delle

combinazioni . . . 90

4.2 Pesi ottimali generati avvalendosi dell’analisi discriminante attribuiti

alle previsioni statiche considerando un diverso segnale operativo per

l’RSI . . . 91

4.3 Bontà delle combinazioni di previsioni statiche ottenute sul test set

considerando un diverso segnale operativo per l’RSI . . . 92

4.4 Bontà del modello ibrido calcolato sulle quotazioni degli indici . . . 97

4.5 Bontà del modello ibrido calcolato sui rendimenti degli indici . . . 97

B.1 Combinazione delle previsioni sui rendimenti delle quattro serie sto-riche in esame generate sul training set . . . 123 B.2 Combinazione delle previsioni sui rendimenti delle quattro serie

sto-riche in esame generate sul test set . . . 123

B.3 Combinazione delle previsioni sui rendimenti delle quattro serie sto-riche in esame generate sul training set imponendo il vincolo della somma a uno sui pesi . . . 124 B.4 Combinazione delle previsioni sui rendimenti delle quattro serie

sto-riche in esame generate sul test set imponendo il vincolo della somma a uno sui pesi . . . 124 B.5 Combinazione delle previsioni sui rendimenti delle quattro serie

sto-riche in esame generate sul training set introducendo nella LOWESS, oltre al trend temporale, anche una componente autoregressiva di or-dine 1 . . . 125

(10)

B.6 Combinazione delle previsioni sui rendimenti delle quattro serie sto-riche in esame generate sul test set introducendo nella LOWESS, oltre al trend temporale, anche una componente autoregressiva di ordine 1 . 125 B.7 Combinazione delle previsioni sui rendimenti delle quattro serie

sto-riche in esame generate sul training set introducendo una componente autoregressiva di ordine 1 e imponendo il vincolo della somma a uno sui pesi . . . 126 B.8 Combinazione delle previsioni sui rendimenti delle quattro serie

sto-riche in esame generate sul test set introducendo una componente au-toregressiva di ordine 1 e imponendo il vincolo della somma a uno sui pesi . . . 126 B.9 Combinazione delle previsioni sui rendimenti delle quattro serie

sto-riche in esame generate sul training set introducendo nella LOWESS, oltre al trend temporale, anche una componente autoregressiva di or-dine 5 . . . 127 B.10 Combinazione delle previsioni sui rendimenti delle quattro serie

sto-riche in esame generate sul test set introducendo nella LOWESS, oltre al trend temporale, anche una componente autoregressiva di ordine 5 . 127 B.11 Combinazione delle previsioni sui rendimenti delle quattro serie

sto-riche in esame generate sul training set introducendo una componente autoregressiva di ordine 5 e imponendo il vincolo di somma a uno sui pesi . . . 128 B.12 Combinazione delle previsioni sui rendimenti delle quattro serie

sto-riche in esame generate sul test set introducendo una componente au-toregressiva di ordine 5 e imponendo il vincolo di somma a uno sui pesi . . . 128 C.1 Parametri stimati dal PSO e relativi al modello ibrido calcolato sulle

quotazioni del indici in esame . . . 130 C.2 Parametri stimati dal PSO e relativi al modello ibrido calcolato sui

rendimenti degli indici in esame . . . 131 C.3 Pesi ottimali generati dal PSO attribuiti alle previsioni statiche

utiliz-zando le ultime 200 quotazioni degli indici di mercato . . . 132 C.4 Pesi ottimali generati dal PSO attribuiti alle previsioni statiche

(11)

1.1 Combinazione previsiva del modello ARIMA con l’algoritmo PSO.

Fonte: S. ASADI, A. TAVAKOLI E S. R. HEJAZI, 2012 [17] . . . 16

1.2 Combinazione previsiva del modello ARIMA con la BPNN e l’ESM

utilizzando un algoritmo genetico. Fonte: J. J. WANG, J. Z. WANG, Z.

G. ZHANG ES. P. GUO, 2012 [18] . . . 17

2.1 Il diagramma del modello proposto . . . 21

2.2 Regressione lineare locale stimata sui dati stipendio/anni. Fonte: M.

P. WAND EM. C. JONES, 1995 [34] . . . 34

2.3 Modifica della posizione e della velocità di un individuo nel PSO.

Fonte: S. ASADI, A. TAVAKOLI E S. R. HEJAZI, 2012 [17] . . . 39

2.4 Regressione locale polinomiale e relativa previsione delle quattro serie

storiche degli indici di mercato calcolate in t1 e t2 . . . 50

2.5 Regressione locale polinomiale e relativa previsione delle quattro serie

storiche degli indici di mercato calcolate in t2 e t3 . . . 53

3.1 Regressione locale polinomiale e relativa previsione delle quattro serie

storiche degli indici di mercato calcolate in t1e t2considerando il trend

temporale e la componente autoregressiva di ordine 1 . . . 58

3.2 Regressione locale polinomiale e relativa previsione delle quattro serie

storiche degli indici di mercato calcolate in t2e t3considerando il trend

temporale e la componente autoregressiva di ordine 1 . . . 62

3.3 Regressione locale polinomiale e relativa previsione delle quattro serie

storiche degli indici di mercato calcolate in t1e t2considerando il trend

temporale e la componente autoregressiva di ordine 5 . . . 65

3.4 Regressione locale polinomiale e relativa previsione delle quattro serie

storiche degli indici di mercato calcolate in t2e t3considerando il trend

temporale e la componente autoregressiva di ordine 5 . . . 68

3.5 La funzionePt3

j=1θjrelativa alla bontà delle combinazioni di

previsio-ni statiche calcolate sui rendimenti considerando solo il trend

tempo-rale . . . 84

3.6 La funzionePt3

j=1θjrelativa alla bontà delle combinazioni di

previsio-ni statiche calcolate sui rendimenti considerando oltre al trend

tempo-rale, anche la componente autoregressiva di ordine 1 . . . 85

(12)

3.7 La funzionePt3

j=1θjrelativa alla bontà delle combinazioni di

previsio-ni statiche calcolate sui rendimenti considerando oltre al trend

tempo-rale, anche la componente autoregressiva di ordine 5 . . . 86

4.1 Il diagramma della nuova versione del modello ibrido . . . 94

A.1 Correllogramma dei residui del modello AR(1) determinato per il FTSE MIB . . . 110

A.2 Test di Box-Ljung sui residui del modello AR(1) determinato per il FTSE MIB . . . 110

A.3 Test di normalità effettuati sui residui del modello AR(1) stimato per il FTSE MIB . . . 110

A.4 Test di eteroschedasticità effettuato sui residui del modello AR(1) sti-mato per il FTSE MIB . . . 111

A.5 Correllogramma dei residui del modello AR(5) determinato per il DAX 30 . . . 112

A.6 Test di Box-Ljung sui residui del modello AR(5) determinato per il DAX 30 . . . 112

A.7 Test di normalità effettuati sui residui del modello AR(5) stimato per il DAX 30 . . . 113

A.8 Test di eteroschedasticità effettuato sui residui del modello AR(5) sti-mato per il DAX 30 . . . 113

A.9 Correllogramma dei rendimenti del NASDAQ 100 . . . 113

A.10 Test di Box-Ljung sui rendimenti del NASDAQ 100 . . . 114

A.11 Test di normalità effettuati sui rendimenti del NASDAQ 100 . . . 114

A.12 Test di eteroschedasticità effettuato sui rendimenti del NASDAQ 100 . 114 A.13 Correllogramma dei rendimenti del FTSE 100 . . . 115

A.14 Test di Box-Ljung sui rendimenti del FTSE 100 . . . 116

A.15 Test di normalità effettuati sui rendimenti del FTSE 100 . . . 116

A.16 Test di eteroschedasticità effettuato sui rendimenti del FTSE 100 . . . . 116

B.1 Regressione locale polinomiale e relativa previsione delle quattro serie storiche degli indici di mercato calcolate sui rendimenti registrati in t1 e t2 e considerando solo il trend temporale . . . 117

B.2 Regressione locale polinomiale e relativa previsione delle quattro serie storiche degli indici di mercato calcolate sui rendimenti registrati in t2 e t3 e considerando solo il trend temporale . . . 118

B.3 Regressione locale polinomiale e relativa previsione delle quattro serie storiche degli indici di mercato calcolate sui rendimenti registrati in t1 e t2e considerando il trend temporale e la componente autoregressiva di ordine 1 . . . 119

B.4 Regressione locale polinomiale e relativa previsione delle quattro serie storiche degli indici di mercato calcolate sui rendimenti registrati in t2 e t3e considerando il trend temporale e la componente autoregressiva di ordine 1 . . . 120

(13)

B.5 Regressione locale polinomiale e relativa previsione delle quattro serie

storiche degli indici di mercato calcolate sui rendimenti registrati in t1

e t2e considerando il trend temporale e la componente autoregressiva

di ordine 5 . . . 121 B.6 Regressione locale polinomiale e relativa previsione delle quattro serie

storiche degli indici di mercato calcolate sui rendimenti registrati in t2

e t3e considerando il trend temporale e la componente autoregressiva

(14)
(15)

«The best prophet of the future is the past» Lord Byron

La previsione è un’attività molto delicata e complessa soprattutto per l’enor-me quantità di dati e informazioni da tenere in considerazione quando si svolge questo tipo di operazione. Ciò diventa ancora più vero nel mondo borsistico. In particolare, nella finanza si può affermare che la previsione è una medaglia con una duplice faccia. Infatti, da un lato una corretta previsione consente di effet-tuare un investimento in maniera sicura e di conseguire un ritorno economico, dall’altro, se la previsione viene sviluppata in maniera superficiale, il rischio di perdere ciò è stato investito può assumere dimensioni elevate. Pertanto, nel mon-do borsistico occorre tenere presente che gli oggetti delle previsioni sono i flussi di capitale, i quali possono subire variazioni ogni minuto e possono risultare mol-to ingenti. Inoltre, tali flussi sono l’espressione di comportamenti collettivi, della diffusione di una determinata informazione, di scelte istituzionali o atte a garan-tire una determinata stabilità economica, nonché fattori che devono essere tenuti in considerazione quando si effettua questo tipo di previsione.

In questo senso, nella finanza la previsione è diventata nel corso degli anni una vera e propria scienza alla quale molti studiosi hanno cercato di dare un loro contributo per comprendere il comportamento futuro dei prezzi di un de-terminato strumento finanziario. Risulterebbe tuttavia più corretto assimilare la previsione ad un’arte, nella quale si cerca di comprendere le varie sfumature di

(16)

un fenomeno finanziario per utilizzare poi tale informazione ai fini di effettuare una formulazione sul comportamento futuro di tale fenomeno. Il tutto avviene all’interno di un ambiente caratterizzato da cambiamenti continui e piuttosto re-pentini e da un certo grado di rumore, nel quale l’artista (il trader) deve cercare di distinguere l’informazione vera e utile ai fini dell’indagine da quella inadatta e falsa. Per questo, la previsione, così come l’economia, non può essere di certo considerata una scienza esatta.

Nel corso degli anni sono state avanzate molte metodologie che cercano di sviluppare previsioni nel mondo della finanza. Tuttavia, la maggior parte di que-sti studi effettua attività previsiva scegliendo il modello, e la relativa previsione, che risulta più adeguato per l’obiettivo fissato, scartando quindi tutti gli altri.

In questo elaborato, l’obiettivo posto assume una direzione contraria a quan-to affermaquan-to in queste ultime righe. In particolare, il fine di questa tesi è quello di combinare previsioni provenienti da strumenti previsivi che effettuano assun-zioni diverse e possono avere una natura differente gli uni dagli altri. In que-sto modo si vuole superare l’ambizione di alcuni studiosi di trovare la migliore previsione per un determinato fenomeno. Infatti, potrebbe risultare vero che la previsione più buona e corretta si ottenga combinando più previsioni piuttosto che scegliendone solo una.

Alla luce di quanto affermato sinora, risulta chiaro che se effettuare una sin-gola previsione è un’operazione molto complessa e delicata, a maggior ragione combinare previsioni può risultare un’attività ancora più articolata e complicata. Per raggiungere l’obiettivo di questo elaborato, nel primo capitolo viene effet-tuato un excursus storico sui vari modelli sviluppati nel corso degli anni che com-binano previsioni. In particolare, vengono presentate metodologie combinative relativamente semplici e di facile comprensione, fino a modelli molto elaborati e complessi.

(17)

uti-lizzati per sviluppare il modello ibrido, nonché alcuni indicatori di analisi tecnica (la media mobile esponenziale, il Relative Strength Index e le bande di Bollinger) e la regressione locale polinomiale. Le relative previsioni vengono poi combinate utilizzando l’algoritmo di ottimizzazione basato su sciami di particelle (Particle Swarm Optimization, PSO), il quale stima i pesi delle quattro previsioni. Tale mo-dello ibrido viene applicato alle serie storiche di alcuni indici di borsa, ovvero il FTSE MIB, il DAX 30, il NASDAQ 100 e il FTSE 100.

Nel terzo capitolo viene introdotta nella regressione locale polinomiale una componente autoregressiva di ordine 1 e di ordine 5 in modo tale da compren-dere quali effetti comporta tale modifica sulla combinazione di previsioni. Ven-gono successivamente considerate le previsioni dei quattro strumenti previsivi e i rendimenti degli indici in esame.

Nell’ultimo capitolo si discute della sostituzione del PSO con l’analisi discri-minante nella stima dei pesi delle previsioni. Inoltre, viene presentata un’ulte-riore evoluzione del modello ibrido nella quale tutti i parametri di tale sistema vengono direttamente determinati dal PSO, in modo tale da ottimizzare l’uso di tale algoritmo.

(18)
(19)

L

O STATO DELL

ARTE

1.1

Motivazioni

La combinazione di previsioni è un tema su cui si è molto dibattuto soprat-tutto in tempi pressoché recenti. A tal proposito, l’importanza rivestita da questa metodologia è stata tale da essere oggetto di attenzione di molti studi. Tale ap-proccio consente infatti di superare un limite imposto dal tradizionale metodo previsivo, ovvero quello di dover scegliere solo la previsione migliore relativa ad un fenomeno, scartando tutte le altre disponibili. In quest’ultime, tuttavia, pos-sono essere presenti delle ulteriori informazioni utili per migliorare la capacità previsiva della previsione scelta. A tal proposito, «[. . . ] [Tr. It] una previsione può basarsi su variabili o informazioni che l’altra previsione non ha considera-to [oppure] [. . . ] una previsione può effettuare delle assunzioni differenti sulla forma della relazione tra le variabili» [1].

Si può quindi affermare che l’uso sempre maggiore di questa metodologia previsiva trova giustificazione da un lato nell’ambizione degli studiosi di ricer-care la migliore previsione possibile per un dato fenomeno, mentre dall’altro lato nel preferire una combinazione di previsioni, piuttosto che sceglierne una tra quelle disponibili e scartare tutte le altre.

Una semplice validazione empirica di quanto sostenuto finora è fornita da A. E. Bopp, docente del Dipartimento di Informatica dell’Università della

(20)

ginia (U.S.A.), il quale in un articolo [2] combina tre previsioni sul consumo di benzina negli U.S.A.. Più specificatamente, la prima previsione è stata ottenuta con un modello econometrico, la seconda utilizzando un semplice modello re-gressivo, mentre la terza deriva da un modello ARIMA. I pesi assegnati alle tre previsioni sono stati ottenuti utilizzando una regressione lineare. Come si può notare dai risultati riportati nella tabella 1.1, Bopp dimostra che combinando le tre previsioni a due a due si ottiene un modello previsivo migliore in termini di

R2 rispetto alle singole previsioni.

Month Single Models Mixed Models

Forecast Econometric Regression Time-Series Eco. + Regr. Eco. + T.S. Regr. + T.S.

1 0.6745 0.7071 0.6549 0.7404 0.7484 0.7116 2 0.7045 0.7329 0.7172 0.7460 0.7772 0.7496 3 0.7490 0.7706 0.8107 0.7784 0.8339 0.8189 4 0.7043 0.7571 0.7542 0.7612 0.7717 0.7745 5 0.6885 0.7798 0.8289 0.7803 0.8333 0.8384 6 0.6363 0.7263 0.8014 0.7274 0.8024 0.8074 7 0.5631 0.6392 0.6995 0.6427 0.7018 0.7093 8 0.5508 0.6570 0.6728 0.6918 0.6871 0.7168 9 0.4229 0.4237 0.4586 0.4748 0.5162 0.4953 10 0.4212 0.4038 0.3610 0.4856 0.4741 0.4180 11 0.3599 0.3519 0.3062 0.4475 0.4282 0.3608 12 0.3589 0.3691 0.2639 0.4860 0.4562 0.3717

Tabella 1.1: Valutazione previsiva in termini di R2 delle singole previsioni confrontata

con quella delle previsioni combinate a due a due. Fonte: A. E. BOPP, 1985 [2]

1.2

Evoluzione degli studi sulla combinazione di

previsioni

I primi studiosi ad occuparsi della combinazione di previsioni sono stati J. M. Bates e C. W. J. Granger, i quali cercano di combinare linearmente due previ-sioni impiegando un criterio a varianza minima come metodo di stima dei pesi da attribuire alle singole previsioni. In particolare, Bates e Granger assegnano un

(21)

previsio-ne f2. La varianza degli errori della combinazione delle due previsioni, indicata

con σ2

c, si ottiene quindi nel seguente modo:

σ2c = k2σ12+ (1 − k)2σ22+ 2ρkσ1(1 − k)σ2 (1.1)

dove ρ è il coefficiente di correlazione tra gli errori della prima previsione e quelli della seconda. Il valore di k è scelto in maniera tale da minimizzare gli errori

della combinazione di previsioni, cioè minimizzando la varianza σ2

c. Per far ciò,

si effettua la derivata prima rispetto a k della (1.1) e la si eguaglia a zero. In questo

modo, la varianza σ2 c è minima quando: k = σ 2 2 − ρσ1σ2 σ2 1− σ22− 2ρσ1σ2 (1.2)

Successivamente, Bates e Granger propongono 5 metodologie per calcolare i pesi

in modo tale da minimizzare σ2

c. Tali metodi soddisfano quindi l’equazione (1.2) e

consentono inoltre di «[. . . ] [Tr. It] attribuire un peso maggiore al set di previsioni che sembra contenere degli errori quadratici-medi minori [e di] [. . . ] assegnare un peso maggiore agli errori recenti rispetto a quelli passati»[1]. Si può quindi scrivere la combinazione c delle due previsioni per un periodo di tempo t nel seguente modo:

ct= ktf1,t+ (1 − kt)f2,t (1.3)

dove kt e (1 − kt) sono i pesi assegnati rispettivamente alla previsione f1,t e f2,t

al tempo t. I risultati ottenuti utilizzando tale metodo (Bates e Granger, 1969) sono stati successivamente analizzati ed estesi (J. P. Dickinson, 1972). Infatti, mentre i due studiosi combinano solo due previsioni, il ricercatore Dickinson propone una combinazione di n previsioni dimostrando che il vettore dei pesi

w = (w1, w2, . . . , wn)assegnati a ciascuna delle n previsioni è pari a:

w = Σ−1In(I

0

−1

In)−1 (1.4)

dove Σ è la matrice di covarianza degli errori di previsione e In è un vettore di

(22)

combina-re le pcombina-revisioni è stato chiamato da numerosi studiosi "la combinazione ottimale di previsioni".

Ovviamente Dickinson, come Bates e Granger, sottolinea che «[Tr. It] le singole previsioni devono essere non distorte nel senso che [. . . ] non devono consisten-temente sovrastimare (o sottostimare) il vero valore. Per esempio, se un set di previsioni non distorte viene combinato con un set di previsioni distorte, ciò può comportare una combinazione di previsioni con errore maggiore rispetto a quello delle singole previsioni non distorte»[3].

Qualche anno più tardi rispetto alla pubblicazione del primo articolo relativo alla combinazione di previsioni, Granger insieme a P. Newbold rivede il lavoro svolto insieme a Bates esaminando il comportamento di tre metodi per la pre-visione di serie storiche univariate, nonché il metodo di Holt Winters, l’autore-gressione stepwise e la procedura di Box-Jenkins. Queste tre procedure previsive sono state applicate a ottanta serie storiche mensili di tipo economico. Dall’ana-lisi condotta da Newbold e Granger emerge che la procedura di Box-Jenkins è un’ottima metodologia previsiva nel caso di serie storiche economiche con meno di 30 osservazioni. Nel caso invece di serie storiche economiche con un numero più elevato di osservazioni, si può migliorare la previsione «[. . . ] [Tr. It] consi-derando una combinazione di tutti e tre i tipi di previsione. È frequente il caso che, per ragioni economiche, di tempo o di costo, l’analisi di Box Jenkins sia im-praticabile, e qualche procedura automatica debba essere impiegata»[4]. Inoltre, Newbold e Granger sostengono che, nel caso in esame, il migliore dei cinque me-todi per stimare i pesi delle previsioni proposti nel primo articolo pubblicato con Bates è quello in cui i pesi sono calcolati nel seguente modo:

kT = t−1 X T =t−12 e22,T t−1 X T =t−12 (e21,T + e22,T) (1.5)

(23)

dove e1,T e e2,T sono gli errori al tempo T delle singole previsioni.

Una revisione dei risultati ottenuti da Newbold e Granger è stata proposta da R. L. Winkler e da S. Makridakis. In particolare, come sostenuto da Newbold e Granger, Winkler e Makridakis ritengono che la bontà della combinazione di previsioni dipende anche dal numero di metodi previsivi utilizzati per ottenere le singole previsioni. Tuttavia, Winkler e Makridakis dimostrano che l’accura-tezza della combinazione di previsioni«[. . . ] [Tr. It] aumenta con l’aumentare del numero di metodi combinati, anche se il grado di saturazione viene raggiunto dopo circa quattro o cinque metodi»[5].

Successivamente Winkler insieme a R. T. Clemen propone tre metodi che, ri-spetto ad altre metodologie, presentano delle ottime performance nel combinare le previsioni relative al Prodotto Interno Lordo degli U.S.A.. La prima metodo-logia proposta è la semplice media aritmetica, cioè a ciascuna previsione viene assegnato lo stesso peso. A tal proposito, gli autori sostengono che «[Tr. It] nes-suna informazione relativa alla precisione delle previsioni o alla dipendenza tra le previsioni è necessaria per generare una semplice media. Il fatto che

ciascu-na previsione riceva lo stesso peso k1 implica che le previsioni sono trattate come

se fossero interscambiabili»[6]. Il secondo approccio per combinare le previsio-ni è pressoché lo stesso proposto da Dickinson, ovvero quello in cui i pesi sono calcolati secondo l’equazione (1.4). Tuttavia, Clemen e Winkler assumono che la matrice di covarianza degli errori di previsione Σ sia una matrice diagonale. A tal riguardo, i due studiosi sostengono che «[. . . ] [Tr. It] la stima di Σ è molto spesso instabile quando la correlazione degli errori di previsione è elevata. [. . . ] Un modo per evitare questa instabilità è quello di trattare gli errori di previsione come indipendenti. Per evitare complicazioni causate dalla dipendenza, si può assumere che Σ sia diagonale e che tutti gli altri elementi al di fuori della diago-nale siano zero. Questo approccio assegna i pesi alle previsioni solo sulla base della precisione [delle singole previsioni] e ignora le correlazioni»[6].

(24)

Si può quindi affermare che «[. . . ] [Tr. It] la stima di ˆΣ, la quale può essere deter-minata sulla base dei dati passati relativi alla stima degli errori, dell’informazione preventiva o di qualche altra combinazione, gioca un ruolo importante nel deter-minare la combinazione delle previsioni»[6]. Infatti, utilizzando i dati passati e l’informazione a priori relativa a Σ, si ottiene il terzo approccio per combinare le previsioni, il quale è una variante del modello Bayesiano. Più specificatamente, secondo questa metodologia si suppone che Σ possa essere stimata utilizzando la funzione di densità della distribuzione inversa di Wishart.

Successivamente, Granger insieme a R. Ramanathan utilizza la regressione li-neare per ottenere i pesi della combinazione di previsioni, i quali vengono stimati avvalendosi del metodo dei minimi quadrati (OLS). In particolare, la combinazio-ne c di n previsioni al tempo t si ottiecombinazio-ne combinazio-nel seguente modo:

ct = ftWi+ et,i = w0+ w1Ft,1+ w2Ft,2+ · · · + et,i (1.6)

dove ft = [1, Ft,1, Ft,2, . . . , Ft,n]è il vettore che contiene le n previsioni al tempo

t, mentre Wi = [w0, w1, . . . , wn]T è il vettore dei pesi, la cui stima, ottenuta con il

metodo dei minimi quadrati, è pari a:

ˆ

Wi = (FTF)−1FTC (1.7)

dove C = [c1, c2, . . . , ct]T è il vettore che contiene le combinazioni delle n

previ-sioni al tempo t-esimo, mentre F è una matrice t × (n + 1) i cui elementi sono rappresentati dalle n-esime previsioni al tempo t-esimo, ovvero:

F =       1 F1,1 . . . F1,n .. . ... ... 1 Ft,1 . . . Ft,n       (1.8)

Granger e Ramanathan dimostrano inoltre che, anche se le singole previsioni

so-no distorte, inserendo nell’equazione (1.6) l’intercetta w0si può ottenere una

(25)

sostengono che tale metodo «[. . . ] [Tr. It] è chiaramente il migliore perché con-sente di ottenere degli errori quadratici medi non elevati e una combinazione di previsioni non distorta anche se le singole previsioni sono distorte»[7].

Qualche anno più tardi, K. Holden e D. A. Peel rivedono il lavoro di Granger e Ramanathan e concordano con i due studiosi nell’utilità dell’inserimento dell’in-tercetta nella regressione rappresentata nell’equazione (1.6). Tuttavia, Holden e Peel sostengono che includendo l’intercetta occorre effettuare la previsione di un paramento aggiuntivo, cioè la media incondizionata delle previsioni. Per evitare questa ulteriore stima, i due ricercatori costringono i pesi della combinazione di previsioni a sommare a uno. Infatti, «[Tr. It] se le previsioni sono costrette ad avere dei pesi che sommano ad uno ed una costante è inclusa nella regressione, le previsioni sono corrette per qualsiasi distorsione, ma la media incondizionata delle serie non verrà introdotta implicitamente come previsione addizionale»[8]. In seguito, sono stati proposti altri vincoli sui pesi della combinazione di pre-visioni stimati con il metodo dei minimi quadrati, come la non negatività di tali pesi. Tuttavia, occorre sottolineare che la capacità previsiva e le assunzioni dei vari metodi previsivi dipendono fortemente dal contesto applicativo.

La prima combinazione non lineare di previsioni fu proposta da R. G. Donald-son e M. Kamstra, i quali, in merito alle metodologie lineari appena esaminate, sostengono che «[Tr. It] un potenziale inconveniente di questi metodi tradizionali di combinazione è la loro restrizione a considerare solo combinazioni lineari del-le singodel-le previsioni. Infatti, non ci sono garanzie che una combinazione lineare sia efficiente se le previsioni individuali sono basate su modelli non lineari o se la vera previsione condizionata sottostante sia una funzione non-lineare dell’in-formation set su cui le singole previsioni si basano»[9]. In particolare, Donaldson e Kamstra stimano i pesi delle previsioni utilizzando una rete neurale artificiale (Artificial Neural Network, ANN), la cui architettura è costituita da un solo strato nascosto e la cui funzione di attivazione dei nodi di questo strato è una funzione

(26)

logistica. Inoltre, le previsioni vengono standardizzate prima di essere inserite come dati di input nella rete neurale. Donaldson e Kamstra utilizzano l’ANN per prevedere la volatilità dello Standard and Poor’s 500, del Nikkei, del FTSE e del TSEC ottenendo ottimi risultati. I due studiosi sottolineano che tale bontà previsiva è da attestare alla capacità delle reti neurali di «[. . . ] [Tr. It] fornire una notevole flessibilità per scoprire relazioni non lineari nascoste tra gruppi di pre-visioni individuali e realizzazioni di variabili previsive»[10].

Nonostante le reti neurali artificiali consentano di ottenere di per sé una buona previsione, tale capacità può essere migliorata combinando le ANN con i modelli autoregressivi integrati a media mobile (ARIMA). Infatti, G. P. Zhang sostiene che «[. . . ] [Tr. It] né gli ARIMA né le ANN risultano adeguati nel modellare e preve-dere serie storiche, dato che i modelli ARIMA non possono analizzare relazioni non-lineari, mentre le reti neurali artificiali da sole non sono capaci di trattare bene sia modelli lineari che non-lineari. Quindi, combinando gli ARIMA con le ANN, la struttura complessa di autocorrellazione dei dati può essere modellata accuratamente»[11]. In questo caso, viene utilizzata una rete neurale feedforward con un solo strato nascosto e con uso della funzione logistica nei nodi dello strato nascosto.

Secondo Zhang, per ottenere la combinazione di previsioni, occorre dapprima sti-mare la componente lineare delle serie storiche utilizzando il modello ARIMA ed effettuare la relativa previsione. Successivamente, i residui del modello ARIMA, i quali contengono la struttura non lineare delle serie storiche, diventano i dati di ingresso della rete neurale artificiale. In questo modo, si riesce a rilevare le relazioni non lineari tra le serie storiche. A questo punto, si effettua la previsione della componente non-lineare con la ANN e tale risultato viene sommato alla pre-visione ottenuta con il modello ARIMA generando la combinazione di previsioni

(27)

35 points ahead 67 points ahead

MSE MAD MSE MAD

ARIMA 216.965 11.319 306.08217 13.033739

ANN 205.302 10.243 351.19366 13.544365

Hybrid 186.867 10.831 280.15956 12.780186

Tabella 1.2: Valutazione previsiva in termini di errore quadratico medio e di deviazione media assoluta del modello ibrido. Fonte: G. P. ZHANG, 2003 [11]

ctrappresentata nell’equazione (1.9).

ct= Lt+ Nt (1.9)

Nell’equazione (1.9), Lt e Ntrappresentano rispettivamente le previsioni al

tem-po t ottenute con il modello ARIMA e con la ANN. Questo "modello ibrido" (così viene chiamata in letteratura la procedura appena descritta) viene poi applicato da Zhang per combinare tre previsioni, dimostrando che questa metodologia ha un’ottima capacità previsiva, come dimostra la Tabella 1.2.

In seguito, T. T. Temizel e M. C. Casey riesaminano i risultati ottenuti da Zhang e sostengono che il modello ibrido ARIMA-ANN presenta dei limiti. In particolare, secondo i due studiosi «[. . . ] [Tr. It] il pericolo nell’uso del model-lo ibrido ARIMA-rete neurale è che viene effettuata un’assunzione secondo cui la relazione tra le componenti lineari e quelle non-lineari sia additiva e ciò può ridurre la performance se la relazione è in realtà differente (per esempio, la rela-zione può essere di tipo moltiplicativo)»[12].

Per ovviare a questa limitazione del modello ibrido ARIMA-ANN, M. Khashei e M. Bijari modificano l’equazione (1.9) nel seguente modo:

ct= f (Lt, Nt) (1.10)

dove f è una funzione non lineare ottenuta utilizzando la rete neurale. Khashei e Bijari ritengono inoltre che il modello ibrido proposto da Zhang presenta anche un altro limite. A tal riguardo, «[Tr. It] i residui [dell’ARIMA] sono importanti

(28)

per capire se è sufficiente il modello lineare. Un modello lineare non è sufficien-te se ci sono ancora delle strutture lineari di correlazione nei residui»[13]. Per questo, Khashei e Bijari utilizzano la rete neurale per stimare la funzione dell’e-quazione (1.10), la componente non-lineare presente nei residui dell’ARIMA e anche una possibile e ulteriore relazione lineare esistente ancora nei residui del modello autoregressivo integrato a media mobile. In questo modo, anche se nei residui ci sono ancora delle componenti lineari, con la rete neurale si può ottenere una migliore modellazione dei residui e del modello stesso.

Nonostante gli ottimi risultati ottenuti con quest’ultimo approccio ibrido, mol-ti studiosi ritengono che anche le ANN hanno qualche limitazione. A tal propo-sito, F. E. H. Tay e L. Cao sostengono che le reti neurali «[. . . ] [Tr. It] soffrono di debolezza, la quale include il bisogno di controllare un elevato numero di para-metri, la difficoltà di ottenere una soluzione stabile e il pericolo di sovrastimare il fenomeno. Il problema di sovrastima è una questione critica che di solito produce scarse generalizzazioni perché le reti neurali hanno una capacità troppo grande che le porta a catturare non solo l’informazione contenuta nel training set, ma anche i rumori indesiderati»[14]. Proprio per questo, le ANN non rappresentano la metodologia migliore per effettuare previsioni in ambito finanziario. Infatti, secondo K. J. Kim «[. . . ] [Tr. It] i dati del mercato azionario hanno un enorme ru-more e una complessa dimensionalità. Le ANN spesso mostrano inconsistenza e prestazioni imprevedibili con dati rumorosi»[15].

Per superare questo limite delle ANN sono state sviluppate le macchine a supporto vettoriale (Support Vector Machines, SVM), nelle quali «[. . . ] [Tr. It] non ci sono molti parametri da regolare [. . . ]. In aggiunta, il problema di sovrastima è improbabile che si verifichi con le SVM. La sovrastima può casomai essere cau-sata da una troppa flessibilità nelle decisioni di confine»[15]. Sulla base di queste considerazioni, P. F. Pai e C. S. Lin propongono un’altra metodologia ibrida, nella quale il modello ARIMA viene combinato con la SVM. In particolare, «[Tr. It] sia

(29)

gli ARIMA che le SVM hanno differenti capacità di catturare le caratteristiche dei dati in domini lineari e non-lineari, così il modello ibrido proposto in questo stu-dio è composto da una componente ARIMA e una componente SVM. Quindi, il modello ibrido può modellare patterns lineari e non-lineari con un miglioramen-to della performance complessiva di previsione»[16]. L’approccio ARIMA verrà quindi utilizzato per stimare e prevedere la componente lineare di un set di da-ti, mentre la SVM verrà impiegata per la rappresentazione e la previsione della

parte non-lineare. Pertanto, la combinazione di previsioni ct che si ottiene sarà

come quella espressa nell’equazione (1.9), dove Ntin questo caso rappresentano

la previsione ottenuta con la SVM. Ovviamente, anche in questa situazione si può obbiettare che la relazione tra la componente lineare e quella non-lineare non sia additiva.

Un ulteriore approccio ibrido è quello proposto da S. Asadi, A. Tavakoli e S. R. Hejazi, i quali combinano il modello ARIMA con il PSO (Particle Swarm Optimization). In particolare, utilizzando tale algoritmo di ottimizzazione, i tre studiosi dimostrano che si può migliorare la capacità previsiva dei modelli ARI-MA utilizzando proprio il PSO per ricavare i parametri ottimali del processo au-toregressivo integrato a media mobile. Tale procedura è illustrata dalla Figura 1.1.

Negli ultimi anni è stato avanzato un altro interessante approccio ibrido per combinare le previsioni. In particolare, J. J. Wang, J. Z. Wang, Z. G. Zhang e S. P. Guo propongono di combinare le previsioni ottenute da tre modelli differenti: l’ARIMA, la BPNN (Back Propagation Neural Network) e il lisciamento esponen-ziale (Exponential Smoothing Model, ESM). La combinazione che si ottiene avrà quindi la seguente forma:

ct= w1PESM (t) + w2PARIM A(t)+ w3PBP N N (t) (1.11)

(30)

Figura 1.1: Combinazione previsiva del modello ARIMA con l’algoritmo PSO. Fonte: S.

ASADI, A. TAVAKOLI ES. R. HEJAZI, 2012 [17]

tre modelli, e w1, w2 e w3 sono i pesi assegnati alle tre previsioni con

3

X

i=1

wi = 1

e 0 ≤ wi ≤ 1. Per ottenere i pesi, viene utilizzato un algoritmo genetico. Infatti,

i quattro ricercatori sostengono che « [Tr. It] l’algoritmo genetico è un strumento per risolvere problemi di ottimizzazione come determinare il set ottimale di pesi per il nostro modello ibrido. Ci sono molte differenze tra gli algoritmi geneti-ci e altri metodi convenzionali di ottimizzazione, le quali rendono gli algoritmi genetici più efficienti nel trovare la soluzione ottimale [. . . ]»[18]. La procedura

(31)

Figura 1.2: Combinazione previsiva del modello ARIMA con la BPNN e l’ESM

utilizzan-do un algoritmo genetico. Fonte: J. J. WANG, J. Z. WANG, Z. G. ZHANG ES.

P. GUO, 2012 [18]

utilizzata per ottenere la combinazione delle previsioni è illustrata in Figura 1.2. Un altro approccio ibrido è stato proposto nel 2014 da C. N. Babu e B. E. Reddy, i quali riesaminano il modello ibrido ARIMA-ANN elaborato da Zhang e ne migliorano la capacità previsiva inserendo come filtro sui dati iniziali un indi-catore di analisi tecnica, ovvero la media mobile (Moving Averag, MA). In partico-lare, «[Tr. It] utilizzando la MA come filtro, le serie storiche fornite vengono sepa-rate o decomposte in due componenti in modo tale che una delle due componenti sia meno volatile e l’altra abbia più volatilità. La lunghezza del filtro MA, m, è ag-giustata in modo tale che la decomposizione sia effettuata adeguatamente»[19]. Successivamente, l’ARIMA modella ed effettua la previsione della componente che presenta una volatilità bassa, mentre la ANN elabora il modello e la previsio-ne della compoprevisio-nente con una volatilità elevata. Le due previsioni vengono poi combinate in maniera additiva, come nell’equazione (1.9).

(32)

1.3

Le serie storiche finanziarie

In questo elaborato, la metodologia relativa alla combinazione di previsioni viene applicata a delle serie storiche particolari, ovvero quelle finanziarie, le quali hanno delle caratteristiche specifiche che le contraddistinguono da tutte le altre serie storiche.

Le serie storiche finanziarie sono infatti non-stazionarie, molto "rumorose" e caotiche. Più specificatamente «[Tr. It] la caratteristica di rumorosità si riferisce alla non disponibilità di informazioni complete dal comportamento passato dei mercati finanziari per catturare completamente la dipendenza tra prezzi passati e futuri. L’informazione che non è inclusa nel modello è considerata come ru-more. La caratteristica di non-stazionarietà, invece, implica che la distribuzione delle serie storiche finanziarie cambia nel tempo. La caoticità significa che le se-rie storiche finanziase-rie assumono un comportamento casuale nel breve termine e deterministico nel lungo termine»[14].

Per questo, alcuni studiosi, in particolare E. F. Fama, hanno sviluppato ed ap-plicato il concetto di "efficienza del mercato", secondo cui i cambiamenti dei prez-zi degli strumenti finanprez-ziari non dipendono dal loro valore passato e rappre-sentano una realizzazione di un processo random walk. Quindi, «[. . . ] [Tr. It] i cambiamenti dei prezzi sono imprevedibili e prevedere nel mercato finanzia-rio è uno sforzo senza speranza. Ogni cambiamento nel prezzo rappresenta l’immediata reazione a eventi nuovi o a nuovi ed inaspettati cambiamenti nella domanda/offerta»[20].

Sull’ipotesi di efficienza del mercato finanziario si è molto dibattuto. Alcu-ni studiosi sono del parere che le serie storiche finanziarie non possono essere oggetto di previsione a causa delle caratteristiche sopra riportate. Altri invece, come Y. S. A. Mostafa e A. F. Atiya, sostengono che «[. . . ] [Tr. It] l’esistenza di così tanti trend dei prezzi nei mercati finanziari [. . . ] e la non attualizzata

(33)

correla-zione seriale tra eventi fondamentali e dati economici che interessano il mercato, sono due delle tante evidenze contro l’ipotesi di efficienza del mercato»[20].

In questo elaborato si preferisce sostenere l’ipotesi secondo cui i mercati non siano pienamente efficienti e che quindi, utilizzando delle metodologie adatte, si riesca ad effettuare delle previsioni in ambito finanziario. Lo strumento che in questo caso verrà utilizzato sarà proprio quello delle combinazioni di previsioni.

(34)
(35)

I

L MODELLO PROPOSTO

2.1

Una panoramica generale

Il fulcro di questo elaborato vuole essere lo sviluppo di una metodologia per combinare previsioni di serie storiche finanziarie. In particolare, il modello proposto cerca di combinare le previsioni ottenute da alcuni indicatori di ana-lisi tecnica con quella elaborata dalla regressione locale avvalendosi di un de-terminato algoritmo di ottimizzazione, il Particle Swarm Optimization (PSO), per determinare i pesi di ciascuna previsione.

Tale approccio, illustrato nella figura 2.1, verrà poi applicato alla serie storica di alcuni indici di mercato.

Input Local Regression PSO Trading Indicators Hybrid Model

Figura 2.1: Il diagramma del modello proposto

(36)

Più specificatamente, gli indicatori di analisi tecnica utilizzati sono la Me-dia Mobile Esponenziale (Exponential Moving Average, EMA), le Bande di Bollinger e l’Indice di Forza relativa (Relative Strength Index, RSI). Tutti questi strumenti sono stati calcolati su un periodo di 20 giorni in modo tale da garantire la confron-tabilità dal punto di vista temporale dei risultati ottenuti. Sullo stesso insieme dei dati è stata utilizzata la regressione locale (LOESS). Successivamente è stata implementata una procedura per rendere robusta la LOESS, ovvero la LOWESS (LOcally WEighted Scatterplot Smoothing), la quale consente appunto di diminuire l’influenza delle osservazioni estreme. Dopo aver ottenuto le quattro previsioni, è stato utilizzato il PSO per determinare i pesi della combinazione.

La scelta di questa metodologia combinativa, piuttosto che di un singolo mo-dello, risiede nel fatto che «[Tr. It] il principale problema nel modellare le serie storiche finanziarie è che le loro dinamiche e le loro proprietà cambiano con il tempo. [. . . ] Pertanto, non è possibile e praticabile per un singolo modello cat-turare le dinamiche dell’intera serie storica»[21]. Utilizzando più strumenti di analisi si può quindi ottenere una migliore modellazione del fenomeno finanzia-rio, la quale sarà capace di catturare al meglio il Data Generating Process (DGP) sottostante.

Come già sottolineato nel primo capitolo, tutto ciò ovviamente si ripercuote sulle previsioni. Infatti, «[Tr. It] combinare diversi modelli o utilizzare modelli ibridi può risultare un’effettiva via per migliorare la performance previsiva e per superare le limitazioni di ciascun modello. [. . . ] Nei modelli combinati, l’obietti-vo è proprio quello di limitare il rischio di utilizzare uno strumento inappropria-to, avvalendosi di una combinazione di diverse metodologie al fine di ridurre il rischio di insuccesso del modello stesso e per ottenere previsioni più precise»[22]. Risulta quindi evidente che in questo elaborato non si vogliono combinare previsioni provenienti dallo stesso modello, bensì da diverse metodologie che in parte hanno una natura diversa e/o effettuano delle differenti assunzioni.

(37)

Di seguito vengono presentati i vari strumenti utilizzati per ottenere le previ-sioni delle serie storiche in esame e l’algoritmo per determinare i relativi pesi per sviluppare la combinazione.

2.2

Gli indicatori di analisi tecnica

L’analisi tecnica è una metodologia di studio dei prezzi passati di mercato al-lo scopo di prevedere l’andamento futuro dei singoli titoli e dei mercati. Essa si avvale di un insieme di strumenti qualitativi e quantitativi. A tal proposito «[Tr. It] questa analisi può essere svolta in una forma qualitativa, basandosi principal-mente sull’esame dei grafici dei prezzi passati [. . . ] oppure può essere prettamen-te quantitativa, costruendo dei segnali di trading o previsioni attraverso un esa-me quantitativo della serie storica. In pratica, gli analisti tecnici spesso adoperano una combinazione di entrambe le tecniche (quantitativa e qualitativa)»[23].

Ovviamente, utilizzare l’analisi tecnica comporta il rifiuto dell’ipotesi di effi-cienza dei mercati nella forma debole, la quale sostiene che il prezzo attuale di uno strumento finanziario riflette tutta l’informazione contenuta nei prezzi pas-sati. Secondo l’analisi tecnica, invece, l’esame dell’evoluzione dei prezzi storici consente di ottenere delle indicazioni utili per gli investitori. In particolare, que-sto tipo di strumento assume che sia possibile individuare dei pattern che si ripe-tono nel corso degli anni. Quando tale pattern si ripresenta nella serie dei prezzi, si hanno già a disposizione delle indicazioni anticipatrici circa l’evoluzione di ta-le tendenza. Si può quindi sostenere che «[Tr. It] un altro modo per affermare che la storia si ripete è che la chiave per comprendere il futuro risiede nello studio del passato oppure che il futuro non è altro che una ripetizione del passato»[24]. Questo rappresenta uno dei pilastri dell’analisi tecnica.

Un’altra ipotesi di questo tipo di analisi consiste nel ritenere che il prezzo sconti tutta l’informazione pubblicamente disponibile, nonché le decisioni politi-che, psicologiche e i dati fondamentali. Quest’ultimi «[. . . ] [Tr. It] vengono infatti

(38)

studiati indirettamente dagli analisti tecnici. La maggior parte dei tecnicisti sa-rebbe probabilmente d’accordo col fatto che sono le forze sottostanti all’offerta e alla domanda, nonché i fondamenti economici del mercato, a rendere il mer-cato bull o bear. I grafici di per sé non rappresentano la causa dei rialzi e dei ribassi dei prezzi. Essi riflettono semplicemente la psicologia rialzista e ribas-sista dei mercati»[24]. Risulta perciò evidente che l’analisi tecnica deve essere combinata con l’analisi fondamentale al fine di effettuare delle buone decisioni di investimento.

Alla luce di ciò, si può quindi affermare che per gli investitori anche il prezzo corrente di uno strumento finanziario riveste una certa importanza, poichè esso sconta appunto tutta l’informazione pubblicamente disponibile. Tuttavia, se vi è troppo "rumore" sul mercato, il prezzo attuale riesce a inglobare tale informa-zione, ma il signal to noise ratio è troppo basso. Per questo «[. . . ] [Tr. It] i prezzi storici insieme a quelli correnti garantiscono un’inferenza più accurata sui segnali passati e presenti rispetto a quello che farebbero i prezzi correnti da soli. Poichè i prezzi attuali non sono pienamente rivelatori, i prezzi passati, nonchè l’anali-si tecnica, forniscono tale informazione agli agenti per aiutarli nelle decil’anali-sioni di trading»[25].

Tutto ciò ha reso l’analisi tecnica una metodologia molto utilizzata dai tra-ders, soprattutto per effettuare previsioni di breve termine. Infatti, una ricerca effettuata da M. P. Taylor e H. Allen rivela che circa un terzo degli economisti in-tervistati si avvale dell’analisi tecnica per prendere decisioni di investimento di breve periodo. Più specificatamente, i due studiosi sottolineano che « [Tr. It] uno dei risultati più evidenti del questionario è che l’analisi tecnica sembra esercita-re la sua massima influenza quando i traders formulano pesercita-revisioni o pesercita-rendono decisioni relative ad un orizzonte temporale di breve termine»[26].

Nel corso degli anni sono stati sviluppati numerosi indicatori di analisi tecni-ca. In questo elaborato ne sono stati utilizzati tre, i quali per le loro caratteristiche

(39)

ed assunzioni consentono di sviluppare il modello predetto.

2.2.1

Simple Moving Average (SMA) ed Exponential Moving

Average (EMA)

La media mobile semplice (Simple Moving Average, SMA) è uno degli indica-tori di analisi tecnica più utilizzato e non è altro che una media calcolata su un determinato numero di termini. Più specificatamente, una media mobile sempli-ce al tempo t calcolata su k prezzi da t − (k − 1) a t viene determinata nel seguente modo: SM A(k)t= 1 k k−1 X i=0 Pt−i (2.1)

Occorre sottolineare che la media mobile sarà più "liscia" all’aumentare del numero k di termini considerati. Infatti, «[. . . ] [Tr. It] la varianza di una media mobile semplice decresce all’aumentare del numero di osservazioni. In manie-ra piuttosto simile, è possibile osservare che la reazione della media mobile alle nuove osservazioni è piuttosto lenta quando la media mobile è composta da un numero elevato di osservazioni. Un modo per aggiustare la volatilità della media mobile è quello di ridurre o aumentare il numero di prezzi considerati»[27]. In particolare, aumentando il numero di osservazioni si ottiene una serie dei prez-zi privata delle oscillaprez-zioni di breve periodo nella quale si possono individuare meglio i vari trend.

L’SMA consente inoltre di ridurre l’eventuale stagionalità presente nei prezzi. A tal proposito, «[Tr. It] il secondo scopo della media mobile è quello di smorzare le fluttuazioni periodiche indesiderate. La media mobile sarà capace di eliminare le fluttuazioni stagionali che hanno la stessa lunghezza della media periodica [. . . ] »[28].

Il principale segnale di trading che produce l’SMA si ha quando la serie storica dei prezzi incrocia la media mobile. Più specificatamente, se la curva dei prezzi

(40)

taglia la sua media mobile dall’alto verso il basso, si ha un segnale di ribasso, mentre nel caso contrario si origina un segnale di rialzo.

Occorre notare che la media mobile semplice attribuisce un peso uguale a tutte

le osservazioni e pari a 1k, rendendole quindi interscambiabili. Tuttavia, questa

proprietà della SMA non sempre la rende adatta all’utilizzo con le serie storiche. In quest’ultime infatti si tende ad assegnare un’importanza diversa alle singole osservazioni a seconda che siano più o meno recenti. Per superare questo limite si ricorre perciò all’utilizzo della media mobile esponenziale (Exponential Moving Average, EMA). Infatti, «il principale vantaggio della media mobile esponenziale è che questa tecnica attribuisce un peso maggiore alle osservazioni recenti nella serie storica. Intuitivamente, ci si aspetta che le osservazioni recenti abbiano più valore, e un vantaggio concettuale può derivare se tale modello viene utilizzato per ricercare un trend persistente»[27]. A differenza della media mobile semplice, quella esponenziale viene calcolata nel seguente modo:

EM At= αPt+ (1 − α)EM At−1 (2.2)

dove EM A0 = P0, Ptè il prezzo al tempo t e 0 ≤ α ≤ 1. Di solito, è l’economista a

decidere il valore di α, anche se dall’equazione (2.2) si può comprendere che per valori piccoli di α, la media mobile esponenziale sarà più liscia.

Si può quindi affermare che l’EMA è una media ponderata con pesi che

de-crescono in maniera esponenziale1.

Nel modello sviluppato in questo elaborato si è preferito utilizzare questo in-dicatore di analisi tecnica proprio per la sua capacità di ridurre le oscillazioni

1Se infatti nell’equazione (2.2) si sostituisce a EM A

t−1la sua relativa espressione si ottiene il

seguente risultato:

EM At= αPt+ (1 − α)EM At−1

= αPt+ (1 − α)[αPt−1+ (1 − α)EM At−2]

= αPt+ α(1 − α)Pt−1+ (1 − α)2EM At−2

(2.3)

Dalla (2.3) si può quindi notare la media mobile esponenziale assegna alle osservazioni pesi che decrescono in maniera esponenziale.

(41)

di breve periodo, le quali di solito sono molto presenti nelle serie storiche degli indici di mercato, e per dare un peso maggiore alle osservazioni più recenti ri-spetto a quelle passate. A ciò si aggiunga che, in generale, le varie tipologie di media mobile «[. . . ] [Tr. It] sono dei semplici strumenti per l’analisi e la presen-tazione delle serie storiche, le quali richiedono solo un minimo di conoscenza e di capacità tecnica. Tuttavia, per molti scopi, le medie mobili producono risul-tati comparabili con quelli ottenuti da procedure più raffinate e complesse. Le loro proprietà derivano dal potere di lisciamento selettivo il quale, senza limi-ti, può essere controllato dall’analista e utilizzato per eliminare o isolare trend, stagionalità o minori fluttuazioni»[28].

2.2.2

Bande di Bollinger

Un altro indicatore di analisi tecnica molto utilizzato dai traders sono le Bande di Bollinger.

Questo strumento è stato sviluppato da John Bollinger nel 1980 «[. . . ] [Tr. It] per fornire una definizione di prezzo azionario elevato o basso [. . . ] . Per defini-zione, un prezzo azionario è "elevato" quando tocca la banda superiore, mentre è "basso" quando raggiunge la banda inferiore. Quanto più i prezzi toccano la banda superiore, tanto più il mercato si trova in una situazione di ipercomprato, e quanto più i prezzi raggiungono la banda inferiore, tanto più il mercato è in una situazione di ipervenduto»[29]. Infatti, si tratta di un indicatore costituito da due bande di trading, una superiore e una inferiore, all’interno delle quali il prezzo dello strumento finanziario oscilla. Tali bande sono ottenute utilizzando una media mobile a k termini (banda mediana) da cui viene sottratta o sommata la deviazione standard mobile calcolata sullo stesso numero di dati, come viene illustrato nelle equazioni (2.4) e (2.5).

BBLt= SM A(k)t− mM ST D(k)t

BBUt= SM A(k)t+ mM ST D(k)t

(42)

con M ST D(k)t = v u u t 1 k k−1 X i=0 (Pt−i− M A(k)t)2 (2.5)

dove BBLte BBUt rappresentano rispettivamente la banda di trading inferiore

e quella superiore.

Occorre sottolineare che l’ampiezza at = BBUt − BBLt delle bande non è

sempre costante per ogni istante temporale t, ma varia nel tempo. In particolare,

minore (maggiore) sarà la volatilità dei prezzi e più elevata (piccola) sarà at.

Le bande di Bollinger rappresentano quindi un intervallo di oscillazione del prezzo dello strumento finanziario in esame. Tuttavia, può capitare che il prezzo fuoriesca dalla banda superiore o inferiore. In questo caso, si ottiene un segnale di

esaurimento del trend in atto. Più specificatamente, se Pt > BBUtsi ha un

segna-le di inversione del trend rialzista verso quello ribassista. Se invece Pt < BBLt

si ha un cambiamento di tendenza da ribasso a rialzo. La maggior parte dei tra-ders, tuttavia, preferisce utilizzare la seguente regola per identificare le inversioni di trend:

Cambiamento di tendenza al rialzo se Pt− BBLt

BBUt− BBLt

< 0.3

Cambiamento di tendenza al ribasso se Pt− BBLt

BBUt− BBLt

> 0.7

(2.6)

È opportuno precisare che le bande di Bollinger possono generare anche dei falsi segnali di trading. Ad esempio una serie dei prezzi con un trend ribassista può uscire dalla banda inferiore, per poi ritornare all’interno delle bande e con-tinuare la sua tendenza al ribasso. Ecco perché lo stesso John Bollinger consiglia di utilizzare il suo indicatore insieme ad altri strumenti di analisi tecnica. Infatti, se più indicatori forniscono lo stesso segnale, quest’ultimo assume una maggiore probabilità di realizzo.

La scelta di utilizzare le bande di Bollinger per sviluppare il modello ibrido proposto in questo elaborato risiede nei segnali che tale strumento fornisce,

(43)

non-ché la capacità di considerare la variabilità dei prezzi, di fornire un intervallo di oscillazione e di evidenziare situazioni di ipercomprato e ipervenduto.

2.2.3

Relative Strength Index (RSI)

L’indice di forza relativa (Relative Strength Index, RSI) è un indicatore di ana-lisi tecnica che fu sviluppato da John Welles Wilder nel 1978 e che consente di determinare la velocità di variazione dei prezzi di un determinato strumento finanziario. Per questo, l’RSI viene considerato un indicatore di momentum.

Tale strumento viene calcolato nel seguente modo:

RSIt= 100 · k−1 X τ =0 ∆+Pt−τ k−1 X τ =0 |∆Pt−τ| (2.7)

dove ∆+rappresenta le differenze positive di prezzo, le quali, dopo essere state

sommate, vengono rapportate a

k−1

X

τ =0

|∆Pt−τ|, nonché all’ammontare delle

diffe-renze di prezzo indipendentemente dal loro segno.

Come si può dedurre dall’equazione (2.7), l’RSI calcolato in un determina-to istante temporale t assume un valore compreso tra 0 e 100. In particolare, se l’indicatore è pari a 0, ciò significa che nell’intervallo di tempo considerato di k giorni non vi sono state variazioni positive di prezzo. Nel caso contrario, cioè

per RSIt = 100, si manifesta una situazione in cui i prezzi hanno effettuato solo

dei movimenti positivi in quel periodo temporale. Questa proprietà dell’RSI di assumere valori all’interno dell’intervallo [0, 100] permette a tale strumento di su-perare un limite che altri indicatori di momentum possiedono, ovvero quello della non comparabilità del valore assunto dall’indicatore calcolato su una specifica serie dei prezzi con quello determinato sui prezzi di un altro prodotto finanzia-rio. Più precisamente, Wilder sostiene che «[. . . ] [Tr. It] il momentum giornaliero di un qualsiasi numero di prodotti può essere misurato sulla stessa scala per po-ter effettuare il confronto e la previsione di rialzi e ribassi di tali prodotti»[30].

(44)

Proprio per questa proprietà che garantisce la confrontabilità dei risultati otte-nuti, l’RSI è stato utilizzato per sviluppare il modello ibrido proposto in questo elaborato.

Per quanto concerne i segnali di trading, un’indicazione di una situazione di ipervenduto si ha quando l’RSI scende al di sotto di 30, mentre quando l’indi-catore assume un valore superiore a 70 si evidenzia un segnale di ipercomprato. Nel caso in cui, invece, l’RSI incroci la linea mediana (RSI = 50), viene generato un segnale di ribasso o di rialzo a seconda che l’indicatore tagli rispettivamente dall’alto verso il basso o dal basso verso l’alto tale linea mediana.

Nel modello ibrido proposto, questi tre indicatori di analisi tecnica vengono utilizzati insieme per identificare i segnali di trading nelle serie storiche di alcuni indici di mercato. Infatti, come già sottolineato in precedenza, «[Tr. It] nessun singolo strumento, metodo o sistema è capace di produrre tutte le volte la risposta corretta. Un trader di successo utilizza diversi metodi di input nelle sue decisioni. Di solito il problema viene risolto restringendo gli input fino a due o tre metodi che funzionano bene per l’operatore finanziario»[30].

A ciò si aggiunga che «[Tr. It] lo scopo generale dell’analisi tecnica è quello di identificare le regolarità nelle serie storiche dei prezzi estraendo i patterns non lineari da dati rumorosi. Implicitamente in questo scopo vi è il riconoscere che alcuni movimenti di prezzo sono significativi -ovvero contribuiscono alla forma-zione di uno specifico trend- mentre altri sono solo delle fluttuazioni casuali che devono essere ignorate»[31]. Ecco perché spesso l’analisi tecnica viene definita come un’arte. Più precisamente, «[. . . ] l’analisi tecnica è un’arte, un riuscire a di-stinguere i suoni di diversi strumenti all’interno di una sinfonia, un riconoscere segnali convincenti da falsi segnali»[32].

Tuttavia, non sempre gli indicatori appena proposti sono capaci di identifica-re i veri segnali di trading. Per questo occoridentifica-re appunto combinaidentifica-re tali strumenti

(45)

con altre metodologie che riescano in qualche modo a gestire al meglio i dati rumorosi. Nel modello proposto, per raggiungere tale obiettivo, è stata utilizza-ta la regressione locale. Infatti, questo tipo di tecnica consente di «[. . . ] [Tr. It]

estrarre le relazioni non lineari ˆm(·) "mediando" il rumore. Inoltre, si

propo-ne l’utilizzo di questo stimatore [. . . ] per raffinare le capacità dell’analisi tecnica nell’identificazione di certi patterns nella serie storica dei prezzi»[31].

2.3

La regressione locale

La regressione locale, o "LOESS" (LOcal regrESSion), è un metodo regressivo non parametrico sviluppato da W. S. Cleveland nel 1979 che consiste nella stima dei parametri di più regressioni sulla stessa serie di dati in esame.

Più precisamente, data la variabile dipendente Y e quella indipendente X,

la regressione locale calcolata in un determinato punto x0 per le coppie di dati

(yi, xi)assume la seguente forma:

yi = m(xi) + i con xi ∈ x0± h e i = 1, . . . , t1 (2.8)

dove h > 0 simboleggia l’ampiezza di banda, mentre i ∼ IID(0, σ2) sono gli

errori del modello. La funzione m(·) è una funzione lineare o non lineare che

rap-presenta il valore atteso condizionato di Y rispetto a X, ovvero m(xi) = E(Y |X =

xi), e che verrà specificata solo in un secondo momento. A detta di ciò, occorre

notare che la regressione locale è un metodo di stima "non parametrico", proprio perché non si presuppone che la funzione m(·) appartenga ad una determinata classe di funzioni parametriche, ma si richiedono solo delle specifiche condizioni di regolarità su di essa.

Giunti a questo punto è opportuno sottolineare che la regressione locale con-sente di ottenere dei buoni risultati soprattutto nel caso in cui la serie storica in esame abbia un elevato numero di osservazioni. A tal proposito, «l’impostazione non parametrica della regressione è risultata particolarmente efficace sopratutto,

(46)

anche se certo non solamente, nel caso in cui si disponga di una considerevole massa di dati [. . . ] . Infatti in presenza di moltissimi dati abbiamo sempre abba-stanza evidenza empirica per "falsificare" qualunque modello parametrico [. . . ] . Il motivo di questo "fallimento" sta nel tentativo di riassumere tutta l’informazio-ne dei dati in un numero ristretto di parametri; questa difficoltà può essere gesti-ta con degli strumenti che offrono maggiore flessibilità»[33], come la regressione locale. Per questi motivi, ovvero data l’elevata numerosità delle osservazioni nelle serie storiche finanziarie e data l’incapacità delle metodologie parametriche di rappresentare tutta l’informazione contenuta nel fenomeno in esame, è sta-to deciso di avvalersi della regressione locale nello sviluppo del modello ibrido proposto in questo elaborato.

La formulazione più semplice della LOESS è la regressione locale lineare. Per ottenere questa particolare metodologia regressiva, l’equazione (2.8) può essere specificata nel seguente modo:

yi = ax0 + bx0xi+ i (2.9)

dove a e b sono i due parametri della regressione, i quali vengono stimati uti-lizzando il metodo dei minimi quadrati pesati illustrato nella formula (2.10).

min a,b t1 X i=1 {yi− ax0 − bx0xi} 2w i (2.10)

Nell’equazione (2.10) i pesi wi sono determinati secondo un’ottica locale attorno

a x0. In particolare, questi pesi sono ottenuti nel seguente modo:

wi = 1 hK  xi− x0 h  (2.11)

dove K è la funzione kernel, la quale è una funzione di densità simmetrica

rispet-to a x0, che decade abbastanza velocemente in modo tale da diminuire l’impatto

dei dati più distanti da x0. Alcuni esempi di funzioni kernel sono illustrate nella

Riferimenti

Documenti correlati

The present work aims to investigate the seismic vulnerability of masonry buildings located in the districts of Fabric and Iosefin, which were grouped in typology classes based on

Changes in QA patterns during treatment were not accurate (AUC: 0.50 to 0.70; p &gt; 0.05) in predicting disease progression as assessed by functional parameters, whereas variation

bibliothécaire de Saint- Gilles n'ait souligné que cet aspect de l'activité multiple d'Anastase dans la note qu'il a ajoutée à la notice très 38. Arnaldi, « II

[r]

Questi contratti sono strutturati affinch`e il loro valore intrinseco al momento dell’acquisto sia pari a zero, mentre invece il prezzo quotato rappresenta l’aspettativa sul livello

Un criterio estremamente semplice e nel contempo efficace per evidenziare il trend di una serie storica è il cosiddetto metodo delle medie mobili, basato sulla sostituzione di

400 - Entrate per l’erogazione del rimborso ai partiti e movimenti politici in relazione alle spese elettorali sostenute per il rinnovo della Ca- mera dei deputati (articolo 1

Tutte le possibili combinazioni di carico sono state ottenute analizzando la struttura sotto le diverse azioni, prese singolarmente, e poi combinate per massimizzare gli effetti. 9.1