OCS
Analisi di Correlazione in Mercati Finanziari utilizzando la Teoria delle
Wavelets
Michele Tumminello
Dipartimento di Fisica e Tecnologie Relative Università di Palermo, Italy
OCS
Overview
•Il problema della stima delle cross-correlazioni.
•Filtrare informazione sul sistema dalla matrice di correlazione
•Comparazione tra Mexican Hat wavelets e rendimenti
•Combinazione lineare di Mexican Hat e funzione di Haar
•Rendimenti logaritmici e wavelets: freccia del tempo.
OCS
Similarità tra serie temporali
21 nov 2021 Michele Tumminello 4
OCS
Cross Correlazione
2 2 2 2
j j
i i
j i j
i ij
r r
r r
r r r
r
−
−
= − ρ
Coefficiente di correlazione:
€
ri(t) ≡ ln Pi(t) − ln Pi(t − τ )
Matrice di Correlazione
C = ρ ( )
ijN serie di dati di lunghezza T
€
ri(tj), j =1,...,T; i =1,...,N
Rendimento logaritmico del prezzo:
Altri stimatori di correlazione:
- Stimatore di Fourier - Stimatore di ML
- Stimatore dinamico - Stimatore di wavelet -…
è il risultato di un prodotto scalare
OCS
Problemi nella stima delle cross correlazioni
N T dati ~ N 2 coefficienti di correlazione:
incertezza statistica
Interazione con l’ambiente, e.g. impatto di news sulle correlazioni tra i rendimenti delle azioni.
Complessità delle interazioni
Eterogeneità del campione -Avere un “buono” stimatore -Filtrare informazione
-Ottenere una robusta matrice
OCS
Dati di espressione di geni
€
N >> T
Yeast: Saccharomyces cerevisiae Cell-cycle
P. T. Spellman et al, Molecular Biology of the Cell 9, 3273 (1998)
OCS
Complessità della struttura di correlazione: ordinamento
…per capitalizzazione … secondo ALCA
N = 300 (NYSE), daily returns, 2001- 2003, T = 748
OCS
Clustering gerarchico
€
C(s) → ρ
ij(s) = max
h,k
[ρ
hk(s)] → q(s +1) = i(s)U j(s)
Redefinire la matrice C allo step di costruzione s+1 secondo la regola R
R(ALCA) : ρqk = Niρik + N jρ jk
Ni + N j ; R(SLCA) : ρqk = max(ρik,ρ jk)
€
C(s = 0) = C; n −1 steps di costruzione
OCS
Output del clustering gerarchico
€
N =100 (NYSE) daily returns 1995 -1998
€
C
<= (ρ
ij<) ρ
ij<= ρ
αk
dove
€
α
kè il primo nodo in cui gli elementi
i e j si uniscono
21 nov 2021 Michele Tumminello 10
OCS
Ultrametricità
(i) d
ij<= 0 ⇔ i = j (ii) d
ij<= d
<ji(iii) d
ij<≤ max d {
ik<,d
kj<}
€
d
ij<= 2 1− ρ ( €
ij<)
(i) d
ij= 0 ⇔ i = j (ii) d
ij= d
ji(iii) d
ij≤ d
ik+ d
kj€
d
ij= 2 1− ρ (
ij)
€
ρ
ijρ
ij<OCS
Correlation Based Networks
Azione i Vertice i
ijLink i-j
ijè la forza del link i-j o una misura della
“similarità”
tra i e j
( i, j,
ij)
iOCS
Il Network completo
OCS
Filtrare il network completo
C =
1 0.13 0.90 0.81 0.13 1 0.57 0.34 0.90 0.57 1 0.71 0.81 0.34 0.71 1
⎛
⎝
⎜⎜
⎜⎜
⎞
⎠
⎟⎟
⎟⎟
→ S =
1 3 0.90 1 4 081 3 4 0.71 2 3 0.57 2 4 0.34 1 2 0.13
⎛
⎝
⎜⎜
⎜⎜
⎜⎜
⎜
⎞
⎠
⎟⎟
⎟⎟
⎟⎟
⎟
Correlation Matrix (C)
Sorted List of Links (S)
OCS
MST and PMFG
Si definisca una misura di similarità tra gli elementi del sistema
Si costruisca la lista S ordinando le similarità in ordine decrescente
Cominciando dal primo elemento di S,
Si aggiunga il corrispondente link se e solo se
il grafo è ancora una Foresta o un Albero
Cominciando dal primo elemento di S,
Si aggiunga il corrispondente link se e solo se
il grafo è ancora Planare (g=0)
Minimum Spannig Tree MST
Planar Maximally Filtered Graph
PMFG
M. T, T. Di Matteo, T. Aste and R.N. Mantegna, PNAS USA 102, 10421 (2005)
OCS
Minimum Spanning Tree (MST)
€
N = 300 (NYSE) daily returns
2001- 2003 T = 748
OCS
Planar Maximally Filtered Graph (PMFG)
€
N =100 (NYSE) daily returns
1995 -1998 T =1011
M. T, T. Di Matteo, T. Aste and R.N. Mantegna, PNAS USA 102, 10421 (2005)
OCS
Mexican Hat mother wavelet
€
r(t,tH ) ≡ ln P(t) − ln P(t − tH) Logarithmic returns:
Mexican Hat:
€
ψ(x) = 2 3π
1 2
1− x2
( )e−x
2
2
w(t1,t1H ) ≡ 1 t1H ( )1 2
ln P(x)[ ]ψ x − t1 t1H
⎛
⎝⎜ ⎞
⎠⎟
−∞
+∞
∫
dxWavelet transform:
OCS
Defininizioni e domande
€
P(t) è una funzione costante a tratti:
€
P(t) = P(ti) ∀ t ∈ t[ i,ti + τ [ ≡ t[ i,ti+1[, i ∈ 1,...,T{ } 0 altrimenti
⎧⎨
⎩
Volendo comparare wavelets e rendimenti, è corretto porre ? t = t1 e tH = t1H
€
t1 ≡ 0
OCS
Mexican hat wavelets
€
ri( jτ ,kτ ) ≡ ln Pi( jτ ) − ln Pi( jτ − kτ ) Logarithmic returns:
wi( jτ ,kτ ) ≡ 4 τ 3k π
1 2
ln P[ i(qτ )] (1+ q − j)exp −(1+ q − j)2 2 k2
⎡
⎣⎢ ⎤
⎦⎥
⎧⎨
⎩
q= 0
∑
T −1−(q − j)exp −(q − j)2 2 k2
⎡
⎣⎢ ⎤
⎦⎥⎫
⎬⎭
Problema: Condizioni al contorno… Soluzione: regione centrale…
OCS
Mexican hat wavelets
ri( jτ ,kτ ) ↔ wi[( j + k 2)τ ,k 2τ ] ri( jτ ,kτ ) ↔ wi[jτ ,kτ ]
€
( j +1)τ
€
jτ
€
( j +1)τ
€
jτ
OCS
Data set
Set delle 100 azioni più capitalizzate (2003) scambiate a NYSE nel periodo 1995-2003.
Prezzi sincronizzati a 5 minuti.
OCS
MST (5 min time horizon)
5 min returns 5 min MH wavelets
OCS
Single Linkage HT
(5 min time horizon)
OCS
Average Linkage HT
(5 min time horizon)
OCS
MST (daily time horizon)
daily returns daily MH wavelets
OCS
Single Linkage HT
(daily time horizon)
OCS
Average Linkage HT
(daily time horizon)
OCS
Link comuni nel MST
OCS
PMFG: connection strength
OCS
Combinare la Mexican Hat e la funzione di Haar
€
M(x) = 2 3π
1 2
1− x2
( )e−x
2
2
€
H(x) =
1 if 0 ≤ x <1 2
−1 if 1 2 ≤ x <1 0 altrimenti
⎧
⎨⎪
⎩⎪
€
ψ(x,λ ) = N(λ )−1/ 2[λ M(x) + (1− λ ) H(x)] with λ ∈ 0,1[ ]
N(λ ) = λ −1( )2 + λ2 − 4λ λ −1( ) e( 3 8 −1) 3eπ1 2
OCS
Combinare la Mexican Hat e la funzione di Haar
€
λ = 0.5
€
λ = 0
ri( jτ ,kτ ) ↔ ψi[( j + k 2)τ ,k 2τ ,λ]
OCS
Invertire il tempo: MST
Daily time Horizon.
OCS
Log returns come trasformate di wavelet
ψ(x,q) =
−1 q if 0 ≤ x < q 1 q if 1− q ≤ x <1
0 altrimenti
⎧
⎨⎪
⎩⎪
q∈ 0,1 2] ] €
lim
q →0 ψ (x,q) = δ(x −1) −δ(x)€
r(t,τ ) ≡ ln P(t) − ln P(t − τ ) = 1
τ ln P(x)[ ] δ x − t τ −1
⎛
⎝⎜ ⎞
⎠⎟−δ x − t τ
⎛
⎝⎜ ⎞
⎠⎟
⎧⎨
⎩
⎫⎬
−∞ ⎭
+∞
∫
dxψ(x,1
2) = 2
−1 if 0 ≤ x <1 2 1 if 1 2 ≤ x <1
0 altrimenti
⎧
⎨⎪
⎩⎪ = −2 H(x)
OCS
Wavelets del logaritmo dei prezzi
€
ψi( jτ ,kτ ) ≡ 1 q
τ
k ln P[ i[( p −1)τ ]]
−1 if p ≤ qk + j
(qk + j - p +1) if p −1 < qk + j < p
p −[ j + (1− q)k] if p −1 < j + (1− q)k < p 1 if (1− q)k + j +1 ≤ p ≤ k + j
0 altrimenti
⎧
⎨
⎪⎪
⎪
⎩
⎪⎪
⎪
p= j +1 k + j
∑
€
P(t) = P(ti) ∀ t ∈ t[ i,ti + τ [ ≡ t[ i,ti+1[, i ∈ 1,...,T{ } 0 altrimenti
⎧⎨
€ ⎩
t1 ≡ 0
€
q k ≥ 1
ψi( jτ ,kτ ) ≡ 1
kτ ln P[ i[( p −1)τ ]]
−1
qqkτ if p = j +1 +1
qqkτ if p = k + j 0 altrimenti
⎧
⎨
⎪⎪
⎪
⎩
⎪⎪
⎪
p= j +1 k + j
∑ = k τ ln Pi[(k + j −1)τ ]
Pi[ jτ ]
⎡
⎣⎢ ⎤
⎦⎥ q k <1
OCS
ALCA HT nuove wavelets
Mattina (-t) Pomeriggio (t)
q kτ =10 min
OCS
MST nuove wavelets
q kτ =10 min
Mattina (-t) Pomeriggio (t)
OCS
ALCA HT nuove wavelets
q kτ = 25 min
Mattina (-t) Pomeriggio (t)
OCS
ALCA HT nuove wavelets
q kτ = 50 min
Mattina (-t) Pomeriggio (t)
OCS
ALCA HT nuove wavelets
q kτ = 75 min
Mattina (-t) Pomeriggio (t)
OCS
ALCA HT nuove wavelets
Haar function limit
Mattina (-t) Pomeriggio (t)
OCS
MST: nuove wavelets
Haar function limit
Mattina (-t) Pomeriggio (t)
OCS
Correlazione media ed Entropia
Correlazione media Entropia
OCS
Sottostrutture
Entropia (normalizzata) Correlazione media
(normalizzata)
OCS
Conclusioni
• Le trasformate di wavelet hanno consentito di distinguere la struttura di correlazione del portafoglio considerato tra mattina e pomeriggio.
• E’ stata introdotta una mother wavelet come “ponte”
che connette i rendimenti e le waveletes di Haar.
• Wavelets a supporto compatto sembrano essere più performanti nel campionare i prezzi.
OCS