Rome-Moscow school of Matrix Methods and Applied Linear Algebra
Rome, Sept 19 - Oct 3, 2010, Moscow, Oct 10 - Oct 24, 2010 Carmine Di Fiore In questi appunti si introducono e si studiano le matrici circolanti, τ e Toeplitz, le algebre di Hessenberg e le decomposizioni di dislocamento, gli spazi di classe V e le migliori approssimazioni nel senso dei minimi quadrati in tali spazi.
Come conseguenza dei risultati presentati, la scelta delle matrici coinvolte nelle decomposizioni di dislocamento, la scelta dei precondizionatori nella risoluzione di sistemi lineari e la scelta delle approssimazioni dell’Hessiano nei metodi di minimizzazione quasi-Newton, diventa possibile in classi pi` u ampie di algebre di matrici di bassa complessit` a.
La matrice di Fourier, le matrici circolanti, e le trasformate discrete veloci Si consideri la seguente matrice n × n
P 1 =
0 1
0 1 . ..
1
1 0
.
Sia ω ∈ C. Si noti che
P 1
1 1 1
=
1 1 1
= 1
1 1 1
, P 1
1 ω ω n−1
=
ω ω 2 ω n−1
1
= ω
1 ω ω n−1
,
dove l’ultima uguaglianza vale se ω n = 1. Pi` u in generale, se ω n = 1, valgono le seguenti identit` a vettoriali
P 1
1 ω j ω (n−1)j
=
ω j ω (n−1)j
1
= ω j
1 ω j ω (n−1)j
, j = 0, 1, . . . , n − 1, o, equivalentemente, la seguente identit` a matriciale
P 1 W = W D 1ω
n−1,
D 1ω
n−1=
1
ω
ω n−1
, W =
1 1 1 1
1 ω ω j ω n−1
1 ω n−1 ω (n−1)j ω (n−1)(n−1)
.
Proposizione. Se ω n = 1 e se ω j 6= 1 per 0 < j < n, allora W ∗ W = nI.
dimostrazione: poich´e |ω| = 1, ω = ω −1 , abbiamo [W ∗ W ] ij = [W W ] ij = P n
k=1 [W ] ik [W ] kj = P n
k=1 ω (i−1)(k−1) ω (k−1)(j−1)
= P n
k=1 ω (k−1)(j−i) = P n
k=1 (ω j−i ) k−1 .
Quindi [W ∗ W ] ij = n se i = j, e [W ∗ W ] ij = 1−(ω 1−ω
j−ij−i)
n= 0 se i 6= j (si noti che l’ipotesi ω j 6= 1 per 0 < j < n `e essenziale per rendere 1 − ω j−i 6= 0).
Per il risultato della Proposizione, possiamo dire che la seguente matrice (simmetrica) di Fourier
F = 1
√ n W
`e unitaria, i.e. F ∗ F = I.
Esercizio. Provare che F 2 = JP 1 dove J `e la matrice di permutazione Je k = e n+1−k , k = 1, . . . , n (J `e di solito chiamata anti-identica).
L’identit` a matriciale soddisfatta da P 1 e da W pu` o essere ovviamente riscritta in termini di F , P 1 F = F D 1ω
n−1, quindi otteniamo l’uguaglianza
P 1 = F D 1ω
n−1F ∗
da cui segue che la matrice di Fourier diagonalizza la matrice P 1 , o, pi` u pre- cisamente, che le colonne della matrice di Fourier formano un sistema di n autovettori unitariamente ortonormali per la matrice P 1 con corrispondenti au- tovalori 1, ω, . . . , ω n−1 .
Ma se F diagonalizza P 1 , allora diagonalizza tutti i polinomi in P 1 : P 1 k−1 = F D k−1 1ω
n−1F ∗ ,
P n
k=1 a k P 1 k−1 = F P n
k=1 a k D 1ω k−1
n−1F ∗
= F
P n
k=1 a k
P n
k=1 a k ω k−1
P n
k=1 a k ω (n−1)(k−1)
F ∗
= F d(W a)F ∗ = √
nF d(F a)F ∗
dove con d(z) indichiamo la matrice diagonale i cui elementi diagonali sono z 1 , z 2 , . . . , z n .
Scriviamo le matrici P 1 k−1 , k = 1, . . . , n, e la matrice P n
k=1 a k P 1 k−1 nel caso n = 4:
P 1 0 = I, P 1 1 =
0 1 0 0 0 0 1 0 0 0 0 1 1 0 0 0
, P 1 2 =
0 0 1 0 0 0 0 1 1 0 0 0 0 1 0 0
, P 1 3 =
0 0 0 1 1 0 0 0 0 1 0 0 0 0 1 0
,
P 1 4 = P 1 3 P 1 = P 1 T P 1 = I = P 1 0 ,
4
X
k=1
a k P 1 k−1 =
a 1 a 2 a 3 a 4
a 4 a 1 a 2 a 3
a 3 a 4 a 1 a 2
a 2 a 3 a 4 a 1
= √
4F d(F a)F ∗ , F = 1
√ 4
1 1 1 1
1 ω ω 2 ω 3 1 ω 2 ω 4 ω 6 1 ω 3 ω 6 ω 9
,
ω 4 = 1, ω j 6= 1, 0 < j < 4 (ω = e ±i2π/4 ).
Si noti che, per n generico, abbiamo le identit` a e T 1 P 1 k−1 = e T k , k = 1, . . . , n, e P 1 n = I (provarle!). Ne segue che lo spazio C = {p(P 1 )} di tutti ipolinomi in P 1
`e generato dalle matrici J k = P 1 k−1 ; il particolare polinomio P n
k=1 a k J k verr` a indicato con il simbolo C(a). Si osserva che C(a) `e la matrice di C la cui prima riga `e a T :
C(a) =
n
X
k=1
a k J k =
a 1 a 2 a n−1 a n
a n a 1 a n−1
a 3 a 2
a 2 a 3 a n a 1
= F d(F T a )d(F T e 1 ) −1 F −1 .
C `e noto come lo spazio delle matrici circolanti.
Esercizio. (i) Si ripeta tutto, partendo dalla matrice n × n
P −1 =
0 1
0 1 . ..
1
−1 0
e arrivando alla matrice (−1)-circolante la cui prima riga `e a T , a ∈ C n :
C −1 (a) =
a 1 a 2 a n−1 a n
−a n a 1 a n−1
−a 3 a 2
−a 2 −a 3 −a n a 1
.
(ii) Sia T una matrice di Toeplitz n × n, i.e. T = (t i−j ) n i,j=1 , per certi t k ∈ C.
Mostrare che T pu` o essere riscritta come la somma di una circolante e di una (−1)-circolante, cio`e, T = C(a) + C −1 (b), a, b ∈ C n .
Perch´e le matrici circolanti possono essere interessanti nelle applicazioni dell’algebra lineare? La principale ragione `e nel fatto che il prodotto matrice- vettore C(a)z pu` o essere calcolato con al pi` u O(n log 2 n) operazioni aritmetiche (mentre, di solito, un prodotto matrice-vettore richiede n 2 moltiplicazioni).
Proposizione FFT. Dato z ∈ C n , la complessit` a del prodotto matrice-vettore F z
`e al pi` u O(n log 2 n). Tale operazione `e chiamata trasformata discreta di Fourier (DFT) di z. Come conseguenza, il prodotto matrice-vettore C(a)z `e calcolabile effettuando due DFT (dopo la pre-elaborazione della DFT F a).
dimostrazione: poich´e ω (i−1)(k−1) `e l’(i, k) elemento di W e z k `e il k-esimo elemento di z ∈ C n , abbiamo
(W z) i = P n
k=1 ω (i−1)(k−1) z k = P n/2
j=1 ω (i−1)(2j−2) z 2j−1 + P n/2
j=1 ω (i−1)(2j−1) z 2j
= P n/2
j=1 (ω 2 ) (i−1)(j−1) z 2j−1 + P n/2
j=1 ω (i−1)(2(j−1)+1) z 2j
= P n/2
j=1 (ω 2 ) (i−1)(j−1) z 2j−1 + ω i−1 P n/2
j=1 (ω 2 ) (i−1)(j−1) z 2j .
Si noti che ω `e di fatto una funzione di n, cio`e la giusta notazione per ω dovrebbe
essere ω n . Allora ω 2 = ω 2 n `e tale che (ω 2 n ) n/2 = 1 e (ω 2 n ) i 6= 1 0 < i < n/2; in
altre parole ω n 2 = ω n/2 . Quindi, abbiamo le identit` a
(W n z) i =
n/2
X
j=1
ω n/2 (i−1)(j−1) z 2j−1 + ω n i−1
n/2
X
j=1
ω n/2 (i−1)(j−1) z 2j , i = 1, 2, . . . , n. (?)
Ne segue che, per i = 1, . . . , n 2 ,
(W n z) i = (W n/2
z 1
z 3
z n−1
) i + ω n i−1 (W n/2
z 2
z 4
z n
) i .
Inoltre, ponendo i = n 2 + k, k = 1, . . . , n 2 , in (?), otteniamo (W n z )
n2+k = P n/2
j=1 ω n/2
n2(j−1) ω n/2 (k−1)(j−1) z 2j−1 + ω n
n2ω k−1 n P n/2
j=1 ω n/2
n2(j−1) ω (k−1)(j−1) n/2 z 2j
= P n/2
j=1 ω (k−1)(j−1) n/2 z 2j−1 − ω n k−1
P n/2
j=1 ω n/2 (k−1)(j−1) z 2j
= (W n/2
z 1
z 3
z n−1
) k − ω n k−1 (W n/2
z 2
z 4
z n
) k , k = 1, . . . , n 2 .
(ω n
n2= −1; si pensi ω = e ±i2π/n ). Le precedenti uguaglianze scalari possono essere riscritte in forma compatta:
W n z =
"
I D
1ω
n 2 −1
I −D 1ω
nn2 −1 n#
W n/2 0 0 W n/2
Qz,
D 1ω
n 2 −1 n