tvmsscho2012DiFiore Algebre di matrici
L ⊂ C n×n `e un’algebra di matrici se L `e un sottospazio vettoriale di C n×n (α, β ∈ C, A, B ∈ L ⇒ αA + βB ∈ L) e il prodotto di matrici di L `e ancora una matrice di L (A, B ∈ L ⇒ AB ∈ L).
Vediamo degli esempi di algebre di matrici.
Esempio 1: Algebre di gruppo, matrici circolanti
Sia G = {1, 2, . . . , n} un gruppo con elemento identico 1. Si pu`o far corrispondere a G l’insieme di matrici L = {A ∈ C n×n : a i,j = a ki,kj , i, j, k ∈ G}.
Una prima cosa da osservare `e che L ammette la seguente altra rappresentazione L = {A ∈ C n×n : a i,j = a 1,i−1j , i, j ∈ G},
dalla quale si deduce che una matrice in L `e in particolare univocamente definita dalla sua prima riga, che pu`o essere arbitraria. ` E evidente quindi che L `e un sottospazio vettoriale di C n×n di dimensione n. Verifichiamo che `e chiuso rispetto alla moltiplicazione di matrici. Siano A, B ∈ G e i, j, k ∈ G. Allora
[AB] i,j = X
s∈G
[A] i,s [B] s,j = X
s∈G
[A] ki,ks [B] ks,kj = X
r∈G
[A] ki,r [B] r,kj = [AB] ki,kj ,
il che da’ la tesi.
Esercizio. L `e chiuso per inversione ? Cio`e, A ∈ L non singolare implica A −1 ∈ L ?
Vediamo un esempio di algebra di gruppo. Sia G il gruppo ciclico di ordine n, cio`e G = {1, 2, . . . , n} con i ↔ g i−1 , i ∈ G, dove g `e un elemento generatore di G (si noti che g n = 1). Studiamo la struttura dell’algebra di gruppo L corrispondente.
Per definizione, per l’elemento generico di A ∈ L si deve avere a i,j = a 1,i−1j = a 1,(g
i−1)
−1(g
j−1)
= a 1,gn+1−ig
j−1 =
j ≥ i : a 1,gj−i= a 1,j−i+1
j < i : a 1,gn+j−i = a 1,n+j−i+1 .
E evidente che se j − i `e costante allora rimane invariato l’elemento (i, j) di A; in altre parole A deve essere ` una matrice di Toeplitz. Se si investigano pi` u a fondo le uguaglianze ottenute si vede che A `e una matrice di Toeplitz definita univocamente dalla sua prima riga e, pi` u precisamente, A ha la seguente struttura:
A =
a 1,k
· a 1,k
a 1,k
· a 1,k
,
cio`e ha nelle posizioni (1, k), (2, k +1), . . . , (n+1−k, n), (n+2−k, 1), . . . (n, k −1) sempre lo stesso elemento a 1,k . Ad esempio, nel caso n = 4:
A =
a 11 a 12 a 13 a 14
a 14 a 11 a 12 a 13
a 13 a 14 a 11 a 12
a 12 a 13 a 14 a 11
.
Tali matrici A, dell’algebra di gruppo corrispondente al gruppo ciclico (che in seguito sar` a denotata C), sono dette circolanti.
Esercizio. Dimostrare che l’algebra di gruppo corrispondente al gruppo ciclico `e commutativa, ovvero che due generiche matrici circolanti dello stesso ordine commutano tra loro.
Esercizio. Scrivere la matrice generica dell’algebra di gruppo L corrispondente al gruppo diedrale G di ordine 6: G = {1, 2, 3, 4, 5, 6} = {e, r, r 2 , f, f r, f r 2 } dove r, f sono tali che r 3 = f 2 = e, rf rf = e. Osservare che L non `e commutativa.
Esempio 2: Il commutatore di una matrice Sia X una matrice n × n a elementi in C. Sia
L = {A ∈ C n×n : AX = XA}.
E semplice mostrare che L `e un’algebra di matrici chiusa per inversione. In generale le matrici di L non ` commutano tra loro (si prenda X = I).
Esercizio. Sia X la seguente matrice n × n
X =
0 1 1
1 0 1 1 · ·
· 1
1 1 0
(gli elementi non scritti si intendono zeri). Sia C + JC l’insieme {A + JB : A, B ∈ C n×n ∩ C}, J =
0 1
·
1 0
.
i) Dimostrare che C + JC = {A ∈ C n×n : AX = XA}
ii) Osservare che C + JC non `e commutativo
iii) Scrivere la generica matrice dello spazio dei polinomi nella matrice X Esempio 3: Lo spazio dei polinomi in una matrice
Sia X una matrice n × n a elementi in C. Dato un polinomio p(t) = a 0 + a 1 t + . . . + a k t k , con il simbolo p(X) intendiamo la matrice a 0 I + a 1 X + . . . + a k X k . Sia
L = {p(X) : p = polinomi}.
E semplice mostrare che L `e un’algebra di matrici commutativa la cui dimensione `e data dal grado del ` polinomio minimo di X ed `e quindi minore o uguale ad n.
Esercizio. Dimostrare che L `e chiusa per inversione, cio`e se A ∈ L `e non singolare, allora A −1 ∈ L (suggerimento: utilizzare il teorema di Cailey-Hamilton applicato ad A).
Un’algebra di questo tipo `e l’algebra di gruppo C delle matrici circolanti. Dimostriamolo. Sia X la matrice circolante la cui prima riga `e il vettore [0 1 0 · · · 0]. ` E semplice osservare che la matrice P n
k=1 a k X k−1
`e circolante per ogni scelta degli a k ({p(X)} ⊂ C), e che la generica matrice circolante, quella la cui prima riga `e il generico vettore [a 11 a 12 · · · a 1n ], si pu` o scrivere nella forma P n
k=1 a 1,k X k−1 (C ⊂ {p(X)}).
In altre parole, vale l’uguaglianza C = {p(X)}.
Esercizio. Studiare l’insieme C −1 dei polinomi nella matrice X ottenuta modificando il valore dell’elemento
(n, 1) della circolante con prima riga [0 1 0 · · · 0] da 1 a −1. C −1 `e noto come lo spazio delle matrici (−1)-
circolanti.
Teorema: relazione tra il commutatore di X e lo spazio dei polinomi in X
Sia X una matrice n × n a elementi in C. Allora {p(X)} ⊂ {A : AX = XA} e dim{p(X)} ≤ n ≤ dim{A : AX = XA}. Inoltre, gli spazi {p(X)} e {A : AX = XA} coincidono se e solo se dim{p(X)} = n se e solo se dim{A : AX = XA} = n, in tal caso X si dice non derogatoria.
Ci sono diverse condizioni equivalenti per la non derogatoriet` a di una matrice X. Ad esempio, una matrice
`e non derogatoria se e solo se ad ogni suo autovalore corrisponde un solo blocco di Jordan (ovvero, i polinomi minimo e caratteristico di X coincidono). Inoltre, ogni qual volta si ha
p(X) = 0 ⇒ deg p ≥ n, la matrice X `e non derogatoria.
Esempio 4: Le matrici triangolari di Toeplitz Sia Z la seguente matrice lower-shift n × n
Z =
0 1
1
· 1 0
ed L lo spazio delle matrici che commutano con Z. Studiamo nei dettagli tale spazio, che ovviamente `e anche un’algebra. Sia A ∈ C n×n generica. Allora
AZ =
a 12 · a 1n 0 .. . .. . .. . a n2 · a nn 0
, ZA =
0 · · · 0 a 11 · · · a 1n
· ·
a n−11 · · · a n−1n
.
Imponendo l’uguaglianza di AZ con ZA si ottengono le condizioni a 12 = a 13 = . . . a 1n = a 2n = . . . a n−1n = 0 e a i,j+1 = a i−1,j , i = 2, . . . , n, j = 1, . . . , n − 1, dalle quali si deduce la struttura di A ∈ L: A deve essere una matrice triangolare inferiore di Toeplitz del tipo
A =
a 11
a 21 a 11
a 31 a 21 a 11
· · ·
a n1 · · a 21 a 11
.
Ne segue in particolare che dim{A : AZ = ZA} = n e, quindi, per il Teorema, si ha anche l’identit`a {A : AZ = ZA} = {p(Z)}. Effettivamente, se si esaminano le potenze di Z ci si accorge che la matrice A in . . . non `e altri che il polinomio P n
k=1 a k1 Z k−1 .
Esempio 5: algebre di matrici simultaneamente diagonalizzabili
Sia M ∈ C n×n una matrice non singolare. Sia L lo spazio delle matrici simultaneamente diagonalizzate da M , cio`e
L = {MDM −1 : D = matrici diagonali}.
E evidente che L `e una algebra di matrici commutativa. Tuttavia questo risultato segue anche dall’osservazione `
che L pu`o essere rappresentata come l’insieme dei polinomi in una matrice X, `e sufficiente scegliere X =
M ˜ DM −1 con ˜ D matrice diagonale con elementi diagonali distinti. Non `e vero il contrario, cio`e non `e vero
in generale che uno spazio del tipo {p(X)} sia esprimibile nella forma {MDM −1 } per qualche matrice M
non singolare. Ad esempio, non pu` o essere vero per {p(Z)}, l’insieme delle matrici triangolari inferiori di Toeplitz, perch´e Z non `e una matrice diagonalizzabile.
Nel seguito descriveremo nei dettagli alcuni esempi di algebre {MDM −1 }. In tali esempi, la matrice M `e unitaria, M H = M −1 , e definisce una trasformata discreta veloce, cio`e ogni prodotto matrice-vettore M · z, z ∈ C n , `e calcolabile effettuando non pi` u di O(n log 2 n) operazioni aritmetiche. Questa `e una caratteristica di parecchie altre algebre di matrici di tipo {MDM −1 } che ha fatto si’ che tali algebre siano correntemente utilizzate per rendere pi` u efficiente la risoluzione numerica di diversi problemi, non solo di algebra lineare.
L’algebra C = {circolanti} (C −1 , C β ) e la trasformata discreta di Fouries (DFT) Sia Π 1 la matrice n × n circolante con prima riga [0 1 0 · · · 0]
Sia ω ∈ C. Si noti che, se e = [1 1 1 · · · 1] T , allora Π 1 e = e = 1e. Inoltre,
Π 1
1 ω
· ω n−1
=
ω ω 2
· ω n−1
1
= ω
1 ω
· ω n−1
,
dove l’ultima uguaglianza vale se ω n = 1. Pi` u in generale, se ω n = 1, valgono le seguenti identit` a vettoriali
Π 1
1 ω j
· ω (n−1)j
=
ω j
· ω (n−1)j
1
= ω j
1 ω j
· ω (n−1)j
, j = 0, 1, . . . , n − 1, o, equivalentemente, la seguente identit` a matriciale
Π 1 W = W D 1ωn−1,
D 1ωn−1=
1
ω
· ω n−1
, W =
1 1 · 1 · 1
1 ω ω j ω n−1
· ·
1 ω n−1 · ω (n−1)j · ω (n−1)(n−1)
.
Proposizione. Se ω n = 1 e se ω j 6= 1 per 0 < j < n, allora W ∗ W = nI.
Dimostrazione. Poich´e |ω| = 1, ω = ω −1 , abbiamo [W ∗ W ] ij = [W W ] ij = P n
k=1 [W ] ik [W ] kj = P n
k=1 ω (i−1)(k−1) ω (k−1)(j−1)
= P n
k=1 ω (k−1)(j−i) = P n
k=1 (ω j−i ) k−1 .
Quindi [W ∗ W ] ij = n se i = j, e [W ∗ W ] ij = 1−(ω 1−ωj−ij−i)
n = 0 se i 6= j (si noti che l’ipotesi ω j 6= 1 per 0 < j < n
`e essenziale per rendere 1 − ω j−i 6= 0).
Per il risultato della Proposizione, possiamo dire che la seguente matrice (simmetrica) di Fourier F = 1
√ n W, W = (ω (i−1)(j−1) ) n i,j=1 , ω n = 1, ω i 6= 1, 0 < i < n,
`e unitaria, i.e. F ∗ F = I.
Esercizio. Provare che F 2 = JΠ 1 dove J `e la matrice di permutazione Je k = e n+1−k , k = 1, . . . , n (J `e di
solito chiamata anti-identica).
L’identit` a matriciale soddisfatta da Π 1 e da W pu` o essere ovviamente riscritta in termini di F , Π 1 F = F D 1ωn−1, quindi otteniamo l’uguaglianza
Π 1 = F D 1ωn−1F ∗
da cui segue che la matrice di Fourier diagonalizza la matrice Π 1 , o, pi` u precisamente, che le colonne della matrice di Fourier formano un sistema di n autovettori unitariamente ortonormali per la matrice Π 1 con corrispondenti autovalori 1, ω, . . . , ω n−1 .
Ma se F diagonalizza Π 1 , allora diagonalizza tutti i polinomi in Π 1 : Π k−1 1 = F D k−1 1ωn−1F ∗ ,
P n
k=1 a k Π k−1 1 = F P n
k=1 a k D k−1 1ω
n−1F ∗
= F
P n
k=1 a k
P n
k=1 a k ω k−1
· P n
k=1 a k ω (n−1)(k−1)
F ∗
= F d(W a)F ∗ = √
nF d(F a)F ∗
dove con d(z) indichiamo la matrice diagonale i cui elementi diagonali sono z 1 , z 2 , . . . , z n .
Quindi per la matrice circolante la cui prima riga `e a T abbiamo ottenuto la rappresentazione C(a) =
√ nF d(F a)F ∗ = F d(F T a)d(F T e 1 ) −1 F ∗ .
Esercizio. Sia Π −1 la matrice (−1)-circolante con prima riga [0 1 0 · · · 0]. Procedendo analogamente al caso circolante cercare una matrice M unitaria tale che C −1 = {MDM −1 : D = diagonali}. (Nota: M si ottiene da F moltiplicando le sue righe, dalla prima alla n-esima, rispettivamente per 1, ρ, . . ., ρ n−1 , dove ρ
`e una radice principale n-sima di −1).
Pi` u in generale, posto Π β = Z T + βe n e T 1 , β ∈ C, e considerato l’insieme C β dei polinomi in Π β , trovare M tale che C β = {MDM −1 : D = diagonali} con M unitaria se |β| = 1. (Nota: M = D β F per una opportuna matrice diagonale D β ).
Esercizio. Sia T una matrice di Toeplitz n × n, i.e. T = (t i−j ) n i,j=1 , per certi t k ∈ C. Mostrare che T = A + B dove A `e una matrice circolante e B `e una matrice (−1)-circolante.
Proposizione FFT. Dato z ∈ C n , la complessit` a del prodotto matrice-vettore F z `e al pi` u O(n log 2 n). Tale operazione `e chiamata trasformata discreta di Fourier (DFT) di z. Come conseguenza, il prodotto matrice- vettore C(a)z `e calcolabile effettuando due DFT (dopo la pre-elaborazione della DFT F a), e, quindi, con al pi` u O(n log 2 n) operazioni aritmetiche.
Dimostrazione. Sia n pari. Poich´e ω (i−1)(k−1) `e l’(i, k) elemento di W e z k `e il k-esimo elemento di z ∈ C n , abbiamo
(W z) i = P n
k=1 ω (i−1)(k−1) z k = P n/2
j=1 ω (i−1)(2j−2) z 2j−1 + P n/2
j=1 ω (i−1)(2j−1) z 2j
= P n/2
j=1 (ω 2 ) (i−1)(j−1) z 2j−1 + P n/2
j=1 ω (i−1)(2(j−1)+1) z 2j
= P n/2
j=1 (ω 2 ) (i−1)(j−1) z 2j−1 + ω i−1 P n/2
j=1 (ω 2 ) (i−1)(j−1) z 2j .
Si noti che ω `e di fatto una funzione di n, cio`e la giusta notazione per ω dovrebbe essere ω n . Allora ω 2 = ω 2 n
`e tale che (ω 2 n ) n/2 = 1 e (ω 2 n ) i 6= 1 0 < i < n/2; in altre parole ω n 2 = ω n/2 (ovvero ω n 2 `e radice n/2-esima principale di 1). Quindi, abbiamo le identit` a
(W n z) i =
n/2
X
j=1
ω n/2 (i−1)(j−1) z 2j−1 + ω i−1 n
n/2
X
j=1
ω n/2 (i−1)(j−1) z 2j , i = 1, 2, . . . , n. (?)
Ne segue che, per i = 1, . . . , n 2 ,
(W n z) i = (W n/2
z 1
z 3
· z n−1
) i + ω n i−1 (W n/2
z 2
z 4
· z n
) i .
Inoltre, ponendo i = n 2 + k, k = 1, . . . , n 2 , in (?), otteniamo (W n z)
n2+k = P n/2
j=1 ω n/2
n2(j−1) ω n/2 (k−1)(j−1) z 2j−1 + ω n
n2ω k−1 n P n/2
j=1 ω n/2
n2(j−1) ω n/2 (k−1)(j−1) z 2j
= P n/2
j=1 ω n/2 (k−1)(j−1) z 2j−1 − ω n k−1
P n/2
j=1 ω (k−1)(j−1) n/2 z 2j
= (W n/2
z 1
z 3
· z n−1
) k − ω n k−1 (W n/2
z 2
z 4
· z n
) k , k = 1, . . . , n 2 .
(ω nn2 = −1; si pensi ω = e ±i2π/n ). Le precedenti uguaglianze scalari possono essere riscritte in forma compatta:
W n z =
"
I D
1ω
n 2 −1 n