INDICE 1
Teorema di Cayley-Hamilton, forma canonica e triangolazioni.
Versione del 2 Maggio 2011
Argomenti scelti sulla triangolazione di matrici, il teorema di Cayley-Hamilton e sulla forma canonica delle matrici 3 × 3 per i corsi di Geometria 1 e Teoria dei Gruppi.
Testo di riferimento consigliato per questi argomenti:
S.Lang, Algebra Lineare, Boringhieri, Torino 1989
Indice
1 Triangolazione di matrici. 2
2 Teorema di Cayley-Hamilton. 3
3 Matrici nilpotenti. 6
4 Forma canonica delle matrici 3 × 3. 8
5 Esempi. 12
1 TRIANGOLAZIONE DI MATRICI. 2
1 Triangolazione di matrici.
In questa sezione dimostriamo per le matrici complesse (e per le matrici reali con tutti gli auto- valori reali) l’esistenza di una base ortonormale in cui la matrice assume una forma triangolare.
Ovvero che le matrici in ipotesi sono triangolabili.
Teorema 1.1 Sia A una matrice complessa, allora esiste in Cn una base ortonormale in cui la matrice assume una forma triangolare.
Prova. La dimostrazione procede per induzione. Consideriamo in Cn un prodotto hermi- tiano. Il caso delle matrici 1 × 1 `e banale. Consideriamo ora una matrice complessa n × n.
Esiste sicuramente almeno un autovalore e un autovettore:
Av1 = λv1
E possiamo prendere kv1k = 1. Sia E il sottospazio generato da v1 e consideriamo il suo complemento ortogonale F :
Cn= E ⊕ F Per ogni v ∈ Cn si ha la scomposizione unica:
Av = kv1+ w
dove w ∈ F e k dipendono da v. Definiamo ora una applicazione lineare A1 : Cn→ F : A1(v) = w
La restrizione di A1 al sottospazio F `e una matrice n − 1 × n − 1 che per l’ipotesi induttiva `e triangolabile, esiste cio`e una base ortonormale {v2, v3, ...vn} di F in cui:
A1(v2) = a22v2
A1(v3) = a23v2+ a33v3 ...
A1(vn) = a2nv2+ a3nv3+ ... + annvn
Aggiungendo il vettore v1 abbiamo allora una base ortogonale di tutto Cn che triangolarizza la matrice n × n da cui siamo partiti. Otteniamo infatti, dalla scomposizione unica Av = kv1+ w applicata ai vettori della base:
A(v1) = λv1
A(v2) = k1v1+ a22v2
A(v3) = k2v1+ a23v2+ a33v3
...
A1(vn) = knv1+ a2nv2+ a3nv3+ ... + annvn
2 TEOREMA DI CAYLEY-HAMILTON. 3
Osservazione 1.1 La forma triangolare `e quindi:
λ k1 k2 ... kn
0 a22 a23 ... a2n 0 0 a33 ... a3n ... ... ... ... ...
0 0 0 0 ann
Gli autovalori della matrice sono gli elementi della diagonale, perch`e il polinomio caratteristico di una matrice triangolare `e:
PA(x) = (λ − x) (a22− x) ... (ann − x)
Osservazione 1.2 La dimostrazione non fornisce un procedimento costruttivo della base che triangolarizza, vedremo in seguito (forma canonica di Jordan) esplicitamente almeno per le matrici 3 × 3, un procedimento costruttivo.
Osservazione 1.3 La dimostrazione ovviamente vale anche se la matrice `e reale e ha tutti gli autovalori reali.
2 Teorema di Cayley-Hamilton.
In questa sezione enunciamo e dimostriamo un risultato molto importante, il cosiddetto teorema di Cayley-Hamilton.
Generalizziamo prima ai polinomi di matrici il teorema del resto, valido per i polinomi reali o complessi. Il teorema del resto dice il resto della divisione di un polinomio p(x) di grado ≥ 1 per il polinomio (x − a) `e p(a). Ovvero:
p(x) = q(x)(x − a) + p(a) Sia ora
p(x) = a0xq+ a1xq−1+ ... + aq un polinomio di grado q ≥ 1 e A una matrice reale o complessa.
Teorema 2.1 Teorema del resto. Vale la seguente formula matriciale:
p (x) I = Q(x) (xI − A) + p(A)
dove I `e la matrice identit`a, Q(x) `e una matrice i cui elementi sono polinomi in x e p(A) `e il polinomio matriciale ottenuto sostituendo la matrice A all’indeterminata x nel polinomio p(x).
Prova. Poniamo
p (x) I = Q(x) (xI − A) + S (1)
2 TEOREMA DI CAYLEY-HAMILTON. 4
Cerchiamo di determinare la matrice Q(x) ponendo:
Q(x) = xq−1R1+ xq−2R2 + .... + Rq
Dove le Ri sono matrici che non dipendono da x. Sostituendo nella (1) otteniamo:
a0xq+ a1xq−1+ ... + aq I = xq−1R1+ xq−2R2+ .... + Rq (xI − A) + S Uguagliando i coefficienti delle potenze distinte di x otteniamo la catena di equazioni:
R1 = aoI R2− R1A = a1I ... = ...
Rq− Rq−1A = aq−1I S − RqA = aqI
Queste equazioni possono essere risolte in successione. Abbiamo quindi dimostrato l’esistenza di Q(x). Moltiplichiamo ora la prima equazione per Aq, la seconda per Aq−1, e cos`ı via fino alla penultima che si moltiplica per A e l’ultima per I. Otteniamo allora:
R1Aq = aoAq R2Aq−1− R1Aq = a1Aq−1
... = ...
RqA − Rq−1A2 = aq−1A S − RqA = aqI Sommando tutte queste equazioni otteniamo:
S = p(A) Cio`e S = 0 ⇐⇒ p(A) = 0.
Teorema 2.2 Teorema di Cayley-Hamilton: ogni matrice `e radice del suo polinomio caratteristico. Ovvero
pA(A) = 0 Prova. Ricordiamo che
pA(x) = det(A − xI) = (−1)ndet(xI − A)
Osserviamo che dalla formula dello sviluppo per righe del determinante di una matrice B si ottiene:
(det B) · I = eBtB
dove eBt `e la trasposta della matrice dei complementi algebrici.
2 TEOREMA DI CAYLEY-HAMILTON. 5
Ponendo B = (−1)ndet(xI − A) otteniamo:
pA(x)I = (−1)ndet(xI − A) · I =(xI − A)^
t
(xI − A)
Per cui, applicando a questo caso il teorema precedente, otteniamo subito che Q(x) =(xI − A)^
t
e
S = pA(A) = 0
Il teorema di Cayley-Hamilton ha interessanti conseguenze:
Teorema 2.3 Sia A una matrice n × n, allora An `e combinazione lineare delle matrici I, A, A2, ...An−1.
Prova. Basta infatti scrivere il polinomio caratteristico
pA(x) = (−1)nxn+ a1xn−1+ ... + det A E applicare Cayley-Hamilton:
pA(A) = (−1)nAn+ a1An−1+ ... + (det A) · I = 0 E quindi:
An = (−1)n+1 a1An−1+ ... + (det A) · I
Osservazione 2.1 E’ anche chiaro che ogni potenza Am con m ≥ n `e combinazione lineare delle matrici I, A, A2, ...An−1. Infatti basta dividere m per n, con resto r, ottenendo quindi
Am = Akn+r = (An)kAr
e, nel prodotto a destra, basta sostituire a ogni occorrenza di An la sua espressione come combinazione lineare di I, A, A2, ...An−1.
Teorema 2.4 Sia A una matrice n × n, invertibile, allora A−1 `e combinazione lineare delle matrici I, A, A2, ...An−1.
Prova. Come sopra, da (−1)nAn+ a1An−1+ ... + (det A) I = 0, raccogliendo A si ottiene:
(−1)nAn−1+ a1An−2+ ... = − (det A) · A−1
3 MATRICI NILPOTENTI. 6
3 Matrici nilpotenti.
Studiamo in questo paragrafo le propriet`a pi`u elementari di una importante classe di matrici, le cosiddette matrici nilpotenti.
Definizione 3.1 Una matrice A si dice nilpotente se esiste un intero m tale che Am = 0 Definizione 3.2 Si dice indice di nilpotenza di una matrice nilpotente il pi`u piccolo intero r per cui Ar = 0
Osservazione 3.1 L’indice di nilpotenza `e conservato dalla relazione di similitudi- ne. Osserviamo prima di tutto che una matrice simile a una nilpotente `e anch’essa nilpotente, infatti se Am = 0 e B = M−1AM una matrice simile ad A, abbiamo subito:
Bm = M−1AmM = 0
Mostriamo ora che l’indice di nilpotenza si conserva. Siano infatti A una matrice con indice di nilpotenza r e B = M−1AM una matrice simile ad A, e indichiamo con s il suo indice di nilpotenza. Otteniamo subito
0 = Bs = M−1AsM =⇒ As= 0 =⇒ r ≤ s 0 = Ar = M BrM−1 =⇒ Br = 0 =⇒ s ≤ r
Il teorema di Cayley-Hamilton fornisce una caratterizzazione delle matrici nilpotenti:
Teorema 3.1 Una matrice n × n `e nilpotente se e solo se ha come unico autovalore lo zero con molteplicit`a algebrica n.
Prova. Se una matrice `e nilpotente l’unico autovalore possibile `e lo zero:
Av = λv =⇒ 0 = Amv = λmv =⇒ λ = 0
Viceversa se una matrice n × n ha come unico autovalore lo zero con molteplicit`a algebrica n il suo polinomio caratteristico `e pA(x) = (−1)nxn, per cui il teorema di Cayley-Hamilton assicura che:
pA(A) = (−1)nAn= 0
Osservazione 3.2 E’ chiaro che l’unica matrice nilpotente diagonalizzabile `e la matrice nulla.
Infatti per essere diagonalizzabile l’autospazio dell’autovalore zero, cio`e il nucleo della matrice, deve avere dimensione n e questo implica che il rango della matrice sia zero. Le matrici nilpotenti sono per`o sempre triangolarizzabili, come vedremo nella prossima sezione.
3 MATRICI NILPOTENTI. 7
Proseguiamo il paragrafo con alcune osservazioni sui nuclei e sulle immagini delle potenze positive di una matrice data B.
Sia B una matrice n × n e consideriamo le sue potenze positive Bm, si ha:
{0} ⊆ ker B ⊆ ker B2 ⊆ ker B3... ⊆ Cn Infatti, ad esempio:
v ∈ ker B =⇒ Bv = 0 =⇒ B (Bv) = 0 =⇒ v ∈ ker B2 e cos`ı via.
Osservazione 3.3 Se la matrice A `e nilpotente la catena di inclusioni dei nuclei `e finita e termina con l’uguaglianza.
Analoga catena di inclusioni vale per le immagini:
{0} ⊆ ... ⊆ Im B3 ⊆ Im B2 ⊆ Im B ⊆ Cn Infatti, ad esempio:
w ∈ Im B2 =⇒ w = B2v =⇒ w = B (Bv) =⇒ w ∈ Im B e cos`ı via.
Osservazione 3.4 Se la matrice A `e nilpotente la catena di inclusioni delle immagini `e finita e inizia con l’uguaglianza.
Studiamo ora il caso particolare di matrici B tali che B3 = 0. Se B3 = 0 allora:
w = Bv ⇒ B2w = B3v = 0 ⇒ Im B ⊆ ker B2 (2) Se l’indice di nilpotenza di B `e due si ha anche:
w = Bv e B2 = 0 ⇒ B2v = Bw = 0 ⇒ Im B ⊆ ker B ⇒ dim ker B ≥ dim Im B (3) Se invece l’indice di nilpotenza `e tre possiamo osservare anche che:
w = B2v e B3 = 0 ⇒ B3v = Bw = 0 ⇒ Im B2 ⊆ ker B ⊆ ker B2 (4) Osservazione 3.5 Nel caso particolare di matrici 3 × 3 abbiamo che se B2 = 0 ma B 6= 0 allora il teorema delle dimensioni:
dim ker B + dim Im B = 3
e la (3) implicano che la dimensione di ker B sia 2, se invece B3 = 0 ma B2 6= 0 ancora il teorema delle dimensioni e la (4) implicano che la dimensione di ker B2 sia 2.
4 FORMA CANONICA DELLE MATRICI 3 × 3. 8
4 Forma canonica delle matrici 3 × 3.
Sia ora B una matrice 3 × 3 nilpotente (e allora Cayley-Hamilton implica che B3 = 0).
Escludendo il caso banale B = 0, studiamo i due casi B2 6= 0 e B2 = 0.
Nel primo caso prendiamo un vettore v /∈ ker B e /∈ ker B2 (l’ultima osservazione del pa- ragrafo precedente dimostra che un tale vettore esiste). Dimostriamo che i vettori v, Bv, B2v sono indipendenti. Infatti:
av + bBv + cB2v = 0 =⇒ B av + bBv + cB2v = aBv + bB2v = 0
=⇒ B aBv + bB2v = aB2v = 0 =⇒ a = b = c = 0 Consideriamo ora la base costituita dai vettori:
v1 = B2v v2 = Bv v3 = v In questa base si ha:
Bv1 = 0 Bv2 = v1 Bv3 = v2 Cio`e la matrice B assume la forma:
B =
0 1 0 0 0 1 0 0 0
Se invece B2 = 0, prendiamo un vettore u 6= 0 ∈ Im B, u = Bv, e un vettore w 6= 0 ∈ ker B e indipendente da u. Un tale vettore esiste sempre per l’ultima osservazione del paragrafo precedente. I vettori v, Bv, w sono indipendenti:
av + bBv + cw = 0 =⇒ B (av + bBv + cw) = 0 =⇒ a = 0 bBv + cw = 0 =⇒ b, c = 0
Allora nella base:
v1 = w v2 = Bv v3 = v si ha:
Bv1 = 0 Bv2 = 0 Bv3 = v2
4 FORMA CANONICA DELLE MATRICI 3 × 3. 9
Cio`e la matrice B assume la forma:
B =
0 0 0 0 0 1 0 0 0
Riassumendo, abbiamo dimostrato che:
Teorema 4.1 Sia B una matrice nilpotente 3×3 allora esiste una base in cui la matrice assume una delle tre forme canoniche (dette di Jordan)
dim ker B = 3 ⇒ B =
0 0 0 0 0 0 0 0 0
dim ker B = 2 ⇒ B =
0 0 0 0 0 1 0 0 0
dim ker B = 1 ⇒ B =
0 1 0 0 0 1 0 0 0
Osservazione 4.1 Si potrebbe dimostrare che un risultato simile vale per matrici nilpotenti di qualsiasi ordine: si possono sempre mettere in una forma diagonale con zeri sulla diagonale e blocchi di elementi uno e zero appena sopra la diagonale (forma canonica di Jordan)
Questo studio sulle matrici nilpotenti 3 × 3 si applica direttamente al caso delle matrici 3 × 3 con un solo autovalore di molteplicit`a algebrica 3.
Teorema 4.2 Sia A una matrice 3 × 3 con un solo autovalore λ di molteplicit`a algebrica 3, allora esiste una base in cui la matrice assume una delle tre forme canoniche (dette di Jordan)
dim ker (A − λI) = 3 ⇒ A =
λ 0 0 0 λ 0 0 0 λ
dim ker (A − λI) = 2 ⇒ A =
λ 0 0 0 λ 1 0 0 λ
dim ker (A − λI) = 1 ⇒ A =
λ 1 0 0 λ 1 0 0 λ
Prova. Per dimostrare il risultato basta osservare che il polinomio caratteristico in questo caso `e pA(x) = (λ − x)3 e quindi si ottiene da Cayley-Hamilton che (λI − A)3 = 0 e applicare poi il teorema precedente alla matrice nilpotente B = (A − λI)
4 FORMA CANONICA DELLE MATRICI 3 × 3. 10
Osservazione 4.2 Abbiamo anche ottenuto un risultato interessante: sia A una matrice 3 × 3 con un solo autovalore λ di molteplicit`a algebrica 3, allora pu`o essere messa in forma di somma di una matrice diagonale e di una nilpotente che commutano fra di loro. Infatti basta osservare che A = λI + B.
Trascurando il caso banale in cui la matrice `e diagonalizzabile, per studiare la forma canonica delle matrici 3 × 3 rimane il caso in cui la matrice ha due autovalori distinti di cui uno di molteplicit`a algebrica 2 e geometrica 1.
Il suo polinomio caratteristico `e quindi del tipo:
PA(x) = (λ − x)2(µ − x)
Poniamo B = A − λI e C = A − µI. Abbiamo dal teorema di Cayley-Hamilton che B2C = 0 e sappiamo anche che dim ker C = dim ker B = 1. Ricordiamo anche che autospazi di autovalori distinti hanno intersezione ridotta al solo vettore nullo.
ker B ∩ ker C = {0}
Osserviamo ora che dalle definizioni di B e C segue che BC `e nilpotente:
B2C = 0 =⇒ B2C2 = (BC)2 = 0
E’ chiaro che nel nostro caso BC 6= 0. Infatti se BC = 0 =⇒ Im C ⊆ ker B e quindi dim Im C ≤ 1, ma allora dim Im C ≤ 1 ⇒ dim ker C ≥ 2 contrariamente all’ipotesi dim ker C = dim ker B = 1.
Sia ora v tale che BCv 6= 0 e prendiamo w3 = Cv. Prendiamo poi w1 = BCv ∈ ker B (infatti B2Cv = 0) e w ∈ ker C. Osserviamo ora che Aw = µw e quindi:
B2w = (A − λI) (A − λI) w = (A − λI) (µ − λ) w = (µ − λ)2w 6= 0 I tre vettori wi formano allora una base perch`e sono indipendenti:
aw1 + bw + cw3 = 0 =⇒ B2(aw1 + bw + cw3) = 0 ⇒ bB2w = 0 ⇒ b = 0 aw1+ cw3 = 0 ⇒ B (aw1+ cw3) = cBCv = 0 ⇒ c = 0
aw1 = 0 ⇒ a = 0 Allora nella base formata dai vettori:
v1 = w ∈ ker C
v2 = w1 = BCv ∈ ker B v3 = w3 = Cv
si ha:
Av1 = µv1 Av2 = λv2
Av3 = (B + λI) Cv = BCv + λCv = v2 + λv3
4 FORMA CANONICA DELLE MATRICI 3 × 3. 11
Cio`e la matrice A assume la forma:
A =
µ 0 0 0 λ 1 0 0 λ
Osservazione 4.3 Anche in questo caso la matrice pu`o essere messa in forma di somma di una matrice diagonale
µ 0 0 0 λ 0 0 0 λ
e una matrice nilpotente
0 0 0 0 0 1 0 0 0
.
Osservazione 4.4 Questo risultato importante vale in realt`a per matrici complesse (o matrici reali con tutti gli autovalori reali) di ogni dimensione. Infatti abbiamo visto che tali matrici sono triangolabili con gli autovalori sulla diagonale e la differenza tra la matrice e la sua diagonale `e una matrice triangolare con solo zeri sulla diagonale, e quindi, avendo come autovalori il solo zero con molteplicit`a n, `e nilpotente.
Osservazione 4.5 la forma canonica di Jordan `e particolarmente utile quando si desidera cal- colare l’esponenziale di una matrice. Infatti `e facile calcolare l’esponenziale di matrici nilpotenti in forma canonica:
e
0 0 0 0 0 1 0 0 0
= I + A =
1 0 0 0 1 1 0 0 1
e
0 1 0 0 0 1 0 0 0
= I + A + A2 2 =
1 1 12 0 1 1 0 0 1
Da queste formule allora si ricava subito, ad esempio:
e
a 0 0 0 a 1 0 0 a
= e
a 0 0 0 a 0 0 0 a
e
0 0 0 0 0 1 0 0 0
=
ea 0 0 0 ea ea 0 0 ea
e
a 1 0 0 a 1 0 0 a
= e
a 0 0 0 a 0 0 0 a
e
0 1 0 0 0 1 0 0 0
=
ea ea 12ea 0 ea ea 0 0 ea
e
a 0 0 0 b 1 0 0 b
=
ea 0 0 0 eb eb 0 0 eb
5 ESEMPI. 12
In generale, per calcolare l’esponenziale di una matrice A, ad esempio 3 × 3, si pu`o mettere la matrice in forma canonica C = M−1AM mediante le basi costruite in questi appunti e poi applicare la formula:
eA = eM CM−1 = M eCM−1
Osservazione 4.6
µ 0 a 0 λ b 0 0 λ
=
0 1 0 0 1ab 1
1
a 0 0
µ 0 0 1 λ 0 0 0 λ
0 0 a
1 0 0
−1ab 1 0
5 Esempi.
• Consideriamo la matrice A =
1 2 3 0 1 3 0 0 1
ha l’autovalore 1, allora B = A − I =
0 2 3 0 0 3 0 0 0
ha nucleo di dimensione 1 con base
1 0 0
. B2 =
0 0 6 0 0 0 0 0 0
, con base
del nucleo
1 0 0
,
0 1 0
La forma canonica di A `e pertanto
1 1 0 0 1 1 0 0 1
. Infatti seguendo il procedimento indi- cato sopra: prendiamo un vettore v non appartenente al nucleo di B e non appartenente al nucleo di B2 , ad esempio v =
0 0 1
costruiamo poi la base: v =
0 0 1
, Bv =
0 2 3 0 0 3 0 0 0
0 0 1
=
3 3 0
, B2v =
0 0 6 0 0 0 0 0 0
0 0 1
=
6 0 0
. In questa base si ha:
6 3 0 0 3 0 0 0 1
−1
0 2 3 0 0 3 0 0 0
6 3 0 0 3 0 0 0 1
=
0 1 0 0 0 1 0 0 0
=⇒ A =
1 1 0 0 1 1 0 0 1
• Consideriamo la matrice A =
2 5
6
5 0
−152 −25 1
0 0 0
ha autovalore 0, e ha nucleo di dimensio-
ne 1 con base
−3 1 0
. A2 =
0 0 65 0 0 −25 0 0 0
, con base del nucleo
1 0 0
,
0 1 0
La
5 ESEMPI. 13
forma canonica di A `e pertanto
0 1 0 0 0 1 0 0 0
. Infatti seguendo il procedimento indicato sopra: prendiamo un vettore v non appartenente al nucleo di A e non appartenente al nucleo di A2 , ad esempio v =
0 0 1
costruiamo poi la base: v =
0 0 1
, Av =
0 1 0
,
A2v =
6
−525
0
6
5 0 0
−25 1 0 0 0 1
−1
A
6
5 0 0
−25 1 0 0 0 1
=
0 1 0 0 0 1 0 0 0
• Consideriamo ora la matrice A =
3
2 −12 12
−12 32 −12
0 0 2
gli autovalori sono 1 e 2: A −
2I = B =
−12 −12 12
−12 −12 −12
0 0 0
e A − I = C =
1
2 −12 12
−12 12 −12
0 0 1
., nullspace basis:
1 1 0
Verifichiamo che
B2C =
0 0 0 0 0 0 0 0 0
, BC =
0 0 12 0 0 −12 0 0 0
la matrice non `e diagonalizzabile. Costruiamo una base per metterla in forma canonica:
v1 = w ∈ ker C =
1 1 0
v2 = w1 = BCv ∈ ker B prendiamo per esempio v =
0 1 1
: allora BCv =
1
−212
0
v3 = w3 = Cv =
0 0 1
Abbiamo allora:
1 12 0 1 −12 0
0 0 1
−1
3
2 −12 12
−12 32 −12
0 0 2
1 12 0 1 −12 0
0 0 1
=
1 0 0 0 2 1 0 0 2
5 ESEMPI. 14
Possiamo allora calcolare ad esempio:
e
1 0 0 0 2 1 0 0 2
=
e 0 0 0 e2 e2 0 0 e2
E allora:
e
3
2 −12 12
−12 32 −12
0 0 2
=
1 12 0 1 −12 0
0 0 1
e 0 0 0 e2 e2 0 0 e2
1 12 0 1 −12 0
0 0 1
−1
=
1
2e + 12e2 12e − 12e2 12e2
1
2e − 12e2 12e + 12e2 −12e2
0 0 e2