1. Premesse
Ricordo sempre che questi files contengono principalmente definizioni e teoremi. Per varie discussioni, motivazioni, applicazioni rimando a quanto detto in aula.
Sia V uno spazio vettoriale di dimensione finita su un campo K.
L’anello EndK(V). Denotiamo EndK(V ) l’insieme delle applicazioni (o endomorfismi, o oper- atori) K-lineari f : V → V . Sappiamo gi`a che ha una naturale struttura di spazio vettoriale. Ha anche un prodotto
V × V → V, (f, g) 7→ f g
dato dalla composizione di funzioni: (f g)(v) := f (g(v)). Questo rende EndK(V ) un anello (eser- cizio: verificare tutti gli assiomi). Anzi, `e una K-algebra (uno spazio vettoriale che ha anche una struttura compatibile di anello). In particolare, dato un operatore (non nullo) f : V → V , abbiamo le sue potenze: fn, per ogni n ∈ N. NB: f0= idV.
Anche l’insieme delle matrici quadrate Mn(K) di un dato ordine n `e un’algebra (il prodotto `e l’usuale prodotto righe per colonne di matrici). Come sappiamo dal corso Geometria 1 la scelta di una base B di V determina un isomorfismo di K-algebre (cio`e un isomorfismo di K spazi vettoriali e di anelli allo stesso tempo)
ΦB: EndK(V ) → Mn(K), f 7→ MB(f ) dove n = dim V .
Polinomi di endomorfismi. Consideriamo ora un’altra K-algebra che conosciamo: l’algebra dei polinomi K[X]1. Un elemento f ∈ EndK(V ) determina una funzione
Ef : K[X] → EndK(V ), Q 7→ Q(f )
dove Q(f ) `e l’endomorfismo ottenuto sostituendo f al posto dell’indeterminata X. Quindi, se Q = Pd
i=0aiXi con ai ∈ K per ogni i = 0, . . . , d, allora Q(f ) : V → V `e, per definizione, l’endomorfismo Pd
i=0aifi. Dunque Q(f )(v) = Pd
i=0aifi(v). `E facile verificare (fatelo) che l’applicazione `e un omomorfismo di k-algebre:
(P + Q)(f ) = P (f ) + Q(f ) (λP )(f ) = λ(P (f )) (P Q)(f ) = P (f )Q(f )
per ogni P, Q ∈ K[X] e per ogni λ ∈ K. Possiamo considerare anche la versione matriciale.
Abbiamo dunque, data una matrice A ∈ Mn(K) una funzione EA: K[X] → MK(n), Q 7→ Q(A) dove Q(A) :=Pd
i=0aiAi. Come prima, `e un omomorfismo di K-algebre.
1di solito `e chiamata l’anello dei polinomi. Comunque `e anche un K-spazio vettoriale (di dimensione infinita).
1
Osserviamo che, anche se il prodotto in EndK(V ) non `e commutativo, per ogni f ∈ EndK(V ), gli endomorfismi nell’immagine di Ef, cio`e gli endomorfismi della forma Q(f ), con Q ∈ K[X], com- mutano tra loro: P (f )Q(f ) = Q(f )P (f ) per ogni P, Q ∈ K[X] (lo potete verificare direttamente.
Oppure si pu`o usare il fatto che l’anello K[X] `e commutativo).
2. Il Teorema di Cayley-Hamilton: enunciato e osservazioni
Continuiamo con le notazioni precedenti. E chiaro che, per ogni f ∈ End` K(V ) (o A ∈ MK(n)) l’omomorfismo Ef (o EA) non `e iniettivo. Infatti Ef `e, in particolare, un’applicazione lineare, e il suo dominio, k[X], `e un K-spazio vettoriale di dimensione infinita, mentre il codominio, EndK(V ) ha dimensione finita (sappiamo che dimkEndk(V ) = dim KMK(n) = n2). Dunque il nucleo dell’applicazione lineare Ef `e sempre non nullo, e, anzi, ha anche lui dimensione infinita.2
Denotiamo Pf ∈ K[X] il polinomio caratteristico di f . Abbiamo anche la versione matriciale:
sia A ∈ Mn,n(K) e denotiamo PA il polinomio caratteristico di A.
Teorema 2.1. [Cayley-Hamilton] Pf(f ) = 0. In altre parole Pf ∈ ker Ef. Versione matriciale: PA(A) = 0. In altre parole PA∈ ker EA 3.
Osservazione 2.2. `E facile vedere che il teorema `e vero nell’ipotesi in cui f (o, equivalentemente, la matrice quadrata A) `e diagonalizzabile. Infatti, per dimostrare che Pf(f ) = 0 `e sufficiente verificare che
Pf(f )(vi) = 0
per ogni vettore vi di una qualsiasi base B = {v1, . . . , vn} dello spazio vettoriale V . Se f `e diagonalizzabile possiamo prendere una base B fatta da autovettori di f , di autovalori λi, per i = 1, . . . , n (non necessariamente distinti). Inoltre in questo caso il polinomio caratteristico `e Pf(x) = (−1)n(x − λ1) · · · (x − λn). Quindi Pf(x) ha una fattorizzazione della forma
Pf(x) = Qi(x)(x − λi) per ogni i. Dunque
Pf(f )(vi) = Qi(f ) ◦ (f − λiid)(vi) = Qi(f )(f (vi) − λivi) = Qi(f )(0) = 0
Osservazione 2.3. L’Osservazione precedente dimostra anche che, se f `e diagonalizzzabile con autovalori NON tutti distinti, c’`e almeno un polinomio Q ∈ K[X] di grado pi`u piccolo di n (quindi di grado pi`u piccolo del polinomio caratteristico di f ) tale che Q(f ) = 0. `E il polinomio (x − λ1)..(x − λk) dove {λ1, . . . , λk} `e lo spettro di f .
3. Teorema di Cayley-Hamiton: dimostrazione
Preliminari : endomorfismi indotti da un sottopazio f -invariante. Sia f ∈ EndK(V ). Se W ⊂ V `e un sottospazio vettoriale f -invariante, abbiamo il K-endomorfismo di W .
(1) f|W : W → W w 7→ f (w)
2Essendo Ef anche un omorfismo di anelli, il nucleo `e un ideale di K[X]. Ne riparleremo dopo che avremo visto la forma normale di Jordan.
3Passando da un endomorfismo alla sua matrice rappresentativa rispetto ad un dato riferimento e viceversa si vede che le due versioni sono equivalenti
Abbiamo anche il K-endomorfismo dello spazio vettoriale quoaziente
(2) f : V
W → V
W v 7→ f (v)
Infatti la f `e ben definita: se cambiamo rappresentante, cio`e prendiamo u tale che v = u, si ha che anche f (u) = f (v) perch`e f (u) − f (v) = f (u − v) ∈ f (W ) = W (perch`e u − v ∈ W )4E chiaro che` l’applicazione f `e lineare.
Lemma 3.1. Pf = Pf|W · Pf
Proof. Prendiamo una base S = {w1, . . . , wk} di W e completiamola ad una base R = {w1, . . . wk, vk+1, . . . vn} di V . Dal fatto che W `e f -invarante, segue che, se i ≤ k,
f (vi) = ai1v1+ · · · + aikvk+ 0vk+1+ · · · + 0vn
Dunque
MR(f ) =A B
O D
con A e D quadrate di ordini rispettivamente k e n − k. `E chiaro che A = MS(f|W). Rimane da capire la matrice D.
Innanzitutto osserviamo che T := {vk+1, . . . , vn} `e una base dello spazio quoziente WV . Per di- mostrare questo `e sufficiente dimostrare che {vk+1, . . . , vn} `e un insieme di vettori linearmente indipendenti. Ma questo `e vero perch`e W ∩ hvk+1, . . . , vni = {0} (cose che sono state dette par- lando degli spazi quoziente).
Abbiamo che
(3) D = MT(f )
Per vederlo prendiamo un qualsiasi j ∈ {k + 1, . . . , n}. Consideriamo f (vj) = b1jv1+ . . . bkjvk+ dk+1,jvk+1+ · · · dn,jvn
dove (dk+1,j, . . . dn,j) `e una colonna di D (precidamente la j − k-esima colonna). Passando al quoziente abbiamo
f (vj) = 0 + dk+1,jvk+1+ · · · dn,jvn
Dunque D `e efftivamente la matrice raprresentativa di f rispetto al la base T di WV .
Dunque, usando il fatto che il determinante di una matrice traingolare a blocchi `e il prodotto dei determinanti dei blocchi, si ha che
PMR(f )= PA· PD cio`e
Pf = Pf|W · Pf
Concludiamo questa parte preliminare con questa osservazione: dato Q ∈ K[X] un qualsiasi polinomio, `e facile vedere (esercizio) che se W `e un sottospazio vettoriale di V f -invariante, allora W `e anche Q(f )-invariante. Dunque, come sopra, abbiamo gli endomorfismi
Q(f )|W : W → W
4Viceversa, se W `e un sottospazio vettoriale tale che la funzione f `e ben definita allora W `e f -invariante (esercizio).
e
Q(f ) : V
W → V
W Abbiamo che
(4) Q(f )|W = Q(f|W)
e
(5) Q(f ) = Q(f )
La (4) `e ovvia (esercizio). La (5) si dimostra facilmente. Infatti, per ogni k ∈ N, fk = fk(esercizio).
Dunque, se Q(x) =Pm
k=0akxk, Q(f ) =
m
X
k=0
akfk=
m
X
k=0
akfk=
m
X
k=0
akfk=
m
X
k=0
akfk= Q(f ).
Dimostrazione del Teorema 2.1. Primo passo: dimostriamo il Teorema sotto l’ipotesi che lo spettro di f sia contenuto in K.
La dimostrazione `e per induzione su dim V .
Se dim V = 1 il teorema `e ovvio (f `e necessariamente un’omotetia, cio`e della forma f = λ id per un λ ∈ K. Dunque Pf(x) = −(x − λ) e Pf(v) = −f (v) + λv = 0.)
Supponiamo ora il Teorema vero per ogni K-endomorfismo g : U → U tale che lo spettro di U `e contenuto in K e dim U < dim V e dimostriamo il Teorema per l’endomorfismo f : V → V . Poich`e lo spettro di V `e contenuto in K allora esiste almeno un sottospazio proprio di V f -invariante.
Infatti esiste almeno un autovalore e il corrispondente autospazio `e f -invariante. Chiamiamo W questo sottospazio f -invariante. Siamo quindi nella situazione di (1) e (2). Sappiamo che (vedi il Lemma precedente)
(6) Pf = Pf|WPf
Per ipotesi induttiva il Teorema vale per f (si noti che dall’ipotesi e (6) segue che anche gli spettri di f|W e f sono contenuti in K). Dunque
Pf(f ) = 0 e quindi, per la (5) Pf(f ) = 0 Dunque, dato un vettore v ∈ V .
(7) Pf(f )(v) = 0 cio`e, per definizione di Q(f ), Pf(f )(v) ∈ W per ogni v ∈ V . Denotiamo w ∈ W il vettore Pf(f )(v). In conclusione, per ogni v ∈ V ,
Pf(f )(v)(6)= Pf|W(f )Pf(f )(v) = Pf|W(f )(Pf(f )(v))(7)= Pf|W(f )(w)(4)= Pf|W(f|W)(w) = 0 dove l’ultima uguaglianza segue dal fatto che, ancora per ipotesi induttiva, Pf|W(f|W) = 0.
Secondo passo: dimostriamo il Teorema senza l’ipotesi che lo spettro di f `e contenuto nel campo K.
E equivalente dimostrare la versione matriciale. Sia dunque A ∈ M` n(K). Allora possiamo vedere A anche come matrice a coefficienti in una chiusura algebrica di K, cio`e A ∈ Mn(K). Lo spettro
di A `e in ogni caso contenuto in K dunque PA(A) = 0 per il passo precedente. Dunque Pf(f ) = 0.
Questo conclude la dimostrazione.