IL TEOREMA DI CAYLEY-HAMILTON. 1. Premesse

(1)

1. Premesse

Ricordo sempre che questi files contengono principalmente definizioni e teoremi. Per varie discussioni, motivazioni, applicazioni rimando a quanto detto in aula.

Sia V uno spazio vettoriale di dimensione finita su un campo K.

L’anello End_K(V). Denotiamo EndK(V ) l’insieme delle applicazioni (o endomorfismi, o oper- atori) K-lineari f : V → V . Sappiamo gi`a che ha una naturale struttura di spazio vettoriale. Ha anche un prodotto

V × V → V, (f, g) 7→ f g

dato dalla composizione di funzioni: (f g)(v) := f (g(v)). Questo rende End_K(V ) un anello (esercizio: verificare tutti gli assiomi). Anzi, `e una K-algebra (uno spazio vettoriale che ha anche una struttura compatibile di anello). In particolare, dato un operatore (non nullo) f : V → V , abbiamo le sue potenze: fⁿ, per ogni n ∈ N. NB: f⁰= id_V.

Anche l’insieme delle matrici quadrate Mn(K) di un dato ordine n è un’algebra (il prodotto è l’usuale prodotto righe per colonne di matrici). Come sappiamo dal corso Geometria 1 la scelta di una base B di V determina un isomorfismo di K-algebre (cioè un isomorfismo di K spazi vettoriali e di anelli allo stesso tempo)

Φ_B: End_K(V ) → M_n(K), f 7→ M_B(f ) dove n = dim V .

Polinomi di endomorfismi. Consideriamo ora un’altra K-algebra che conosciamo: l’algebra dei polinomi K[X]¹. Un elemento f ∈ End_K(V ) determina una funzione

E_f : K[X] → End_K(V ), Q 7→ Q(f )

dove Q(f ) `e l’endomorfismo ottenuto sostituendo f al posto dell’indeterminata X. Quindi, se Q = P_d

i=0aiXⁱ con ai ∈ K per ogni i = 0, . . . , d, allora Q(f ) : V → V `e, per definizione, l’endomorfismo Pd

i=0a_ifⁱ. Dunque Q(f )(v) = Pd

i=0a_ifⁱ(v). `E facile verificare (fatelo) che l’applicazione `e un omomorfismo di k-algebre:

(P + Q)(f ) = P (f ) + Q(f ) (λP )(f ) = λ(P (f )) (P Q)(f ) = P (f )Q(f )

per ogni P, Q ∈ K[X] e per ogni λ ∈ K. Possiamo considerare anche la versione matriciale.

Abbiamo dunque, data una matrice A ∈ M_n(K) una funzione EA: K[X] → MK(n), Q 7→ Q(A) dove Q(A) :=Pd

i=0aiAⁱ. Come prima, `e un omomorfismo di K-algebre.

1di solito `e chiamata l’anello dei polinomi. Comunque `e anche un K-spazio vettoriale (di dimensione infinita).

1

(2)

Osserviamo che, anche se il prodotto in EndK(V ) non `e commutativo, per ogni f ∈ EndK(V ), gli endomorfismi nell’immagine di E_f, cio`e gli endomorfismi della forma Q(f ), con Q ∈ K[X], com- mutano tra loro: P (f )Q(f ) = Q(f )P (f ) per ogni P, Q ∈ K[X] (lo potete verificare direttamente.

Oppure si pu`o usare il fatto che l’anello K[X] `e commutativo).

2. Il Teorema di Cayley-Hamilton: enunciato e osservazioni

Continuiamo con le notazioni precedenti. E chiaro che, per ogni f ∈ End` _K(V ) (o A ∈ MK(n)) l’omomorfismo Ef (o EA) non è iniettivo. Infatti Ef è, in particolare, un’applicazione lineare, e il suo dominio, k[X], è un K-spazio vettoriale di dimensione infinita, mentre il codominio, End_K(V ) ha dimensione finita (sappiamo che dim_kEnd_k(V ) = dim KM_K(n) = n²). Dunque il nucleo dell’applicazione lineare E_f è sempre non nullo, e, anzi, ha anche lui dimensione infinita.²

Denotiamo P_f ∈ K[X] il polinomio caratteristico di f . Abbiamo anche la versione matriciale:

sia A ∈ Mn,n(K) e denotiamo PA il polinomio caratteristico di A.

Teorema 2.1. [Cayley-Hamilton] P_f(f ) = 0. In altre parole P_f ∈ ker E_f. Versione matriciale: PA(A) = 0. In altre parole PA∈ ker E_A ³.

Osservazione 2.2. È facile vedere che il teorema è vero nell’ipotesi in cui f (o, equivalentemente, la matrice quadrata A) è diagonalizzabile. Infatti, per dimostrare che P_f(f ) = 0 è sufficiente verificare che

P_f(f )(vi) = 0

per ogni vettore vi di una qualsiasi base B = {v1, . . . , vn} dello spazio vettoriale V . Se f `e diagonalizzabile possiamo prendere una base B fatta da autovettori di f , di autovalori λ_i, per i = 1, . . . , n (non necessariamente distinti). Inoltre in questo caso il polinomio caratteristico `e P_f(x) = (−1)ⁿ(x − λ1) · · · (x − λn). Quindi P_f(x) ha una fattorizzazione della forma

P_f(x) = Q_i(x)(x − λ_i) per ogni i. Dunque

P_f(f )(v_i) = Q_i(f ) ◦ (f − λ_iid)(v_i) = Q_i(f )(f (v_i) − λ_iv_i) = Q_i(f )(0) = 0

Osservazione 2.3. L’Osservazione precedente dimostra anche che, se f è diagonalizzzabile con autovalori NON tutti distinti, c’è almeno un polinomio Q ∈ K[X] di grado più piccolo di n (quindi di grado più piccolo del polinomio caratteristico di f ) tale che Q(f ) = 0. È il polinomio (x − λ1)..(x − λk) dove {λ1, . . . , λk} è lo spettro di f .

3. Teorema di Cayley-Hamiton: dimostrazione

Preliminari : endomorfismi indotti da un sottopazio f -invariante. Sia f ∈ End_K(V ). Se W ⊂ V `e un sottospazio vettoriale f -invariante, abbiamo il K-endomorfismo di W .

(1) f_|W : W → W w 7→ f (w)

2Essendo Ef anche un omorfismo di anelli, il nucleo `e un ideale di K[X]. Ne riparleremo dopo che avremo visto la forma normale di Jordan.

3Passando da un endomorfismo alla sua matrice rappresentativa rispetto ad un dato riferimento e viceversa si vede che le due versioni sono equivalenti

(3)

Abbiamo anche il K-endomorfismo dello spazio vettoriale quoaziente

(2) f : V

W → V

W v 7→ f (v)

Infatti la f è ben definita: se cambiamo rappresentante, cioè prendiamo u tale che v = u, si ha che anche f (u) = f (v) perchè f (u) − f (v) = f (u − v) ∈ f (W ) = W (perchè u − v ∈ W )⁴E chiaro che` l’applicazione f è lineare.

Lemma 3.1. Pf = Pf_|W · P_f

Proof. Prendiamo una base S = {w₁, . . . , w_k} di W e completiamola ad una base R = {w₁, . . . w_k, v_k+1, . . . v_n} di V . Dal fatto che W `e f -invarante, segue che, se i ≤ k,

f (vi) = ai1v1+ · · · + aikvk+ 0vk+1+ · · · + 0vn

Dunque

M_R(f ) =A B

O D

con A e D quadrate di ordini rispettivamente k e n − k. `E chiaro che A = MS(f|W). Rimane da capire la matrice D.

Innanzitutto osserviamo che T := {vk+1, . . . , vn} è una base dello spazio quoziente _W^V . Per dimostrare questo è sufficiente dimostrare che {v_k+1, . . . , vn} è un insieme di vettori linearmente indipendenti. Ma questo è vero perchè W ∩ hv_k+1, . . . , v_ni = {0} (cose che sono state dette par- lando degli spazi quoziente).

Abbiamo che

(3) D = M_T(f )

Per vederlo prendiamo un qualsiasi j ∈ {k + 1, . . . , n}. Consideriamo f (v_j) = b_1jv₁+ . . . b_kjv_k+ d_k+1,jv_k+1+ · · · d_n,jv_n

dove (d_k+1,j, . . . d_n,j) `e una colonna di D (precidamente la j − k-esima colonna). Passando al quoziente abbiamo

f (v_j) = 0 + d_k+1,jv_k+1+ · · · d_n,jv_n

Dunque D `e efftivamente la matrice raprresentativa di f rispetto al la base T di _W^V .

Dunque, usando il fatto che il determinante di una matrice traingolare a blocchi `e il prodotto dei determinanti dei blocchi, si ha che

P_M_R_{(f )}= P_A· P_D cio`e

P_f = P_f_|W · P_f

Concludiamo questa parte preliminare con questa osservazione: dato Q ∈ K[X] un qualsiasi polinomio, è facile vedere (esercizio) che se W è un sottospazio vettoriale di V f -invariante, allora W è anche Q(f )-invariante. Dunque, come sopra, abbiamo gli endomorfismi

Q(f )_|W : W → W

4Viceversa, se W è un sottospazio vettoriale tale che la funzione f è ben definita allora W è f -invariante (esercizio).

(4)

e

Q(f ) : V

W → V

W Abbiamo che

(4) Q(f )_|W = Q(f_|W)

e

(5) Q(f ) = Q(f )

La (4) `e ovvia (esercizio). La (5) si dimostra facilmente. Infatti, per ogni k ∈ N, f^k = f^k(esercizio).

Dunque, se Q(x) =Pm

k=0a_kx^k, Q(f ) =

m

X

k=0

a_kf^k=

m

X

k=0

a_kf^k=

m

X

k=0

a_kf^k=

m

X

k=0

a_kf^k= Q(f ).

Dimostrazione del Teorema 2.1. Primo passo: dimostriamo il Teorema sotto l’ipotesi che lo spettro di f sia contenuto in K.

La dimostrazione `e per induzione su dim V .

Se dim V = 1 il teorema è ovvio (f è necessariamente un’omotetia, cioè della forma f = λ id per un λ ∈ K. Dunque P_f(x) = −(x − λ) e P_f(v) = −f (v) + λv = 0.)

Supponiamo ora il Teorema vero per ogni K-endomorfismo g : U → U tale che lo spettro di U è contenuto in K e dim U < dim V e dimostriamo il Teorema per l’endomorfismo f : V → V . Poichè lo spettro di V è contenuto in K allora esiste almeno un sottospazio proprio di V f -invariante.

Infatti esiste almeno un autovalore e il corrispondente autospazio `e f -invariante. Chiamiamo W questo sottospazio f -invariante. Siamo quindi nella situazione di (1) e (2). Sappiamo che (vedi il Lemma precedente)

(6) P_f = P_f_|WP_f

Per ipotesi induttiva il Teorema vale per f (si noti che dall’ipotesi e (6) segue che anche gli spettri di f_|W e f sono contenuti in K). Dunque

P_f(f ) = 0 e quindi, per la (5) P_f(f ) = 0 Dunque, dato un vettore v ∈ V .

(7) P_f(f )(v) = 0 cio`e, per definizione di Q(f ), P_f(f )(v) ∈ W per ogni v ∈ V . Denotiamo w ∈ W il vettore P_f(f )(v). In conclusione, per ogni v ∈ V ,

Secondo passo: dimostriamo il Teorema senza l’ipotesi che lo spettro di f `e contenuto nel campo K.

E equivalente dimostrare la versione matriciale. Sia dunque A ∈ M` _n(K). Allora possiamo vedere A anche come matrice a coefficienti in una chiusura algebrica di K, cio`e A ∈ M_n(K). Lo spettro

(5)

di A `e in ogni caso contenuto in K dunque PA(A) = 0 per il passo precedente. Dunque Pf(f ) = 0.

Questo conclude la dimostrazione.