• Non ci sono risultati.

IL TEOREMA DI CAYLEY-HAMILTON. 1. Premesse

N/A
N/A
Protected

Academic year: 2022

Condividi "IL TEOREMA DI CAYLEY-HAMILTON. 1. Premesse"

Copied!
5
0
0

Testo completo

(1)

1. Premesse

Ricordo sempre che questi files contengono principalmente definizioni e teoremi. Per varie discussioni, motivazioni, applicazioni rimando a quanto detto in aula.

Sia V uno spazio vettoriale di dimensione finita su un campo K.

L’anello EndK(V). Denotiamo EndK(V ) l’insieme delle applicazioni (o endomorfismi, o oper- atori) K-lineari f : V → V . Sappiamo gi`a che ha una naturale struttura di spazio vettoriale. Ha anche un prodotto

V × V → V, (f, g) 7→ f g

dato dalla composizione di funzioni: (f g)(v) := f (g(v)). Questo rende EndK(V ) un anello (eser- cizio: verificare tutti gli assiomi). Anzi, `e una K-algebra (uno spazio vettoriale che ha anche una struttura compatibile di anello). In particolare, dato un operatore (non nullo) f : V → V , abbiamo le sue potenze: fn, per ogni n ∈ N. NB: f0= idV.

Anche l’insieme delle matrici quadrate Mn(K) di un dato ordine n `e un’algebra (il prodotto `e l’usuale prodotto righe per colonne di matrici). Come sappiamo dal corso Geometria 1 la scelta di una base B di V determina un isomorfismo di K-algebre (cio`e un isomorfismo di K spazi vettoriali e di anelli allo stesso tempo)

ΦB: EndK(V ) → Mn(K), f 7→ MB(f ) dove n = dim V .

Polinomi di endomorfismi. Consideriamo ora un’altra K-algebra che conosciamo: l’algebra dei polinomi K[X]1. Un elemento f ∈ EndK(V ) determina una funzione

Ef : K[X] → EndK(V ), Q 7→ Q(f )

dove Q(f ) `e l’endomorfismo ottenuto sostituendo f al posto dell’indeterminata X. Quindi, se Q = Pd

i=0aiXi con ai ∈ K per ogni i = 0, . . . , d, allora Q(f ) : V → V `e, per definizione, l’endomorfismo Pd

i=0aifi. Dunque Q(f )(v) = Pd

i=0aifi(v). `E facile verificare (fatelo) che l’applicazione `e un omomorfismo di k-algebre:

(P + Q)(f ) = P (f ) + Q(f ) (λP )(f ) = λ(P (f )) (P Q)(f ) = P (f )Q(f )

per ogni P, Q ∈ K[X] e per ogni λ ∈ K. Possiamo considerare anche la versione matriciale.

Abbiamo dunque, data una matrice A ∈ Mn(K) una funzione EA: K[X] → MK(n), Q 7→ Q(A) dove Q(A) :=Pd

i=0aiAi. Come prima, `e un omomorfismo di K-algebre.

1di solito `e chiamata l’anello dei polinomi. Comunque `e anche un K-spazio vettoriale (di dimensione infinita).

1

(2)

Osserviamo che, anche se il prodotto in EndK(V ) non `e commutativo, per ogni f ∈ EndK(V ), gli endomorfismi nell’immagine di Ef, cio`e gli endomorfismi della forma Q(f ), con Q ∈ K[X], com- mutano tra loro: P (f )Q(f ) = Q(f )P (f ) per ogni P, Q ∈ K[X] (lo potete verificare direttamente.

Oppure si pu`o usare il fatto che l’anello K[X] `e commutativo).

2. Il Teorema di Cayley-Hamilton: enunciato e osservazioni

Continuiamo con le notazioni precedenti. E chiaro che, per ogni f ∈ End` K(V ) (o A ∈ MK(n)) l’omomorfismo Ef (o EA) non `e iniettivo. Infatti Ef `e, in particolare, un’applicazione lineare, e il suo dominio, k[X], `e un K-spazio vettoriale di dimensione infinita, mentre il codominio, EndK(V ) ha dimensione finita (sappiamo che dimkEndk(V ) = dim KMK(n) = n2). Dunque il nucleo dell’applicazione lineare Ef `e sempre non nullo, e, anzi, ha anche lui dimensione infinita.2

Denotiamo Pf ∈ K[X] il polinomio caratteristico di f . Abbiamo anche la versione matriciale:

sia A ∈ Mn,n(K) e denotiamo PA il polinomio caratteristico di A.

Teorema 2.1. [Cayley-Hamilton] Pf(f ) = 0. In altre parole Pf ∈ ker Ef. Versione matriciale: PA(A) = 0. In altre parole PA∈ ker EA 3.

Osservazione 2.2. `E facile vedere che il teorema `e vero nell’ipotesi in cui f (o, equivalentemente, la matrice quadrata A) `e diagonalizzabile. Infatti, per dimostrare che Pf(f ) = 0 `e sufficiente verificare che

Pf(f )(vi) = 0

per ogni vettore vi di una qualsiasi base B = {v1, . . . , vn} dello spazio vettoriale V . Se f `e diagonalizzabile possiamo prendere una base B fatta da autovettori di f , di autovalori λi, per i = 1, . . . , n (non necessariamente distinti). Inoltre in questo caso il polinomio caratteristico `e Pf(x) = (−1)n(x − λ1) · · · (x − λn). Quindi Pf(x) ha una fattorizzazione della forma

Pf(x) = Qi(x)(x − λi) per ogni i. Dunque

Pf(f )(vi) = Qi(f ) ◦ (f − λiid)(vi) = Qi(f )(f (vi) − λivi) = Qi(f )(0) = 0

Osservazione 2.3. L’Osservazione precedente dimostra anche che, se f `e diagonalizzzabile con autovalori NON tutti distinti, c’`e almeno un polinomio Q ∈ K[X] di grado pi`u piccolo di n (quindi di grado pi`u piccolo del polinomio caratteristico di f ) tale che Q(f ) = 0. `E il polinomio (x − λ1)..(x − λk) dove {λ1, . . . , λk} `e lo spettro di f .

3. Teorema di Cayley-Hamiton: dimostrazione

Preliminari : endomorfismi indotti da un sottopazio f -invariante. Sia f ∈ EndK(V ). Se W ⊂ V `e un sottospazio vettoriale f -invariante, abbiamo il K-endomorfismo di W .

(1) f|W : W → W w 7→ f (w)

2Essendo Ef anche un omorfismo di anelli, il nucleo `e un ideale di K[X]. Ne riparleremo dopo che avremo visto la forma normale di Jordan.

3Passando da un endomorfismo alla sua matrice rappresentativa rispetto ad un dato riferimento e viceversa si vede che le due versioni sono equivalenti

(3)

Abbiamo anche il K-endomorfismo dello spazio vettoriale quoaziente

(2) f : V

W → V

W v 7→ f (v)

Infatti la f `e ben definita: se cambiamo rappresentante, cio`e prendiamo u tale che v = u, si ha che anche f (u) = f (v) perch`e f (u) − f (v) = f (u − v) ∈ f (W ) = W (perch`e u − v ∈ W )4E chiaro che` l’applicazione f `e lineare.

Lemma 3.1. Pf = Pf|W · Pf

Proof. Prendiamo una base S = {w1, . . . , wk} di W e completiamola ad una base R = {w1, . . . wk, vk+1, . . . vn} di V . Dal fatto che W `e f -invarante, segue che, se i ≤ k,

f (vi) = ai1v1+ · · · + aikvk+ 0vk+1+ · · · + 0vn

Dunque

MR(f ) =A B

O D



con A e D quadrate di ordini rispettivamente k e n − k. `E chiaro che A = MS(f|W). Rimane da capire la matrice D.

Innanzitutto osserviamo che T := {vk+1, . . . , vn} `e una base dello spazio quoziente WV . Per di- mostrare questo `e sufficiente dimostrare che {vk+1, . . . , vn} `e un insieme di vettori linearmente indipendenti. Ma questo `e vero perch`e W ∩ hvk+1, . . . , vni = {0} (cose che sono state dette par- lando degli spazi quoziente).

Abbiamo che

(3) D = MT(f )

Per vederlo prendiamo un qualsiasi j ∈ {k + 1, . . . , n}. Consideriamo f (vj) = b1jv1+ . . . bkjvk+ dk+1,jvk+1+ · · · dn,jvn

dove (dk+1,j, . . . dn,j) `e una colonna di D (precidamente la j − k-esima colonna). Passando al quoziente abbiamo

f (vj) = 0 + dk+1,jvk+1+ · · · dn,jvn

Dunque D `e efftivamente la matrice raprresentativa di f rispetto al la base T di WV .

Dunque, usando il fatto che il determinante di una matrice traingolare a blocchi `e il prodotto dei determinanti dei blocchi, si ha che

PMR(f )= PA· PD cio`e

Pf = Pf|W · Pf

 Concludiamo questa parte preliminare con questa osservazione: dato Q ∈ K[X] un qualsiasi polinomio, `e facile vedere (esercizio) che se W `e un sottospazio vettoriale di V f -invariante, allora W `e anche Q(f )-invariante. Dunque, come sopra, abbiamo gli endomorfismi

Q(f )|W : W → W

4Viceversa, se W `e un sottospazio vettoriale tale che la funzione f `e ben definita allora W `e f -invariante (esercizio).

(4)

e

Q(f ) : V

W → V

W Abbiamo che

(4) Q(f )|W = Q(f|W)

e

(5) Q(f ) = Q(f )

La (4) `e ovvia (esercizio). La (5) si dimostra facilmente. Infatti, per ogni k ∈ N, fk = fk(esercizio).

Dunque, se Q(x) =Pm

k=0akxk, Q(f ) =

m

X

k=0

akfk=

m

X

k=0

akfk=

m

X

k=0

akfk=

m

X

k=0

akfk= Q(f ).

Dimostrazione del Teorema 2.1. Primo passo: dimostriamo il Teorema sotto l’ipotesi che lo spettro di f sia contenuto in K.

La dimostrazione `e per induzione su dim V .

Se dim V = 1 il teorema `e ovvio (f `e necessariamente un’omotetia, cio`e della forma f = λ id per un λ ∈ K. Dunque Pf(x) = −(x − λ) e Pf(v) = −f (v) + λv = 0.)

Supponiamo ora il Teorema vero per ogni K-endomorfismo g : U → U tale che lo spettro di U `e contenuto in K e dim U < dim V e dimostriamo il Teorema per l’endomorfismo f : V → V . Poich`e lo spettro di V `e contenuto in K allora esiste almeno un sottospazio proprio di V f -invariante.

Infatti esiste almeno un autovalore e il corrispondente autospazio `e f -invariante. Chiamiamo W questo sottospazio f -invariante. Siamo quindi nella situazione di (1) e (2). Sappiamo che (vedi il Lemma precedente)

(6) Pf = Pf|WPf

Per ipotesi induttiva il Teorema vale per f (si noti che dall’ipotesi e (6) segue che anche gli spettri di f|W e f sono contenuti in K). Dunque

Pf(f ) = 0 e quindi, per la (5) Pf(f ) = 0 Dunque, dato un vettore v ∈ V .

(7) Pf(f )(v) = 0 cio`e, per definizione di Q(f ), Pf(f )(v) ∈ W per ogni v ∈ V . Denotiamo w ∈ W il vettore Pf(f )(v). In conclusione, per ogni v ∈ V ,

Pf(f )(v)(6)= Pf|W(f )Pf(f )(v) = Pf|W(f )(Pf(f )(v))(7)= Pf|W(f )(w)(4)= Pf|W(f|W)(w) = 0 dove l’ultima uguaglianza segue dal fatto che, ancora per ipotesi induttiva, Pf|W(f|W) = 0.

Secondo passo: dimostriamo il Teorema senza l’ipotesi che lo spettro di f `e contenuto nel campo K.

E equivalente dimostrare la versione matriciale. Sia dunque A ∈ M` n(K). Allora possiamo vedere A anche come matrice a coefficienti in una chiusura algebrica di K, cio`e A ∈ Mn(K). Lo spettro

(5)

di A `e in ogni caso contenuto in K dunque PA(A) = 0 per il passo precedente. Dunque Pf(f ) = 0.

Questo conclude la dimostrazione.

Riferimenti

Documenti correlati

Nel caso in cui invece M sia invertibile, si calcoli la matrice inversa M

il che corrisponde a risolvere il sistema lineare che ha per matrice dei coefficienti la matrice A 0 considerata in precedenza e per colonna dei termini noti il vettore colonna (3,

4.Se si moltiplicano gli elementi di una riga (o colonna )per uno scalare anche il determinante risulta moltiplicato per lo

L’espressione esplicita ci dice che, una volta identificati i vettori con le rispettive coordinate, un’applicazione lineare f trasforma un vet- tore numerico (x 1 ,.. I

[r]

Telefoni, tablet, smartwatch, etc.... devono

a se si intersecano allora sono contenute in un piano affine; b se sono contenute in un piano allora si intersecano; c se sono sghembe generano R 3 ; d se le giaciture sono

Si dimostri che se la funzione f ha un flesso nella radice ¯ x, allora il metodo di Newton converge (localmente) con ordine almeno