Francesca Mazzia Dipartimento Interuniversitario di Matematica Universit`a di Bari

(1)

Francesca Mazzia

Dipartimento Interuniversitario di Matematica Universit` a di Bari

3. Algoritmi per la soluzione di sistemi lineari.

1

(2)

Sistemi triangolari inferiori

Sia L triangolare inferiore. La matrice ` e non singolare se gli elementi principali l _i,i 6= 0, per i = 1, · · · , n.

Il sistema Lx = b pu` o scriversi:

l _1,1 x ₁ = b ₁

l _2,1 x ₁ + l _2,2 x ₂ = b ₂ l _3,1 x ₁ + l _3,2 x ₂ + l _3,3 x ₃ = b ₃ . . .

. . .

l _n,1 x ₁ + l _n,2 x ₂ − . . . + l ^n,n x _n = b _n da cui si ottiene:

x ₁ = b ₁

l _1,1 , x ₂ = b ₂ − l 2,1 x ₁ l _2,2

x ₃ = b ₃ − l 3,1 x ₁ − l 3,2 x ₂

l

(3)

in generale

x _i =

b _i −

i −1 X j=1

l _i,j x _j

l _i,i i = 1, 2, . . . , n

Essendo l _i,i 6= 0 queste formule determinano in modo univoco x _i .

La procedura descritta si chiama algoritmo di sostituzione in avanti, in Matlab ` e descritta dal seguente algoritmo:

function b = soll(L,b) n = length(b);

b(1) = b(1)/L(1,1);

for i=2:n

b(i) = (b(i) - L(i,1:i-1)*b(1:i-1))/L(i,i);

end

3

(4)

L’istruzione matlab L(i,1:i-1)*b(1:i-1) esegue il prodotto riga per colonne fra il vettore L(i,1:i-1) e il vettore b(1:i-1).

L(i,1:i-1) elementi

( L(i,1), L(i,2), · · ·, L(i,i-1)) b(1:i-1) elementi

( b(1), b(2), · · ·, b(i-1)) Costo computazionale:

moltiplicazioni :

L(i,1:i-1)*b(1:i-1)

richiede i-1 moltiplicazioni

viene eseguita per i=2,n sommando

n X

2

(i − 1) =

n −1 X

1

i = n(n − 1)

2

(5)

Sistemi triangolari superiori

u _1,1 x ₁ + u _1,2 x ₂ + . . . + u _1,n x _n = b ₁ u _2,2 x ₂ + . . . + u _2,n x _n = b ₂

. . . . . .

u _n,n x _n = b _n

La matrice ` e non singolare se u _i,i 6= 0.

La soluzione di questo sistema ` e:

x _n = b _n

u _n,n , x _n ₋₁ = b _n ₋₁ − u n −1,n x _n u _n _−1,n−1

x _n ₋₂ = b _n ₋₂ − u n −2,n−1 x _n ₋₁ − u n −2,n x _n u _n _−2,n−2

5

(6)

In generale:

x _i = 1 u _i,i



 b _i −

n X j=i+1

u _i,j x _j



 i = n, n −1, . . . , 1

La procedura descritta si chiama algoritmo di sostituzione all’indietro, in Matlab ` e descritta dal seguente algoritmo:

function b = solu(U,b) n = length(b);

b(n) = b(n)/U(n,n);

for i=n-1:-1:1

b(i) = (b(i) - U(i,i+1:n)*b(i+1:n))/U(i,i);

end

(7)

Matrici di permutazione

P _r,s matrici di permutazione elementari si ottengono dalla matrice I di dimensione n × n scambiando la r.ma riga con la s.ma.

r s

P _r,s =







1 0

0 . . . . . . . 1

0 0 . . . 0 1

0 1 0

... . . . ...

0 1 0

1 0 . . . 0 0

1 . . . . . . 0

0 1







r

s

P _r,s A scambia le righe r ed s AP _r,s scambia le colonne r ed s

7

(8)

Propriet` a delle matrici di permutazione Siano P, P ₁ , P ₂ matrici di permutazione n × n e A una matrice n × n allora:

1. PA ` e come A con le righe permutate.

AP ` e come A con le colonne permutate

2. P ⁻¹ = P ^T

3. det(P ) = ±1

4. P ₁ P ₂ ` e un matrice di permutazione.

(9)

Algoritmo di eliminazione di Gauss per risolvere Ax = b:

1. Fattorizzare A in A = P LU con P = matrice di permutazione

L = matrice triangolare inferiore con elementi diagonali uguali a 1

U = matrice triangolare superiore non singolare

2. Risolvere P z = b, permutando le righe di b: z = LU x = P ⁻¹ b

3. risolvereLy = P ⁻¹ b,y = U x con l’algoritmo di sostituzione in avanti

4. risolvere U x = L ⁻¹ (P ⁻¹ b) con l’algoritmo

di sostituzione all’indietro : x = U ⁻¹ (L ⁻¹ (P ⁻¹ b))

9

(10)

La sottomatrice principale di A di ordine j ` e A(1 : j, 1 : j).

Teorema. Le seguenti definizioni sono equi- valenti:

1. Esiste un’unica matrice triangolare L con elementi principali uguali ad 1 a un’u- nica matrice trangolare superiore U non singolare tale che A = LU .

2. Tutte le sottomatrici principali di A sono

non singolari

(11)

Dimostrazione: (1) implica (2) Partizioniamo le matrici A, L e U

A = LU ≡ A _1,1 A _1,2

A _2,1 A _2,2

!

= L _1,1 0 L _2,1 L _2,2

! U _1,1 U _1,2 0 U _2,2

!

= L _1,1 U _1,1 L _1,1 U _1,2

L _2,1 U _1,1 L _2,1 U _1,2 + L _2,2 U _2,2

!

A _1,1 sottomatrice principale di dimensione j.

det(A _1,1 ) = det(L _1,1 U _1,1 ) = det(L _1,1 )det(U _1,1 ) = 1 · ^Q ^j _k=1 (u _k,k ) 6= 0

proviamo che (2) implica (1) per induzione su n.

Per matrice di ordine 1 ` e vero: a = 1 · a.

11

(12)

Supponiamo sia vero per n − 1 e dimostria- molo per n.

Sia ˜ A di ordine n, allora dobbiamo mostrare che esistono e sono unici :

L e U triangolari di ordine n − 1,

s e t due vettori di lunghezza n −1 e η scalare tali che:

A = ˜ A b c ^T δ

!

= L 0

s ^T 1

! U t 0 η

!

= LU Lt

s ^T U s ^T t + η

!

Per induzione esistono L e U tali che A = LU .

Siano t = L ⁻¹ b, s ^T = c ^T U ⁻¹ e η = δ − s ^T t,

essi sono unici. Gli elementi diagonali di U

sono diversi da zero per induzione e η 6= 0

(13)

Algoritmo di eliminazione di Gauss Consideriamo il sistema lineare:

a _1,1 x ₁ + a _1,2 x ₂ + a _1,3 x ₃ + a _1,4 x ₄ = b ₁ a _2,1 x ₁ + a _2,2 x ₂ + a _2,3 x ₃ + a _2,4 x ₄ = b ₂ a _3,1 x ₁ + a _3,2 x ₂ + a _3,3 x ₃ + a _3,4 x ₄ = b ₂ a _4,1 x ₁ + a _4,2 x ₂ + a _4,3 x ₃ + a _4,4 x ₄ = b ₂

Poniamo m _i,1 = a _i,1 /a _1,1 , i = 2, 3, 4

e sottraiamo m _i,1 moltiplicato per la prima equazione dalla equazione iesima.

a _1,1 x ₁ + a _1,2 x ₂ + a _1,3 x ₃ + a _1,4 x ₄ = b ₁ a ⁽¹⁾ _2,2 x ₂ + a ⁽¹⁾ _2,3 x ₃ + a ⁽¹⁾ _2,4 x ₄ = b ⁽¹⁾ ₂ a ⁽¹⁾ _3,2 x ₂ + a ⁽¹⁾ _3,3 x ₃ + a ⁽¹⁾ _3,4 x ₄ = b ⁽¹⁾ ₃ a ⁽¹⁾ _4,2 x ₂ + a ⁽¹⁾ _4,3 x ₃ + a ⁽¹⁾ _4,4 x ₄ = b ⁽¹⁾ ₄

con

a ⁽¹⁾ _i,j = a _i,j − m i,1 a _1,j , b ⁽¹⁾ _i = b _i − m i,1 b ₁

12

(14)

La variabile x ₁ ` e stata eliminata dalle ultime tre equazioni.

Poniamo m _i,2 = a ⁽¹⁾ _i,2 /a ⁽¹⁾ _2,2 , i = 3, 4 e sottraiamo m _i,2 moltiplicato per la seconda equazione dalla equazione iesima.

a _1,1 x ₁ + a _1,2 x ₂ + a _1,3 x ₃ + a _1,4 x ₄ = b ₁ a ⁽¹⁾ _2,2 x ₂ + a ⁽¹⁾ _2,3 x ₃ + a ⁽¹⁾ _2,4 x ₄ = b ⁽¹⁾ ₂

a ⁽²⁾ _3,3 x ₃ + a ⁽²⁾ _3,4 x ₄ = b ⁽²⁾ ₃ a ⁽²⁾ _4,3 x ₃ + a ⁽²⁾ _4,4 x ₄ = b ⁽²⁾ ₄ con

a ⁽²⁾ _i,j = a ⁽¹⁾ _i,j −m i,2 a ⁽¹⁾ _2,j , b ⁽²⁾ _i = b ⁽¹⁾ _i −m i,2 b ⁽¹⁾ ₂

La variabile x ₂ ` e stata eliminata dalle ultime

due equazioni.

(15)

Infine poniamo m _i,3 = a ⁽²⁾ _i,3 /a ⁽²⁾ _3,3 , i = 4 e sottraiamo m _i,3 moltiplicato per la terza equazione dalla equazione iesima.

La variabile x ₃ viene eliminata dall’ ultima equazione.

Otteniamo il sistema triangolare superiore:

a _1,1 x ₁ + a _1,2 x ₂ + a _1,3 x ₃ + a _1,4 x ₄ = b ₁ a ⁽¹⁾ _2,2 x ₂ + a ⁽¹⁾ _2,3 x ₃ + a ⁽¹⁾ _2,4 x ₄ = b ⁽¹⁾ ₂

a ⁽²⁾ _3,3 x ₃ + a ⁽²⁾ _3,4 x ₄ = b ⁽²⁾ ₃ a ⁽³⁾ _4,4 x ₄ = b ⁽³⁾ ₄ con

a ⁽³⁾ _i,j = a ⁽²⁾ _i,j −m i,3 a ⁽²⁾ _3,j , b ⁽²⁾ _i = b ⁽³⁾ _i −m i,2 b ⁽³⁾ ₂

Questo algoritmo pu` o essere esteso ad un sistema di qualsiasi ordine.

14

(16)

Sia A ₁ = A e

M ₁ =







1 0 0 0

−m 2,1 1 0 0

−m 3,1 0 1 0

−m 4,1 0 0 1







allora

A ₂ = M ₁ A ₁ =

=







1 0 0 0

−m 2,1 1 0 0

−m 3,1 0 1 0

−m 4,1 0 0 1













a _1,1 a _1,2 a _1,3 a _1,4 a _2,1 a _2,2 a _2,3 a _2,4 a _3,1 a _3,2 a _3,3 a _3,4 a _4,1 a _4,2 a _4,3 a _4,4







=







a _1,1 a _1,2 a _1,3 a _1,4 0 a ⁽¹⁾ _2,2 a ⁽¹⁾ _2,3 a ⁽¹⁾ _2,4 0 a ⁽¹⁾ _3,2 a ⁽¹⁾ _3,3 a ⁽¹⁾ _3,4 0 a ⁽¹⁾ _4,2 a ⁽¹⁾ _4,3 a ⁽¹⁾ _4,4







(17)

M ₂ =







1 0 0 0

0 1 0 0

0 −m 3,2 1 0 0 −m 4,2 0 1







A ₃ = M ₂ A ₂ =

=







1 0 0 0

0 1 0 0

0 −m 3,2 1 0 0 −m 4,2 0 1













a _1,1 a _1,2 a _1,3 a _1,4 0 a ⁽¹⁾ _2,2 a ⁽¹⁾ _2,3 a ⁽¹⁾ _2,4 0 a ⁽¹⁾ _3,2 a ⁽¹⁾ _3,3 a ⁽¹⁾ _3,4 0 a ⁽¹⁾ _4,2 a ⁽¹⁾ _4,3 a ⁽¹⁾ _4,4







=







a _1,1 a _1,2 a _1,3 a _1,4 0 a ⁽¹⁾ _2,2 a ⁽¹⁾ _2,3 a ⁽¹⁾ _2,4 0 0 a ⁽²⁾ _3,3 a ⁽²⁾ _3,4 0 0 a ⁽²⁾ _4,3 a ⁽²⁾ _4,4







(18)

Infine

M ₃ =







1 0 0 0

0 1 0 0

0 0 1 0

0 0 −m 4,3 1







U = M ₃ A ₃ =

=







1 0 0 0

0 1 0 0

0 0 1 0

0 0 −m 4,3 1













a _1,1 a _1,2 a _1,3 a _1,4 0 a ⁽¹⁾ _2,2 a ⁽¹⁾ _2,3 a ⁽¹⁾ _2,4 0 0 a ⁽²⁾ _3,3 a ⁽²⁾ _3,4 0 0 a ⁽²⁾ _4,3 a ⁽²⁾ _4,4







=







a _1,1 a _1,2 a _1,3 a _1,4 0 a ⁽¹⁾ _2,2 a ⁽¹⁾ _2,3 a ⁽¹⁾ _2,4 0 0 a ⁽²⁾ _3,3 a ⁽²⁾ _3,4 0 0 0 a ⁽³⁾ _4,4







(19)

U = M ₃ M ₂ M ₁ A triangolare superiore.

Poniamo

L = M ₁ ⁻¹ M ₂ ⁻¹ M ₃ ⁻¹ allora

A = LU

Possiamo scrivere la matrice

M ₁ = I −m 1 e ^T ₁ con m ₁ = (0, m _2,1 , m _3,1 , m _4,1 ) ^T Si dimostra che

M ₁ ⁻¹ = I + m ₁ e ^T ₁

infatti, essendo (e ^T ₁ m ₁ ) = 0

M ₁ ⁻¹ M ₁ = (I + m ₁ e ^T ₁ )(I − m 1 e ^T ₁ ) =

= I + m ₁ e ^T ₁ − m 1 e ^T ₁ + m ₁ (e ^T ₁ m ₁ )e ^T ₁ = I.

17

(20)

M ₂ = I − m 2 e ^T ₂ con m ₂ = (0, 0, m _3,2 , m _4,2 ) ^T e M ₂ ⁻¹ = I + m ₂ e ^T ₂

M ₃ = I − m 3 e ^T ₃ con m ₃ = (0, 0, 0, m _4,3 ) ^T M ₃ ⁻¹ = I + m ₃ e ^T ₃

Inoltre, essendo e ^T _i m _j = 0, i < j,

L = (I + m ₁ e ^T ₁ )(I + m ₂ e ^T ₂ )(I + m ₃ e ^T ₃ ) =

= I + m ₁ e ^T ₁ + m ₂ e ^T ₂ + m ₃ e ^T ₃ quindi

L =







1 0 0 0

m _2,1 1 0 0

m _3,1 m _3,2 1 0

m m m 1







(21)

Problemi dell’algoritmo di fattorizzazione LU senza permutazioni:

Non pu` o essere eseguita su matrici come:

P =







0 1 0 0 0 1 1 0 0







A =







1 2 5

−1 −2 −7

1 1 3







18

(22)

Presenta problemi di instabilit` a numerica:

( 10 ⁻¹⁷ x ₁ + x ₂ = 1 x ₁ + x ₂ = 2

Il problema ` e ben posto, ed ha come soluzione esatta x ' (1, 1) ^T . Applicando il metodo di Gauss ed operando in virgola mobile in base 2 in doppia precisione, si ottengono i fattori L ed U seguenti:

L = 1 0

10 ¹⁷ 1

!

, U = 10 ⁻¹⁷ 1

0 −10 ¹⁷

!

il prodotto LU non ` e A bens` ı la matrice seguente

A = ˜ 10 ⁻¹⁷ 1

1 0

!

confrontando A con A si vede che l’ ele- ˜

mento a ₂₂ di A ` e stato cambiato, pertan-

to la soluzione numerica che ` e ˜ x = (0, 1) ^T ` e

(23)

Teorema. Se A ` e non singolare, allora esistono due matrici di permutazione P ₁ e P ₂ , una matrice triangolare inferiore L con elementi diagonali uguali a uno e una matrice triangolare superiore U tali che P ₁ AP ₂ = LU . Solo una fra P ₁ e P ₂ ` e necessaria.

P ₁ A scambia le righe di A, AP ₂ scambia le colonne,

P ₁ AP ₂ scambia righe e colonne di A.

20

(24)

Dimostrazione per induzione.

Per matrici di ordine 1 basta scegliere:

P ₁ = P ₂ = L = 1 e U = A.

Supponiamo sia vero per matrici di ordine n − 1 e sia A di ordine n.

Essendo A non singolare, allora ha sicura- mente un elemento diverso da zero.

Scegliamo P ₁ ⁰ e P ₂ ⁰ matrici di permutazione in modo da rendere l’elemento in posizione (1,1) di P ₁ ⁰ AP ₂ ⁰ diverso da zero.

Scriviamo la fattorizzazione e risolviamo per le componenti incognite.

P ⁰ AP ⁰ = a _1,1 A _1,2 ^!

(25)

1 0 L _2,1 I

! u _1,1 U _1,2 0 A ˜ _2,2

!

a _1,1 A _1,2 A _2,1 A _2,2

!

= u _1,1 U _1,2

L _2,1 u _1,1 L _2,1 U _1,2 + ˜ A _2,2

!

A _2,2 e ˜ A _2,2 di ordine n −1, L 2,1 e U _1,2 ∈ IR ⁿ ⁻¹ Risolvendo per le componenti di questa fattorizzazione a blocchi otteniamo:

u _1,1 = a _1,1 6= 0 U _1,2 = A _1,2

L _2,1 = A _2,1 /a _1,1

A ˜ _2,2 = A _2,2 − L 2,1 U _1,2

det(P ₁ ⁰ AP ₂ ⁰ ) = ±det(A) 6= 0 det(P ₁ ⁰ AP ₂ ⁰ ) = 1 · u 1,1 det( ˜ A _2,2 )

22

(26)

det( ˜ A _2,2 ) 6= 0

quindi per induzione esistono due matrici di permutazione ˜ P ₁ e ˜ P ₂ tali che ˜ P ₁ A ˜ _2,2 P ˜ ₂ = ˜ L ˜ U . Sostituendo si ha:

P ₁ ⁰ AP ₂ ⁰ = 1 0 L _2,1 I

! u _1,1 U _1,2 0 P ˜ ₁ ^T L ˜ ˜ U ˜ P ₂ ^T

!

= 1 0

L _2,1 I

! 1 0 0 P ˜ ₁ ^T L ˜

! u _1,1 U _1,2 0 U ˜ ˜ P ₂ ^T

!

= 1 0

L _2,1 P ˜ ₁ ^T L ˜

! u _1,1 U _1,2 0 U ˜

! 1 0 0 P ˜ ₂ ^T

!

= 1 0

0 P ˜ ₁ ^T

! 1 0 P ˜ ₁ L _2,1 L ˜

! u _1,1 U _1,2 0 U ˜

! 1 0 0 P ˜ ₂ ^T

!

quindi

P ₁ AP ₂ = 1 0 0 P ˜ ₁

!

P ₁ ⁰ AP ₂ ⁰ 1 0 0 P ˜ ₂

!

= 1 0 ^! u _1,1 U _1,2 ^!

(27)

Possiamo scegliere P ₂ ⁰ = I e P ₁ ⁰ in modo tale che a _1,1 sia il pi` u garnde elemento in valore assoluto nella colonna, il che implica che L _2,1 = A _2,1 /a _1,1 ha elementi limitati da 1 in valore assoluto. In generale al passo i dell’e- liminazione di Gauss, ordiniamo le righe da i a n in modo da portare l’elemento pi` u grande in valore assoluto in posizione i, i. Questa tecnica si chiama eliminazione di Gauss con Pivot Parziale.

Possiamo scegliere P ₂ ⁰ e P ₁ ⁰ in modo tale che a _1,1 sia il pi` u garnde elemento in valore assoluto di tutta la matrice. In generale al passo i dell’eliminazione di Gauss, ordiniamo le righe e le colonne da i a n in modo da portare l’elemento pi` u grande in valore assoluto in posizione i, i. Questa tecnica si chiama eliminazione di Gauss con Pivot Totale.

23

(28)

L’algoritmo di eliminazione di Gauss con pivot parziale.

Se eseguiamo le permutazioni partendo dalla matrice A calcoliamo:

M ₃ P ₃ M ₂ P ₂ M ₁ P ₁ A = U

Per ricavarci la matrice P e la matrice L tali che P A = LU poniamo

M ˜ ₂ = P ₃ M ₂ P ₂ ^T = P ₃ (I −m 2 e ^T ₂ )P ₃ ^T = I −P 3 m ₂ e ^T ₂ M ˜ ₁ = P ₃ P ₂ M ₂ P ₂ ^T P ₃ ^T = P ₃ P ₂ (I − m 1 e ^T ₁ )P ₂ ^T P ₃ ^T

= I − P 3 P ₂ m ₁ e ^T ₁ e

P = P ₃ P ₂ P ₁ quindi

L = ˜ M ₁ ⁻¹ M ˜ ₂ ⁻¹ M ₃ ⁻¹

cioe’ gli elementi dei vettori m che costitui-

(29)

function [L,U] = gauss(A) [n,m] = size(A);

for k=1:n −1

if abs(A(k,k)) <= realmin

error(’ Un elemento pivotale e” piccolo’) else

L(k+1:n,k)= A(k+1:n,k)/A(k,k);

end

A(k+1:n,k+1:n)=A(k+1:n,k+1:n) − ....

L(k+1:n,k) ∗A(k,k+1:n);

end

U = triu(A);

end

La funzione Matlab che esegue la fattorizzazione LU con pivot ` e lu. Essa pu` o essere richiamata con l’istruzione:

[L,U,P]=lu(A)

25

(30)

Supponiamo che det(A) = 0 e U abbia l’ultimo elemento diagonale nullo.

Quindi l’ultima riga di U ` e un vettore nullo che si ottiene moltiplicando l’ultima riga di L ⁻¹ per le righe di A, cio` e:

l _n,1 a ^T ₁ + . . . + l _n,n ₋₁ a ^T _n ₋₁ + l _n,n a ^T _n = 0

con l _n,i non tutti nulli e ci` o implica la lineare dipendenza delle righe di A.

L’annullarsi del determinante di una matrice quadrata ` e condizione necessaria e sufficiente affinch` e i vettori riga siano linearmente dipendenti.

Lo stesso discorso pu` o farsi con i vettori co-

(31)

Numero di operazioni

1) Calcolo dei coefficienti m _i,j . Questi sono n − 1 per la prima colonna, n − 2 per la seconda, fino ad 1 per la penultima. In totale abbiamo:

n −1 X k=1

(n − k) = n(n − 1) 2

divisioni.

2) Calcolo degli a ^(k) _i,j . Questi sono (n −1) ² al primo passo (k = 2), (n − 2) ² al secondo passo fino ad 1 all’ultimo passo (k = n − 1). In totale il numero degli a ^(k) _i,j calcolati sono:

n −1 X k=1

(n − k) ² = n(n − 1)(2n − 1)

6 ∼ n ³

3 .

Riassumendo:

moltiplicazioni e divisioni: ∼ n ³ /3 sottrazioni:

∼ n ³ /3.

27

(32)

Sia Ax = b e (A + δA)ˆ x = b + δb, ˆ x = x + δx Studiamo il comportamento di δx in funzione della perturbazione sui dati di input.

(A + δA)(x + δx) − Ax = b + δb − b δAx + Aδx + δAδx = δb

δx = A ⁻¹ ( −δAˆ x + δb) Passando alle norme

kδxk = kA ⁻¹ k(kδAkkˆ x k + kδbk) Dividendo per kˆ x k

kδxk

kˆ x k ≤ kA ⁻¹ kkAk kδAk

kAk + kδbk kAkkˆ x k

!

kAkkA ⁻¹ k `

(33)

La maggiorazione dipende da δx, ed ` e diffi- cile da interpretare. Possiamo derivare una maggiorazione teorica che non dipende da δx utilizzando il seguente lemma:

Lemma. Sia k·k una norma matriciale. Allora kBk < 1 implica che I − B ` e invertibile e

k(I − B) ⁻¹ k ≤ 1/(1 − kBk).

Dimostrazione. Sia λ autovalore di B con x autovettore, allora (I − B) ha l’autovalore 1 − λ con x autovettore:

(I − B)x = x − Bx = x − λx = (1 − λ)x

quindi (I − B) ` e non singolare, infatti gli autovalori sono tutti diversi da zero e quindi il determinante ` e diverso da zero, essendo uguale al prodotto degli autovalori.

I = (I −B)(I −B) ⁻¹ = (I −B) ⁻¹ −B(I −B) ⁻¹ I + B(I − B) ⁻¹ = (I − B) ⁻¹

k(I − B) ⁻¹ k ≤ kIk + kBkk(I − B) ⁻¹ k

k(I − B) ⁻¹ k − kBkk(I − B) ⁻¹ k ≤ 1

k(I − B) ⁻¹ k ≤ 1/(1 − kBk)

(34)

Troviamo una maggiorazione relativa per kδxk δAx + (A + δA)δx = δb

(A + δA)δx = δb − δAx

(I + A ⁻¹ δA)δx = A ⁻¹ (δb − δAx)

Se kA ⁻¹ kkδAk < 1 possiamo applicare il lemma e

δx = (I + A ⁻¹ δA) ⁻¹ A ⁻¹ (δb − δAx) passando alle norme

kδxk ≤ k(I+A ⁻¹ δA) ⁻¹ kkA ⁻¹ k(kδbk+kδAkkxk) kδxk ≤ kA ⁻¹ k

1 − kA ⁻¹ kkδAk kAk kδbk

kAk + kδAkkxk kAk

!

kδxk

kxk ≤ kA ⁻¹ kkA||

1 − kA ⁻¹ kkδAk

kδbk

kAkkxk + kδAk kAk

!

kbk = kAxk ≤ kAkkxk kδxk

kxk ≤ kA ⁻¹ kkAk 1 − kA ⁻¹ kkδAk

kδbk

kbk + kδAk kAk

!

(35)

Residuo : r = Aˆ x − b r = 0 se ˆ x = x

Aδx = Aˆ x − Ax = Aˆ x − b δx = A ⁻¹ r

kδxk ≤ kA ⁻¹ kkrk

30

(36)

Sistema lineare Ax=b : A =

"

1 1

0.99 1

#

, b =

"

2 1.99

#

soluzione x = [1, 1] ^T . La matrice inversa di A ` e

A ⁻¹ = 1 0.01

"

1 −1

−0.99 1

#

κ _∞ (A) = 400. Perturbiamo A sommando ad essa la seguente matrice

δA = 0.002

"

1 1

−1 −1

#

.

Essendo kA ⁻¹ k _∞ = 200 e kδAk _∞ = 0.004 si ha kA ⁻¹ k ∞ kδAk ∞ = 0.8, quindi il sistema perturbato

(A + δA)ˆ x = b

ha matrice dei coefficienti non singolare. La soluzione del sistema perturbato ` e

ˆ x = [0.2016..., 1.794...] ^T , per cui

kδxk _∞ / kxk _∞ = 0.3992.... La maggiorazione

kδxk kxk ≤ 4.

(37)

Ci sono sistemi che non sono mal condizio- nati ma per i quali il numero di condizione della matrice ` e grande. Esempio:

A =







u 0

0 1/u





 .

con u sufficientemente piccolo, ha numero di condizione κ ₁ (A) = (1/u) ² . Se si moltiplica la seconda equazione per u ² , cio` e se si scala la matrice, risulta

A ⁰ =







u 0

0 u







che ha numero di condizione pari ad 1.

Il condizionamento di una matrice pu` o essere modificato dallo scaling.

Si va alla ricerca di due matrici diagonali D ₁ e D ₂ in modo da minimizzare κ(D ₁ AD ₂ ).

32

(38)

Matrice di Hilbert

La matrice di Hilbert rappresenta un classico esempio di matrice mal condizionata reale, nel senso che ha origine da modelli reali.

Gli elementi della matrice di Hilbert sono dati dalla espressione seguente:

a ⁽ⁿ⁾ _ij = 1

i + j − 1 , i, j = 1, ..., n

La tabella riporta i valori del numero di condizione di A, in norma 2 e in norma ∞, per diversi valori di n.

n κ ₂ (A ⁽ⁿ⁾ ) κ _∞ (A ⁽ⁿ⁾ )

2 1.505 27

3 5.241 10 ² 7.480 10 ²

4 1.551 10 ⁴ 2.837 10 ⁴

5 4.766 10 ⁵ 9.436 10 ⁵

6 1.495 10 ⁷ 2.907 10 ⁷

7 4.754 10 ⁸ 9.852 10 ⁸

8 1.526 10 ¹⁰ 3.387 10 ¹⁰

9 4.932 10 ¹¹ 1.099 10 ¹²

(39)

Si consideri la matrice A e il vettore b definiti da:

A =

"

1.2969 0.8648 0.2161 0.1441

#

, b =

"

0.8642 0.1440

#

. La soluzione esatta del sistema Ax = b ` e x = [2, −2] ^T .

Sia ˆ x = [0.9911, −0.4870] ^T , e sia r = Aˆ x − b, quindi r = [ −10 ⁻⁸ , 10 ⁻⁸ ] ^T .

Questo valore di r fa intendere che ˆ x ` e una buona approssimazione della soluzione esatta anche se in realt` a non lo ` e.

La matrice inversa di A ` e data da A ⁻¹ = −10 ⁻⁸

"

0.8648 −0.1441

−1.2969 0.2161

#

per cui κ _∞ (A) = 3 10 ⁸ , quindi A ` e mal condizionata.

34

(40)

Il residuo non ` e una buona indicazione di precisione della soluzione di un sistema quando la matrice ` e mal condizionata. Infatti, vale la disuguaglianza

kδxk

kxk ≤ κ(A) krk kbk che si ottiene da

kδxk ≤ kA ⁻¹ kkrk

dividendo per kxk e sfruttando la disugua-

glianza kbk ≤ kAk · kxk.

(41)

Matrici diagonali dominanti

Sia A una matrice di ordine n diagonale dominante per colonne. Allora i fattori di A ottenuti con il metodo di Gauss coincidono con quelli che si ottengono con il metodo di Gauss con pivot parziale.

Esempio: matrice diagonale dominante per righe

A =







3 1 1 4 8 2 2 2 5







I fattori di A ottenuti con il metodo di Gauss sono:

L =







1

4 3 1

2 3

1 5 1







, U =







3 1 1

20 3

2 21 3

5 





, mentre i fattori ottenuti con il metodo di Gauss con pivot parziale sono:

L =







1

3 4 1

1 2

2 5 1







, U =







4 8 2

−5 − ² ₃

21 5







.

36

(42)

Nel primo caso L non ` e diagonale predominante, nel secondo caso ` e U a non essere diagonale predominante. Utilizzando il metodo di Gauss con pivot totale si ottengono i seguenti fattori:

L =







1

1 8 1

1 4

1 6 1







, U =







8 2 4

9 2 1

7 3







.

In questo caso i fattori sono entrambi diago-

nali predominanti.

(43)

Errore nel metodo di Gauss

La propagazione pi` u o meno rapida degli errori di arrotondamento caratterizza la stabilit` a di un algoritmo. Per studiare la stabilit` a si utilizza generalmente l’analisi all’indietro (backward).

L’idea alla base di questa analisi consiste nel considerare la soluzione calcolata in aritmeti- ca floating point come la soluzione esatta di un problema perturbato e misurare la quantit` a di questa perturbazione. In questo caso si cerca di trovare la matrice δA tale che:

P (A + δA) = LU

ove L ed U sono le matrici calcolate effet- tivamente e P ` e la matrice di permutazione dovuta al pivoting. La norma di δA misurer` a la stabilit` a dell’algoritmo.

37

(44)

Il risultato finale stabilisce che:

kδAk _∞ ≤ 3g ⁿ kAk _∞ n(n − 1)

2 u (1)

u: l’unit` a di arrotondamento (precisione di macchina),

g _n =

max _i,j,k |a ^(k) _i,j | max _i.j |a i,j |

Questo termine, detto fattore di crescita, sti-

ma la crescita degli elementi delle successi-

ve matrici A ^(k) al crescere di k e caratteriz-

za la stabilit` a della fattorizzazione. Nei casi

peggiori questo termine pu` o crescere espo-

nenzialmente con n. Si considerano stabili

le fattorizzazioni in cui g _n cresce al massi-

mo come n ^α , con α ≥ 0. Si pu` o dimostrare

che sono stabili le fattorizzazioni di matrici

a diagonale dominante e la fattorizzazione di

(45)

Naturalmente, nel caso in cui stiamo risolvendo un sistema lineare, bisogna considerare anche gli errori che si commettono nella riso- luzione dei sistemi triangolari. Anche in questo caso le soluzioni ottenute al calcolatore possono essere considerate come le soluzioni esatte dei sistemi perturbati:

(L + δL)y = b (U + δU )x = y

Si pu` o dimostrare che, supponendo di usare il pivoting, si ha:

kδLk ∞ ≤ n(n + 1)

2 u

kδUk _∞ ≤ n(n + 1)

2 g _n kAk _∞ u

La soluzione di un sistema lineare, tenendo conto degli errori dovuti all’uso dell’aritmeti- ca floating point e a possibili errori nel termine noto, pu` o essere considerata come la soluzione esatta di un problema perturbato del tipo:

(A + E)(x + δx) = b + δb

(46)

in cui x + δx ` e la soluzione fornita dal calcolatore ed x ` e la soluzione esatta che si sarebbe ottenuta in assenza di errori. Dovendo essere (A + E) = (L + δL)(U + δU ) + δA

si ha, trascurando il termine contenente δLδU ,

kEk ≤ kδAk + kL|kkδUk + kδLkkUk, e

kδxk

kxk ≤ k(A)

1 − kA ⁻¹ kkEk

kδbk

kbk + kEk kAk

!

.

(47)

Matrici simmetriche definite positive Si incontrano nelle applicazioni.

Sono le pi` u semplici da trattare.

La loro fattorizzazione non richiede il proce- dimento di pivoting:

si pu` o dimostrare che a ^(k) _k,k > 0 .

Sia D la matrice diagonale formata dagli elementi pivotali, cio` e dagli elementi sulla diagonale principale della matrice U , si ha:

A = LU = LDD ⁻¹ U = LD ˆ U

U = D ˆ ⁻¹ U ` e una matrice triangolare superiore con elementi diagonali uguali ad 1.

39

(48)

Poich` e A ` e simmetrica si ha:

A ^T = ˆ U ^T DL ^T = A = LD ˆ U ,

con ˆ U ^T triangolare inferiore e L ^T triangolare superiore.

L’uguaglianza ` e verificata se ˆ U ^T = L quindi A = LDL ^T .

Poich` e abbiamo detto che gli elementi sulla diagonale di D sono positivi, si pu` o definire la matrice D ^1/2 , con elementi le radici quadrate degli elementi di D. Si ha:

A = LD ^1/2 D ^1/2 L ^T . Ponendo S = LD ^1/2 si ha:

A = SS ^T .

Questa fattorizzazione ` e detta fattorizzazione di Cholesky.

E pi` ` u semplice della fattorizzazione LU per-

ch` e ha come incognite solo gli elementi della

(49)

La fattorizzazione si pu` o ottenere diretta- mente uguagliando gli elementi di A e quelli di SS ^T .

Consideriamo la prima riga di A e la prima riga di SS ^T

a _1,1 = s ² _1,1

a _1,j = s _1,1 s _j,1 per j = 2, . . . , n.

ed ` e quindi possibile ricavare:

s _1,1 = a ^1/2 _1,1

s _j,1 = a _1,j /s _1,1 per j = 2, . . . , n.

In generale si avr` a:

a _i,i = ^P ⁱ _k=1 s ² _i,k per i = 1, . . . , n a _i,j = ^P ⁱ _k=1 s _i,k s _j,k per i = 1, . . . , n

j = i + 1, . . . , n.

Data la simmetria di A ` e sufficiente conside-

rare solo la parte triangolare superiore. Dalle

due precedenti relazioni si ricava:

(50)

s _i,i = a _i,i − ^P ⁱ _k=1 ⁻¹ s ² _i,k ^1/2 per i = 1, . . . , n

s _j,i = a _i,j − ^P ⁱ _k=1 ⁻¹ s _i,k s _j,k /s _i,i per

( i = 1, . . . , n

j = i + 1, . . . , n .

Le istruzioni Matlab per eseguire la fattorizzazione di Cholesky sono le seguenti:

for i=1:n

s(i,i) = a(i,i);

for k=1:i–1

s(i,i)=s(i,i) – s(i,k)^2;

end

s(i,i)=s(i,i)^(.5);

for j = i+1:n s(j,i)=a(i,j);

for k=1:i–1

s(j,i) = s(j,i) – s(i,k)*s(j,k);

end

s(j,i)=s(j,i)/s(i,i);

end

(51)

La funzione Matlab che calcola la fattorizzazione di Cholesky di una matrice ` e chol. Se A ` e definita positiva allora dopo l’istruzione

R = chol(A);

la variabile R ` e la matrice triangolare supe-

riore della fattorizzazione di Cholesky.

(52)

Metodo dei minimi quadrati

Matrice A rettangolare con numero di righe maggiore del numero di colonne.

Sistemi sovradeterminati.

Sia A formata da una sola colonna a ₁ _{∈ IR} ^m ^. Il sistema diventa:

a ₁ x = b

con x scalare e b _{∈ IR} ^m ^.

la soluzione esiste se i vettori b ^ed a ₁ ^sono

proporzionali, cio` e se hanno la stessa dire-

zione; la costante di proporzionalit` a x ` e la

soluzione.

(53)

E possibile trovare una soluzione approssima- ` ta del problema?

Geometricamente il problema si presenta nel seguente modo: dati un vettore b ed un altro vettore a ₁ con direzione diverse, trovare un vettore proporzionale ad a ₁ che approssimi meglio b ^.

- -

x a ₁ a ₁

b _{− x} a ₁ b

Il vettore lungo a ₁ tra l’origine ed il piede della perpendicolare minimizza la distanza di b dalla retta individuata da A ₁ , cio` e minimizza la quantit` a k b _{− x} a ₁ _k ² ₂ ^{= (} b _{− x} a ₁ ⁾ ^T ⁽ b _{− x} a ₁ ^).

Il minimo si ottiene in corrispondenza di:

x = a ^T ₁ b a ^T ₁ a ₁

Questa soluzione si chiama soluzione ai mi-

nimi quadrati dell’equazione.

(54)

Generalizzazione al caso in cui la matrice ha k (con k < m) colonne.

Sia k = 2. Siano a ₁ , a ₂ le colonne di A l.i.. Il problema ` e trovare la soluzione di:

x ₁ a ₁ + x ₂ a ₂ = b (2) nel caso in cui rango(A, b) 6= rango(A) = 2.

Sappiamo che tale soluzione non esiste.

Esiste la soluzione ai minimi quadrati, cio` e esiste x ∈ IR ² tale che la funzione:

F (x) = F (x ₁ , x ₂ ) =

= ( b _{− x} ₁ a ₁ _{− x} ₂ a ₂ ⁾ ^T ⁽ b _{− x} ₁ a ₁ _{− x} ₂ a ₂ ^{) =}

= b ^T b _{− 2x} ₁ a ^T ₁ b _{− 2x} ₂ a ^T ₂ b + x ² ₁ a ^T ₁ a ₁ ⁺ 2x ₁ x ₂ a ^T ₁ a ₂ + x ² ₂ a ^T ₂ a ₂

risulti minima.

Questa ` e una funzione di 2 variabili. Deri- vando si ottiene:

− a ^T b + x a ^T a + x a ^T a ^{= 0}

(55)

Questo ` e un sistema lineare la cui matrice dei coefficienti ` e:

a ^T ₁ a ₁ a ^T ₁ a ₂ a ^T ₂ a ₁ a ^T ₂ a ₂

!

≡ A ^T A.

Il sistema lineare diventa quindi:

A ^T Ax = A ^T b

cio` e un sistema 2 × 2. La soluzione di questo problema ` e la soluzione ai minimi quadrati del sistema originario. In generale se le colonne di A sono k (k < m) e se queste sono l.i., la soluzione di:

Ax = b,

con rango(A, b) 6= rango(A) = k, si ottiene risolvendo il sistema A ^T Ax = A ^T b con matrice k × k. Si pu` o dimostrare che rango(A ^T A)

= k, e quindi il sistema ammette una ed una sola soluzione che potr` a scriversi nella forma:

x = (A ^T A) ⁻¹ A ^T b.

(56)

La matrice A ^I = (A ^T A) ⁻¹ A ^T si dice pseu- doinversa di A. Essa diventa uguale all’inversa se k = m. A ^I conserva tuttavia alcune propriet` a delle matrici inverse. Ad esempio:

A Î AA Î = A Î ; AA Î A = A.

La funzione Matlab che calcola la pseudoin- versa di una matrice ` e la pinv.

pinv(A)

Per la soluzione dei sistemi lineari ai mini-

mi quadrati si usa la divisione a sinistra, allo

stesso modo che per la soluzione dei sistemi

lineari con matrici quadrate.

Francesca Mazzia Dipartimento Interuniversitario di Matematica Universit`a di Bari