Funzioni di piu' Variabili

(1)

1. Spazi Euclidei N-Dimensionali.

Per lo studio delle funzioni di più variabili reali occorre aver presenti alcune proprietà degli spazi euclidei ad n dimensioni.

È inoltre indispensabile conoscere qualche proprietà delle appli-cazioni lineari inRne delle forme bilineari e quadratiche.

1.1 Norma e Prodotto scalare

Definizione 1.1 Indichiamo conRn lo spazio vettoriale costituito dalle n−

ple ordinate di numeri reali; in altre parole x∈Rn _⇔ _x _{= (}_x

1, x2, ...., xn)con xk∈R.

InRn si definiscono le operazioni di somma e di prodotto per uno scalare mediante le

x+y= (x1+y1, x2+y2, ...., xn+yn) , x, y∈Rn

e

αx= (αx1, αx2, ...., αxn) , α∈R , x∈Rn.

L’insieme dei vettori

e1= (1, 0, 0, ...., 0)

e2= (0, 1, 0, ...., 0)

. . . . en = (0, 0, 0, ...., 1)

costituisce una base diRn; si avrà pertanto che, se x∈Rn

x=

n

∑

i=1

xiei.

Definizione 1.2 Si definisce norma inRnuna funzione che si indica con

k · k:Rn →R

(2)

2

1. kxk ≥0 ∀x∈Rn

2. kxk =0 ⇔ x=0

3. kαxk = |α|kxk ∀α∈R , ∀x ∈Rn 4. kx+yk ≤ kxk + kyk ∀x, y∈Rn_.

Definizione 1.3 Si definisce prodotto scalare inRnuna funzione

h·,·i:Rn×Rn_−→_R tale che 1. hx, xi ≥0 ∀x ∈Rn 2. hx, yi = hy, xi ∀x, y∈Rn 3. hx, xi =0 ⇔ x=0 4. hαx+βy, zi =αhx, zi +βhy, zi ∀x, y, z∈Rn , ∀α, β∈R.

Come nel caso del valore assoluto per i numeri reali, si ha

|kxk − kyk| ≤ kx−yk

Lemma 1.1 Siano x, y∈Rn_{, allora se 1/p}₊_1/q₌_{1 , p, q}_≥_{1 ,}

|

∑

xiyi| ≤

∑

|xi||yi| ≤ (

∑

|xi|p)1/p (

∑

|yi|q)1/q

(Disuguaglianza di Schwarz-Holder)

(

∑

|xi+yi|p)1/p ≤ (

∑

|xi|p)1/p+ (

∑

|yi|p)1/p

(Disuguaglianza di Minkowski). Dimostrazione. Intanto è ovvio che

|

∑

xiyi| ≤

∑

|xi||yi|.

Dal momento che la funzione ξ→ξpè convessa su ¯R+, si ha

∑ λiξi ∑ λi p ≤ ∑ λiξ p i ∑ λi ∀λi ≥0 , ∀ξi ≥0 e

∑

λiξi ≤ (

∑

λi)(p−1)/p (

∑

λiξ_ip)1/p. Ora, posto λi= |yi|p/(p−1) e λiξ_ip= |xi|p ,

(3)

3 si ha (λiξi)p=λ_ip−1λiξ_ip = |xi|p|yi|p e λiξi= |xi||yi|. Da cui

∑

|xi||yi| ≤ (

∑

|xi|p)1/p (

∑

|yi|p/(p−1))(p−1)/p

e si può concludere la disuguaglianza di Holder tenendo conto che p/(p−1) = q . Per quanto riguarda la disuguaglianza di Minkowski si ha

∑

|xi+yi|p=

∑

|xi+yi||xi+yi|p−1 ≤

≤

∑

|xi||xi+yi|p−1 +

∑

|yi||xi+yi|p−1.

Applicando la disuguaglianza di Holder ad entrambi gli addendi dell’ultimo membro si ha

∑

|xi+yi|p≤ [(

∑

|xi|p)1/p+ (

∑

|yi|p)1/p](

∑

|xi+yi|(p−1)q)1/q

e tenendo conto che(p−1)q= p si ha

(

∑

|xi+yi|p)1−1/q ≤ (

∑

|xi|p)1/p + (

∑

|yi|p)1/p.

Si conclude tenendo conto che 1−1/q=1/p . 2

La disuguaglianza di Holder si riduce alla più nota disuguaglianza di Schwarz per p=q=2.

Per p = q = 2 la disuguaglianza di Schwarz può essere riscritta come

|hx, yi| ≤ kxkkyk

e può essere dedotta osservando che,∀t∈R

0≤ kx+tyk2= hx+ty, x+tyi =t2kyk2+2thx, yi + kxk2

Ciò implica infatti

hx, yi2− kxk2kyk2 ≤0

La corrispondente disuguaglianza triangolare segue da

kx+yk2= kxk2+ kyk2+2hx, yi ≤ kxk2+ kyk2+2kxkkyk

Osserviamo che

|hx, yi| = kxkkyk

(4)

4

Pertanto

kxk =sup{hx, yi:kyk ≤1} =max{|hx, yi|:kyk ≤1}. Sono esempi di norme inRnle seguenti

kxkp= ( n

∑

k=1 |xi|p)1/p p≥1 kxk_∞=max{|xi| : i=1, .., n}.

Mentre un esempio di prodotto scalare è dato da

hx, yi = ( n

∑

k=1 xiyi Ovviamente si hahx, xi = kxk2 2.

InRn useremo abitualmente lak · k2che è detta norma euclidea in

quantokxk2coincide con la distanza euclidea del vettore x dall’origine.

Nel seguito faremo riferimento, a meno di espliciti avvisi contrari, a tale norma e scriveremok · kin luogo dik · k₂.

Osserviamo altresì che il prodotto scalare sopra definito, pur non essendo l’unico possibile, sarà l’unico da noi considerato.

Si vede subito che

hP1, P2i = |P1||P2|cos(θ2−θ1)

Infatti, facendo riferimento adR2e alla figura 1.1, si ha

Figure 1.1:

hP1, P2i =

=x1x2+y1y2= |P1||P2|cos(θ2)cos(θ1) + |P1||P2|sin(θ2)sin(θ1) =

= |P1||P2|cos(θ2−θ1)

L’osservazione appena fatta giustifica il fatto che

Diciamo che due vettori x, y∈Rn_{sono ortogonali se}_h_{x, y}_{i =}_0.

Diciamo che sono paralleli se esiste λ∈ R tale che x= λy. Se

x ed y sono parallelihx, yi = kxkkyk

Sek · ka ek · kb sono due norme inRn si dice che sono equivalenti

se esistono due costanti reali H e K tali che Hkxkb ≤ kxka ≤ Kkxkb.

Si può dimostrare che

(5)

5

Dimostrazione. Siak · kauna norma inRn; si ha

kxka= k n

∑

i=1 xieika ≤ n

∑

i=1 |xi|keika ≤ Kkxk1 essendo K=max{keika}.

Quindi la funzionek · kaè continua e, dal momento che

{x∈Rn : kxk1=1}

è compatto è lecito considerare

H=min{kxka : kxk1=1}; si ha H>0 e kxka kxk1 = x kxk1 _a ≥H. Pertanto, per ogni x∈Rn _{si ha}

Hkxk1≤ kxka≤Kkxk1

e tutte le norme inRnsono equivalenti. 2

È anche interessante osservare che

Lemma 1.2 La funzione p−→ kxkpè decrescente∀x∈Rne si ha

kxk_∞=lim

p kxkp=inf{kxkp : p≥1} ;

inoltre

(24.1) kxk_∞≤ kxkp≤ kxk1≤nkxk∞≤nkxkq ≤nkxk1 ∀p, q≥1

e pertanto le normek · kpsono tutte equivalenti.

Dimostrazione. Per provare che p−→ kxkpè decrescente sarà

suffi-ciente provare che

d dp kxkp ≤ 0. Si ha kxkp= (

∑

|xi|p)1/p e pertanto d dp kxkp= kxkp − 1 p2 ln

∑

|xi| p₊1 p ∑|xi|pln|xi| ∑|xi|p = = kxkp p2_∑_|_x i|p p

∑

|xi|pln|xi| −

∑

|xi|pln

∑

|xi|p .

(6)

6 Ora

∑

|xi|pln|xi|p −

∑

|xi|pln

∑

|xi|p ≤ 0 in quanto ln|xi|p≤ln∑|xi|p. Inoltre si ha kxk_∞≤ kxkp≤ (nkxk∞p)1/p =n1/pkxk∞ e d’altra parte lim p n 1/p ₌_lim p e (ln n)/p₌_1.

La (24.1) è immediata conseguenza di quanto visto. 2

Le notazioni vettoriali introdotte consentono di esprimere facilmente condizioni che individuano rette piani e sfere.

Possiamo individuare i punti di una retta che passa per il punto

(x0, y0, z0) ed è parallela alla direzione (a, b, c) semplicemente

som-mando(x, y, z)con il vettore t(a, b, c)al variare di t∈R.

Otterremo in tal caso che

(x, y, z) = (x0, y0, z0) +t(a, b, c)

che scritta componente per componente        x=x0+ta y=y0+tb z=z0+tc

fornisce le equazioni parametriche della retta.

Se t∈ R+ avremo una delle due semirette in cui(x0, y0, z0)divide

la retta intera, mentre se t ∈ [a, b] ci limitiamo ad un segmento della retta stessa.

Un piano passante per l’origine può essere individuato dai vettori perpendicolari ad un vettore assegnato; l’equazione del piano si potrà quindi scrivere come

h(x, y, z),(a, b, c)i =0

mentre il piano parallelo che passa per(x0, y0, z0)è dato da

h(x−x0, y−y0, z−z0),(a, b, c)i =0

come abbiamo già visto una sfera può essere individuata come l’insieme dei punti che hanno distanza dal centro (x0, y0, z0) minore

del raggio R;

Una sfera sarà pertanto individuata dalla condizione

(7)

7

1.2 Applicazioni Lineari

Definizione 1.4 Si chiama applicazione lineare una funzione

f :Rn →Rm

tale che

f(αx+βy) =α f(x) +β f(y) ∀x, y∈Rn, ∀α, β∈R

L(Rn_,_Rm₎_{è l’insieme delle applicazioni lineari su}_Rn_{a valori in}_Rm_._L(_Rn_,_R₎

si chiama anche spazio duale diRn.

Gli elementi diL(Rn_,_Rm₎_{possono essere messi in corrispondenza}

biunivoca con le matrici aventi m righe ed n colonne,Mm×n_.

Più precisamente L(Rn_,_Rm₎ _ed _Mm×n _{sono isomorfi in quanto}

ogni applicazione lineare f può essere scritta nella forma f(x) =Ax con A∈ Mm×n.

e d’altro canto f(x) =Ax è lineare. In particolare

Le applicazioni lineari daRninR sono tutte e sole quelle della forma

f(x) = hx∗, xi con x∗∈Rn_.

Definizione 1.5 Se f ∈ L(Rn_,_Rm₎_{definiamo norma di f , e la indichiamo}

conkfk0, la seguente

kfk₀=sup{kf(x)k : kxk ≤1}.

In virtù del teorema 24.7 possiamo identificare f con la matrice A per

la quale risulta f(x) =Ax .

Pertanto possiamo anche definire

kAk₀=sup{kAxk : kxk ≤1}.

D’altro canto A ∈ Mm×n _{e può essere identificato come un}

ele-mento diRm×n. Si può pertanto definire

kAkp= (

∑

ij

|aij|p)1/p p≥1

e

kAk_∞=max{|aij| : i=1, .., m , j=1, .., n}

(8)

8

Osserviamo subito che

kAk0≤ kAk2= kAk

la disuguaglianza essendo stretta ad esempio se A=I . Infatti, se denotiamo con Ai le righe della matrice A,

kAxk2₌

∑

i hAi, xi2≤

∑

i kAik2kxk2= kAk2kxk2. Teorema 1.2 Se A∈ Mm×n_{si ha} kAxk ≤ kAk₀kxk ≤ kAkkxk. Dimostrazione. Dalla definizione 24.9 si ottiene

kAx/kxkk ≤ kAk0

e la tesi. 2

Possiamo altresì provare che:

Teorema 1.3 Sia A∈ Mm×n_{, allora}

kAk0=sup{|hAx, yi| : kxk ≤1 , kyk ≤1}

ed inoltre, se A∈ Mn×n_{= M}n_{è simmetrica}

kAk0=sup{|hAx, xi| : kxk ≤1}.

Dimostrazione. La prima relazione segue dall’osservazione che pre-cede la definizione 24.4.

Per quel che riguarda la seconda uguaglianza è ovvio che

kAk0≥sup{|hAx, xi| : kxk ≤1, } =ν ed inoltre, poiché hA(x+y), x+yi − hA(x−y), x−yi =4hAx, yi |hAx, yi| ≤ 1 4(|hA(x+y), x+yi| + |hA(x−y), x−yi|) ≤ ≤ ν 4(kx+yk 2_{+ k}_x₋_y_k2_{) =} ν 2(kxk 2_{+ k}_y_k2₎ onde sup{|hAx, yi| : kxk ≤1, kyk ≤1} ≤ν. 2

(9)

9

Osserviamo inoltre che, se A è simmetrica, esiste una matrice P or-togonale ed unitaria, (la cui inversa coincide pertanto con la trasposta) tale che

A=P−1EP

con E matrice diagonale avente come elementi della diagonale princi-pale gli autovalori λidi A.

Allora

sup{hAx, xi : kxk ≤1} =sup{hP−1EPx, xi : kxk ≤1} = =sup{hEPx, Pxi : kxk ≤1} = =sup{hEy, yi : kyk ≤1} = =sup{ n

∑

i=1 λiy2i : kyk ≤1} = =sup{Λkyk2 _: _k_y_{k ≤}₁_{} =}_Λ

non appena si sia definito

Λ=max{λi : i=1, 2, ..n} =λi0

e si sia tenuto conto del fatto che, in corrispondenza di y= ei0 , si ha

hEy, yi =λi0 =Λ .

1.3 Forme Bilineari e Quadratiche

Definizione 1.6 Si chiama forma bilineare inRn una funzione f :Rn×Rn_→_R

tale che f(·, y)e f(x,·)siano funzioni lineari suRn_.

Le funzioni bilineari suRnsono tutte e sole quelle definite da f(x, y) = hx, Ayi = hBx, yi con A, B∈ Mn

dove B è la matrice trasposta di A. (si ottiene da A scambiando le righe con le colonne. Solitamente si denota B= A∗).

Definizione 1.7 Se f è una forma bilineare inRn; la funzione g :Rn−→R

definita da

g(x) = f(x, x)

si chiama forma quadratica inRn.

Si può sempre trovare una matrice A∈ Mn_{, non unica, tale che}

(10)

10

possiamo inoltre sempre scegliere A in modo che sia una matrice simmetrica; in tal caso A si dice matrice associata alla forma quadratica e risulta univoca-mente determinata.

Se g è una forma quadratica; g si dice semidefinita positiva (negativa) se g(x) ≥ 0 ( ≤ 0) ∀x∈Rn

g si dice definita positiva (negativa) se

g(x) > 0 ( < 0) ∀x∈Rn{0}. Si possono provare i seguenti:

Teorema 1.4 Sia g una forma quadratica e sia A la matrice ad essa associata;

allora

• g è definita positiva se e solo se, detto Akil minore principale di ordine k

di A , si ha

det Ak > 0 ∀k ;

• g è definita negativa se solo se

(−1)kdet Ak > 0 ∀k.

Teorema 1.5 Sia g una forma quadratica e sia A la matrice ad essa associata;

allora

• g è definita positiva (negativa) se e solo se, detti λki suoi autovalori, si ha

λk > 0 ( < 0) ∀k ;

• g è semidefinita positiva (negativa) se e solo se

λk ≥ 0 ( ≤ 0) ∀k.

Il prodotto scalare inRn

f(x, y) = hx, yi

è il più semplice esempio di funzione bilineare; la forma quadratica g(x) = f(x, x) = hx, xi = kxk

si riduce alla norma euclidea in Rn La matrice di rappresentazione della forma bilineare associata al prodotto scalare è la matrice identica.

(11)

11

1.4 Topologia di

R

n

Definizione 1.8 Chiamiamo successione inRn una applicazione x : N−→Rn

che ad ogni k∈N associa xk∈Rn_.

Come nel caso reale chiamiamo estratta della successione xk una

succes-sione xkh dove kh è una successione a valori nei naturali strettamente cres-cente.

Diciamo che lim xk=x se limkxk−xk =0.

Chiaramente la definizione data è funzione della norma scelta ma dà luogo agli stessi risultati qualora si considerino norme equivalenti. Osserviamo che, dal momento che inRntutte le norme sono equiv-alenti, in effetti la definizione di convergenza di una successione non dipende dalla norma scelta. (Si veda la definizione 24.4)

Si può provare facilmente che

Teorema 1.6 Sia xkuna successione inRn

• se xkè convergente allora ogni sua estratta è ancora convergente allo stesso

limite;

• se xkè convergente allorakxkkè limitata.

E’ anche immediato provare che

Teorema 1.7 Sia xkuna successione inRntale chekxkk ≤M , allora esiste

una successione xk_h , estratta da xk, convergente.

Dimostrazione. Si ha|(xk)i| ≤ kxkk ≤ M, ∀i, e pertanto esiste una

estratta xk1 tale che(xk1)1 → x1; con una successiva estrazione si ha

(xk2)2 →x2e iterando il procedimento si può concludere osservando

chekxkn−xk1→0. 2

Teorema 1.8 - criterio di convergenza di Cauchy - Sia xkuna successione in

Rn_{, allora x}

kè convergente se e solo se

∀ε>0 ∃kε ∈N : h, k>kε ⇒ kxh−xkk <ε.

Dimostrazione. La necessità è ovvia conseguenza della disuguaglianza triangolare della norma; per quel che riguarda la sufficienza basta os-servare che, se vale la condizione di Cauchy, xk è una successione

limitata e pertanto esiste una estratta xk_h →x. Ora per k, h

sufficiente-mente grandi

kxk−xk ≤ kxk−xkhk + kxkh−xk <ε.

2 Diamo ora alcune definizioni che useremo sistematicamente nello studio delle funzioni di più variabili.

(12)

12

Definizione 1.9 Sia x0∈Rn_{, r}_>_{0 , chiamiamo sfera aperta di centro x} 0e

raggio r, l’insieme

S(x0, r) = {x∈Rn : kx−x0k <r}.

Sia A ⊂ Rn_{, x}

0 ∈ A si dice interno ad A se esiste r > 0 tale che

S(x0, r) ⊂ A ; l’insieme dei punti di A che sono interni si indica con intA e

costituisce l’interno di A.

A⊂Rn_{si dice aperto se tutti i suoi punti sono interni, cioè se A}₌_{int A}

.

A⊂Rn_{si dice chiuso se il suo complementare è aperto.}

Diciamo che x0è punto di frontiera per A⊂Rnse

∀δ>0 S(x0, δ) ∩A6= ∅ e S(x0, δ) ∩Ac6= ∅.

Indicheremo con ∂A l’insieme dei punti di frontiera di A . Definiamo chiusura di A l’insieme

cl A= {x∈Rn : ∃xk ∈A, xk →x}.

Valgono i seguenti fatti:

Se A⊂Rn _{allora cl A}₌_∂A_∪_A

Infatti è intanto ovvio che A ⊂ cl A, mentre se x ∈ ∂A si ha che

∀ε> 0 ∃xε ∈ S(x, ε), xε ∈ A, e perciò si può trovare xn ∈ A tale che

kxn−xk <1/n da cui x∈cl A .

Sia viceversa x∈clA , x6∈ A ; allora esiste una successione xn ∈ A

, xn →x e quindi ∀ε> 0 x ∈ S(x, ε) ed xˆn ∈ S(x, ε) se ˆn è scelto in

maniera opportuna.

Ma x6∈A mentre xˆn∈A per cui x∈∂A.

Sia A⊂Rn_{, f : cl A}_−→_{R continua , allora}

inf{f(x) : x∈ A} =inf{f(x) : x∈cl A} Sia infatti λ=inf{f(x) : x∈ A} si ha f(x) ≥λ∀x∈ A ∀ε>0∃xε ∈A tale che f(xε) ≤λ+ε.

Per la continuità di f si ha anche che f(x) ≥λ∀x∈cl A

(13)

13

e pertanto

λ=inf{f(x) : x∈cl A}.

Sia A⊂Rn_{allora ∂A}₌_{cl A}_∩_{cl A}c

Sia x∈∂A,∀ε>0∃x0_ε, x”ε∈S(x, ε), x0ε∈ A, x”ε ∈Ace pertanto si

possono trovare x0n∈ A, x”n ∈Ac, x0n, x”n →x.

Sia viceversa x∈cl A∩cl Ac, allora

x=lim x0n =lim x”n , x0n∈ A , x”n ∈Ac

e∀ε>0∃n1, n2tali che x0n1, x”n2 ∈S(x, ε)e x∈∂A.

Teorema 1.9 Sia A ⊂ Rn_{, allora A è aperto se e solo se} _∀_x _∈ _A, _∀_x k,

xk → x, si ha xk ∈ A definitivamente; A è chiuso se e solo se ∀xk ∈ A,

xk →x, si ha x∈A .

Dimostrazione. Sia A aperto e sia r>0 tale che S(x, r) ⊂ A ; allora definitivamentekxk−xk <r e xk∈S(x, r) ⊂A.

Supponiamo viceversa che A non sia aperto, allora esiste x∈A tale che ∀r> 0∃xr ∈ S(x, r) \A; pertanto si può trovare una successione

xk ∈S(x, 1/k) \A e si ha xk→x e ciò è assurdo.

Sia A chiuso e sia xk ∈ A, xk → x; se x ∈ Ac che è aperto, allora

xk ∈Acdefinitivamente e ciò non è possibile.

Supponiamo che A non sia chiuso, allora Acnon è aperto ed esiste x ∈ Ac, xk→x, con xk 6∈Ac. Pertanto esiste una successione xk→x,

xk ∈A e x6∈A , assurdo. 2

Osserviamo che cl A è un insieme chiuso; infatti, se xk ∈ cl A,

xk → x, per ogni k esiste xhk ∈ A, xhk → xk ed è possibile trovare

una successione h(k) tale che xh(k)_k →x . Ne segue che

A=cl A ⇔ A è chiuso.

Definizione 1.10 Un insieme A⊂Rn_{si dice}

• limitato, se esiste r>0 tale che A⊂S(0, r);

• convesso, se∀x, y∈ A,∀λ∈ [0, 1], λx+ (1−λ)y∈ A;

• compatto, se∀xk∈ A, esiste un’estratta xkh →x ∈A;

• connesso, se non esistono due insiemi aperti, A1,A2tali che A1∩A6= ∅

, A2∩A6= ∅, A∩ (A1∩A2) = ∅, A⊂A1∪A2.

(14)

14

Dimostrazione. Se A è chiuso e limitato, presa una successione xk∈

A si ha che xk è limitata e per il teorema 24.20 esiste xkh →x; x∈ A perché A è chiuso.

Sia viceversa A compatto, allora è chiuso ed inoltre è limitato, in quanto se così non fosse, esisterebbe una successione xk ∈ A, con

kxkk → +∞, e dal momento che A è compatto esiste xk_h →x ; pertanto

kxk_hkè limitata e contemporaneamentekxk_hk → +∞ , assurdo. 2 Lemma 1.3 InR gli insiemi connessi sono tutti e soli gli intervalli.

Dimostrazione. Supponiamo che I sia un intervallo non connesso, allora esistono I1, I2 ⊂ R aperti tali che I1∩I 6= ∅ , I2∩I 6= ∅ ,

I∩I1∩I2= ∅e I ⊂I1∪I2.

Se definiamo f : I −→R tale che f(x) =1 se x ∈ I∩I1ed f(x) =

−1 se x∈ I∩I2, è immediato provare che f è continua e poiché f non

si annulla mai, I non può essere un intervallo (teor. 7.8).

Supponiamo viceversa che I sia connesso, se I non fosse un inter-vallo esisterebbero due punti x, y∈I ed esisterebbe z∈ (x, y)e z6∈I e ciò non è possibile in quanto si potrebbe allora scegliere I1= (−∞, z)

e I2= (z,+∞)ed I non sarebbe connesso. 2

Gli insiemi connessi ed aperti diRn possono essere caratterizzati facendo uso della nozione di connessione per spezzate poligonali, che diamo qui di seguito.

Teorema 1.11 Sia A⊂Rn_{, A aperto, allora A è connesso se e solo se vale la}

seguente condizione

∀x, y ∈ A esiste una funzione continua, lineare a tratti (il cui grafico è costituito da segmenti paralleli agli assi) φ :[a, b] −→A tale che φ(a) =x e

φ(b) =y.

Dimostrazione. La condizione è equivalente, per ogni x0∈ A alla

∀y∈ A∃φ:[a, b] −→A lineare a tratti tale che φ(a) =x0e φ(b) =y

.

Cominciamo a vedere che se A è connesso allora quest’ultima vale. Definiamo

A1= {y∈ A : (24.3) è soddisfatta}

A2=A\A1.

Si ha A1 6= ∅ (x0 ∈ A1), A1∩A2 = ∅ed inoltre A1 ed A2 sono

aperti. Infatti A1è aperto in quanto preso y∈ A1, si ha y∈ A ed esiste

r>0 tale che S(y, r) ⊂ A. Dal momento che ogni punto di S(y,r) può essere congiunto con y mediante n segmenti paralleli agli assi e dal momento che y∈A1si ha S(y, r) ⊂A1ed A1è aperto.

A2d’altro canto è aperto in quanto, se y∈ A2, y 6∈ A1e se r> 0 è

tale che S(y, r) ⊂ A si ha S(y, r) ⊂ A2 (se cos ì non fosse si potrebbe

(15)

15

Ne concludiamo, dal momento che A è connesso, che A1 = A e la

condizione richiesta.

Se viceversa la condizione è vera e A non è connesso, esistono A1

ed A2 aperti, non vuoti, disgiunti, la cui unione è A, e se x1 ∈ A1 ,

x2∈ A2e φ :[a, b] −→ A è lineare a tratti con φ(a) = x1 , φ(b) = x2 ,

si può definire

Ti= {t∈ [a, b] : φ(t) ∈Ai } , i=1, 2;

Ti è aperto, T1∩T2 = ∅, T1∪T2 = [a, b] e pertanto l’intervallo [a,b]

non sarebbe connesso. 2

(16)

(17)

2. Le Funzioni Di PiÙ Variabili.

Questo capitolo è dedicato allo studio delle proprietà di continuità e differenziabilità delle funzioni

f :Rn →Rm

con n, m≥1,

Definizione 2.1 È data una funzione

f :Rn −→Rm

se sono assegnati • un insieme A⊂Rn

• una corrispondenza

x∈ A7→ f(x) ∈Rm

che ad ogni x∈ A associa uno ed un solo vettore f(x) ∈Rm.

Si dice che A è il dominio di f e si scrive D(f) = A e, nel caso che tale dominio non sia esplicitamente indicato, si suppone la corrispon-denza f definita per tutti gli x ∈ Rn _{per cui è possibile considerare}

f(x).

Si definisce rango di f

R(f) = {y∈Rm _: _∃_x_∈ _{A, y}₌ _f₍_x_)}

e grafico di f .

G(f) = {(x, y) ∈Rn×Rm _{: y}₌ _f₍_x_)}

Restrizione e composizione di funzioni sono definite come nel caso reale e parimenti simile è la definizione di iniettività, surgettività, bigettività.

(18)

18

2.1 Limiti

Lo studio dei limiti di una funzione di più può essere condotto sem-plicemente ripercorrendo i risultati ottenuti nel caso di una funzione reale di una variabile reale, avendo cura di puntualizzare solo qualche particolare sui valori infiniti.

Quando n = 1, si estende R mediante due punti all’infinito che vengono denominati +∞ e −∞, in quanto è ben chiaro che

due punti diR possono sempre essere confrontati nella relazione d’ordine (R è totalmente ordinato). Se n > 1 cade la possibilità di ordinare totalmenteRn e pertanto si preferisce estendere Rn, n > 1, con un solo punto all’infinito che viene denominato sem-plicemente∞. Ricordiamo che, anche se meno utile, questa possibilità esiste anche inR

Definizione 2.2 Se n=1 e x0∈R∪ {±∞}, definiamo, per ρ>0

I(x0, ρ) =        (ρ,+∞) se x= +∞ (x0−ρ, x0+ρ) se x∈R (−∞,−ρ) se x= −∞ Definiamo inoltre I0(x0, ρ) =I(x0, ρ) \ {x0}. Se n>1, x0∈Rn∪ {∞}, definiamo per ρ>0 I(x0, ρ) =    {x0∈Rn : kx0k <ρ} =S(x0, ρ) x0∈Rn {x0∈Rn : kx0k >ρ} x0=∞

anche qui poniamo I0(x0, ρ) =I(x0, ρ) \ {x0} Definizione 2.3 Sia A ⊂ Rn_{, si dice che x}

0 ∈ Rn∪ {∞}è un punto di

accumulazione per A se∀r>0 I0(x0, r) ∩A6= ∅.

Indichiamo conD(A)l’insieme dei punti di accumulazione di A.

Sia A⊂ Rn_{, x}

0 ∈ Rn∪ {∞}; x0 ∈ D(A)se e solo se ∃xk ∈ A,

xk6= x0, xk→x0.

Definizione 2.4 Sia f : A→Rn_{, A}_⊂_Rn_{e sia x}

0∈ D(A); diciamo che

lim

x→x0

f(x) = `

(19)

19

∀ε>0 ∃δ(ε) >0 tale che se x∈ I0(x0, δ(ε)) ∩A si ha f(x) ∈ I(`, ε)

Si può facilmente provare che:

• ogni funzione che ammette limite finito è localmente limitata; • il limite di una funzione, se esiste, è unico;

• se m=1 vale il teorema della permanenza del segno;

• il limite di una somma è uguale alla somma dei limiti, ove questi esistono finiti;

• il limite del prodotto di una funzione a valori reali per una funzione a valori vettoriali è uguale al prodotto dei limiti, ove questi esistono finiti;

• se m = 1 il limite del reciproco di una funzione è uguale al reciproco del limite della funzione stessa, ammesso che non sia nullo.

• se m = 1 valgono i risultati sul confronto dei limiti del tipo considerato per le funzioni reali di una variabile;

• il limite di una funzione può essere caratterizzato per succes-sioni come per le funzioni di una variabile.

Ricordiamo anche l’enunciato che permette di calcolare il limite di una funzione composta

Sia f : A −→ Rm_{, A} _⊂ _Rn_{, x} 0 ∈ D(A) e sia g : B −→ A, B⊂Rp_{, y} 0∈ D(B), g(B) ⊂A; supponiamo che lim x→x0 f(x) = e lim y→y0 g(y) =x0

Allora, se una delle due seguenti condizioni è verificata • x06∈dom f • f(x0) = ` si ha lim y→y0 f (g(y)) = `.

(20)

20

2.2 Continuità

Definizione 2.5 Sia f : A −→ Rm_{, x}

0 ∈ A ⊂ Rn, diciamo che f è una

funzione continua in x0se∀ε>0∃δ(ε) >0 tale che

se x∈ A,kx−x0k <δ(ε)si hakf(x) −f(x0)k <ε.

Nel caso in cui x0∈ A∩ D(A), la condizione sopra espressa è equivalente

alla

lim

x→x0 f

(x) = f(x0)

f si dice continua in A se è continua in ogni punto di A.

Come nel caso delle funzioni reali di una variabile reale si prova che:

• la somma di funzioni continue è continua;

• il prodotto di una funzione a valori vettoriali per una funzione a valori scalari, entrambe continue, è continua;

• se m=1, il reciproco di una funzione continua è continuo dove ha senso definirlo;

• vale la caratterizzazione della continuità per successioni data, nel caso reale;

• la composta di funzioni continue è una funzione continua. • se limx→x0 f(x) =λe limx→x0g(x) =µ, con λ, µ∈R

m_{si ha}

lim

x→x0

hf(x), g(x)i = hλ, µi

• In particolare la funzioneh·,·i:Rm×Rm_→_{R è continua}

Valgono per le funzioni continue i soliti teoremi

Teorema 2.1 -degli zeri - Sia f : A−→R, A⊂Rn_{, A aperto e connesso}

e supponiamo che f sia una funzione continua; allora se esistono x1, x2∈ A

tali che f(x1)f(x2) <0 esiste anche x0∈ A tale che f(x0) =0.

Figure 2.1: Il teorema degli zeri

Dimostrazione. Poichè A è connesso è possibile congiungere x1

ed x2con una linea spezzata costituita di segmenti paralleli agli assi

coordinati.

Siano xjgli estremi di ciascuno dei segmenti, nel caso in cui f(xj) =

0 per qualche j, il teorema è dimostrato, in caso contrario esisteranno xk, xk+1tali che f(xk)f(xk+1) <0.

Allora la funzione[0, 1] 3 t 7→ ϕ(t) = f(x_k+t(x_k+1−x_k) ∈ R è

(21)

21

Teorema 2.2 - Weierstraß- Sia f : A −→ R una funzione continua e

supponiamo che A sia un insieme compatto; allora esistono x1, x2 ∈ A tali

che

f(x1) =min{f(x) : x∈A}

f(x2) =max{f(x) : x∈A}

Dimostrazione. Sia, ad esempio λ=inf{f(x): x∈ A}; allora esiste una successione xk ∈ A tale che f(xk) → λ e, dal momento che A è

compatto, è possibile trovare una successione xkh → x1 ∈ A. Si ha pertanto f(xkh) → λ e, per la continuità di f , f(xkh) → f(x1). Ne

segue che λ= f(x1)e la tesi. 2

Teorema 2.3 - Weiertsraß generalizzato - Sia f : Rn −→ R una

fun-zione continua e supponiamo che esista ˆx∈Rn_{tale che}

lim

x→∞ f(x) = ` > f(ˆx)

allora esiste x1∈Rntale che

f(x1) =min{f(x) : x∈Rn} Dimostrazione. Sia λ=inf{f(x) : x∈Rn} si ha ` > f(ˆx) ≥λ .

Sia poi δ>0 tale che sekxk >δsi abbia f(x) ≥ ` −ε, con ε>0.

Sia ancora xk∈Rn tale che f(xk) →λ.

Allora, per ε piccolo e per k abbastanza grande, si ha f(xk) <λ+ε< ` −ε

e quindikxkk ≤δ.

Si può pertanto estrarre da xkuna successione xkh tale che xkh →x1 e si può concludere utilizzando le stesse argomentazioni del teorema

precedente. 2

Definizione 2.6 Sia f : A −→ Rm_{, A} _⊂ _Rn_{; f si dice uniformemente}

continua in A se

∀ε>0∃δ(ε) >0 tale che se x, y∈ A ekx−yk <δ(ε), si ha

kf(x) −f(y)k <ε.

Teorema 2.4 - Heine-Cantor - Sia f : A −→ Rm_{, A} _⊂ _Rn _{; se f è una}

funzione continua su A ed A è un insieme compatto allora f è uniformemente continua su A.

(22)

22

Dimostrazione. Se f non fosse uniformemente continua in A∃ε0>0

ed∃xk, yk ∈A tali chekxk−ykk <1/k ekf(xk) −f(yk)k >ε0.

Dal momento che A è compatto,∃xkh estratta da xk, xkh →x∈ A e si ha

kykh−xk ≤ kykh−xkhk + kxkh −xk →0 per cui yk_h →x.

Ne viene chekf(xk_h) −f(yk_h)k →0 e ciò è assurdo. 2 Corollario 2.1 Sia f :Rn →Rm_{, lineare; allora}

• f è uniformemente continua suRn;

• f trasforma insiemi limitati diRn_{in insiemi limitati di}_Rm_.

2.3 Differenziabilità e Derivabilità

Definizione 2.7 - Sia f : A−→Rm_{, A}_⊂_Rn_{, A aperto, x}

0∈ A; diciamo

che f è differenziabile in x0se esiste una applicazione lineare

L :Rn −→Rm tale che lim h→0 kf(x0+h) −f(x0) −L(h)k khk =0

L’applicazione lineare L si chiama differenziale di f in x0e si indica

soli-tamente con d f(x0).

La matrice che la rappresenta si chiama matrice jacobiana di f in x0e verrà

indicata con∇f(x0). Si ha perciò

L(h) =d f(x0)(h) = ∇f(x0)h

Quando m=1,∇f(x0)si riduce ad un vettore diRne si indica

col nome di gradiente di f in x0; faremo uso del nome gradiente

anche se m>1.

Osserviamo infine che∇f : A−→Rm×n_{= M}m×n

Sia f : A−→Rm_{, posto}

ω(h) = kf(x0+h) − f(x0) −d f(x0)(h)k

khk

per la definizione di differenziabilità si ha lim

(23)

23

per cui

f(x0+h) −f(x0) −d f(x0)(h) = khkω(h)

Se viceversa vale l’uguaglianza precedente si può verificare che f è differenziabile. Naturalmente kf(x0+h) − f(x0)k ≤ [ω(h) + kd f(x0)k] khk e si ha lim h→0 f(x0+h) = f(x0) per cui

Ogni funzione differenziabile è continua.

Definizione 2.8 Sia f : A−→R, A⊂Rn_{, A aperto, x}

0∈A; diciamo che

f è parzialmente derivabile in x0rispetto alla variabile xi se

lim

t→0

f(x0+tei) − f(x0)

t esiste finito.

In tal caso denotiamo il valore di tale limite con il simbolo

∂ f ∂xi

(x0) oppure con fx_i(x0)

e lo chiamiamo derivata parziale di f rispetto ad xi calcolata in x0.

(Osserviamo che tei= (0, 0, .., t, .., 0, 0)).

Se y∈Rn_{, diciamo che f è derivabile in x}

0rispetto al vettore y se lim t→0+ f(x0+ty) − f(x0) t esiste finito.

In tal caso denotiamo il valore di tale limite con f0(x0, y).

E’ facile vedere che f è derivabile rispetto alla i-esima variabile se e solo se f0(x0, ei)ed f0(x0,−ei)esistono e

f0(xo, ei) = −f0(x0,−ei)

In tal caso si ha

f0(x0, ei) = −f0(x0,−ei) = fxi(x0).

Teorema 2.5 Sia f : A −→R, x0∈ A⊂Rn_{, A aperto e supponiamo che}

f sia differenziabile in x0; allora f è derivabile in x0lungo ogni direzione e si

ha

(24)

24

Se ne deduce in particolare, scegliendo y=eied y= −eiche f è derivabile

in x0rispetto ad xi e che

(∇f(x0))i = fxi(x0).

Dimostrazione. Dal momento che f è differenziabile,

|f(x0+h) −f(x0) − h∇f(x0), hi| khk =ω(h) con limh→0 ω(h) =0. Per h=ty con t>0 si ha |f(x0+ty) − f(x0) − h∇f(x0), tyi| =tkykω(ty) e f(x0+ty) −f(x0) t − h∇f(x0), yi = kykω(ty) Quindi f0(x0, y) = h∇f(x0), yi =d f(x0)(y).

Osserviamo che, se f è differenziabile in x0, allora si ha

f0(x0, y) = −f0(x0,−y) e pertanto lim t→0+ f(x0+ty) − f(x0) t = t→0lim− f(x0+ty) − f(x0) t 2 Teorema 2.6 Sia f : A −→ Rm_{, x} 0 ∈ A ⊂ Rn, A aperto e sia f = (f1, f2, ..., fm)con fj: A−→R, j=1, 2, ..., m.

Allora f è differenziabile in x0se e solo se fjè differenziabile in x0per ogni

j=1, 2, ..., m. Inoltre si ha ∇f(x0) =        ∇f1(x0) ∇f2(x0) · · · ∇fm(x0)       

Dimostrazione. Sia f differenziabile in x0ed indichiamo con

D1, D2, ..., Dm

le righe della matrice∇f(x0), ovviamente risulterà Dj∈Rned avremo

inoltre

(25)

25 Si avrà allora lim h→0 |fj(x0+h) −fj(x0) − hDj, hi| khk =0 e pertanto fj è differenziabile in x0e Dj = ∇fj(x0). Se viceversa si ha lim h→0 |fj(x0+h) − fj(x0) − h∇fj(x0), hi| khk =0, allora anche lim h→0 kf(x0+h) −f(x0) −Dhk khk =0

non appena si definisca

D=           ∇f1(x0) ∇f2(x0) · · · ∇fm(x0)           2 Dimostrazione.. Sia f differenziabile in x0ed indichiamo con

D1, D2, ..., Dm

le righe della matrice∇f(x0), ovviamente risulterà Dj∈Rned avremo

inoltre ∇f(x0)h= (hD1, hi,hD2, hi, ...,hDm, hi) Si avrà allora lim h→0 |fj(x0+h) −fj(x0) − hDj, hi| khk =0 e pertanto fj è differenziabile in x0e Dj = ∇fj(x0). Se viceversa si ha lim h→0 |fj(x0+h) − fj(x0) − h∇fj(x0), hi| khk =0, allora anche lim h→0 kf(x0+h) −f(x0) −Dhk khk =0

D=           ∇f1(x0) ∇f2(x0)C · · · ∇fm(x0)          

(26)

26

Osserviamo che si è con ciò dimostrato che

∇f(x0) =      f1x1(x0) f1x2(x0) . . . f1xn(x0) f2x1(x0) f2x2(x0) . . . f2xn(x0) . . . . fmx1(x0) fmx2(x0) . . . fmxn(x0)      2

Definizione 2.9 Sia f : A −→ Rp_{, A} _⊂ _Rn _×_Rm_{, A aperto, e sia}

(x0, y0) ∈A (con x0∈Rn, y0∈Rm).

Definiamo

φx(y) = f(x, y) per ogni f issato x,

e

ψy(x) = f(x, y) per ogni f issato y.

Chiamiamo differenziale parziale di f rispetto ad y in(x0, y0)

dyf(x0, y0) =dφx0(y0) e differenziale parziale di f rispetto ad x in(x0, y0)

dxf(x0, y0) =dψy0(x0)

Si ha dyf(x0, y0) ∈ L(Rm,Rp), mentre dxf(x0, y0) ∈ L(Rn,Rp) ed

in-dichiamo con∇yf(x0, y0)e∇xf(x0, y0)le matrici ad essi associate.

Osserviamo infine che, se f = (f1, .., fp), si ha

∇yf(x0, y0) = f1y1 (x0, y0) · · · f1ym(x0, y0) fpy₁(x0, y0) · · · fpym(x0, y0) ! ∇xf(x0, y0) = f1x1 (x0, y0) · · · f1xn(x0, y0) fpx1(x0, y0) · · · fpxn(x0, y0) ! e pertanto ∇f(x0, y0) = (∇xf(x0, y0),∇yf(x0, y0))

Osserviamo infine che∇yf(x0, y0)può essere bigettivo solo se m=

p.

Definizione 2.10 Sia f : A −→ Rp_{, A} _⊂ _Rn_×_Rm_{, A aperto, e sia}

(x0, y0) ∈A (con x0∈Rn, y0∈Rm).

Definiamo

φx(y) = f(x, y) per ogni f issato x,

e

(27)

27

Chiamiamo differenziale parziale di f rispetto ad y in(x0, y0)

dyf(x0, y0) =dφx0(y0) e differenziale parziale di f rispetto ad x in(x0, y0)

dxf(x0, y0) =dψy0(x0)

Si ha dyf(x0, y0) ∈ L(Rm,Rp), mentre dxf(x0, y0) ∈ L(Rn,Rp) ed

in-dichiamo con∇yf(x0, y0)e∇xf(x0, y0)le matrici ad essi associate.

Osserviamo infine che, se f = (f1, .., fp), si ha

∇yf(x0, y0) = f1y1(x0, y0) · · · f1ym(x0, y0) fpy1(x0, y0) · · · fpym(x0, y0) ! ∇xf(x0, y0) = f1x1 (x0, y0) · · · f1xn(x0, y0) fpx1(x0, y0) · · · fpxn(x0, y0) ! e pertanto ∇f(x0, y0) = (∇xf(x0, y0),∇yf(x0, y0))

Osserviamo infine che∇yf(x0, y0)può essere bigettivo solo se m=

p.

Corollario 2.2 Sia f : A −→ Rn_{, A} _⊂ _Rn_{, A aperto, e supponiamo che}

f sia invertibile nel suo rango: supponiamo cioè che esista una funzione g : R(f) −→A tale che

f(g(y)) =y ∀y∈R(f)

g(f(x)) =x ∀x ∈A allora, se f e g sono differenziabili, si ha

∇f(g(y))∇g(y) =I ∀y∈R(f)

∇g(f(x))∇f(x) =I ∀x∈ A essendo I la matrice identica.

**********************************************************************************************************

Teorema 2.7 -Derivazione delle Funzioni Composte - Sia f : A −→

Rm_{, A}_⊂_Rn_{, e sia g : B}_−→ _{A, B}_⊂_Rp_.

(28)

28

Siano x0∈ A, y0 ∈ B tali che g(y0) =x0, f e g siano differenziabili in

x0ed y0, rispettivamente.

Allora f(g(·))è differenziabile in y0e si ha

∇f(g(y0)) = ∇f(x0) · ∇g(y0) = ∇f(g(y0)) · ∇g(y0),

essendo il prodotto tra matrici inteso righe per colonne. Dimostrazione. Si ha f(x0+h) − f(x0) − ∇f(x0)h= khkω1(h)con lim h→0 ω1(h) =0 ed anche g(y0+k) −g(y0) − ∇g(y0)k= kkkω2(k)con lim k→0ω2(k) =0 Pertanto posto h(k) =g(y0+k) −g(y0) si ha lim k→0h(k) =0 e quindi f(g(y0+k)) −f(g(y0)) − ∇f(x0)∇g(y0)k kkk = = ∇f(x0)[g(y0+k) −g(y0) − ∇g(y0)k] + kh(k)kω1(h(k)) kkk = = ∇f(x0)ω2(k) + kh(k)kω1(h(k)) kkk −→0

dal momento che

kh(k)k ≤ kkk(ω2(k) +cost)

2 Esplicitiamo in caso semplice il teorema di derivazione delle fun-zioni composte con lo scopo di illustrarne l’uso.

Sia

f :R2→R , g :R27→R2

(x, y) 7→ f(x, y) , (t, s) 7→ (x(t, s), y(t, s))

e consideriamo la funzione

φ(t, s) = f(x(t, s), y(t, s)) = f(g(t, s))

Utilizzando il teorema possiamo affermare che

(29)

29 Ma ∇f(x, y) = fx(x, y), fy(x, y) , , ∇g(t, s) = xt (t, s) xs(t, s) yt(t, s) ys(t, s) ! per cui (φt(t, s), φs(t, s)) = fx(x, y), fy(x, y) xt(t, s) xs(t, s) yt(t, s) ys(t, s) ! = fx(x, y)xt+fy(x, y)yt, fx(x, y)xs+fy(x, y)ys Se f : A−→Rm_{, A}_⊂_Rn_{, A aperto, è differenziabile in A e se} definiamo φ(t) = f(x+th)

si ha che φ è derivabile per i valori di t tali che x+th ∈ A (cioè almeno in un intorno(−δ, δ)di 0) e si ha

φ0(t) = ∇f(x+th)h

Nel caso in cui f assuma valori reali si ha

φ0(t) = h∇f(x+th), hi

Il teorema di Lagrange applicato alla funzione ϕ appena introdotta permette di affermare che

Se f assume valori reali ed è differenziabile in A; allora, allora f(x+h) −f(x) = h∇f(x+τh), hi τ∈ (0, 1)

di conseguenza

|f(x+h) − f(x)| ≤ khk sup

t∈(0,1)

k∇f(x+th)k

Quando la funzione f assume valori inRm, m > 1, il precedente risultato può non essere vero.

Sia infatti f :R−→R2_{definita da f}₍_t_{) = (}_{cos t, sin t}₎_{; si ha}

(0, 0) = f(2π) − f(0) 6=2π(−sin t, cos t) =2π∇f(t) ∀t∈ (0, 2π)

Tenendo conto che se f assume valori inRm allora f = (f1, .., fm),

(30)

30

Se f : A−→Rm_{, A}_⊂_Rn_{, è differenziabile in A; allora,}

kf(x+h) −f(x)k ≤ khk sup

t∈(0,1)

k∇f(x+th)k0.

infatti poichè esiste ph∈Rm, di norma 1, tale che

kf(x+h) − f(x)k = hph, f(x+h) − f(x)i = = hph,∇f(x+τh)hi ≤ ≤ khk sup t∈(0,1) k∇f(x+th)k0 (2.1)

Poichè la definizione non è di immediata verifica, è utile avere con-dizioni sufficienti che assicurino la differenziabilità di una funzione.

Se f : A −→ R, A ⊂ Rn_{, A aperto, ammette derivate parziali}

prime continue in A (indicheremo questo dicendo che f ∈ C1_{); allora}

f è differenziabile in A.

Infatti: se ad esempio consideriamo il caso n =2, indichiamo con

(x, y) un punto di A e supponiamo che le derivate parziali prime fx

ed fysiano continue in A; avremo

f(x+h, y+k) − f(x, y) − fx(x, y)h−fy(x, y)k (h2₊_k2₎ = = f(x+h, y+k) −√f(x+h, y) + f(x+h, y) h2₊_k2 − −f(x, y) − fx(x, y)h−fy(x, y)k √ h2₊_k2 =

per il teorema di Lagrange applicato alle funzioni f(x+h,·)e f(·, y) = (fx(ξ, y) −fx(x, y))h+ (fy(x+h, η) −fy(x, y))k

(h2₊_k2₎

con|x−ξ| <h e|y−η| <k.

Pertanto, osservando che h h2₊_k2 ≤1 e k h2₊_k2 ≤1

per la continuità di fxed fyl’ultimo membro tende a 0 quando(h, k) →

(0, 0).

(31)

31

Teorema 2.8 Sia f : A −→ Rm_{, A} _⊂ _Rn_{, A aperto, e supponiamo che}

fj, j = 1, .., m, ammetta derivate parziali prime continue in A; allora f è

differenziabile in A. Dimostrazione. si ha f(x+h) − f(x) = n

∑

i=1 [f(x+ i

∑

j=1 hjej) − f(x+ i−1

∑

j=1 hjej)] = = n

∑

i=1 fxi(x+ i−1

∑

j=1 hjej+ξiei)hi con|ξi| <hi. 2

Se f : A −→ R, A⊂ Rn_{, A aperto, e chiamiamo derivata parziale}

seconda di f rispetto alle variabili xi ed xj, calcolata in x, e scriviamo

fxixj(x)la derivata rispetto a xjdella Funzione fxi, calcolata in x. Nel caso in cui n = 2 e le variabili in A si indichino con (x, y)

possiamo calcolare 4 derivate parziali seconde: fxx, fxy, fyx, fyy

Si può dimostrare che

Teorema 2.9 -Schwartz - Sia f : A −→ R, A ⊂ Rn_{, A aperto, e}

supponiamo che f sia parzialmente derivabile due volte in A e che almeno una tra fxye fyxsia continua; allora

fxy(x, y) = fyx(x, y)

Infatti se ad esempio supponiamo che fxysia continua, posto

ω(h, k) = f(x+h, y+k) − f(x+h, y) − f(x, y+k) + f(x, y) hk si ha fxy(x) =lim k→0 limh→0 ω(h, k) e fyx(x) =lim h→0 k→0lim ω(h, k)

Pertanto se proviamo, che lim

(h,k)→(0,0) ω(h, k)

esiste finito, avremo che lim

(32)

32

e l’uguaglianza delle due derivate seconde

Applicando il teorema di Lagrange alla funzione h7→ f(x+h, y+k) − f(x+h, y)

si ha

ω(h, k) = fx(x+ξ, y+k) − fx(x+ξ, y)

k , −h<ξ<h

ed applicando ancora Lagrange alla funzione k−→ fx(x+ξ, y+k) si ottiene ω(h, k) = fxy(x+ξ, y+η), −k<η<k Ora lim (h,k)→(0,0) (ξ, η) = (0, 0)

e pertanto, per la continuità di fxy

lim

(h,k)→(0,0) ω

(h, k) = fxy(x, y).

In generale possiamo enunciare il seguente teorema

Teorema 2.10 Sia f : A−→ Rm_{, A}_⊂_Rn_{, A aperto, e supponiamo che f}

sia parzialmente derivabile due volte in A; allora fxixj(x) = fxjxi(x)

per tutti gli x∈ A ove almeno una tra fxixj e fxjxi è continua.

Le derivate parziali di ordine superiore si definiscono in maniera del tutto simile.

Le derivate parziali seconde caratterizzano il gradiente della fun-zione∇f infatti, se f : A −→ R, A⊂ Rn_{, A aperto, è differenziabile}

in A, possiamo considerare la funzione

∇f : A−→Rn

Se ∇f è a sua volta differenziabile (ricordiamo che basta che le derivate parziali prime di ∇f siano continue), possiamo considerare

∇(∇f)(x)e si vede che ∇(∇f)(x) =    ∇fx₁(x) · · · ∇fxn(x)   =    fx₁x₁(x) · · · fx₁xn(x) · · · · fxnx1(x) · · · fxnxn(x)   

La matrice∇(∇f)(x) si indica solitamente con H f(x) e si chiama matrice Hessiana di f in x.

(33)

33

La funzione quadratica g(h) = hh, H f(x)hiviene di solito indicata con il nome di forma quadratica hessiana di f in x.

Qualora f ammetta derivate parziali seconde continue in A ( f ∈ C2₍_A₎_{), per il teorema di Schwarz, la matrice H f}₍_x₎_{è simmetrica.}

Per fissare le idee ricordiamo che nel caso di una funzione di due variabili a valori reali

H f(x, y) = ∇(∇f)(x, y) = ∇fx(x, y) ∇fy(x, y) ! = fxx(x, y) fxy(x, y) fyx(x, y) fyy(x, y) !

2.4 Formula di Taylor

Consideriamo una funzione f : A −→ R, A ⊂ Rn_{, A aperto,}

x0 ∈ A, e sia h ∈ S(0, r) dove r > 0 è scelto in modo che x0+

S(0, r) ⊂A.

Definiamo φ :(−1, 1) −→R mediante la

ϕ(t) = f(x0+th)

se supponiamo f ∈ Ck_{(cioè se è derivabile k volte in A), avremo che}

ϕè derivabile k volte in(−1, 1)e si ha ϕ0(t) =d f(x0+th)h= hh,∇f(x0+th)i ϕ00(t) = d dt n

∑

i=1 hifxi(x0+th) = = n

∑

i=1 hih∇fxi(x0+th), hi = hh, H f(x0+th)hi

Possiamo pertanto ottenere una formula di Taylor anche per funzioni di più variabili, sviluppando la funzione ϕ. Ci limitiamo al secondo ordine in quanto è l’unico di cui abbiamo necessità ed in ogni caso è l’ultimo che possa essere enunciato senza eccessive difficoltà formali.

Teorema 2.11 Se f : A−→R, A⊂Rn_{, A aperto, x}_∈ _{A e se f} _{∈ C}2₍_A₎_,

(e quindi è differenziabile due volte). Allora per h abbastanza piccolo si ha •

f(x+h) = f(x) + hh,∇f(x)i + hh, H f(x+ξ h)hi/2, ξ ∈ (0, 1)

(34)

34

•

f(x+h) = f(x) + hh,∇f(x)i + hh, H f(x)hi/2+ khk2

ω(h)

con limh→0ω(h) =0 e ω(0) =0

(formula di Taylor con resto di Peano). Dimostrazione.

Applicando a ϕ la formula di McLaurin otteniamo

φ(1) =φ(0) +φ0(0) +φ00(ξ)/2 0<ξ<1

da cui tenuto conto che

φ0(t) = hh,∇f(x+th)i φ00(t) = hh, H f(x+th)hi

si ricava la prima affermazione Inoltre

f(x+h) = f(x) + h∇f(x), hi + hh, H f(x)hi/2+ khk2

ω(h)

ω(h) = hh,(H f(x+ξhh) −H f(x))hi

2khk2

dove limh→0 ω(h) =0 in quanto H f è continuo e

|ω(h)| ≤ kH f(x+ξhh) −H f(x)k/2, kξhhk ≤ khk.

2

2.5 Massimi e Minimi Relativi

Definizione 2.11 Diciamo che x è un punto di minimo (massimo) relativo

per f se esiste una sfera S(x, r), r>0, tale che

f(y) ≥ f(x) ( f(y) ≤ f(x) ) ∀y∈S(x, r) ∩A

Teorema 2.12 Se x è un punto di minimo (massimo) relativo per f interno

al suo dominio, allora

• se f è differenziabile in x si ha∇f(x) =0;

• se f ammette derivate seconde continue in x, H f(x)è semidefinita positiva (negativa).

(35)

35

Dimostrazione. Basta osservare che ϕ(t) = f(x+th)ammette un punto di minimo relativo in 0 e che∀h∈S(0, r)

0=φ0(0) = h∇f(x), hi

ed anche

0≤φ”(0) = hh, H f(x)hi

La prima condizione assicura che∇f(x) =0, mentre la seconda è,

per definizione, la semidefinitezza di H f(x). 2

Se∇f(x) =0 e H f(x)è una forma quadratica non definita, allora x non è né punto di massimo relativo, né punto di minimo relativo per f ; un punto siffatto viene solitamente indicato con il nome di ’punto sella’.

Teorema 2.13 Se f ∈ C2₍_A₎_,

• ∇f(x) =0

• H f(x)è definita positiva (negativa)

allora x è punto di minimo (massimo) relativo per f . Dimostrazione. Si ha f(x+h) − f(x) = hh, H f(x)hi/2+ khk2 ω(h) con limh→0ω(h) =0=ω(0). Se ne deduce che f(x+h) − f(x) khk2 = 1 2 h khk, H f(x) h khk +ω(h) ≥ ≥min 1 2hu, H f(x)ui : kuk =1 +ω(h) = M 2 +ω(h) dove M=min{hu, H f(x)ui:kuk =1} = hu0, H f(x)u0i >0 in quantoku0k =1

(Il minimo esiste per il teorema di Weierstraßed M>0 perché Hf(x) è definita positiva e u06=0.)

Pertanto, per il teorema della permanenza del segno, si può scegliere

ρ>0 in modo che, se h∈S(0, ρ), si abbia

f(x+h) −f(x) khk2 >0

(36)

36

2.6 Convessità

Definizione 2.12 Sia f : A −→ R, A ⊂ Rn _{convesso; diciamo che f è}

convessa se

f(λx+ (1−λ)y) ≤λ f(x) + (1−λ)f(y) ∀x, y∈A, ∀λ∈ (0, 1)

Inoltre f si dice strettamente convessa se vale la disuguaglianza stretta. possiamo dimostrare che

• Se f è convessa su un aperto A, f0(x, y)esiste∀x∈ A,∀y∈Rn_.

• se f ∈ C2₍_A₎_{, allora sono fatti equivalenti:} – f è convessa

f(y) ≥ f(x) + h∇f(x), y−xi ∀x, y∈ A

– H f(x)è semidefinita positiva.

• le seguenti condizioni sono ciascuna sufficiente per la succes-siva:

– H f(x)è definita positiva∀x ∈A;

– f(y) > f(x) + h∇f(x), y−xi ∀x, y∈A, y6= x ;

– f è strettamente convessa.

2.7 Convessità

Osservazione. Si può provare, come per le funzioni di una variabile, che f è convessa in A se e solo se

f( k

∑

i=1 λixi) ≤ k

∑

i=1 λif(xi) ∀xi∈ A, λi∈ (0, 1),∑ki=1 λi=1 2 Teorema 2.14 Sia f : A−→R, A⊂Rn_{convesso, allora L}−

α è un insieme

convesso per ogni α∈R.

Dimostrazione. Se f(x) ≤αe f(y) ≤α, allora

f(λx+ (1−λ)y) ≤λ f(x) + (1−λ)f(y) ≤α.

(37)

37

Osserviamo che la convessità di L−_α non è sufficiente per la conves-sità di f , come f(x) =lnx dimostra.

Osserviamo anche che, posto

{v1, v2, .., v2n} = {e1, .., en,−e1, ..,−en} si ha B(x, r) = {y∈Rn:ky−xk1≤r} = = {y∈Rn_{: y}₌

∑

2n i=1 λi(x+rvi), 2n

∑

i=1 λi =1, λi≥0}

Sia infattiky−xk₁≤r, allora y−x= n

∑

i=1 (y−x)_iei e y=x+ n

∑

i=1 |(y−x)_i|sgn[(y−x)_i]ei = 2n

∑

i=1 λi(x+rvi)

Qualora a = ∑2n_i=1λi < 1 è sufficiente sommare be1+b(−e1)

es-sendo b= (1−a)/2. Viceversak∑2n

i=1λirvik ≤∑2ni=1rλi =r.

Teorema 2.15 Sia f : A −→ R, A ⊂ Rn _{convesso e aperto, e sia f}

con-vessa; allora

f è continua in A

f0(x, y)esiste∀x ∈A,∀y∈Rn_.

Dimostrazione. Sia x∈A e proviamo che f è continua in x.

Dal momento che A è aperto, A ⊃ B(x, r) con r > 0, e se y ∈

B(x, r), y=x+th,khk₁=r, t∈ (0, 1] f(y) = f( 2n

∑

i=1 λi(x+rvi)) ≤ 2n

∑

(38)

38

Per quanto riguarda il secondo punto è sufficiente osservare che, se t∈ (−1, 1), si può definire∀y∈Rn

φ(t) = f(x+ty)

e si può applicare il teorema 13.4 a φ. 2

Teorema 2.16 Sia f : A −→ R, A ⊂ Rn _{convesso, aperto; supponiamo}

inoltre f ∈ C2₍_A₎_{, allora f è convessa se e solo se}

f(y) ≥ f(x) + h∇f(x), y−xi ∀x, y∈ A se e solo se H f(x)è semidefinita positiva.

Dimostrazione. f è convessa se e solo se φvz :[0, 1] −→R definita da

φvz(t) = f(v+t(z−v))

è convessa∀z, v∈ A, e questo, per il teorema 13.10, è vero se e solo se

φvz(t) ≥φvz(s) +φ0_vz(s)(t−s) ∀t, s∈ [0, 1], ∀z, v∈ A cioè se e solo se f(v+t(z−v)) ≥ f(v+s(z−v)) + h∇f(v+s(z−v)), z−vi(t−s) ∀t, s∈ [0, 1], ∀z, v∈A se e solo se f(y) ≥ f(x) + h∇f(x), y−xi ∀x, y∈A

Inoltre φvz è convessa se e solo se φ”vz(t) ≥0∀t∈ (0, 1), corollario

13.9, e pertanto se e solo se

hh, H f(x)hi ≥0 ∀h∈Rn, ∀x ∈A.

2

Teorema 2.17 Sia f : A −→ R, A ⊂ Rn _{aperto e convesso, f} _{∈ C}2₍_A₎_;

allora le seguenti condizioni sono ciascuna sufficiente per la successiva: • H f(x)è definita positiva∀x∈A;

• f(y) > f(x) + h∇f(x), y−xi ∀x, y∈ A, y6=x ; • f è strettamente convessa.

Dimostrazione. 1) ⇒2). Si ha

(39)

39

2) ⇒3). Si ha

f(y) > f(λx+ (1−λ)y) + h∇f(λx+ (1−λ)y), λ(y−x)i

f(x) > f(λx+ (1−λ)y) + h∇f(λx+ (1−λ)y),−(1−λ)(y−x)i

moltiplicando la prima per(1−λ), la seconda per λ e sommando, si

ha

λ f(x) + (1−λ)f(y) > f(λx+ (1−λ)y).

2

Teorema 2.18 Sia f : Rn −→ R, strettamente convessa e supponiamo che

f(x) → +∞ se x→∞ ; allora esiste uno ed un solo punto x∈Rn_{tale che}

f(x) =min{f(y) : y∈Rn_}_.

Dimostrazione. L’esistenza di x discende dai teoremi 25.39 e 25.13; se esistesse z con le stesse caratteristiche di x, si avrebbe

f(x) =λ f(x) + (1−λ)f(z) > f(λx+ (1−λ)z) ∀λ∈ (0, 1)

e ciò è assurdo. 2

Corollario 2.3 Sia f :Rn −→R, f ∈ C2₍_Rn₎_{, e supponiamo che}

hh, H f(x)hi ≥mkhk2 _∀_h_∈_Rn_{, m}_>₀

Allora f è strettamente convessa e limx→∞ f(x) = +∞.

Dimostrazione. H f è evidentemente definita positiva ed inoltre f(x) = f(0) + h∇f(0), xi + hx, H f(ξ)xi/2≥

≥ f(0) − k∇f(0)kkxk +mkxk2/2.

2

Teorema 2.19 Sia f :Rn −→ R, f ∈ C2₍_Rn₎_{e supponiamo che esistano}

m, M>0 tali che

mkhk2_{≤ h}_{h, H f}₍_x₎_h_{i ≤}_M_k_h_k2 _∀_{h, x}_∈_Rn

Allora f ammette un unico punto x di minimo assoluto e, definita la succes-sione xkmediante le x0∈Rn, xk+1=xk−α∇f(xk), 0<α< 2 M, si ha kxk−xk ≤ckkx0−xk ove c=max{|1−αm|,|1−αM|} <1. Ne segue che xk→x.

(40)

40

Dimostrazione. L’esistenza e l’unicità di x seguono dal corollario 25.43, e si ha∇f(x) =0; pertanto

kxk+1−xk2= hxk+1−x, xk+1−xi =

= hxk−x−α(∇f(xk) − ∇f(x)), xk+1−xi =

= h(I−αH f(ξ))(xk−x), xk+1−xi

con ξ opportuno, non appena si applichi il teorema di Lagrange alla funzione g(s) = hs−α∇f(s), xk+1−xi e si ricordi che ∇g(s)(xk−x) = h(I−αH f(s))(xk−x), xk+1−xi Quindi kxk+1−xk2≤ k(I−αH f(ξ))(xk−x)kkxk+1−xk e kxk+1−xk ≤ k(I−αH f(ξ))(xk−x)k ≤ kI−αH f(ξ)k0kxk−xk

Dalle condizioni imposte su H f si ottiene allora che

(1−αM) ≤ h(I−αH f(ξ)) h khk, h khki ≤ (1−αm) Ne viene kI−αH f(ξ)k0≤c e kxk+1−xk ≤ckxk−xk

da cui si può concludere. 2

Osserviamo che il precedente teorema assicura che xk → x e ne

valuta la velocità di convergenza che è maggiore quanto più è piccolo c.

A tale proposito si può vedere che

min0<α<2/M max{|1−αm|,|1−αM|} = M−m

M+m e si ottiene per α=2/(M+m).

Teorema 2.20 Sia f : R2 −→ R, f ∈ C1₍_R2₎_{, strettamente convessa, e}

supponiamo che

lim

(x,y)→∞ f(x, y) = +∞

allora, se definiamo una successione(xk, yk)mediante le

(41)

41

xk+1 tale che f(xk+1, yk) =min{f(x, yk) : x∈R}

yk+1 tale che f(xk+1, yk+1) =min{f(xk+1, y) : y∈R},

si ha che(xk, yk)converge all’unico punto (x,y) di minimo assoluto per f .

Dimostrazione. L’esistenza di(xk+1, yk+1)segue dalla continuità di

f e dal fatto che f(x, y) −→ +∞ per(x, y) →∞.

Si ha inoltre

(25.1) f(xk+1, yk+1) ≤ f(xk+1, yk) ≤ f(xk, yk)

e

fx(xk+1, yk) = fy(xk, yk) =0

Si ha pertanto che f(xk, yk) è una successione decrescente e ne

segue:

f(xk, yk) ≤ f(x0, y0)

f(xk, yk) →λ

f(xk+1, yk) →λ

Dal momento che f → +∞ si deduce che (xk, yk) è limitata e si

può pertanto affermare che ogni sua estratta ha una estratta (xk0, yk0)

soddisfacente le seguenti condizioni

xk0 →x, x_k0₊₁→ξ, yk0→y.

Per la (25.1) e per la continuità di f e delle sue derivate parziali si ha

f(ξ, y) =lim f(xk0₊₁, y_k0) =lim f(x_k0, y_k0) = f(x, y)

fx(ξ, y) =0= fy(x, y)

Pertanto, per la stretta convessità di f, ξ è l’unico punto di minimo di f(˙,y)e ne segue ξ =x.

Quindi ∇f(x, y) =0; dal momento che f è strettamente convessa,

(x, y) è l’unico punto di minimo di f , e per il teorema 6.10 l’intera

successione(xk, yk)converge ad(x, y). 2

Vogliamo ora tentare di dare una stima della velocità di convergenza dei metodi di minimizzazione numerica che abbiamo presentato.

Definizione 2.13 Sia f : A→R e sia a⊂Rn_{un aperto, sia M}

f ⊂A un

insieme, definito mediante la funzione f , che si vuole raggiungere.

Diciamo che F : A→ P (A)(l’insieme delle parti di A) è una funzione di discesa verso Mf se

(1) x /∈ Mf , y∈F(x) ⇒ f(y) < f(x)

Diciamo inoltre che F è una funzione di discesa chiusa se

(42)

42

Teorema 2.21 Sia f : A → R e sia a ⊂ Rn _{f : A} _→ _{R un aperto e sia}

f continua in A. sia F una funzione di discesa verso Mf e consideriamo la

successione xkdefinita da

(3) x0∈A xk+1 ∈F(xk)

Supponiamo inoltre che xk ∈ K ⊂ A, ove K è un sottoinsieme compatto;

allora una delle seguenti condizioni è verificata:

1. xk∈ Mf per qualche k∈N

2. per ogni sottosuccessione xk_h of xk, xk_h →ξ, si ha ξ∈ Mf.

Dimostrazione. Dimostriamo che se 1) è falsa allora 2) è verificata. Poichè xk ∈K, che è compatto, possiamo supporre che

(xk_h, xk_h+1) → (ξ, η)

inoltre, poichè xk6∈Mf, f(xk)è strettamente decrescente e si ha

λ=inf{f(xk)} =lim f(xk)

ne deduciamo che, per la continuità di f ,

λ=lim f(xk_h) =lim f(xk_h+1) = f(ξ) = f(η)

Ciò dimostra che ξ∈Mf. Infatti se non fosse così dovremmo avere,

poichè xkh+1∈ F(xkh)ed F è una funzione di discesa chiusa,

η∈F(ξ) e f(η) < f(ξ)

il che non è possibile. 2

Corollario 2.4 Sia f : A→R e sia a⊂Rn_{un aperto, sia f una funzione}

continua e supponiamo che esista L∈R tale che {x∈ A : f(x) ≤L} =SL

sia un insieme limitato.

Allora SL è compatto e se xk è una successione definita come in (3) da

x0∈SL, si ha xk∈SL.

Quando A=Rne

lim

x→∞f(x) = +∞

allora esiste almeno un L ∈ R tale che {x ∈ A : f(x) ≤ L} = SL is un

insieme limitato.

Teorema 2.22 sia f : A →R e sia a ⊂ Rn _{un aperto , sia f} _∈ _C1₍_A₎_e

supponiamo che esista L ∈ R tale che {x ∈ A : f(x) ≤ L} = SL sia un

insieme limitato. Definiamo

(43)

43

e una funzione di discesa verso M−f F mediante la F(x) =x+α0

∇f(x) k∇f(x)k

essendo α0scelto in modo che

f x+α0 ∇f(x) k∇f(x)k =min f x+α ∇f(x) k∇f(x)k : α∈R . allora F è una funzione di discesa chiusa.

Dimostrazione. Osserviamo innanzi tutto che se y∈F(x)si ha f(y) = f(F(x)) ≤ f(x)

Inoltre se fosse f(y) = f(x), t =0 sarebbe argomento di minimo per f(x+t∇f(x)/k∇f(x)k)e avremmo 0= d dαf x+α ∇f(x) k∇f(x)k α=0 = = ∇f x+α ∇f(x) k∇f(x)k , ∇f(x) k∇f(x)k α=0 perciò∇f(x) =0 e x∈ Mf. Inoltre se (xk, yk) → (ξ, η), yk ∈ F(xk) e ξ /∈ Mf si ha∇f(xk) → ∇f(ξ),∇f(ξ) 6=0 yk=xk+αk ∇f(xk) k∇f(xk)k e M≥ kyk−xkk = |αk|

perciò possiamo supporre che αn →¯α a meno di considerare una

sot-tosuccessione che chiameremo ancora αn.

Per la continuità η=ξ+¯α ∇f(ξ) k∇f(ξ)k inoltre, poichè f xk+αk ∇f(xk) k∇f(xk)k ≤ f xk+α ∇f(xk) k∇f(xk)k ∀α∈R si ha f ξ+¯α ∇f(ξ) k∇f(ξ)k ≤ f ξ+α ∇f(ξ) k∇f(ξ)k ∀α∈R e η∈ F(ξ). 2

(44)

44

Teorema 2.23 Sia f : A→R e sia a⊂Rn _{un aperto , supponiamo che f}

ammetta derivate parziali prime in A e supponiamo che esista L∈R tale che

{x∈ A : f(x) ≤L} =SLsia un insieme limitato.

Definiamo

Mf = {x ∈A : fxi(x) =0 ∀i=1 . . . n} e una funzione di discesa verso Mf mediante la

F(x) =x+

n

∑

i=1

αiei

ove αisono scelti in modo che

f(x+α1e1) ≤ f(x+αe1) ∀α∈R f(x+α1e1+α2e2) ≤ f(x+α1e1+αe2) ∀α∈R . . . . f x+ n−1

∑

i=1 αiei+αnen ! ≤ f x+ n−1

∑

i=1 αiei+αen ! ∀α∈R

allora F è una funzione di discesa chiusa.

Dimostrazione. Osserviamo innanzi tutto che se y∈F(x)si ha f(y) ≤ f(F(x)) ≤ f(x)

e che per f(y) = f(x)deve essere

fxi(x) =0 ∀i=1 . . . n e ∀x∈Mf Inoltre se scegliamo (xk, yk) → (ξ, η) yk ∈F(xk) , ξ∈/ Mf; allora yk =xk+ n

∑

i=1 αk_iei e, poichè f xk+ j

∑

i=1 αk_iei ! ≤L,

possiamo supporre che αk_i →αi, a meno di passare ad una estratta.

Ora, se ricordiamo che

f xk+ j

∑

i=1 αk_iei ! ≤ ≤ f xk+ j−1

∑

i=1 α_ikei+αej ! ∀α∈R ∀j

(45)

45

e passiamo al limite, la continuità assicura che

f ξ+ j

∑

i=1 αiei ! ≤ ≤ f ξ+ j−1

∑

i=1 αiei+αej ! ∀α∈R ∀j e η∈ F(ξ). 2

Cerchiamo ora di valutare la velocità di convergenza del metodo del gradiente e del metodo di discesa componente per componente.

Lemma 2.1 sia f : A→R e sia a⊂Rn _{un aperto, sia inoltre f} _∈_C2₍_A₎_.

Supponiamo che 0<mkhk2≤ hH f(x)h, hi ≤Mkhk2. Allora si ha m≤ fxixi(x) ≤M e |fxixj(x)| ≤ M−m 2 . Inoltre, se∇f(a) =0 si ha mkhk2≤ h∇f(a+h), hi ≤Mkhk2 e m 2khk 2_≤ _f₍_a₊_h_{) −} _f₍_a_{) ≤} M 2 khk 2_.

Dimostrazione. Se scegliamo h = ei ed usiamo le ipotesi, possiamo

ottenere

m≤ fxixi(x) ≤M, inoltre poichè H f(x)è simmetrica si ha

hH f(x)h, ki =1 4(hH f(x)(h+k),(h+k)i − hH f(x)(h−k),(h−k)i) ≤ ≤ 1 4 Mkh+kk2−mkh−kk2 e se poniamo h=ei, k=ej fxi xj (x) ≤ 1 4(2M−2m) =M−m2. In maniera del tutto simile si ottiene

fxixj(x) ≥

m−M

2 .

Quando∇f(a) =0, se consideriamo

(46)

46 si ha ϕ(1) −ϕ(0) =ϕ0(τ) τ∈ [0, 1] h∇f(a+h), hi = hH f(a+τk)h, hi τ∈ [0, 1] e mkhk2≤ h∇f(a+h), hi ≤Mkhk2 mentre se consideriamo ϕ(t) = f(a+th) t∈ [0, 1] si ha ϕ(1) −ϕ(0) −ϕ0(0) = ϕ 00₍ σ) 2 σ∈ [0, 1] f(a+h) − f(a) = hH f(a+σh)h, hi 2 σ∈ [0, 1] e m 2khk 2_≤ _f₍_a₊_h_{) −} _f₍_a_{) ≤} M 2 khk 2 2

Lemma 2.2 Sia f : A →R, sia a ⊂ Rn _{un aperto e sia f} _∈ _C2₍_A₎_{. Sia}

inoltre a∈ A e h∈Rn_.

Definiamo ϕ(t) = f(a+th)e sia T∈R tale che

ϕ(T) = m

2M2in{ϕ(t): t∈R a+th∈ A}

allora possiamo trovare τ, σ∈ [−T, T]tale che T= −ϕ 0₍₀₎ ϕ00(τ) = − h∇f(a), hi hH f(a+τh)h, hi, e ϕ(0) −ϕ(T) = f(a) − f(a+Th) = ϕ 00₍ σ) 2 T 2₌ = 1 2 hH f(a+σh)h, hi hH f(a+τh)h, hi2(h∇f(a), hi) 2 Dimostrazione. Si ha ϕ0(0) =ϕ0(0) −ϕ0(T) = −ϕ00(τ)T τ∈ [−T, T] e T= −ϕ 0₍₀₎ ϕ00(τ) τ∈ [−T, T] Inoltre