1. Spazi Euclidei N-Dimensionali.
Per lo studio delle funzioni di più variabili reali occorre aver presenti alcune proprietà degli spazi euclidei ad n dimensioni.
È inoltre indispensabile conoscere qualche proprietà delle appli-cazioni lineari inRne delle forme bilineari e quadratiche.
1.1
Norma e Prodotto scalare
Definizione 1.1 Indichiamo conRn lo spazio vettoriale costituito dalle n−
ple ordinate di numeri reali; in altre parole x∈Rn ⇔ x = (x
1, x2, ...., xn)con xk∈R.
InRn si definiscono le operazioni di somma e di prodotto per uno scalare mediante le
x+y= (x1+y1, x2+y2, ...., xn+yn) , x, y∈Rn
e
αx= (αx1, αx2, ...., αxn) , α∈R , x∈Rn.
L’insieme dei vettori
e1= (1, 0, 0, ...., 0)
e2= (0, 1, 0, ...., 0)
. . . . en = (0, 0, 0, ...., 1)
costituisce una base diRn; si avrà pertanto che, se x∈Rn
x=
n
∑
i=1
xiei.
Definizione 1.2 Si definisce norma inRnuna funzione che si indica con
k · k:Rn →R
2
1. kxk ≥0 ∀x∈Rn
2. kxk =0 ⇔ x=0
3. kαxk = |α|kxk ∀α∈R , ∀x ∈Rn 4. kx+yk ≤ kxk + kyk ∀x, y∈Rn.
Definizione 1.3 Si definisce prodotto scalare inRnuna funzione
h·,·i:Rn×Rn−→R tale che 1. hx, xi ≥0 ∀x ∈Rn 2. hx, yi = hy, xi ∀x, y∈Rn 3. hx, xi =0 ⇔ x=0 4. hαx+βy, zi =αhx, zi +βhy, zi ∀x, y, z∈Rn , ∀α, β∈R.
Come nel caso del valore assoluto per i numeri reali, si ha
|kxk − kyk| ≤ kx−yk
Lemma 1.1 Siano x, y∈Rn, allora se 1/p+1/q=1 , p, q≥1 ,
|
∑
xiyi| ≤∑
|xi||yi| ≤ (∑
|xi|p)1/p (∑
|yi|q)1/q(Disuguaglianza di Schwarz-Holder)
(
∑
|xi+yi|p)1/p ≤ (∑
|xi|p)1/p+ (∑
|yi|p)1/p(Disuguaglianza di Minkowski). Dimostrazione. Intanto è ovvio che
|
∑
xiyi| ≤∑
|xi||yi|.Dal momento che la funzione ξ→ξpè convessa su ¯R+, si ha
∑ λiξi ∑ λi p ≤ ∑ λiξ p i ∑ λi ∀λi ≥0 , ∀ξi ≥0 e
∑
λiξi ≤ (∑
λi)(p−1)/p (∑
λiξip)1/p. Ora, posto λi= |yi|p/(p−1) e λiξip= |xi|p ,3 si ha (λiξi)p=λip−1λiξip = |xi|p|yi|p e λiξi= |xi||yi|. Da cui
∑
|xi||yi| ≤ (∑
|xi|p)1/p (∑
|yi|p/(p−1))(p−1)/pe si può concludere la disuguaglianza di Holder tenendo conto che p/(p−1) = q . Per quanto riguarda la disuguaglianza di Minkowski si ha
∑
|xi+yi|p=∑
|xi+yi||xi+yi|p−1 ≤≤
∑
|xi||xi+yi|p−1 +∑
|yi||xi+yi|p−1.Applicando la disuguaglianza di Holder ad entrambi gli addendi dell’ultimo membro si ha
∑
|xi+yi|p≤ [(∑
|xi|p)1/p+ (∑
|yi|p)1/p](∑
|xi+yi|(p−1)q)1/qe tenendo conto che(p−1)q= p si ha
(
∑
|xi+yi|p)1−1/q ≤ (∑
|xi|p)1/p + (∑
|yi|p)1/p.Si conclude tenendo conto che 1−1/q=1/p . 2
La disuguaglianza di Holder si riduce alla più nota disuguaglianza di Schwarz per p=q=2.
Per p = q = 2 la disuguaglianza di Schwarz può essere riscritta come
|hx, yi| ≤ kxkkyk
e può essere dedotta osservando che,∀t∈R
0≤ kx+tyk2= hx+ty, x+tyi =t2kyk2+2thx, yi + kxk2
Ciò implica infatti
hx, yi2− kxk2kyk2 ≤0
La corrispondente disuguaglianza triangolare segue da
kx+yk2= kxk2+ kyk2+2hx, yi ≤ kxk2+ kyk2+2kxkkyk
Osserviamo che
|hx, yi| = kxkkyk
4
Pertanto
kxk =sup{hx, yi:kyk ≤1} =max{|hx, yi|:kyk ≤1}. Sono esempi di norme inRnle seguenti
kxkp= ( n
∑
k=1 |xi|p)1/p p≥1 kxk∞=max{|xi| : i=1, .., n}.Mentre un esempio di prodotto scalare è dato da
hx, yi = ( n
∑
k=1 xiyi Ovviamente si hahx, xi = kxk2 2.InRn useremo abitualmente lak · k2che è detta norma euclidea in
quantokxk2coincide con la distanza euclidea del vettore x dall’origine.
Nel seguito faremo riferimento, a meno di espliciti avvisi contrari, a tale norma e scriveremok · kin luogo dik · k2.
Osserviamo altresì che il prodotto scalare sopra definito, pur non essendo l’unico possibile, sarà l’unico da noi considerato.
Si vede subito che
hP1, P2i = |P1||P2|cos(θ2−θ1)
Infatti, facendo riferimento adR2e alla figura 1.1, si ha
Figure 1.1:
hP1, P2i =
=x1x2+y1y2= |P1||P2|cos(θ2)cos(θ1) + |P1||P2|sin(θ2)sin(θ1) =
= |P1||P2|cos(θ2−θ1)
L’osservazione appena fatta giustifica il fatto che
Diciamo che due vettori x, y∈Rnsono ortogonali sehx, yi =0.
Diciamo che sono paralleli se esiste λ∈ R tale che x= λy. Se
x ed y sono parallelihx, yi = kxkkyk
Sek · ka ek · kb sono due norme inRn si dice che sono equivalenti
se esistono due costanti reali H e K tali che Hkxkb ≤ kxka ≤ Kkxkb.
Si può dimostrare che
5
Dimostrazione. Siak · kauna norma inRn; si ha
kxka= k n
∑
i=1 xieika ≤ n∑
i=1 |xi|keika ≤ Kkxk1 essendo K=max{keika}.Quindi la funzionek · kaè continua e, dal momento che
{x∈Rn : kxk1=1}
è compatto è lecito considerare
H=min{kxka : kxk1=1}; si ha H>0 e kxka kxk1 = x kxk1 a ≥H. Pertanto, per ogni x∈Rn si ha
Hkxk1≤ kxka≤Kkxk1
e tutte le norme inRnsono equivalenti. 2
È anche interessante osservare che
Lemma 1.2 La funzione p−→ kxkpè decrescente∀x∈Rne si ha
kxk∞=lim
p kxkp=inf{kxkp : p≥1} ;
inoltre
(24.1) kxk∞≤ kxkp≤ kxk1≤nkxk∞≤nkxkq ≤nkxk1 ∀p, q≥1
e pertanto le normek · kpsono tutte equivalenti.
Dimostrazione. Per provare che p−→ kxkpè decrescente sarà
suffi-ciente provare che
d dp kxkp ≤ 0. Si ha kxkp= (
∑
|xi|p)1/p e pertanto d dp kxkp= kxkp − 1 p2 ln∑
|xi| p+1 p ∑|xi|pln|xi| ∑|xi|p = = kxkp p2∑|x i|p p∑
|xi|pln|xi| −∑
|xi|pln∑
|xi|p .6 Ora
∑
|xi|pln|xi|p −∑
|xi|pln∑
|xi|p ≤ 0 in quanto ln|xi|p≤ln∑|xi|p. Inoltre si ha kxk∞≤ kxkp≤ (nkxk∞p)1/p =n1/pkxk∞ e d’altra parte lim p n 1/p =lim p e (ln n)/p=1.La (24.1) è immediata conseguenza di quanto visto. 2
Le notazioni vettoriali introdotte consentono di esprimere facilmente condizioni che individuano rette piani e sfere.
Possiamo individuare i punti di una retta che passa per il punto
(x0, y0, z0) ed è parallela alla direzione (a, b, c) semplicemente
som-mando(x, y, z)con il vettore t(a, b, c)al variare di t∈R.
Otterremo in tal caso che
(x, y, z) = (x0, y0, z0) +t(a, b, c)
che scritta componente per componente x=x0+ta y=y0+tb z=z0+tc
fornisce le equazioni parametriche della retta.
Se t∈ R+ avremo una delle due semirette in cui(x0, y0, z0)divide
la retta intera, mentre se t ∈ [a, b] ci limitiamo ad un segmento della retta stessa.
Un piano passante per l’origine può essere individuato dai vettori perpendicolari ad un vettore assegnato; l’equazione del piano si potrà quindi scrivere come
h(x, y, z),(a, b, c)i =0
mentre il piano parallelo che passa per(x0, y0, z0)è dato da
h(x−x0, y−y0, z−z0),(a, b, c)i =0
come abbiamo già visto una sfera può essere individuata come l’insieme dei punti che hanno distanza dal centro (x0, y0, z0) minore
del raggio R;
Una sfera sarà pertanto individuata dalla condizione
7
1.2
Applicazioni Lineari
Definizione 1.4 Si chiama applicazione lineare una funzione
f :Rn →Rm
tale che
f(αx+βy) =α f(x) +β f(y) ∀x, y∈Rn, ∀α, β∈R
L(Rn,Rm)è l’insieme delle applicazioni lineari suRna valori inRm.L(Rn,R)
si chiama anche spazio duale diRn.
Gli elementi diL(Rn,Rm)possono essere messi in corrispondenza
biunivoca con le matrici aventi m righe ed n colonne,Mm×n.
Più precisamente L(Rn,Rm) ed Mm×n sono isomorfi in quanto
ogni applicazione lineare f può essere scritta nella forma f(x) =Ax con A∈ Mm×n.
e d’altro canto f(x) =Ax è lineare. In particolare
Le applicazioni lineari daRninR sono tutte e sole quelle della forma
f(x) = hx∗, xi con x∗∈Rn.
Definizione 1.5 Se f ∈ L(Rn,Rm)definiamo norma di f , e la indichiamo
conkfk0, la seguente
kfk0=sup{kf(x)k : kxk ≤1}.
In virtù del teorema 24.7 possiamo identificare f con la matrice A per
la quale risulta f(x) =Ax .
Pertanto possiamo anche definire
kAk0=sup{kAxk : kxk ≤1}.
D’altro canto A ∈ Mm×n e può essere identificato come un
ele-mento diRm×n. Si può pertanto definire
kAkp= (
∑
ij|aij|p)1/p p≥1
e
kAk∞=max{|aij| : i=1, .., m , j=1, .., n}
8
Osserviamo subito che
kAk0≤ kAk2= kAk
la disuguaglianza essendo stretta ad esempio se A=I . Infatti, se denotiamo con Ai le righe della matrice A,
kAxk2=
∑
i hAi, xi2≤∑
i kAik2kxk2= kAk2kxk2. Teorema 1.2 Se A∈ Mm×nsi ha kAxk ≤ kAk0kxk ≤ kAkkxk. Dimostrazione. Dalla definizione 24.9 si ottienekAx/kxkk ≤ kAk0
e la tesi. 2
Possiamo altresì provare che:
Teorema 1.3 Sia A∈ Mm×n, allora
kAk0=sup{|hAx, yi| : kxk ≤1 , kyk ≤1}
ed inoltre, se A∈ Mn×n= Mnè simmetrica
kAk0=sup{|hAx, xi| : kxk ≤1}.
Dimostrazione. La prima relazione segue dall’osservazione che pre-cede la definizione 24.4.
Per quel che riguarda la seconda uguaglianza è ovvio che
kAk0≥sup{|hAx, xi| : kxk ≤1, } =ν ed inoltre, poiché hA(x+y), x+yi − hA(x−y), x−yi =4hAx, yi |hAx, yi| ≤ 1 4(|hA(x+y), x+yi| + |hA(x−y), x−yi|) ≤ ≤ ν 4(kx+yk 2+ kx−yk2) = ν 2(kxk 2+ kyk2) onde sup{|hAx, yi| : kxk ≤1, kyk ≤1} ≤ν. 2
9
Osserviamo inoltre che, se A è simmetrica, esiste una matrice P or-togonale ed unitaria, (la cui inversa coincide pertanto con la trasposta) tale che
A=P−1EP
con E matrice diagonale avente come elementi della diagonale princi-pale gli autovalori λidi A.
Allora
sup{hAx, xi : kxk ≤1} =sup{hP−1EPx, xi : kxk ≤1} = =sup{hEPx, Pxi : kxk ≤1} = =sup{hEy, yi : kyk ≤1} = =sup{ n
∑
i=1 λiy2i : kyk ≤1} = =sup{Λkyk2 : kyk ≤1} =Λnon appena si sia definito
Λ=max{λi : i=1, 2, ..n} =λi0
e si sia tenuto conto del fatto che, in corrispondenza di y= ei0 , si ha
hEy, yi =λi0 =Λ .
1.3
Forme Bilineari e Quadratiche
Definizione 1.6 Si chiama forma bilineare inRn una funzione f :Rn×Rn→R
tale che f(·, y)e f(x,·)siano funzioni lineari suRn.
Le funzioni bilineari suRnsono tutte e sole quelle definite da f(x, y) = hx, Ayi = hBx, yi con A, B∈ Mn
dove B è la matrice trasposta di A. (si ottiene da A scambiando le righe con le colonne. Solitamente si denota B= A∗).
Definizione 1.7 Se f è una forma bilineare inRn; la funzione g :Rn−→R
definita da
g(x) = f(x, x)
si chiama forma quadratica inRn.
Si può sempre trovare una matrice A∈ Mn, non unica, tale che
10
possiamo inoltre sempre scegliere A in modo che sia una matrice simmetrica; in tal caso A si dice matrice associata alla forma quadratica e risulta univoca-mente determinata.
Se g è una forma quadratica; g si dice semidefinita positiva (negativa) se g(x) ≥ 0 ( ≤ 0) ∀x∈Rn
g si dice definita positiva (negativa) se
g(x) > 0 ( < 0) ∀x∈Rn{0}. Si possono provare i seguenti:
Teorema 1.4 Sia g una forma quadratica e sia A la matrice ad essa associata;
allora
• g è definita positiva se e solo se, detto Akil minore principale di ordine k
di A , si ha
det Ak > 0 ∀k ;
• g è definita negativa se solo se
(−1)kdet Ak > 0 ∀k.
Teorema 1.5 Sia g una forma quadratica e sia A la matrice ad essa associata;
allora
• g è definita positiva (negativa) se e solo se, detti λki suoi autovalori, si ha
λk > 0 ( < 0) ∀k ;
• g è semidefinita positiva (negativa) se e solo se
λk ≥ 0 ( ≤ 0) ∀k.
Il prodotto scalare inRn
f(x, y) = hx, yi
è il più semplice esempio di funzione bilineare; la forma quadratica g(x) = f(x, x) = hx, xi = kxk
si riduce alla norma euclidea in Rn La matrice di rappresentazione della forma bilineare associata al prodotto scalare è la matrice identica.
11
1.4
Topologia di
R
nDefinizione 1.8 Chiamiamo successione inRn una applicazione x : N−→Rn
che ad ogni k∈N associa xk∈Rn.
Come nel caso reale chiamiamo estratta della successione xk una
succes-sione xkh dove kh è una successione a valori nei naturali strettamente cres-cente.
Diciamo che lim xk=x se limkxk−xk =0.
Chiaramente la definizione data è funzione della norma scelta ma dà luogo agli stessi risultati qualora si considerino norme equivalenti. Osserviamo che, dal momento che inRntutte le norme sono equiv-alenti, in effetti la definizione di convergenza di una successione non dipende dalla norma scelta. (Si veda la definizione 24.4)
Si può provare facilmente che
Teorema 1.6 Sia xkuna successione inRn
• se xkè convergente allora ogni sua estratta è ancora convergente allo stesso
limite;
• se xkè convergente allorakxkkè limitata.
E’ anche immediato provare che
Teorema 1.7 Sia xkuna successione inRntale chekxkk ≤M , allora esiste
una successione xkh , estratta da xk, convergente.
Dimostrazione. Si ha|(xk)i| ≤ kxkk ≤ M, ∀i, e pertanto esiste una
estratta xk1 tale che(xk1)1 → x1; con una successiva estrazione si ha
(xk2)2 →x2e iterando il procedimento si può concludere osservando
chekxkn−xk1→0. 2
Teorema 1.8 - criterio di convergenza di Cauchy - Sia xkuna successione in
Rn, allora x
kè convergente se e solo se
∀ε>0 ∃kε ∈N : h, k>kε ⇒ kxh−xkk <ε.
Dimostrazione. La necessità è ovvia conseguenza della disuguaglianza triangolare della norma; per quel che riguarda la sufficienza basta os-servare che, se vale la condizione di Cauchy, xk è una successione
limitata e pertanto esiste una estratta xkh →x. Ora per k, h
sufficiente-mente grandi
kxk−xk ≤ kxk−xkhk + kxkh−xk <ε.
2 Diamo ora alcune definizioni che useremo sistematicamente nello studio delle funzioni di più variabili.
12
Definizione 1.9 Sia x0∈Rn, r>0 , chiamiamo sfera aperta di centro x 0e
raggio r, l’insieme
S(x0, r) = {x∈Rn : kx−x0k <r}.
Sia A ⊂ Rn, x
0 ∈ A si dice interno ad A se esiste r > 0 tale che
S(x0, r) ⊂ A ; l’insieme dei punti di A che sono interni si indica con intA e
costituisce l’interno di A.
A⊂Rnsi dice aperto se tutti i suoi punti sono interni, cioè se A=int A
.
A⊂Rnsi dice chiuso se il suo complementare è aperto.
Diciamo che x0è punto di frontiera per A⊂Rnse
∀δ>0 S(x0, δ) ∩A6= ∅ e S(x0, δ) ∩Ac6= ∅.
Indicheremo con ∂A l’insieme dei punti di frontiera di A . Definiamo chiusura di A l’insieme
cl A= {x∈Rn : ∃xk ∈A, xk →x}.
Valgono i seguenti fatti:
Se A⊂Rn allora cl A=∂A∪A
Infatti è intanto ovvio che A ⊂ cl A, mentre se x ∈ ∂A si ha che
∀ε> 0 ∃xε ∈ S(x, ε), xε ∈ A, e perciò si può trovare xn ∈ A tale che
kxn−xk <1/n da cui x∈cl A .
Sia viceversa x∈clA , x6∈ A ; allora esiste una successione xn ∈ A
, xn →x e quindi ∀ε> 0 x ∈ S(x, ε) ed xˆn ∈ S(x, ε) se ˆn è scelto in
maniera opportuna.
Ma x6∈A mentre xˆn∈A per cui x∈∂A.
Sia A⊂Rn, f : cl A−→R continua , allora
inf{f(x) : x∈ A} =inf{f(x) : x∈cl A} Sia infatti λ=inf{f(x) : x∈ A} si ha f(x) ≥λ∀x∈ A ∀ε>0∃xε ∈A tale che f(xε) ≤λ+ε.
Per la continuità di f si ha anche che f(x) ≥λ∀x∈cl A
13
e pertanto
λ=inf{f(x) : x∈cl A}.
Sia A⊂Rnallora ∂A=cl A∩cl Ac
Sia x∈∂A,∀ε>0∃x0ε, x”ε∈S(x, ε), x0ε∈ A, x”ε ∈Ace pertanto si
possono trovare x0n∈ A, x”n ∈Ac, x0n, x”n →x.
Sia viceversa x∈cl A∩cl Ac, allora
x=lim x0n =lim x”n , x0n∈ A , x”n ∈Ac
e∀ε>0∃n1, n2tali che x0n1, x”n2 ∈S(x, ε)e x∈∂A.
Teorema 1.9 Sia A ⊂ Rn, allora A è aperto se e solo se ∀x ∈ A, ∀x k,
xk → x, si ha xk ∈ A definitivamente; A è chiuso se e solo se ∀xk ∈ A,
xk →x, si ha x∈A .
Dimostrazione. Sia A aperto e sia r>0 tale che S(x, r) ⊂ A ; allora definitivamentekxk−xk <r e xk∈S(x, r) ⊂A.
Supponiamo viceversa che A non sia aperto, allora esiste x∈A tale che ∀r> 0∃xr ∈ S(x, r) \A; pertanto si può trovare una successione
xk ∈S(x, 1/k) \A e si ha xk→x e ciò è assurdo.
Sia A chiuso e sia xk ∈ A, xk → x; se x ∈ Ac che è aperto, allora
xk ∈Acdefinitivamente e ciò non è possibile.
Supponiamo che A non sia chiuso, allora Acnon è aperto ed esiste x ∈ Ac, xk→x, con xk 6∈Ac. Pertanto esiste una successione xk→x,
xk ∈A e x6∈A , assurdo. 2
Osserviamo che cl A è un insieme chiuso; infatti, se xk ∈ cl A,
xk → x, per ogni k esiste xhk ∈ A, xhk → xk ed è possibile trovare
una successione h(k) tale che xh(k)k →x . Ne segue che
A=cl A ⇔ A è chiuso.
Definizione 1.10 Un insieme A⊂Rnsi dice
• limitato, se esiste r>0 tale che A⊂S(0, r);
• convesso, se∀x, y∈ A,∀λ∈ [0, 1], λx+ (1−λ)y∈ A;
• compatto, se∀xk∈ A, esiste un’estratta xkh →x ∈A;
• connesso, se non esistono due insiemi aperti, A1,A2tali che A1∩A6= ∅
, A2∩A6= ∅, A∩ (A1∩A2) = ∅, A⊂A1∪A2.
14
Dimostrazione. Se A è chiuso e limitato, presa una successione xk∈
A si ha che xk è limitata e per il teorema 24.20 esiste xkh →x; x∈ A perché A è chiuso.
Sia viceversa A compatto, allora è chiuso ed inoltre è limitato, in quanto se così non fosse, esisterebbe una successione xk ∈ A, con
kxkk → +∞, e dal momento che A è compatto esiste xkh →x ; pertanto
kxkhkè limitata e contemporaneamentekxkhk → +∞ , assurdo. 2 Lemma 1.3 InR gli insiemi connessi sono tutti e soli gli intervalli.
Dimostrazione. Supponiamo che I sia un intervallo non connesso, allora esistono I1, I2 ⊂ R aperti tali che I1∩I 6= ∅ , I2∩I 6= ∅ ,
I∩I1∩I2= ∅e I ⊂I1∪I2.
Se definiamo f : I −→R tale che f(x) =1 se x ∈ I∩I1ed f(x) =
−1 se x∈ I∩I2, è immediato provare che f è continua e poiché f non
si annulla mai, I non può essere un intervallo (teor. 7.8).
Supponiamo viceversa che I sia connesso, se I non fosse un inter-vallo esisterebbero due punti x, y∈I ed esisterebbe z∈ (x, y)e z6∈I e ciò non è possibile in quanto si potrebbe allora scegliere I1= (−∞, z)
e I2= (z,+∞)ed I non sarebbe connesso. 2
Gli insiemi connessi ed aperti diRn possono essere caratterizzati facendo uso della nozione di connessione per spezzate poligonali, che diamo qui di seguito.
Teorema 1.11 Sia A⊂Rn, A aperto, allora A è connesso se e solo se vale la
seguente condizione
∀x, y ∈ A esiste una funzione continua, lineare a tratti (il cui grafico è costituito da segmenti paralleli agli assi) φ :[a, b] −→A tale che φ(a) =x e
φ(b) =y.
Dimostrazione. La condizione è equivalente, per ogni x0∈ A alla
∀y∈ A∃φ:[a, b] −→A lineare a tratti tale che φ(a) =x0e φ(b) =y
.
Cominciamo a vedere che se A è connesso allora quest’ultima vale. Definiamo
A1= {y∈ A : (24.3) è soddisfatta}
A2=A\A1.
Si ha A1 6= ∅ (x0 ∈ A1), A1∩A2 = ∅ed inoltre A1 ed A2 sono
aperti. Infatti A1è aperto in quanto preso y∈ A1, si ha y∈ A ed esiste
r>0 tale che S(y, r) ⊂ A. Dal momento che ogni punto di S(y,r) può essere congiunto con y mediante n segmenti paralleli agli assi e dal momento che y∈A1si ha S(y, r) ⊂A1ed A1è aperto.
A2d’altro canto è aperto in quanto, se y∈ A2, y 6∈ A1e se r> 0 è
tale che S(y, r) ⊂ A si ha S(y, r) ⊂ A2 (se cos ì non fosse si potrebbe
15
Ne concludiamo, dal momento che A è connesso, che A1 = A e la
condizione richiesta.
Se viceversa la condizione è vera e A non è connesso, esistono A1
ed A2 aperti, non vuoti, disgiunti, la cui unione è A, e se x1 ∈ A1 ,
x2∈ A2e φ :[a, b] −→ A è lineare a tratti con φ(a) = x1 , φ(b) = x2 ,
si può definire
Ti= {t∈ [a, b] : φ(t) ∈Ai } , i=1, 2;
Ti è aperto, T1∩T2 = ∅, T1∪T2 = [a, b] e pertanto l’intervallo [a,b]
non sarebbe connesso. 2
2. Le Funzioni Di PiÙ Variabili.
Questo capitolo è dedicato allo studio delle proprietà di continuità e differenziabilità delle funzioni
f :Rn →Rm
con n, m≥1,
Definizione 2.1 È data una funzione
f :Rn −→Rm
se sono assegnati • un insieme A⊂Rn
• una corrispondenza
x∈ A7→ f(x) ∈Rm
che ad ogni x∈ A associa uno ed un solo vettore f(x) ∈Rm.
Si dice che A è il dominio di f e si scrive D(f) = A e, nel caso che tale dominio non sia esplicitamente indicato, si suppone la corrispon-denza f definita per tutti gli x ∈ Rn per cui è possibile considerare
f(x).
Si definisce rango di f
R(f) = {y∈Rm : ∃x∈ A, y= f(x)}
e grafico di f .
G(f) = {(x, y) ∈Rn×Rm : y= f(x)}
Restrizione e composizione di funzioni sono definite come nel caso reale e parimenti simile è la definizione di iniettività, surgettività, bigettività.
18
2.1
Limiti
Lo studio dei limiti di una funzione di più può essere condotto sem-plicemente ripercorrendo i risultati ottenuti nel caso di una funzione reale di una variabile reale, avendo cura di puntualizzare solo qualche particolare sui valori infiniti.
Quando n = 1, si estende R mediante due punti all’infinito che vengono denominati +∞ e −∞, in quanto è ben chiaro che
due punti diR possono sempre essere confrontati nella relazione d’ordine (R è totalmente ordinato). Se n > 1 cade la possibilità di ordinare totalmenteRn e pertanto si preferisce estendere Rn, n > 1, con un solo punto all’infinito che viene denominato sem-plicemente∞. Ricordiamo che, anche se meno utile, questa possibilità esiste anche inR
Definizione 2.2 Se n=1 e x0∈R∪ {±∞}, definiamo, per ρ>0
I(x0, ρ) = (ρ,+∞) se x= +∞ (x0−ρ, x0+ρ) se x∈R (−∞,−ρ) se x= −∞ Definiamo inoltre I0(x0, ρ) =I(x0, ρ) \ {x0}. Se n>1, x0∈Rn∪ {∞}, definiamo per ρ>0 I(x0, ρ) = {x0∈Rn : kx0k <ρ} =S(x0, ρ) x0∈Rn {x0∈Rn : kx0k >ρ} x0=∞
anche qui poniamo I0(x0, ρ) =I(x0, ρ) \ {x0} Definizione 2.3 Sia A ⊂ Rn, si dice che x
0 ∈ Rn∪ {∞}è un punto di
accumulazione per A se∀r>0 I0(x0, r) ∩A6= ∅.
Indichiamo conD(A)l’insieme dei punti di accumulazione di A.
Sia A⊂ Rn, x
0 ∈ Rn∪ {∞}; x0 ∈ D(A)se e solo se ∃xk ∈ A,
xk6= x0, xk→x0.
Definizione 2.4 Sia f : A→Rn, A⊂Rne sia x
0∈ D(A); diciamo che
lim
x→x0
f(x) = `
19
∀ε>0 ∃δ(ε) >0 tale che se x∈ I0(x0, δ(ε)) ∩A si ha f(x) ∈ I(`, ε)
Si può facilmente provare che:
• ogni funzione che ammette limite finito è localmente limitata; • il limite di una funzione, se esiste, è unico;
• se m=1 vale il teorema della permanenza del segno;
• il limite di una somma è uguale alla somma dei limiti, ove questi esistono finiti;
• il limite del prodotto di una funzione a valori reali per una funzione a valori vettoriali è uguale al prodotto dei limiti, ove questi esistono finiti;
• se m = 1 il limite del reciproco di una funzione è uguale al reciproco del limite della funzione stessa, ammesso che non sia nullo.
• se m = 1 valgono i risultati sul confronto dei limiti del tipo considerato per le funzioni reali di una variabile;
• il limite di una funzione può essere caratterizzato per succes-sioni come per le funzioni di una variabile.
Ricordiamo anche l’enunciato che permette di calcolare il limite di una funzione composta
Sia f : A −→ Rm, A ⊂ Rn, x 0 ∈ D(A) e sia g : B −→ A, B⊂Rp, y 0∈ D(B), g(B) ⊂A; supponiamo che lim x→x0 f(x) = e lim y→y0 g(y) =x0
Allora, se una delle due seguenti condizioni è verificata • x06∈dom f • f(x0) = ` si ha lim y→y0 f (g(y)) = `.
20
2.2
Continuità
Definizione 2.5 Sia f : A −→ Rm, x
0 ∈ A ⊂ Rn, diciamo che f è una
funzione continua in x0se∀ε>0∃δ(ε) >0 tale che
se x∈ A,kx−x0k <δ(ε)si hakf(x) −f(x0)k <ε.
Nel caso in cui x0∈ A∩ D(A), la condizione sopra espressa è equivalente
alla
lim
x→x0 f
(x) = f(x0)
f si dice continua in A se è continua in ogni punto di A.
Come nel caso delle funzioni reali di una variabile reale si prova che:
• la somma di funzioni continue è continua;
• il prodotto di una funzione a valori vettoriali per una funzione a valori scalari, entrambe continue, è continua;
• se m=1, il reciproco di una funzione continua è continuo dove ha senso definirlo;
• vale la caratterizzazione della continuità per successioni data, nel caso reale;
• la composta di funzioni continue è una funzione continua. • se limx→x0 f(x) =λe limx→x0g(x) =µ, con λ, µ∈R
msi ha
lim
x→x0
hf(x), g(x)i = hλ, µi
• In particolare la funzioneh·,·i:Rm×Rm→R è continua
Valgono per le funzioni continue i soliti teoremi
Teorema 2.1 -degli zeri - Sia f : A−→R, A⊂Rn, A aperto e connesso
e supponiamo che f sia una funzione continua; allora se esistono x1, x2∈ A
tali che f(x1)f(x2) <0 esiste anche x0∈ A tale che f(x0) =0.
Figure 2.1: Il teorema degli zeri
Dimostrazione. Poichè A è connesso è possibile congiungere x1
ed x2con una linea spezzata costituita di segmenti paralleli agli assi
coordinati.
Siano xjgli estremi di ciascuno dei segmenti, nel caso in cui f(xj) =
0 per qualche j, il teorema è dimostrato, in caso contrario esisteranno xk, xk+1tali che f(xk)f(xk+1) <0.
Allora la funzione[0, 1] 3 t 7→ ϕ(t) = f(xk+t(xk+1−xk) ∈ R è
21
Teorema 2.2 - Weierstraß- Sia f : A −→ R una funzione continua e
supponiamo che A sia un insieme compatto; allora esistono x1, x2 ∈ A tali
che
f(x1) =min{f(x) : x∈A}
f(x2) =max{f(x) : x∈A}
Dimostrazione. Sia, ad esempio λ=inf{f(x): x∈ A}; allora esiste una successione xk ∈ A tale che f(xk) → λ e, dal momento che A è
compatto, è possibile trovare una successione xkh → x1 ∈ A. Si ha pertanto f(xkh) → λ e, per la continuità di f , f(xkh) → f(x1). Ne
segue che λ= f(x1)e la tesi. 2
Teorema 2.3 - Weiertsraß generalizzato - Sia f : Rn −→ R una
fun-zione continua e supponiamo che esista ˆx∈Rntale che
lim
x→∞ f(x) = ` > f(ˆx)
allora esiste x1∈Rntale che
f(x1) =min{f(x) : x∈Rn} Dimostrazione. Sia λ=inf{f(x) : x∈Rn} si ha ` > f(ˆx) ≥λ .
Sia poi δ>0 tale che sekxk >δsi abbia f(x) ≥ ` −ε, con ε>0.
Sia ancora xk∈Rn tale che f(xk) →λ.
Allora, per ε piccolo e per k abbastanza grande, si ha f(xk) <λ+ε< ` −ε
e quindikxkk ≤δ.
Si può pertanto estrarre da xkuna successione xkh tale che xkh →x1 e si può concludere utilizzando le stesse argomentazioni del teorema
precedente. 2
Definizione 2.6 Sia f : A −→ Rm, A ⊂ Rn; f si dice uniformemente
continua in A se
∀ε>0∃δ(ε) >0 tale che se x, y∈ A ekx−yk <δ(ε), si ha
kf(x) −f(y)k <ε.
Teorema 2.4 - Heine-Cantor - Sia f : A −→ Rm, A ⊂ Rn ; se f è una
funzione continua su A ed A è un insieme compatto allora f è uniformemente continua su A.
22
Dimostrazione. Se f non fosse uniformemente continua in A∃ε0>0
ed∃xk, yk ∈A tali chekxk−ykk <1/k ekf(xk) −f(yk)k >ε0.
Dal momento che A è compatto,∃xkh estratta da xk, xkh →x∈ A e si ha
kykh−xk ≤ kykh−xkhk + kxkh −xk →0 per cui ykh →x.
Ne viene chekf(xkh) −f(ykh)k →0 e ciò è assurdo. 2 Corollario 2.1 Sia f :Rn →Rm, lineare; allora
• f è uniformemente continua suRn;
• f trasforma insiemi limitati diRnin insiemi limitati diRm.
2.3
Differenziabilità e Derivabilità
Definizione 2.7 - Sia f : A−→Rm, A⊂Rn, A aperto, x
0∈ A; diciamo
che f è differenziabile in x0se esiste una applicazione lineare
L :Rn −→Rm tale che lim h→0 kf(x0+h) −f(x0) −L(h)k khk =0
L’applicazione lineare L si chiama differenziale di f in x0e si indica
soli-tamente con d f(x0).
La matrice che la rappresenta si chiama matrice jacobiana di f in x0e verrà
indicata con∇f(x0). Si ha perciò
L(h) =d f(x0)(h) = ∇f(x0)h
Quando m=1,∇f(x0)si riduce ad un vettore diRne si indica
col nome di gradiente di f in x0; faremo uso del nome gradiente
anche se m>1.
Osserviamo infine che∇f : A−→Rm×n= Mm×n
Sia f : A−→Rm, posto
ω(h) = kf(x0+h) − f(x0) −d f(x0)(h)k
khk
per la definizione di differenziabilità si ha lim
23
per cui
f(x0+h) −f(x0) −d f(x0)(h) = khkω(h)
Se viceversa vale l’uguaglianza precedente si può verificare che f è differenziabile. Naturalmente kf(x0+h) − f(x0)k ≤ [ω(h) + kd f(x0)k] khk e si ha lim h→0 f(x0+h) = f(x0) per cui
Ogni funzione differenziabile è continua.
Definizione 2.8 Sia f : A−→R, A⊂Rn, A aperto, x
0∈A; diciamo che
f è parzialmente derivabile in x0rispetto alla variabile xi se
lim
t→0
f(x0+tei) − f(x0)
t esiste finito.
In tal caso denotiamo il valore di tale limite con il simbolo
∂ f ∂xi
(x0) oppure con fxi(x0)
e lo chiamiamo derivata parziale di f rispetto ad xi calcolata in x0.
(Osserviamo che tei= (0, 0, .., t, .., 0, 0)).
Se y∈Rn, diciamo che f è derivabile in x
0rispetto al vettore y se lim t→0+ f(x0+ty) − f(x0) t esiste finito.
In tal caso denotiamo il valore di tale limite con f0(x0, y).
E’ facile vedere che f è derivabile rispetto alla i-esima variabile se e solo se f0(x0, ei)ed f0(x0,−ei)esistono e
f0(xo, ei) = −f0(x0,−ei)
In tal caso si ha
f0(x0, ei) = −f0(x0,−ei) = fxi(x0).
Teorema 2.5 Sia f : A −→R, x0∈ A⊂Rn, A aperto e supponiamo che
f sia differenziabile in x0; allora f è derivabile in x0lungo ogni direzione e si
ha
24
Se ne deduce in particolare, scegliendo y=eied y= −eiche f è derivabile
in x0rispetto ad xi e che
(∇f(x0))i = fxi(x0).
Dimostrazione. Dal momento che f è differenziabile,
|f(x0+h) −f(x0) − h∇f(x0), hi| khk =ω(h) con limh→0 ω(h) =0. Per h=ty con t>0 si ha |f(x0+ty) − f(x0) − h∇f(x0), tyi| =tkykω(ty) e f(x0+ty) −f(x0) t − h∇f(x0), yi = kykω(ty) Quindi f0(x0, y) = h∇f(x0), yi =d f(x0)(y).
Osserviamo che, se f è differenziabile in x0, allora si ha
f0(x0, y) = −f0(x0,−y) e pertanto lim t→0+ f(x0+ty) − f(x0) t = t→0lim− f(x0+ty) − f(x0) t 2 Teorema 2.6 Sia f : A −→ Rm, x 0 ∈ A ⊂ Rn, A aperto e sia f = (f1, f2, ..., fm)con fj: A−→R, j=1, 2, ..., m.
Allora f è differenziabile in x0se e solo se fjè differenziabile in x0per ogni
j=1, 2, ..., m. Inoltre si ha ∇f(x0) = ∇f1(x0) ∇f2(x0) · · · ∇fm(x0)
Dimostrazione. Sia f differenziabile in x0ed indichiamo con
D1, D2, ..., Dm
le righe della matrice∇f(x0), ovviamente risulterà Dj∈Rned avremo
inoltre
25 Si avrà allora lim h→0 |fj(x0+h) −fj(x0) − hDj, hi| khk =0 e pertanto fj è differenziabile in x0e Dj = ∇fj(x0). Se viceversa si ha lim h→0 |fj(x0+h) − fj(x0) − h∇fj(x0), hi| khk =0, allora anche lim h→0 kf(x0+h) −f(x0) −Dhk khk =0
non appena si definisca
D= ∇f1(x0) ∇f2(x0) · · · ∇fm(x0) 2 Dimostrazione.. Sia f differenziabile in x0ed indichiamo con
D1, D2, ..., Dm
le righe della matrice∇f(x0), ovviamente risulterà Dj∈Rned avremo
inoltre ∇f(x0)h= (hD1, hi,hD2, hi, ...,hDm, hi) Si avrà allora lim h→0 |fj(x0+h) −fj(x0) − hDj, hi| khk =0 e pertanto fj è differenziabile in x0e Dj = ∇fj(x0). Se viceversa si ha lim h→0 |fj(x0+h) − fj(x0) − h∇fj(x0), hi| khk =0, allora anche lim h→0 kf(x0+h) −f(x0) −Dhk khk =0
non appena si definisca
D= ∇f1(x0) ∇f2(x0)C · · · ∇fm(x0)
26
Osserviamo che si è con ciò dimostrato che
∇f(x0) = f1x1(x0) f1x2(x0) . . . f1xn(x0) f2x1(x0) f2x2(x0) . . . f2xn(x0) . . . . fmx1(x0) fmx2(x0) . . . fmxn(x0) 2
Definizione 2.9 Sia f : A −→ Rp, A ⊂ Rn ×Rm, A aperto, e sia
(x0, y0) ∈A (con x0∈Rn, y0∈Rm).
Definiamo
φx(y) = f(x, y) per ogni f issato x,
e
ψy(x) = f(x, y) per ogni f issato y.
Chiamiamo differenziale parziale di f rispetto ad y in(x0, y0)
dyf(x0, y0) =dφx0(y0) e differenziale parziale di f rispetto ad x in(x0, y0)
dxf(x0, y0) =dψy0(x0)
Si ha dyf(x0, y0) ∈ L(Rm,Rp), mentre dxf(x0, y0) ∈ L(Rn,Rp) ed
in-dichiamo con∇yf(x0, y0)e∇xf(x0, y0)le matrici ad essi associate.
Osserviamo infine che, se f = (f1, .., fp), si ha
∇yf(x0, y0) = f1y1 (x0, y0) · · · f1ym(x0, y0) fpy1(x0, y0) · · · fpym(x0, y0) ! ∇xf(x0, y0) = f1x1 (x0, y0) · · · f1xn(x0, y0) fpx1(x0, y0) · · · fpxn(x0, y0) ! e pertanto ∇f(x0, y0) = (∇xf(x0, y0),∇yf(x0, y0))
Osserviamo infine che∇yf(x0, y0)può essere bigettivo solo se m=
p.
Definizione 2.10 Sia f : A −→ Rp, A ⊂ Rn×Rm, A aperto, e sia
(x0, y0) ∈A (con x0∈Rn, y0∈Rm).
Definiamo
φx(y) = f(x, y) per ogni f issato x,
e
27
Chiamiamo differenziale parziale di f rispetto ad y in(x0, y0)
dyf(x0, y0) =dφx0(y0) e differenziale parziale di f rispetto ad x in(x0, y0)
dxf(x0, y0) =dψy0(x0)
Si ha dyf(x0, y0) ∈ L(Rm,Rp), mentre dxf(x0, y0) ∈ L(Rn,Rp) ed
in-dichiamo con∇yf(x0, y0)e∇xf(x0, y0)le matrici ad essi associate.
Osserviamo infine che, se f = (f1, .., fp), si ha
∇yf(x0, y0) = f1y1(x0, y0) · · · f1ym(x0, y0) fpy1(x0, y0) · · · fpym(x0, y0) ! ∇xf(x0, y0) = f1x1 (x0, y0) · · · f1xn(x0, y0) fpx1(x0, y0) · · · fpxn(x0, y0) ! e pertanto ∇f(x0, y0) = (∇xf(x0, y0),∇yf(x0, y0))
Osserviamo infine che∇yf(x0, y0)può essere bigettivo solo se m=
p.
Corollario 2.2 Sia f : A −→ Rn, A ⊂ Rn, A aperto, e supponiamo che
f sia invertibile nel suo rango: supponiamo cioè che esista una funzione g : R(f) −→A tale che
f(g(y)) =y ∀y∈R(f)
g(f(x)) =x ∀x ∈A allora, se f e g sono differenziabili, si ha
∇f(g(y))∇g(y) =I ∀y∈R(f)
∇g(f(x))∇f(x) =I ∀x∈ A essendo I la matrice identica.
**********************************************************************************************************
Teorema 2.7 -Derivazione delle Funzioni Composte - Sia f : A −→
Rm, A⊂Rn, e sia g : B−→ A, B⊂Rp.
28
Siano x0∈ A, y0 ∈ B tali che g(y0) =x0, f e g siano differenziabili in
x0ed y0, rispettivamente.
Allora f(g(·))è differenziabile in y0e si ha
∇f(g(y0)) = ∇f(x0) · ∇g(y0) = ∇f(g(y0)) · ∇g(y0),
essendo il prodotto tra matrici inteso righe per colonne. Dimostrazione. Si ha f(x0+h) − f(x0) − ∇f(x0)h= khkω1(h)con lim h→0 ω1(h) =0 ed anche g(y0+k) −g(y0) − ∇g(y0)k= kkkω2(k)con lim k→0ω2(k) =0 Pertanto posto h(k) =g(y0+k) −g(y0) si ha lim k→0h(k) =0 e quindi f(g(y0+k)) −f(g(y0)) − ∇f(x0)∇g(y0)k kkk = = ∇f(x0)[g(y0+k) −g(y0) − ∇g(y0)k] + kh(k)kω1(h(k)) kkk = = ∇f(x0)ω2(k) + kh(k)kω1(h(k)) kkk −→0
dal momento che
kh(k)k ≤ kkk(ω2(k) +cost)
2 Esplicitiamo in caso semplice il teorema di derivazione delle fun-zioni composte con lo scopo di illustrarne l’uso.
Sia
f :R2→R , g :R27→R2
(x, y) 7→ f(x, y) , (t, s) 7→ (x(t, s), y(t, s))
e consideriamo la funzione
φ(t, s) = f(x(t, s), y(t, s)) = f(g(t, s))
Utilizzando il teorema possiamo affermare che
29 Ma ∇f(x, y) = fx(x, y), fy(x, y) , , ∇g(t, s) = xt (t, s) xs(t, s) yt(t, s) ys(t, s) ! per cui (φt(t, s), φs(t, s)) = fx(x, y), fy(x, y) xt(t, s) xs(t, s) yt(t, s) ys(t, s) ! = fx(x, y)xt+fy(x, y)yt, fx(x, y)xs+fy(x, y)ys Se f : A−→Rm, A⊂Rn, A aperto, è differenziabile in A e se definiamo φ(t) = f(x+th)
si ha che φ è derivabile per i valori di t tali che x+th ∈ A (cioè almeno in un intorno(−δ, δ)di 0) e si ha
φ0(t) = ∇f(x+th)h
Nel caso in cui f assuma valori reali si ha
φ0(t) = h∇f(x+th), hi
Il teorema di Lagrange applicato alla funzione ϕ appena introdotta permette di affermare che
Se f assume valori reali ed è differenziabile in A; allora, allora f(x+h) −f(x) = h∇f(x+τh), hi τ∈ (0, 1)
di conseguenza
|f(x+h) − f(x)| ≤ khk sup
t∈(0,1)
k∇f(x+th)k
Quando la funzione f assume valori inRm, m > 1, il precedente risultato può non essere vero.
Sia infatti f :R−→R2definita da f(t) = (cos t, sin t); si ha
(0, 0) = f(2π) − f(0) 6=2π(−sin t, cos t) =2π∇f(t) ∀t∈ (0, 2π)
Tenendo conto che se f assume valori inRm allora f = (f1, .., fm),
30
Se f : A−→Rm, A⊂Rn, è differenziabile in A; allora,
kf(x+h) −f(x)k ≤ khk sup
t∈(0,1)
k∇f(x+th)k0.
infatti poichè esiste ph∈Rm, di norma 1, tale che
kf(x+h) − f(x)k = hph, f(x+h) − f(x)i = = hph,∇f(x+τh)hi ≤ ≤ khk sup t∈(0,1) k∇f(x+th)k0 (2.1)
Poichè la definizione non è di immediata verifica, è utile avere con-dizioni sufficienti che assicurino la differenziabilità di una funzione.
Se f : A −→ R, A ⊂ Rn, A aperto, ammette derivate parziali
prime continue in A (indicheremo questo dicendo che f ∈ C1); allora
f è differenziabile in A.
Infatti: se ad esempio consideriamo il caso n =2, indichiamo con
(x, y) un punto di A e supponiamo che le derivate parziali prime fx
ed fysiano continue in A; avremo
f(x+h, y+k) − f(x, y) − fx(x, y)h−fy(x, y)k (h2+k2) = = f(x+h, y+k) −√f(x+h, y) + f(x+h, y) h2+k2 − −f(x, y) − fx(x, y)h−fy(x, y)k √ h2+k2 =
per il teorema di Lagrange applicato alle funzioni f(x+h,·)e f(·, y) = (fx(ξ, y) −fx(x, y))h+ (fy(x+h, η) −fy(x, y))k
(h2+k2)
con|x−ξ| <h e|y−η| <k.
Pertanto, osservando che h h2+k2 ≤1 e k h2+k2 ≤1
per la continuità di fxed fyl’ultimo membro tende a 0 quando(h, k) →
(0, 0).
31
Teorema 2.8 Sia f : A −→ Rm, A ⊂ Rn, A aperto, e supponiamo che
fj, j = 1, .., m, ammetta derivate parziali prime continue in A; allora f è
differenziabile in A. Dimostrazione. si ha f(x+h) − f(x) = n
∑
i=1 [f(x+ i∑
j=1 hjej) − f(x+ i−1∑
j=1 hjej)] = = n∑
i=1 fxi(x+ i−1∑
j=1 hjej+ξiei)hi con|ξi| <hi. 2Se f : A −→ R, A⊂ Rn, A aperto, e chiamiamo derivata parziale
seconda di f rispetto alle variabili xi ed xj, calcolata in x, e scriviamo
fxixj(x)la derivata rispetto a xjdella Funzione fxi, calcolata in x. Nel caso in cui n = 2 e le variabili in A si indichino con (x, y)
possiamo calcolare 4 derivate parziali seconde: fxx, fxy, fyx, fyy
Si può dimostrare che
Teorema 2.9 -Schwartz - Sia f : A −→ R, A ⊂ Rn, A aperto, e
supponiamo che f sia parzialmente derivabile due volte in A e che almeno una tra fxye fyxsia continua; allora
fxy(x, y) = fyx(x, y)
Infatti se ad esempio supponiamo che fxysia continua, posto
ω(h, k) = f(x+h, y+k) − f(x+h, y) − f(x, y+k) + f(x, y) hk si ha fxy(x) =lim k→0 limh→0 ω(h, k) e fyx(x) =lim h→0 k→0lim ω(h, k)
Pertanto se proviamo, che lim
(h,k)→(0,0) ω(h, k)
esiste finito, avremo che lim
32
e l’uguaglianza delle due derivate seconde
Applicando il teorema di Lagrange alla funzione h7→ f(x+h, y+k) − f(x+h, y)
si ha
ω(h, k) = fx(x+ξ, y+k) − fx(x+ξ, y)
k , −h<ξ<h
ed applicando ancora Lagrange alla funzione k−→ fx(x+ξ, y+k) si ottiene ω(h, k) = fxy(x+ξ, y+η), −k<η<k Ora lim (h,k)→(0,0) (ξ, η) = (0, 0)
e pertanto, per la continuità di fxy
lim
(h,k)→(0,0) ω
(h, k) = fxy(x, y).
In generale possiamo enunciare il seguente teorema
Teorema 2.10 Sia f : A−→ Rm, A⊂Rn, A aperto, e supponiamo che f
sia parzialmente derivabile due volte in A; allora fxixj(x) = fxjxi(x)
per tutti gli x∈ A ove almeno una tra fxixj e fxjxi è continua.
Le derivate parziali di ordine superiore si definiscono in maniera del tutto simile.
Le derivate parziali seconde caratterizzano il gradiente della fun-zione∇f infatti, se f : A −→ R, A⊂ Rn, A aperto, è differenziabile
in A, possiamo considerare la funzione
∇f : A−→Rn
Se ∇f è a sua volta differenziabile (ricordiamo che basta che le derivate parziali prime di ∇f siano continue), possiamo considerare
∇(∇f)(x)e si vede che ∇(∇f)(x) = ∇fx1(x) · · · ∇fxn(x) = fx1x1(x) · · · fx1xn(x) · · · · fxnx1(x) · · · fxnxn(x)
La matrice∇(∇f)(x) si indica solitamente con H f(x) e si chiama matrice Hessiana di f in x.
33
La funzione quadratica g(h) = hh, H f(x)hiviene di solito indicata con il nome di forma quadratica hessiana di f in x.
Qualora f ammetta derivate parziali seconde continue in A ( f ∈ C2(A)), per il teorema di Schwarz, la matrice H f(x)è simmetrica.
Per fissare le idee ricordiamo che nel caso di una funzione di due variabili a valori reali
H f(x, y) = ∇(∇f)(x, y) = ∇fx(x, y) ∇fy(x, y) ! = fxx(x, y) fxy(x, y) fyx(x, y) fyy(x, y) !
2.4
Formula di Taylor
Consideriamo una funzione f : A −→ R, A ⊂ Rn, A aperto,
x0 ∈ A, e sia h ∈ S(0, r) dove r > 0 è scelto in modo che x0+
S(0, r) ⊂A.
Definiamo φ :(−1, 1) −→R mediante la
ϕ(t) = f(x0+th)
se supponiamo f ∈ Ck(cioè se è derivabile k volte in A), avremo che
ϕè derivabile k volte in(−1, 1)e si ha ϕ0(t) =d f(x0+th)h= hh,∇f(x0+th)i ϕ00(t) = d dt n
∑
i=1 hifxi(x0+th) = = n∑
i=1 hih∇fxi(x0+th), hi = hh, H f(x0+th)hiPossiamo pertanto ottenere una formula di Taylor anche per funzioni di più variabili, sviluppando la funzione ϕ. Ci limitiamo al secondo ordine in quanto è l’unico di cui abbiamo necessità ed in ogni caso è l’ultimo che possa essere enunciato senza eccessive difficoltà formali.
Teorema 2.11 Se f : A−→R, A⊂Rn, A aperto, x∈ A e se f ∈ C2(A),
(e quindi è differenziabile due volte). Allora per h abbastanza piccolo si ha •
f(x+h) = f(x) + hh,∇f(x)i + hh, H f(x+ξ h)hi/2, ξ ∈ (0, 1)
34
•
f(x+h) = f(x) + hh,∇f(x)i + hh, H f(x)hi/2+ khk2
ω(h)
con limh→0ω(h) =0 e ω(0) =0
(formula di Taylor con resto di Peano). Dimostrazione.
Applicando a ϕ la formula di McLaurin otteniamo
φ(1) =φ(0) +φ0(0) +φ00(ξ)/2 0<ξ<1
da cui tenuto conto che
φ0(t) = hh,∇f(x+th)i φ00(t) = hh, H f(x+th)hi
si ricava la prima affermazione Inoltre
f(x+h) = f(x) + h∇f(x), hi + hh, H f(x)hi/2+ khk2
ω(h)
non appena si definisca
ω(h) = hh,(H f(x+ξhh) −H f(x))hi
2khk2
dove limh→0 ω(h) =0 in quanto H f è continuo e
|ω(h)| ≤ kH f(x+ξhh) −H f(x)k/2, kξhhk ≤ khk.
2
2.5
Massimi e Minimi Relativi
Definizione 2.11 Diciamo che x è un punto di minimo (massimo) relativo
per f se esiste una sfera S(x, r), r>0, tale che
f(y) ≥ f(x) ( f(y) ≤ f(x) ) ∀y∈S(x, r) ∩A
Teorema 2.12 Se x è un punto di minimo (massimo) relativo per f interno
al suo dominio, allora
• se f è differenziabile in x si ha∇f(x) =0;
• se f ammette derivate seconde continue in x, H f(x)è semidefinita positiva (negativa).
35
Dimostrazione. Basta osservare che ϕ(t) = f(x+th)ammette un punto di minimo relativo in 0 e che∀h∈S(0, r)
0=φ0(0) = h∇f(x), hi
ed anche
0≤φ”(0) = hh, H f(x)hi
La prima condizione assicura che∇f(x) =0, mentre la seconda è,
per definizione, la semidefinitezza di H f(x). 2
Se∇f(x) =0 e H f(x)è una forma quadratica non definita, allora x non è né punto di massimo relativo, né punto di minimo relativo per f ; un punto siffatto viene solitamente indicato con il nome di ’punto sella’.
Teorema 2.13 Se f ∈ C2(A),
• ∇f(x) =0
• H f(x)è definita positiva (negativa)
allora x è punto di minimo (massimo) relativo per f . Dimostrazione. Si ha f(x+h) − f(x) = hh, H f(x)hi/2+ khk2 ω(h) con limh→0ω(h) =0=ω(0). Se ne deduce che f(x+h) − f(x) khk2 = 1 2 h khk, H f(x) h khk +ω(h) ≥ ≥min 1 2hu, H f(x)ui : kuk =1 +ω(h) = M 2 +ω(h) dove M=min{hu, H f(x)ui:kuk =1} = hu0, H f(x)u0i >0 in quantoku0k =1
(Il minimo esiste per il teorema di Weierstraßed M>0 perché Hf(x) è definita positiva e u06=0.)
Pertanto, per il teorema della permanenza del segno, si può scegliere
ρ>0 in modo che, se h∈S(0, ρ), si abbia
f(x+h) −f(x) khk2 >0
36
2.6
Convessità
Definizione 2.12 Sia f : A −→ R, A ⊂ Rn convesso; diciamo che f è
convessa se
f(λx+ (1−λ)y) ≤λ f(x) + (1−λ)f(y) ∀x, y∈A, ∀λ∈ (0, 1)
Inoltre f si dice strettamente convessa se vale la disuguaglianza stretta. possiamo dimostrare che
• Se f è convessa su un aperto A, f0(x, y)esiste∀x∈ A,∀y∈Rn.
• se f ∈ C2(A), allora sono fatti equivalenti: – f è convessa
f(y) ≥ f(x) + h∇f(x), y−xi ∀x, y∈ A
– H f(x)è semidefinita positiva.
• le seguenti condizioni sono ciascuna sufficiente per la succes-siva:
– H f(x)è definita positiva∀x ∈A;
– f(y) > f(x) + h∇f(x), y−xi ∀x, y∈A, y6= x ;
– f è strettamente convessa.
2.7
Convessità
Osservazione. Si può provare, come per le funzioni di una variabile, che f è convessa in A se e solo se
f( k
∑
i=1 λixi) ≤ k∑
i=1 λif(xi) ∀xi∈ A, λi∈ (0, 1),∑ki=1 λi=1 2 Teorema 2.14 Sia f : A−→R, A⊂Rnconvesso, allora L−α è un insieme
convesso per ogni α∈R.
Dimostrazione. Se f(x) ≤αe f(y) ≤α, allora
f(λx+ (1−λ)y) ≤λ f(x) + (1−λ)f(y) ≤α.
37
Osserviamo che la convessità di L−α non è sufficiente per la conves-sità di f , come f(x) =lnx dimostra.
Osserviamo anche che, posto
{v1, v2, .., v2n} = {e1, .., en,−e1, ..,−en} si ha B(x, r) = {y∈Rn:ky−xk1≤r} = = {y∈Rn: y=
∑
2n i=1 λi(x+rvi), 2n∑
i=1 λi =1, λi≥0}Sia infattiky−xk1≤r, allora y−x= n
∑
i=1 (y−x)iei e y=x+ n∑
i=1 |(y−x)i|sgn[(y−x)i]ei = 2n∑
i=1 λi(x+rvi)Qualora a = ∑2ni=1λi < 1 è sufficiente sommare be1+b(−e1)
es-sendo b= (1−a)/2. Viceversak∑2n
i=1λirvik ≤∑2ni=1rλi =r.
Teorema 2.15 Sia f : A −→ R, A ⊂ Rn convesso e aperto, e sia f
con-vessa; allora
f è continua in A
f0(x, y)esiste∀x ∈A,∀y∈Rn.
Dimostrazione. Sia x∈A e proviamo che f è continua in x.
Dal momento che A è aperto, A ⊃ B(x, r) con r > 0, e se y ∈
B(x, r), y=x+th,khk1=r, t∈ (0, 1] f(y) = f( 2n
∑
i=1 λi(x+rvi)) ≤ 2n∑
i=1 λif(x+rvi) =m Per il lemma 13.3 si ha f(x) −m≤ f(x) −f(x−h) ≤ f(x+th) −f(x) t ≤ f(x+h) −f(x) ≤m−f(x) e |f(x+th) −f(x)| ≤t|m−f(x)| Pertanto |f(y) − f(x)| ≤ ky−xk1 r |m− f(x)| Ne segue la continuità di f in x.38
Per quanto riguarda il secondo punto è sufficiente osservare che, se t∈ (−1, 1), si può definire∀y∈Rn
φ(t) = f(x+ty)
e si può applicare il teorema 13.4 a φ. 2
Teorema 2.16 Sia f : A −→ R, A ⊂ Rn convesso, aperto; supponiamo
inoltre f ∈ C2(A), allora f è convessa se e solo se
f(y) ≥ f(x) + h∇f(x), y−xi ∀x, y∈ A se e solo se H f(x)è semidefinita positiva.
Dimostrazione. f è convessa se e solo se φvz :[0, 1] −→R definita da
φvz(t) = f(v+t(z−v))
è convessa∀z, v∈ A, e questo, per il teorema 13.10, è vero se e solo se
φvz(t) ≥φvz(s) +φ0vz(s)(t−s) ∀t, s∈ [0, 1], ∀z, v∈ A cioè se e solo se f(v+t(z−v)) ≥ f(v+s(z−v)) + h∇f(v+s(z−v)), z−vi(t−s) ∀t, s∈ [0, 1], ∀z, v∈A se e solo se f(y) ≥ f(x) + h∇f(x), y−xi ∀x, y∈A
Inoltre φvz è convessa se e solo se φ”vz(t) ≥0∀t∈ (0, 1), corollario
13.9, e pertanto se e solo se
hh, H f(x)hi ≥0 ∀h∈Rn, ∀x ∈A.
2
Teorema 2.17 Sia f : A −→ R, A ⊂ Rn aperto e convesso, f ∈ C2(A);
allora le seguenti condizioni sono ciascuna sufficiente per la successiva: • H f(x)è definita positiva∀x∈A;
• f(y) > f(x) + h∇f(x), y−xi ∀x, y∈ A, y6=x ; • f è strettamente convessa.
Dimostrazione. 1) ⇒2). Si ha
39
2) ⇒3). Si ha
f(y) > f(λx+ (1−λ)y) + h∇f(λx+ (1−λ)y), λ(y−x)i
f(x) > f(λx+ (1−λ)y) + h∇f(λx+ (1−λ)y),−(1−λ)(y−x)i
moltiplicando la prima per(1−λ), la seconda per λ e sommando, si
ha
λ f(x) + (1−λ)f(y) > f(λx+ (1−λ)y).
2
Teorema 2.18 Sia f : Rn −→ R, strettamente convessa e supponiamo che
f(x) → +∞ se x→∞ ; allora esiste uno ed un solo punto x∈Rntale che
f(x) =min{f(y) : y∈Rn}.
Dimostrazione. L’esistenza di x discende dai teoremi 25.39 e 25.13; se esistesse z con le stesse caratteristiche di x, si avrebbe
f(x) =λ f(x) + (1−λ)f(z) > f(λx+ (1−λ)z) ∀λ∈ (0, 1)
e ciò è assurdo. 2
Corollario 2.3 Sia f :Rn −→R, f ∈ C2(Rn), e supponiamo che
hh, H f(x)hi ≥mkhk2 ∀h∈Rn, m>0
Allora f è strettamente convessa e limx→∞ f(x) = +∞.
Dimostrazione. H f è evidentemente definita positiva ed inoltre f(x) = f(0) + h∇f(0), xi + hx, H f(ξ)xi/2≥
≥ f(0) − k∇f(0)kkxk +mkxk2/2.
2
Teorema 2.19 Sia f :Rn −→ R, f ∈ C2(Rn)e supponiamo che esistano
m, M>0 tali che
mkhk2≤ hh, H f(x)hi ≤Mkhk2 ∀h, x∈Rn
Allora f ammette un unico punto x di minimo assoluto e, definita la succes-sione xkmediante le x0∈Rn, xk+1=xk−α∇f(xk), 0<α< 2 M, si ha kxk−xk ≤ckkx0−xk ove c=max{|1−αm|,|1−αM|} <1. Ne segue che xk→x.
40
Dimostrazione. L’esistenza e l’unicità di x seguono dal corollario 25.43, e si ha∇f(x) =0; pertanto
kxk+1−xk2= hxk+1−x, xk+1−xi =
= hxk−x−α(∇f(xk) − ∇f(x)), xk+1−xi =
= h(I−αH f(ξ))(xk−x), xk+1−xi
con ξ opportuno, non appena si applichi il teorema di Lagrange alla funzione g(s) = hs−α∇f(s), xk+1−xi e si ricordi che ∇g(s)(xk−x) = h(I−αH f(s))(xk−x), xk+1−xi Quindi kxk+1−xk2≤ k(I−αH f(ξ))(xk−x)kkxk+1−xk e kxk+1−xk ≤ k(I−αH f(ξ))(xk−x)k ≤ kI−αH f(ξ)k0kxk−xk
Dalle condizioni imposte su H f si ottiene allora che
(1−αM) ≤ h(I−αH f(ξ)) h khk, h khki ≤ (1−αm) Ne viene kI−αH f(ξ)k0≤c e kxk+1−xk ≤ckxk−xk
da cui si può concludere. 2
Osserviamo che il precedente teorema assicura che xk → x e ne
valuta la velocità di convergenza che è maggiore quanto più è piccolo c.
A tale proposito si può vedere che
min0<α<2/M max{|1−αm|,|1−αM|} = M−m
M+m e si ottiene per α=2/(M+m).
Teorema 2.20 Sia f : R2 −→ R, f ∈ C1(R2), strettamente convessa, e
supponiamo che
lim
(x,y)→∞ f(x, y) = +∞
allora, se definiamo una successione(xk, yk)mediante le
41
xk+1 tale che f(xk+1, yk) =min{f(x, yk) : x∈R}
yk+1 tale che f(xk+1, yk+1) =min{f(xk+1, y) : y∈R},
si ha che(xk, yk)converge all’unico punto (x,y) di minimo assoluto per f .
Dimostrazione. L’esistenza di(xk+1, yk+1)segue dalla continuità di
f e dal fatto che f(x, y) −→ +∞ per(x, y) →∞.
Si ha inoltre
(25.1) f(xk+1, yk+1) ≤ f(xk+1, yk) ≤ f(xk, yk)
e
fx(xk+1, yk) = fy(xk, yk) =0
Si ha pertanto che f(xk, yk) è una successione decrescente e ne
segue:
f(xk, yk) ≤ f(x0, y0)
f(xk, yk) →λ
f(xk+1, yk) →λ
Dal momento che f → +∞ si deduce che (xk, yk) è limitata e si
può pertanto affermare che ogni sua estratta ha una estratta (xk0, yk0)
soddisfacente le seguenti condizioni
xk0 →x, xk0+1→ξ, yk0→y.
Per la (25.1) e per la continuità di f e delle sue derivate parziali si ha
f(ξ, y) =lim f(xk0+1, yk0) =lim f(xk0, yk0) = f(x, y)
fx(ξ, y) =0= fy(x, y)
Pertanto, per la stretta convessità di f, ξ è l’unico punto di minimo di f(˙,y)e ne segue ξ =x.
Quindi ∇f(x, y) =0; dal momento che f è strettamente convessa,
(x, y) è l’unico punto di minimo di f , e per il teorema 6.10 l’intera
successione(xk, yk)converge ad(x, y). 2
Vogliamo ora tentare di dare una stima della velocità di convergenza dei metodi di minimizzazione numerica che abbiamo presentato.
Definizione 2.13 Sia f : A→R e sia a⊂Rnun aperto, sia M
f ⊂A un
insieme, definito mediante la funzione f , che si vuole raggiungere.
Diciamo che F : A→ P (A)(l’insieme delle parti di A) è una funzione di discesa verso Mf se
(1) x /∈ Mf , y∈F(x) ⇒ f(y) < f(x)
Diciamo inoltre che F è una funzione di discesa chiusa se
42
Teorema 2.21 Sia f : A → R e sia a ⊂ Rn f : A → R un aperto e sia
f continua in A. sia F una funzione di discesa verso Mf e consideriamo la
successione xkdefinita da
(3) x0∈A xk+1 ∈F(xk)
Supponiamo inoltre che xk ∈ K ⊂ A, ove K è un sottoinsieme compatto;
allora una delle seguenti condizioni è verificata:
1. xk∈ Mf per qualche k∈N
2. per ogni sottosuccessione xkh of xk, xkh →ξ, si ha ξ∈ Mf.
Dimostrazione. Dimostriamo che se 1) è falsa allora 2) è verificata. Poichè xk ∈K, che è compatto, possiamo supporre che
(xkh, xkh+1) → (ξ, η)
inoltre, poichè xk6∈Mf, f(xk)è strettamente decrescente e si ha
λ=inf{f(xk)} =lim f(xk)
ne deduciamo che, per la continuità di f ,
λ=lim f(xkh) =lim f(xkh+1) = f(ξ) = f(η)
Ciò dimostra che ξ∈Mf. Infatti se non fosse così dovremmo avere,
poichè xkh+1∈ F(xkh)ed F è una funzione di discesa chiusa,
η∈F(ξ) e f(η) < f(ξ)
il che non è possibile. 2
Corollario 2.4 Sia f : A→R e sia a⊂Rnun aperto, sia f una funzione
continua e supponiamo che esista L∈R tale che {x∈ A : f(x) ≤L} =SL
sia un insieme limitato.
Allora SL è compatto e se xk è una successione definita come in (3) da
x0∈SL, si ha xk∈SL.
Quando A=Rne
lim
x→∞f(x) = +∞
allora esiste almeno un L ∈ R tale che {x ∈ A : f(x) ≤ L} = SL is un
insieme limitato.
Teorema 2.22 sia f : A →R e sia a ⊂ Rn un aperto , sia f ∈ C1(A)e
supponiamo che esista L ∈ R tale che {x ∈ A : f(x) ≤ L} = SL sia un
insieme limitato. Definiamo
43
e una funzione di discesa verso M−f F mediante la F(x) =x+α0
∇f(x) k∇f(x)k
essendo α0scelto in modo che
f x+α0 ∇f(x) k∇f(x)k =min f x+α ∇f(x) k∇f(x)k : α∈R . allora F è una funzione di discesa chiusa.
Dimostrazione. Osserviamo innanzi tutto che se y∈F(x)si ha f(y) = f(F(x)) ≤ f(x)
Inoltre se fosse f(y) = f(x), t =0 sarebbe argomento di minimo per f(x+t∇f(x)/k∇f(x)k)e avremmo 0= d dαf x+α ∇f(x) k∇f(x)k α=0 = = ∇f x+α ∇f(x) k∇f(x)k , ∇f(x) k∇f(x)k α=0 perciò∇f(x) =0 e x∈ Mf. Inoltre se (xk, yk) → (ξ, η), yk ∈ F(xk) e ξ /∈ Mf si ha∇f(xk) → ∇f(ξ),∇f(ξ) 6=0 yk=xk+αk ∇f(xk) k∇f(xk)k e M≥ kyk−xkk = |αk|
perciò possiamo supporre che αn →¯α a meno di considerare una
sot-tosuccessione che chiameremo ancora αn.
Per la continuità η=ξ+¯α ∇f(ξ) k∇f(ξ)k inoltre, poichè f xk+αk ∇f(xk) k∇f(xk)k ≤ f xk+α ∇f(xk) k∇f(xk)k ∀α∈R si ha f ξ+¯α ∇f(ξ) k∇f(ξ)k ≤ f ξ+α ∇f(ξ) k∇f(ξ)k ∀α∈R e η∈ F(ξ). 2
44
Teorema 2.23 Sia f : A→R e sia a⊂Rn un aperto , supponiamo che f
ammetta derivate parziali prime in A e supponiamo che esista L∈R tale che
{x∈ A : f(x) ≤L} =SLsia un insieme limitato.
Definiamo
Mf = {x ∈A : fxi(x) =0 ∀i=1 . . . n} e una funzione di discesa verso Mf mediante la
F(x) =x+
n
∑
i=1
αiei
ove αisono scelti in modo che
f(x+α1e1) ≤ f(x+αe1) ∀α∈R f(x+α1e1+α2e2) ≤ f(x+α1e1+αe2) ∀α∈R . . . . f x+ n−1
∑
i=1 αiei+αnen ! ≤ f x+ n−1∑
i=1 αiei+αen ! ∀α∈Rallora F è una funzione di discesa chiusa.
Dimostrazione. Osserviamo innanzi tutto che se y∈F(x)si ha f(y) ≤ f(F(x)) ≤ f(x)
e che per f(y) = f(x)deve essere
fxi(x) =0 ∀i=1 . . . n e ∀x∈Mf Inoltre se scegliamo (xk, yk) → (ξ, η) yk ∈F(xk) , ξ∈/ Mf; allora yk =xk+ n
∑
i=1 αkiei e, poichè f xk+ j∑
i=1 αkiei ! ≤L,possiamo supporre che αki →αi, a meno di passare ad una estratta.
Ora, se ricordiamo che
f xk+ j
∑
i=1 αkiei ! ≤ ≤ f xk+ j−1∑
i=1 αikei+αej ! ∀α∈R ∀j45
e passiamo al limite, la continuità assicura che
f ξ+ j
∑
i=1 αiei ! ≤ ≤ f ξ+ j−1∑
i=1 αiei+αej ! ∀α∈R ∀j e η∈ F(ξ). 2Cerchiamo ora di valutare la velocità di convergenza del metodo del gradiente e del metodo di discesa componente per componente.
Lemma 2.1 sia f : A→R e sia a⊂Rn un aperto, sia inoltre f ∈C2(A).
Supponiamo che 0<mkhk2≤ hH f(x)h, hi ≤Mkhk2. Allora si ha m≤ fxixi(x) ≤M e |fxixj(x)| ≤ M−m 2 . Inoltre, se∇f(a) =0 si ha mkhk2≤ h∇f(a+h), hi ≤Mkhk2 e m 2khk 2≤ f(a+h) − f(a) ≤ M 2 khk 2.
Dimostrazione. Se scegliamo h = ei ed usiamo le ipotesi, possiamo
ottenere
m≤ fxixi(x) ≤M, inoltre poichè H f(x)è simmetrica si ha
hH f(x)h, ki =1 4(hH f(x)(h+k),(h+k)i − hH f(x)(h−k),(h−k)i) ≤ ≤ 1 4 Mkh+kk2−mkh−kk2 e se poniamo h=ei, k=ej fxi xj (x) ≤ 1 4(2M−2m) =M−m2. In maniera del tutto simile si ottiene
fxixj(x) ≥
m−M
2 .
Quando∇f(a) =0, se consideriamo
46 si ha ϕ(1) −ϕ(0) =ϕ0(τ) τ∈ [0, 1] h∇f(a+h), hi = hH f(a+τk)h, hi τ∈ [0, 1] e mkhk2≤ h∇f(a+h), hi ≤Mkhk2 mentre se consideriamo ϕ(t) = f(a+th) t∈ [0, 1] si ha ϕ(1) −ϕ(0) −ϕ0(0) = ϕ 00( σ) 2 σ∈ [0, 1] f(a+h) − f(a) = hH f(a+σh)h, hi 2 σ∈ [0, 1] e m 2khk 2≤ f(a+h) − f(a) ≤ M 2 khk 2 2
Lemma 2.2 Sia f : A →R, sia a ⊂ Rn un aperto e sia f ∈ C2(A). Sia
inoltre a∈ A e h∈Rn.
Definiamo ϕ(t) = f(a+th)e sia T∈R tale che
ϕ(T) = m
2M2in{ϕ(t): t∈R a+th∈ A}
allora possiamo trovare τ, σ∈ [−T, T]tale che T= −ϕ 0(0) ϕ00(τ) = − h∇f(a), hi hH f(a+τh)h, hi, e ϕ(0) −ϕ(T) = f(a) − f(a+Th) = ϕ 00( σ) 2 T 2= = 1 2 hH f(a+σh)h, hi hH f(a+τh)h, hi2(h∇f(a), hi) 2 Dimostrazione. Si ha ϕ0(0) =ϕ0(0) −ϕ0(T) = −ϕ00(τ)T τ∈ [−T, T] e T= −ϕ 0(0) ϕ00(τ) τ∈ [−T, T] Inoltre