Vous êtes sur la page 1sur 15

1

Funzioni implicite

1.1

Introduzione.

Consideriamo lequazione
F (x, y) = 0,

(1.1)

con F : A R2 R una funzione reale di due variabili reali. Siamo


interessati a descrivere linsieme delle sue soluzioni (o zeri di F )
E0 = E0 (F ) = {(x, y) A | F (x, y) = 0}

(1.2)

In alcuni casi fortunati si pu`o esplicitare una delle due variabili in funzione
dellaltra, cio`e si pu`o riscrivere (1.1) equivalentemente nella forma
y = f (x),

x B R,

x = h(y),

y B R.

oppure nella forma


In tali casi si ha rispettivamente
E0 = {(x, f (x)), x B} = gr(f ),
oppure
E0 = {(h(y), h), y B} = gr(h).
Si dice anche che (1.1) definisce implicitamente la funzione y = f (x) (o
x = h(y)) o, equivalentemente, che y = f (x) (o x = h(y)) `e definita
implicitamente da (1.1).
Vediamo alcuni esempi.
Esempio 1.1. Sia F (x, y) = ax + by + c, con a2 + b2 > 0. E0 `e una retta e
(1.1) definisce implicitamente una funzione y = f (x) o x = h(y).
Esempio 1.2. Sia F (x, y) = xey 3y 2 + 1. Possiamo facilmente esplicitare x
in funzione di y: x = (3y 2 1)ey . E possibile esplicitare anche y in funzione
di x?
Esempio 1.3. Sia F (x, y) = x2 +y 2 1. E0 `e la circonferenza di centro lorigine
e raggio 1. Non `e il grafico di alcuna funzione n`e
del tipo y = f (x), n`e del
1 x2 , per x [1, 1] e
tipo x = h(y). Possiamo
per`
o
definire
y
=
f
(x)
=

2
y = f (x) = 1 x , per x [1, 1]. Si ha che E0 = gr(f ) gr(f ), cio`e
E0 `e unione di due grafici. Unanalisi pi`
u dettagliata mostra che per ogni
punto P0 E0 non appartenente agli assi cartesiani, esiste un suo intorno
1

U in cui si pu`o esplicitare ciascuna variabile in funzione dellaltra, mentre


i quattro punti in cui E0 interseca gli assi hanno un intorno in cui si pu`o
esplicitare una variabile, ma nessun intorno in cui si possa esplicitare anche
laltra variabile. In conclusione per ogni punto P0 E0 , esiste un suo intorno
U tale che E0 U `e il grafico di una funzione.
Definizione 1.4. Diremo che E0 `e localmente grafico se
P0 E0 , U intorno di P0 : E0 U `e il grafico di una funzione

(1.3)

Esempio 1.5. Sia F (x, y) = x2 + y 2 + 1. E0 = .


Esempio 1.6. Sia F (x, y) = x2 + y 2 . E0 = {O = (0, 0)}, `e un punto isolato.
Esempio 1.7. Sia F (x, y) = x2 y 2 . E0 `e unione di due rette passanti
per lorigine (dette rami). Non `e localmente grafico perch`e non `e grafico di
una funzione in nessun intorno dellorigine (appartenente ad E0 ). In questo
caso diremo che (1.1) definisce implicitamente due funzioni in ogni intorno
dellorigine.
Esempio 1.8. Sia F (x, y) = xey + yex . Non si vede come esplicitare una
variabile, si nota facilmente che F (0, 0) = 0, cio`e che P0 = (0, 0) E0 . Come
sar`a E0 in un intorno dellorigine? Per rispondere a questa domanda avremo
bisogno di concscere la teoria delle funzioni implicite.

1.2

Il teorema di Dini.

Definizione 1.9. Sia F : A R2 R. Diremo che una funzione y =


f (x), x I R (x = h(y), y J R) `e definita implicitamente dallequazione (1.1) se (x, f (x)) A per ogni x I ((h(y), y) A per ogni y J) e
se F (x, f (x)) = 0 per ogni x I (F (h(y), y) = 0 per ogni y J). Quanto
sopra equivale a dire che gr(f ) E0 (gr(h) E0 ).
Notazioni.
Sia A un aperto di Rn . Definiamo
C 0 (A) = C(A) = {f : A R | f continua},
C k (A) = {f : A R | f dotata di tutte le derivate parziali fino allordine k,
continue in A},
C (A) = {f : A R | f dotata delle derivate parziali di ogni ordine,
continue in A}.
2

Si ha ovviamente
C (A) C k+1 (A) C k (A) C 0 (A),

k N.

Per semplicit`a, denoteremo le derivate parziali indicando le variabili rispetto


2
alle quali si deriva a pedice della funzione, ad esempio F
= Fx , xyF = Fxy .
x
Teorema 1.10 (Teorema del Dini (o delle funzioni implicite)). Sia
F : A R2 R, con A aperto e F C 1 (A). Sia P0 (x0 , y0 ) A tale che
F (x0 , y0 ) = 0 (ovvero P0 E0 ) e Fy (x0 , y0 ) 6= 0. Allora esistono un intorno
U di x0 ed un intorno V di y0 tali che per ogni x U esiste un unico y V
tale che F (x, y) = 0. Indicato con f (x) tale y, resta definita una funzione
f : U V , tale che f C 1 (U ) e
f 0 (x) =

Fx (x, f (x))
,
Fy (x, f (x))

per ogni x U.

(1.4)

Osservazioni. 1) Il significato geometrico del teorema `e che E0 (U V )


`e il grafico di una funzione y = f (x) di classe C 1 , ovvero una curva. Si ha
ovviamente che f `e definita implicitamente dallequazione F = 0.
2) Poich`e P0 (x0 , y0 ) E0 (U V ), si ha che f (x0 ) = y0 , ovvero il
grafico di f passa per P0 . Si pu`o quindi calcolare f 0 (x0 ), ma in generale, non
essendo nota la funzione f (x), non si potr`a calcolare f 0 (x) usando la (1.4),
per x 6= x0 .
Dimostrazione. Supponiamo ad esempio che Fy (x0 , y0 ) > 0 (nel caso
Fy (x0 , y0 ) < 0 si ha dimostrazione analoga oppure ci si riconduce a questo
caso operando con F , dato che E0 (F ) = E0 (F )).
Essendo Fy continua, per il teorema di permanenza del segno esiste un
rettangolo chiuso R = W V = [x0 k, x0 + k] [y0 h, y0 + h] tale che
Fy > 0 in R. Quindi per ogni x W la funzione
F (x, ) : V R
y 7 F (x, y)
`e strettamente crescente. In particolare, per x = x0 , si ha
F (x0 , y0 h) < F (x0 , y0 ) = 0 < F (x0 , y0 + h)
Applicando il teorema della permanenza del segno a F , si ha che esiste un
intorno U = [x0 l, x0 + l] W tale che F (x, y0 h) < 0 e F (x, y0 + h) > 0
per ogni x U . Applicando il teorema dellesistenza degli zeri a F (x, ) in
V e ricordando che F (x, ) `e strettamente crescente in V , si ha che per ogni
3

x U esiste un unico y V tale che F (x, y) = 0. Resta cos` definita la


funzione f . Proviamo che f `e continua. Dati x1 , x2 U , consideriamo i
punti P1 = (x1 , f (x1 )) U V e P2 = (x2 , f (x2 )) U V . Il segmento
chiuso [P1 , P2 ] `e contenuto nel rettangolo R (che `e convesso). Per il teorema
della media, esiste un punto (, ) [P1 , P2 ] tale che
F (P2 ) F (P1 ) = F (, ) (P2 P1 ),
ovvero
0 = F (x2 , f (x2 )) F (x1 , f (x1 )) = Fx (, )(x2 x1 ) + Fy (, )(f (x2 ) f (x1 )),
da cui
f (x2 ) f (x1 ) =

Fx (, )(x2 x1 )
Fy (, )

Siano M = maxR |Fx | e m = minR Fy . Tali massimo e minimo sono assunti


per il teorema di Weierstrass applicato alle funzioni Fx e Fy , continue sul
compatto R. Inoltre m > 0 per la scelta compiuta di R. Si ha
|f (x2 ) f (x1 )|

M
|x2 x1 |
m

Abbiamo cos` provato che f `e continua. Consideriamo ora il rapporto incrementale


Fx (, )
f (x2 ) f (x1 )
=
x2 x1
Fy (, )
Per la continuit`a di f , se x2 tende a x1 si ha che f (x2 ) tende a f (x1 ), cio`e
P2 tende a P1 e quindi anche (, ) [P1 , P2 ] tende a P1 . Dunque, per la
continuit`a di Fx e Fy ,
lim

x2 x1

f (x2 ) f (x1 )
Fx (x1 , f (x1 ))
=
,
x2 x1
Fy (x1 , f (x1 ))

x1 U.

Vale quindi la (1.4), dalla quale `e evidente la continuit`a di f 0 .



Osservazioni. 1) E evidente che se lipotesi Fy (x0 , y0 ) 6= 0 `e sostituita
da Fx (x0 , y0 ) 6= 0, allora, invertendo il ruolo delle variabili x e y, si ha una
seconda versione del teorema di Dini, simmetrica alla precedente, e cio`e in
tal caso esistono un intorno U di x0 ed un intorno V di y0 tali che per ogni
y V esiste un unico x U tale che F (x, y) = 0. Indicato con h(y) tale x,
resta definita una funzione h : V U , tale che h C 1 (V ) e
h0 (y) =

Fy (h(y), y)
,
Fx (h(y), y)
4

per ogni y V.

(1.5)

2) Se F C 1 (A), P0 = (x0 , y0 ) E0 (F ) e F (x0 , y0 ) 6= 0, allora, in un


opportuno intorno di P0 , E0 (F ) `e il grafico di una funzione.
3) Se F (x0 , y0 ) 6= 0, per ogni P0 E0 (F ), allora E0 (F ) `e localmente
grafico.
Si rivedano gli esempi 1.3, 1.7, 1.8, alla luce del teorema di Dini.
Corollario 1.11 (Regolarit`
a delle funzioni implicite). Se, nelle ipotesi
del teorema di Dini, F C n (A), con n 1, allora f C n (U ); se F
C (A), allora f C (U ).
Dimostrazione.
La dimostrazione procede per induzione. Per n = 1 la tesi `e vera, per il
teorema di Dini. Supponiamo che sia vera per n e proviamolo per n + 1. Se
F C n+1 (A), ovviamente F C n (A) e, per lipotesi induttiva, f C n (U ).
Da (1.4) si ha che f 0 C n (U ), da cui f C n+1 (U ).

Possiamo in particolare usare la (1.4) per esprimere la derivata seconda
di f , nel caso in cui F C 2 (A), ottenendo
Fy2 Fxx 2Fx Fy Fxy + Fx2 Fyy
f (x) =
|(x,f (x)) ,
Fy3
00

per ogni x U.

(1.6)

In alternativa, si pu`o usare il metodo di derivazione implicita, che


consiste nel partire dallidentit`a
per ogni x U,

F (x, f (x)) = 0,

(1.7)

e nellosservare che anche le derivate successive di (1.7), quando esistono, sono


identicamente nulle in U . Ad esempio, derivando una volta, ed omettendo
per brevit`a largomento (x, f (x)) delle derivate di F , si ha
Fx + Fy f 0 (x) = 0,

per ogni x U.

(1.8)

Con riferimento allesempio 1.8, si calcolino le derivate prime e seconde


della funzione y = f (x) definita implicitamente dallequazione xey + yex = 0
in un intorno dellorigine. Si ottiene f (x) = x + 2x2 + o(x2 ). Si noti che,
essendo f di classe infinito, si pu`o scrivere la formula di Taylor di qualunque
ordine di f con punto iniziale 0.
Da (1.8) si vede che il gradiente di F `e ortogonale al vettore tangente al
grafico di f in ogni suo punto (x, f (x)). Si dice anche che il gradiente di F
`e ortogonale alla curva gr(f ) = E0 (F ) (U V ). Si noti che, dato che il
gradiente individua la direzione di massima crescita di F , `e naturale che
esso sia ortogonale alla curva su cui F `e costante (F = 0).
5

Considerazioni del tutto analoghe valgono ovviamente nel caso in cui si


esplicita la variabile x (derivate successive, derivazione implicita, ortogonalit`a
del gradiente di F alla curva x = h(y)). Ad esempio, se F C 2 (A) e
Fx (x0 , y0 ) 6= 0, si ha
h00 (y) =

Fy2 Fxx 2Fx Fy Fxy + Fx2 Fyy


|(h(y),y) ,
Fx3

per ogni y V.

(1.9)

Definizione 1.12. Un punto P0 E0 (F ) si dice punto regolare di E0 se


F (P0 ) 6= 0.
Un punto P0 E0 (F ) si dice punto singolare di E0 se non `e regolare
cio`e se F (P0 ) = 0.
Se tutti i punti di E0 (F ) sono regolari allora E0 (F ) `e localmente grafico
di una funzione, quindi `e una curva piana, eventualmente sconnessa. Inoltre
E0 (F ) `e un insieme chiuso essendo F continua.
In un punto singolare P0 possono verificarsi varie situazioni: P0 pu`o essere
un punto isolato di E0 (v. esempio 1.6); P0 pu`o essere lintersezione di due o
pi`
u rami di E0 (v. esempio 1.7); ma pu`o anche esistere un intorno di P0 in cui
E0 `e grafico di una funzione! (ad esempio F (x, y) = (y x2 )2 , P0 = (0, 0))
Il teorema di Dini si estende, con dimostrazione analoga, al caso in cui
F sia una funzione di 3 o pi`
u variabili. Lenunciato in dimensione 3 `e il
seguente.
Teorema 1.13 (Teorema del Dini (caso 3D)). Sia F : A R3 R,
con A aperto e F C 1 (A). Sia P0 (x0 , y0 , z0 ) A tale che F (x0 , y0 , z0 ) = 0
(ovvero P0 E0 ) e Fz (x0 , y0 , z0 ) 6= 0. Allora esistono un intorno U di (x0 , y0 )
ed un intorno V di z0 tali che per ogni (x, y) U esiste un unico z V tale
che F (x, y, z) = 0. Indicato con f (x, y) tale z, resta definita una funzione
f : U V , tale che f C 1 (U ) e
fx (x, y) =

Fx (x, y, f (x, y))


,
Fz (x, y, f (x, y))

fy (x, y) =

Fy (x, y, f (x, y))


,
Fz (x, y, f (x, y))

(x, y) U.
(1.10)

Osservazioni. 1) Il significato geometrico del teorema `e che E0 (U V )


`e il grafico di una funzione z = f (x, y) di classe C 1 , ovvero una superficie.
Il piano tangente a tale superficie in un suo punto P (x, y, z = f (x, y)) ha
equazione

... z = f (x, y) + fx (x, y)(x x) + fy (x, y)(y y),

ovvero, tenendo conto di (1.10),

... Fx (P )(x x) + Fy (P )(y y) + Fz (P )(z z) = 0,


6

da cui
F (P ) (P P ) = 0,

P .

Quindi F (P ) `e ortogonale al piano tangente . Si dice perci`o che il


gradiente di F `e ortogonale alla superficie gr(f ).
2) Valgono le versioni analoghe del teorema nel caso in cui lipotesi
Fz (P0 ) 6= 0 sia sostituita da Fx (P0 ) 6= 0 o da Fy (P0 ) 6= 0. Si d`a, similmente al caso bidimensionale, la definizione di punti regolari e singolari di
E0 .
3) Si `e fin qui considerato linsieme degli zeri di F , ma in generale interessa
descrivere gli insiemi di livello Ec = Ec (F ) = {F = c} = {F c = 0} =
E0 (F c). Applicando il teorema di Dini a F c, al variare di c R, si
ottengono informazioni sugli insiemi di livello di F (detti curve di livello nel
caso bidimensionale e superfici di livello nel caso tridimensionale, si pensi alle
isobare o alle isoterme). Da quanto sopra si ha che in ogni punto regolare di
uninsieme di livello di F , il gradiente di F `e ortogonale allinsieme di livello.
Facciamo ora un ulteriore passo, considerando un sistema di due equazioni
in tre variabili

F (x, y, z) = 0,
(1.11)
G(x, y, z) = 0,
le cui equazioni F = 0 e G = 0 rappresentano dei vincoli imposti alle variabili
spaziali x, y, z e le cui soluzioni costituiscono linsieme E0 = E0 (F ) E0 (G).
Possiamo immaginare di esplicitare una variabile dalla prima equazione, ad
esempio la z in funzione di x e y, sostituire nella seconda equazione, ottenendo
una equazione nelle variabili x e y e da essa ricavare ad esempio y in funzione
di x; in tal modo, sostituendo ancora, anche z sar`a espressa in funzione
della sola variabile x. Ci si aspetta quindi in generale che il sistema (1.11)
rappresenti una curva nello spazio, ad esempio di equazioni z = z(x), y =
y(x), x I.
Adottando un altro punto di vista, se F e G sono di classe C 1 su un
aperto A e se P0 (x0 , y0 , z0 ) E0 `e punto regolare sia per E0 (F ) che per
E0 (G), allora in un intorno di P0 linsieme E0 `e intersezione di due superfici
di tipo grafico, quindi ci aspettiamo che sia una curva.
Come esempio, consideriamo due punti P1 (x1 , y1 , z1 ) e P2 (x2 , y2 , z2 ) aventi
distanza d, d > 0. Il sistema

F (x, y, z) = (x x1 )2 + (y y1 )2 + (z z1 )2 r2 = 0,
(1.12)
G(x, y, z) = (x x2 )2 + (y y2 )2 + (z z2 )2 r2 = 0,
dove r > 0, d 2r, rappresenta lintersezione di due sfere i cui punti sono
tutti punti regolari, come si verifica facilmente. Se d = 2r, le due sfere
7

sono tangenti nel punto medio P0 del segmento [P1 , P2 ]. Pur essendo P0
punto regolare sia per E0 (F ) che per E0 (G), linsieme E0 = E0 (F ) E0 (G) `e
costituito dal solo punto P0 . Se invece d < 2r, allora il sistema rappresenta
una circonferenza. Se si osservano i vettori F (P0 ) e G(P0 ) in un punto
P0 E0 , si nota che nel primo caso essi sono paralleli, mentre nel secondo
caso non lo sono. Ed in effetti si pu`o verificare, utilizzando il teorema del
Dini in due e in tre variabili, che una opportuna versione del teorema del Dini
si applica a sistemi della forma (1.11) in un punto P0 E0 se sono verificate
le ipotesi seguenti:
F C 1 (A),
G C 1 (A),
F (P0 ) e G(P0 ) sono linearmente indipendenti.
Si osservi che lultima condizione implica che F (P0 ) 6= 0 e G(P0 ) 6= 0
ed `e equivalente a chiedere che sia massimo, cio`e uguale a 2, il rango della
matrice Jacobiana


Fx (P0 ) Fy (P0 ) Fz (P0 )
Gx (P0 ) Gy (P0 ) Gz (P0 )
Sotto queste ipotesi, in un intorno opportuno di P0 , E0 `e una curva,
grafico di una funzione di una variabile spaziale a valori in R2 , ad esempio
f (x) = (y(x), z(x)), x I.
Per enunciare il caso generale del teorema di Dini, che comprende anche il
caso di sistemi di due equazioni in tre incognite sopra menzionato, introduciamo alcune notazioni. Consideriamo un sistema di n equazioni nelle m + n
variabili x1 , ..., xm , y1 , ..., yn

F1 (x1 , ..., xm , y1 , ..., yn ) = 0,

(1.13)

Fn (x1 , ..., xm , y1 , ..., yn ) = 0.


n
Denotiamo x = (x1 , ..., xm ) Rm
x , y = (y1 , ..., yn ) Ry , e F = (F1 , ..., Fn ),
m
n
n
F : Rx Ry R . Con queste notazioni, il sistema si scrive in forma
compatta come
F (x, y) = 0.

La matrice Jacobiana di F
F1
x1


JF =

Fn
x1

F1
F1
x
y1
m


Fn
Fn
x
y1
m

1
F
yn


n
F
yn

(1.14)

si riscrive nella forma


JF =

F
x

F
y

(1.15)

Teorema 1.14 (Teorema del Dini (caso generale)). Sia F : A Rm


x
n
n
1
Ry R , con A aperto e F C (A). Sia P0 (x0 , y0 ) A tale che F (x0 , y0 ) =
0 e det( F
(x0 , y0 )) 6= 0. Allora esistono un intorno U di x0 in Rm ed un
y
intorno V di y0 in Rn tali che per ogni x U esiste un unico y V tale che
F (x, y) = 0. Indicato con f (x) tale y, resta definita una funzione f : U
Rm V Rn , tale che f C 1 (U ) e

Jf (x) =

1
F
F
(x, f (x))
(x, f (x)),
y
x

per ogni x U.

(1.16)

y
Talora indicheremo anche f (x) = y(x) e Jf (x) = f
= x
.
x
Osservazioni. 1) f (x0 ) = y0 .
2) Poich`e f `e funzione di m variabili, il suo grafico che, in U V , coincide con E0 , `e detto m-superficie; m rappresenta la dimensione delloggetto
geometrico ed `e uguale alla differenza tra il numero delle variabili (gradi di
libert`a) e il numero di equazioni (vincoli).
3) Per semplificare la notazione si suppone nellenunciato del teorema che
le ultime n colonne della matrice Jacobiana siano linearmente indipendenti,
in modo da esplicitare le ultime n variabili. Ma naturalmente la tesi sussiste
ancora nel caso in cui la matrice Jacobiana abbia n colonne linearmente
indipendenti; basta infatti cambiare lordine delle variabili per ricondursi al
caso sopra enunciato. Quindi la condizione generale sotto la quale vale il
teorema `e che la matrice Jacobiana abbia rango massimo (uguale a n) in P0 .

1.3

Il teorema della funzione inversa.

Definizione 1.15. Siano A e B aperti di Rn . Una funzione f : A B si


dice diffeomorfismo (diffeomorfismo C k , diffeomorfismo C ) se
1) f C 1 (A)(C k (A), C (A))
2) f `e biettiva
3) f 1 : B A C 1 (B)(C k (B), C (B))
Definizione 1.16. Siano A un aperto di Rn , f : A Rn e x0 A. Si dice
che f `e un diffeomorfismo locale in x0 se esistono un intorno U di x0 ed un
intorno V di f (x0 ) tali che f|U : U V sia un diffeomorfismo. Si dice che f
`e localmente invertibile se `e un diffeomorfismo locale in ogni x A.

Osservazione. Se f : A B `e un diffeomorfismo tra gli aperti A e B


di Rn , allora si verifica facilmente che per ogni x A la matrice Jacobiana
Jf (x) `e invertibile e Jf 1 (f (x)) = (Jf (x))1 , per ogni x A.
Infatti si ha che
f 1 f = IdA ,
f f 1 = IdB ,
da cui
J(f 1 f )(x) = J(f 1 (f (x)) Jf (x) = J(IdA )(x) = In ,
J(f f 1 )(f (x)) = Jf (f 1 (f (x))) J(f 1 (f (x)) = J(IdB )(f (x)) = In .
Quindi Jf (x) `e invertibile e Jf 1 (f (x)) = (Jf (x))1 .
In realt`a la condizione che Jf (x) sia invertibile `e condizione non solo
necessaria ma anche sufficiente per linvertibilit`a locale, come enunciato nel
seguente teorema, che non dimostriamo.
Teorema 1.17 (Teorema della funzione inversa). Sia A un aperto di
Rn e sia f C 1 (A, Rn ). Sia x0 A. Se det (Jf (x0 )) 6= 0, allora f `e un
diffeomorfismo locale in x0 , cio`e esistono un intorno U di x0 e un intorno V
di f (x0 ) tali che f|U : U V `e un diffeomorfismo e
(Jf 1 )(y) = (Jf (f 1 (y))1 ,

y V.

Osservazioni. 1) Gli enunciati del teorema delle funzioni implicite e del


teorema della funzione inversa sono equivalenti, nel senso che a partire da
uno di essi si pu`o dimostrare laltro.
2) Ci si pu`o chiedere come mai si sia data la definizione di diffeomorfismo solo tra aperti di spazi euclidei aventi la stessa dimensione. Si pu`o
agevolmente verificare, seguendo le linee della verifica svolta allinterno della
precedente osservazione, che, supponendo che f sia un diffeomorfismo tra un
aperto di Rk e un aperto di Rm , si ha necessariamente k = m. A titolo di curiosit`a, vale un risultato molto pi`
u generale: se f `e un omeomorfismo (mappa
continua con inversa continua) tra un aperto di Rk e un aperto di Rm , necessariamente k = m, ma la dimostrazione di tale risultato `e estremamente
complessa e profonda!
3) E possibile fornire controesempi che testimoniano che lipotesi f
1
C (A) non pu`o essere rilassata a f differenziabile in A.

10

1.4

Estremi vincolati.

Considereremo ora situazioni in cui si ricercano gli estremi (massimo/minimo)


di una funzione le cui variabili non sono indipendenti luna dallaltra, ma devono soddisfare una o pi`
u equazioni o disequazioni, dette di vincolo. Ad
esempio,
massimizzare f (x, y, z), soggetta a F (x, y, z) = 0,
minimizzare f (x, y, z, w), soggetta a F (x, y, z, w) = 0, G(x, y, z, w) = 0,
massimizzare f (x, y, z), soggetta a F (x, y, z) 0.
Considereremo prima il caso in cui i vincoli siano costituiti da equazioni.
In questo ambito una strategia naturale `e quella di esplicitare un numero di
variabili pari al numero di equazioni e ridurre il problema di estremo a un
problema di estremo senza vincoli in un numero minore di variabili. Spesso
per`o ci`o o non `e possibile o non `e conveniente ed allora si ricorre al metodo dei
moltiplicatori di Lagrange, che si basa sul teorema delle funzioni implicite.
Sia A un aperto di Rm , con m 2. Siano f : A Rm R e F :
A Rm Rn , con n < m. Dunque F = (F1 , ..., Fn ). Sia E0 (F ) = {x
A : F (x) = 0} = ni=1 E0 (Fi ). Linsieme E0 (F ) `e detto vincolo. Il termine
vincolo `e utilizzato anche per indicare lequazione F = 0 o la funzione F .
Definizione 1.18. Un punto x0 A si dice punto di massimo vincolato
(o condizionato) per f con vincolo F = 0 se
F (x0 ) = 0

( x0 E0 (F )),
(1.17)

f (x) f (x0 ), x E0 (F ).
Un punto x0 A si dice punto di massimo vincolato (o condizionato)
relativo (o locale) per f con vincolo F = 0 se
F (x0 ) = 0

( x0 E0 (F )),
(1.18)

un intorno U di x0 : f (x) f (x0 ), x E0 (F ) U.


Il valore f (x0 ) `e detto massimo vincolato.
Analoghe definizioni si danno per i punti di minimo vincolati. Un punto
di estremo vincolato `e un punto di massimo o minimo vincolato (assoluto
o relativo). Per distinguere questo concetto di estremo da quello di estremo usuale, i punti di estremo in assenza di vincoli vengono detti punti di
estremo liberi.
11

Teorema 1.19 (Teorema dei moltiplicatori di Lagrange). Sia f : A


Rm R, differenziabile su A, con A aperto e m 2. Sia F : A Rm Rn ,
con n < m, F C 1 (A). Sia x0 A un punto di estremo relativo vincolato
per f con vincolo F = 0, tale che rank(JF (x0 )) = n. Allora esistono n
numeri reali 1 ,...,n , detti moltiplicatori di Lagrange, tali che

F (x0 ) = 0,
(1.19)
P

f (x0 ) + ni=1 i Fi (x0 ) = 0,


ovvero, posto = (1 , ..., n ), si ha che (x0 , ) Rm+n verifica il sistema di
m + n equazioni in m + n incognite

F1 (x1 , ..., xm ) = 0,

Fn (x1P
, ..., xm ) = 0,
(1.20)
n
(f
+

i=1 i Fi )x1 (x1 , ..., xm ) = 0,

(f + ni=1 i Fi )xm (x1 , ..., xm ) = 0.


Osservazioni. 1) Il numero dei moltiplicatori `e uguale al numero dei vincoli. La seconda delle (1.19) esprime f (x0 ) come combinazione lineare dei
vettori (linearmente indipendenti per ipotesi) Fi (x0 ). Perci`o i moltiplicatori
di Lagrange sono univocamente determinati.
2) La condizione di estremo vincolato relativo `e meno restrittiva rispetto
a quella di estremo libero relativo e, corrispondentemente, questo teorema
fornisce una condizione necessaria affinch`e un punto sia di estremo vincolato
relativo, che `e meno restrittiva rispetto alla condizione necessaria f (x0 ) = 0
soddisfatta dagli estremi liberi.
3) Un metodo per ricordare
Pn il sistema (1.19) consiste nellintrodurre la
funzione (x, ) = f (x) + i=1 i Fi (x) e imporre = 0.
4) Il teorema fornisce una condizione necessaria, che `e utile per cercare
gli estremi vincolati assoluti (quando esistono). Precisamente si determinano
le soluzioni del sistema (1.20) oltre agli eventuali punti di E0 (F ) in cui non `e
soddisfatta la condizione di rango massimo. Dal confronto dei valori assunti
da f in tali punti, si determinano gli estremi assoluti.
Dimostrazione. Il teorema delle funzioni implicite garantisce che si
possono esplicitare n variabili in funzione delle rimanenti m n in un intorno
di x0 . Poniamo k = m n, (k `e la dimensione del vincolo in un intorno di
x0 ), cos` che m = n + k. Supponiamo che sia, ad esempio,


(F1 , ..., Fn )
(x0 ) 6= 0.
(1.21)
det
(xk+1 , ..., xm )
12

Poniamo xk+i = yi , i = 1, ..., n, e cambiano le notazioni come segue. Riscriviamo il generico punto x = (x1 , ..., xk , xk+1 , ..., xm ) nella forma (x, y) =
(x1 , ..., xk , y1 , ..., yn ). In tal modo il punto x0 viene riscritto come (x0 , y0 ) e
la condizione (1.21) diventa


F
(x0 , y0 ) 6= 0,
(1.22)
det
y
dove si `e posto

Jf (x0 , y0 ) =

F
(x0 , y0 )
x


F
(x0 , y0 ) .
y

Per il teorema delle funzioni implicite, esistono un intorno W di x0 , un intorno


V di y0 ed una funzione g : W Rk V Rn , g C 1 (W ), tale che g(x0 ) =
y0 e F (x, g(x)) 0 in W . Equivalentemente, (x, g(x)) E0 (F ) per ogni x
W . Essendo (x0 , g(x0 )) punto di estremo relativo vincolato per f con vincolo
E0 (F ), allora x0 `e punto di estremo relativo libero per
 (x) =
 la funzione
f
f g
f (x, g(x)), definita in W . Quindi (x0 ) = 0, ovvero x + y x (x0 , y0 ) =
h i1
g
F
0. Dal teorema delle funzioni implicite abbiamo che x
= F
|
y
x (x,g(x))


h i1
F
F
per ogni x W e quindi f
f
(x0 , y0 ) = 0. Dunque (x0 , y0 )
x
y y
x
risolve un sistema di k equazioni in m incognite, ma, se aggiungiamo le n
equazioni contenute nella condizione F = 0, otteniamo il seguente sistema di
m equazioni in m incognite

h i1 

f
f
F

(x0 , y0 ) = 0,
x y F
y
x
(1.23)

F (x0 , y0 ) = 0.
Questa formula ha vari svantaggi: comporta il calcolo dellinversa di una
matrice e del prodotto di tre matrici; inoltre essa `e stata ottenuta supponendo che, riutilizzando la notazione iniziale, il minore costituito dalle ultime
n righe della matrice JF (x0 ) avesse determinante non nullo e, nellapplicazione pratica del teorema (vedi ossevazione 4)) tale minore pu`o variare al
variare del punto x0 A, modificandosi di conseguenza la formula (1.23). Ci
troveremmo quindi, in generale, a dover risolvere pi`
u di un sistema di tale
tipo.
Conviene allora procedere definendo

1
f F
= (1 , ..., n ) =
|(x0 ,y0 ) ,
(1.24)
y y
13

da cui

F
f
+
y
y


(x0 , y0 ) = 0.

Inoltre la prima equazione di (1.23) si riscrive come




f
F
+
(x0 , y0 ) = 0.
x
x

(1.25)

(1.26)

Passando dalla notazione matriciale compatta a quella per componenti e


ritornando alle notazioni iniziali per le variabili, si ottiene la tesi.


1.5

Estremi assoluti.

Sia B un sottinsieme compatto (chiuso e limitato) di Rn e sia f : B Rn


R una funzione continua. Il teorema di Weierstrass garantisce che f assume
massimo e minimo (assoluti) su B.
Per determinarli si cercano i candidati punti di estremo:
1) tra i punti interni a B:
1a) punti critici,
1b) punti in cui f non `e differenziabile;
2) tra i punti di B appartenenti alla frontiera di B:
2a) punti di estremo vincolato (con il metodo dei moltiplicatori di Lagrange o utilizzando parametrizzazioni del vincolo),
2b) punti di intersezione di vincoli (spigoli)
Se B non `e compatto, ovvero non `e chiuso o `e illimitato (eventualmente
entrambe le cose) non si pu`o garantire lesistenza degli estremi, dato che non
vale il teorema di Weierstrass. Sono comunque definiti lestremo inferiore
inf B f e lestremo superiore supB f , finiti o infiniti. Soffermiamoci sullestremo inferiore, considerazioni analoghe varranno per lestremo superiore. Se
esiste P0 B : f (P0 ) = inf B f allora f assume il minimo, altrimenti no.
Per determinare inf B f e vedere se esiste il minimo, si ricercano i candidati punti di minimo come indicato sopra per il caso B compatto ed inoltre si
studia il comportamento di f in prossimit`a degli eventuali punti di frontiera
di B che non appartengono a B (se B non `e chiuso) e allinfinito, cio`e per
kP k . Se ad esempio si riesce a dimostrare che limkP k f (P ) = +
oppure che tale limite `e maggiore del valore di f in un particolare punto
di B, allora linf non `e assunto allinfinito. Per chiarire questa affermazione, si consideri una successione minimizzante, cio`e {Pn } B, tale che
limn f (Pn ) = inf B f , che esiste sicuramente per definizione di estremo inferiore. Dal comportamento di f allinfinito descritto sopra, si ha che Pn `e
14

limitata, quindi, per il teorema di Bolzano-Weierstrass, ha una sottosuccessione convergente a un punto P B. Se P B allora il minimo `e assunto
e si determina, come descritto sopra, valutando f nei punti elencati nello
schema introdotto per il caso B compatto; altrimenti si deve studiare il comportamento di f intorno ai punti di frontiera di B che non appartengono a
B. Un trucco che si rivela utile talvolta consiste nellestendere la funzione f
ad una funzione continua su B, quando ci`o sia possibile, eliminando in tal
modo le difficolt`a legate alla non chiusura di B. Comunque non esiste un
unico modo di procedere, si deve valutare il da farsi volta per volta.

15

Vous aimerez peut-être aussi