Vous êtes sur la page 1sur 31

Université Paris 2 - L1 Economie-Gestion - Mathématiques 2 (Paris) - Mme Morhaim

Ce document comporte les parties

• Conseils de travail
• Rappel
• Fonctions de deux variables réelles: généralités
• Optimisation libre
• Optimisation liée
• Solutions des exercices

Conseils de travail

La méthode de travail
L’essentiel de la méthode de travail tient dans le temps et la concentration que vous allez apporter à
l’apprentissage du cours et à la recherche des exercices. Moins vous regardez la correction, plus vous
recherchez les exercices et y réfléchissez avant la correction, mieux vous assimilerez les notions.

Ce document d’accompagnement de votre travail pour le cours de mathématiques 2 n’est pas conçu
pour être lu mais est conçu comme un outil de travail. Il vous accompagne et vous guide, même si
rien ne remplace le rythme que le professeur donne au cours en fonction des étudiants. C’est vous,
en respectant le rythme conseillé qui avez la clé de la meilleure assimilation possible des notions. En
particulier, il faut chercher les exercices au fur et à mesure, et y passer du temps.

Progression Si vous rencontrez une difficulté sur une notion de cours ou une question dans un
exercice, il faut progressivement suivre les étapes suivantes.
Etape 1. Continuer de réfléchir par soi-même, mûrir la question.
Etape 2. Si la difficulté persiste, y revenir un peu plus tard et y reréfléchir.
Etape 3. Si la difficulté persiste encore, contacter ses camarades et travailler à distance avec eux.
Etape 4. Si la difficulté persiste toujours, contacter son chargé de td de la façon dont il vous l’a
indiqué, en faisant circuler au maximum l’information parmi vos camarades.
Etape 5. Il est aussi possible de me contacter: lisa.morhaim@u-paris2.fr

Solidarité entre les étudiants


J’en appelle à la solidarité entre vous. Echangez le plus possible à distance. Bien sûr pour prendre
des nouvelles. Mais aussi pour transmettre les informations dont vous disposez, vérifier que vos
camarades ont bien reçu les documents, continuer de travailler ensemble à distance.

Je vous souhaite un très bon travail !

Mme Morhaim
Rappel

Au début du cours d’optimisation, on avait insisté sur le fait que la notion d’optimum d’une fonction
est lié à l’ensemble sur lequel on travaille. On avait travaillé un exemple graphiquement. Je vous
avait proposé de commencer par travailler cet exercice avant de continuer le cours.

Exercice 1 On considère le problème d’optimisation



Optimiser f (x) = x3 + x2
(P) =
s.c. x∈E

On travaille pour chaque question sur un ensemble E différent. Répondre à toutes les questions par
une étude analytique. A la fin de l’exercice, construire le tableau de variations de f sur E = IR et
contrôler les résultats trouvés.
1) On suppose que E = IR.
a) Calculer le(s) point(s) critiques de f .
b) Calculer la dérivée seconde de f .
c) Que peut-on en conclure quant aux points critiques trouvés au a)?
d) Résoudre le problème d’optimisation (P) lorsque E = IR.
2) Résoudre le problème d’optimisation (P) lorsque
a) E = [− 31 ; 13 ] b) E = [−1; − 13 ] c) E = [−1; 31 ] d) E = [−1; 1] e) E = [−2; 13 ] ∪ [1; 5]
Fonctions de deux variables réelles: généralités

On s’intéresse maintenant aux fonctions de IRn dans IR, autrement dit la variable x est un n-uplet.
On parle de fonctions à n variables et les outils permettant l’étude de ces fonctions sont spécifiques.
Parce qu’on peut encore faire des représentations graphiques pour des fonctions de deux variables
(n = 2), on commence par étudier ces fonctions. On peut dans ce cas voir les deux variables comme
les coordonnées d’un point du plan dans un repère orthonormé et les valeurs de la fonction comme
une “altitude”.

Les éléments x de IR2 sont appelés des points de IR2 ou des vecteurs de IR2 .

Définitions. Soit E un sous-ensemble de IR2 , f : E ⊂ IR2 → IR une fonction et k un réel.


1) On appelle courbe de niveau k l’ensemble

Lk = {x ∈ E, f (x) = k}

ou encore, en écrivant la variable x = (x1 , x2 ) ∈ IR2 , Lk = {(x1 , x2 ) ∈ E, f (x1 , x2 ) = k}.


2) On appelle ensemble de niveau k l’ensemble

Sk = {x ∈ E, f (x) ≤ k}

ou encore, en écrivant la variable x = (x1 , x2 ) ∈ IR2 , Lk = {(x1 , x2 ) ∈ E, f (x1 , x2 ) ≤ k}.

Exercice 2
Quel est le domaine de définition des fonctions suivantes? Est-il ouvert, fermé, borné, compact,
convexe? √
a) f1 (x, y) = 2x+y
x−y
b) f2 (x, y) = 2x − y c) f3 (x, y) = ln(4 − x2 − y 2 ) d) f4 (x, y) = xy = ey ln x

Exercice 3
Pour chacune des fonctions suivantes, donner son domaine de définition puis représenter géométriquement
les courbes et les ensembles de niveaup k = 1 et k = 0.
1) f1 (x, y) = xy 2) f2 (x, y) = x2 + y

Définition. Une fonction f : IR2 → IR est linéaire si elle vérifie les deux conditions suivantes
1) ∀x, x0 ∈ IR2 , f (x + x0 ) = f (x) + f (x0 )
2) ∀x ∈ IR2 , ∀λ ∈ IR, f (λx) = λf (x).

Proposition. f : IR2 → IR est linéaire si et seulement si il existe un unique vecteur a ∈ IR2


tel que f (x) = ha, xi.

Définition. Une fonction f : IR2 → IR est affine si elle s’écrit

f (x) = l(x) + c

avec l : IR2 → IR une fonction linéaire et c ∈ IR une constante.


Autrement dit, une fonction affine est la somme d’une fonction linéaire et d’une constante.

Continuité.
Définition. Soit f : IR2 → IR, a ∈ IR2 et l ∈ IR. On dit que f tend vers vers l en a, noté lim f (x) = l
x→a
si
∀ε > 0, ∃δ > 0, ∀x ∈ IR2 , kx − ak ≤ δ ⇒ |f (x) − f (l)| ≤ ε
On dit que f est continue en a si f est définie en a et si lim f (x) = f (a). On dit que f est
x→a
continue sur l’ensemble D si f est continue en tout point de D.
Propriétés.
La fonction constante est continue.
La somme de fonctions continues est une fonction continue.
Le produit de fonctions continues est une fonction continue.
Le quotient de fonctions continues dont le dénominateur ne s’annule pas est une fonction continue.

Différentiabilité d’une fonction de deux variables.


Pour comprendre la notion de différentiabilité d’une fonction de deux variables, souvenons-nous
d’abord de la notion de dérivabilité d’une fonction d’une variable réelle. Dans le cas d’une fonction
f : IR → IR d’une variable, f est dérivable en x ∈ IR si le taux d’accroissement τx (h), défini pour
h 6= 0 par
f (x + h) − f (x)
τx (h) =
h
admet une limite a ∈ IR quand h tend vers 0. On dit alors que cette limite a est la dérivée de f en
x et on note cette limite f 0 (x).

On peut montrer que, en notant ε(h) = f (x+h)−f h


(x)
− a, cette définition est équivalente à dire que f
est dérivable en x ∈ IR s’il existe a ∈ IR tel que

f (x + h) = f (x) + ah + hε(h), avec lim ε(h) = 0


h→0

On appelle souvent le terme r(h) = hε(h) le “reste”. Autrement dit, pour h assez petit, f est presque
une fonction affine: elle serait une fonction affine s’il n’y avait pas le terme r(h).

En posant x = x + h, on obtient que

f (x) = f (x) + a(x − x) + (x − x)ε(x − x), avec lim ε(x − x) = 0


x→x

et pour x au voisinage de x, la fonction f est presque affine

f (x) ∼ f (x) + a(x − x)

C’est la même idée pour la notion de différentiabilité d’une fonction de deux variables.

Définition. On dit que f : IR2 → IR est différentiable en x ∈ IR2 si f est définie au voisinage
de x et s’il existe un vecteur a ∈ IR2 tel que

f (x + h) = f (x) + ha, hi + ||h||ε(h)

avec ε : IR2 → IR telle que lim ε(h) = 0.


||h||→0

Définition. Soit f : IR2 → IR une fonction définie au voisinage de x = (x1 , x2 ) ∈ IR2 . On ap-
pelle
1) dérivée partielle de f par rapport à la première variable au point x la limite si elle existe

∂f f (x1 + h, x2 ) − f (x1 , x2 )
(x) = lim
∂x1 h→0 h
2) dérivée partielle de f par rapport à la deuxième variable au point x la limite si elle existe

∂f f (x1 , x2 + h) − f (x1 , x2 )
(x) = lim
∂x2 h→0 h
∂f
Autrement dit, la dérivée partielle de f par rapport à la première variable, notée ∂x 1
, est la dérivée
de la fonction d’une variable x1 → f (x1 , x2 ), la valeur de x2 étant fixée. De la même manière, la
∂f
dérivée partielle de f par rapport à la deuxième variable, notée ∂x 2
, est la dérivée de la fonction
d’une variable x2 → f (x1 , x2 ), la valeur de x1 étant fixée.
Notations.
∂f ∂f
Les notations usuelles des dérivées partielles secondes sont ∂x1
et ∂x2
, ou D1 f et D2 f , ou fx0 1 et fx0 2
ou f10 et f20 .

Définition. Soit f : IR2 → IR une fonction définie et admettant des dérivées partielles au point
x ∈ IR2 . On appelle gradient de f le vecteur des dérivées partielles

∂f ∂f
∇f (x) = ( (x), (x))
∂x1 ∂x2

Définition. Soit f : IR2 → IR une fonction définie et admettant des dérivées partielles au point
x ∈ IR2 . Si ∇f (x) = 0 alors x est appelé point critique de f .

Si f admet dérivées partielles au voisinage du point x ∈ IR2 , on peut regarder si chacune de ces
dérivées partielles admet elle-même des dérivées partielles. Les dérivées partielles secondes au point
x sont alors définies, si elles existent par

∂ 2f ∂ ∂f
(x) = ( )(x), avec i, j = 1, 2
∂xi ∂xj ∂xi ∂xj

Notations.
∂2f
Les notations usuelles des dérivées partielles sont ∂xi ∂xj
ou Dij ou fx00i xj ou fij00 .

Définition. Soit f : IR2 → IR une fonction définie et admettant des dérivées partielles secondes
au point x ∈ IR2 . On appelle matrice hessienne ou hessien de f en x le tableau à deux lignes et deux
colonnes  ∂2f ∂2f

∂x1 2 (x) ∂x1 ∂x2
(x)
∇2 f (x) = 
 

∂2f ∂2f
∂x2 ∂x1
(x) ∂x2
(x)
2

Définition.
On appelle forme quadratique associée à la matrice hessienne en x, la fonction d2 fx : IR2 → IR
définie pour tout h = (h1 , h2 ) ∈ IR2 par

∂ 2f ∂ 2f 2
2∂ f
d2 fx (h) = h21 (x) + 2h h
1 2 (x) + h2 (x)
∂x21 ∂x1 ∂x2 ∂x22

Développements limités.
1) Soit f : IR2 → IR une fonction définie et admettant des dérivées partielles au point x ∈ IR2 . Ecrire
le développement limité à l’ordre un de la fonction f au point x = (x1 , x2 ) ∈ IR2 , c’est écrire qu’il
existe une fonction ε : IR2 → IR continue en 0 telle que ε(0) = 0 et telle que pour x au voisinage de
x,
f (x) = f (x) + h∇f (x), x − xi + ||x − x||ε(x − x)
autrement dit
∂f ∂f
f (x1 , x2 ) = f (x1 , x2 ) + (x1 − x1 ) (x1 , x2 ) + (x2 − x2 ) (x1 , x2 ) + ||x − x||ε(x − x)
∂x1 ∂x2
ce qui peut s’écrire aussi, pour h = (h1 , h2 ) au voisinage de (0, 0),

f (x + h) = f (x) + h∇f (x), hi + ||h||ε(h)

autrement dit
∂f ∂f
f (x1 + h1 , x2 + h2 ) = f (x1 , x2 ) + h1 (x1 , x2 ) + h2 (x1 , x2 ) + ||h||ε(h)
∂x1 ∂x2
2) Soit f : IR2 → IR une fonction définie et admettant des dérivées partielles secondes au point
x ∈ IR2 . Ecrire le développement limité à l’ordre deux de la fonction f au point x = (x1 , x2 ) ∈ IR2 ,
c’est écrire qu’il existe une fonction ε : IR2 → IR continue en 0 telle que ε(0) = 0 et telle que pour x
au voisinage de x,
1
f (x) = f (x) + h∇f (x), x − xi + d2 fx (x − x) + ||x − x||2 ε(x − x)
2
ce qui peut s’écrire aussi, pour h = (h1 , h2 ) au voisinage de (0, 0),
1
f (x + h) = f (x) + h∇f (x), hi + d2 fx (h) + ||h||2 ε(h)
2
Remarque
Quand on écrit “ε : IR2 → IR continue en 0 telle que ε(0) = 0”, comme ε est définie de IR2 dans
IR, le premier 0 (dans “continue en 0”) est le 0 de IR2 , le deuxième 0 (dans “ε(0)”) est le 0 de IR2
et le troisième 0 (dans “= 0”) est le 0 de IR. Autrement dit, “ε : IR2 → IR continue en 0 telle que
ε(0) = 0” signifie “ε : IR2 → IR continue en 0IR2 telle que ε(0IR2 ) = 0IR ” ou encore “ε : IR2 → IR
continue en (0, 0) telle que ε(0, 0) = 0”

Approximations.
Les développements limités permettent d’obtenir des approximations pour h “assez petit” (assez
proche de (0, 0)) en négligeant le reste. Ainsi à l’ordre un, une telle approximation donne

f (x + h) ∼ f (x) + h∇f (x), hi

autrement dit
∂f ∂f
f (x1 + h1 , x2 + h2 ) ∼ f (x1 , x2 ) + h1 (x1 , x2 ) + h2 (x1 , x2 )
∂x1 ∂x2

Exercice 4 On considère la fonction f : IR2 → IR définie par

2x2
f (x, y) =
y − x2

1) Déterminer et représenter géométriquement l’ensemble de définition Df de f .


2) L’ensemble Df est-il convexe ?
3) Tracer les courbes de niveau
a) k = 1 b) k = −1 c) k = 0 d) k = −2
4) A quelle courbe de niveau appartient le point (2, 1) ?
5) Tracer l’ensemble de niveau k = 4.
6) On admet que Df est un ensemble ouvert et que f est de classe C 1 sur Df . Calculer le gradient
∇f de f en tout point (x, y) de l’ensemble de définition de f .
7) Ecrire le développement limité à l’ordre un de f au point (2, 1).
8) En déduire une valeur approchée de f (2, 08; 0, 98).

Exercice 5
On considère la fonction f : IR2 → IR définie par

x2 + y 2
f (x, y) =
x+y

1) Déterminer et représenter géométriquement l’ensemble de définition Df de f .


2) L’ensemble Df est-il convexe ?
3) Tracer les courbes de niveau a) k = −2 b) k = 4.
4) A quelle courbe de niveau appartient le point (1, 1) ?
5) Tracer l’ensemble de niveau k = 4.
6) On admet que Df est un ensemble ouvert et que f est de classe C 1 sur Df . Calculer le gradient
∇f de f en tout point (x, y) de l’ensemble de définition de f .
7) Ecrire le développement limité à l’ordre un de f au point (1, 1).
8) En déduire une valeur approchée de f (1, 04; 0, 92).

Définiton. f : IR2 → IR et x ∈ IR2 . Si les dérivées partielles secondes existent en x, on appelle


matrice hessienne ou hessien de f en x le tableau à deux lignes et deux colonnes
 ∂2f ∂2f
 
(x) (x) 00 00

∂x12 ∂x1 ∂x2 f11 (x) f12 (x)
∇2 f (x) =  =
   
2
∂ f 2
∂ f 00 00
(x) (x) f21 (x) f22 (x)
∂x2 ∂x1 ∂x2 2

00 00
En général si on est dans un cas assez continu on a f12 (x) = f21 (x) (cf le théorème de Schwarz)

Fonctions convexes.
Définition. Soit E = IRn et C ⊂ E un sous-ensemble de E

Une fonction f : C → IR est convexe sur C si et seulement si


1) C est un ensemble convexe
2) ∀x, y ∈ C, ∀λ ∈ [0, 1], f (λx + (1 − λ)y) ≤ λf (x) + (1 − λ)f (y)

Une fonction f : C → IR est concave sur C si et seulement si −f est convexe sur C, autrement
dit si et seulement si
1) C est un ensemble convexe
2) ∀x, y ∈ C, ∀λ ∈ [0, 1], f (λx + (1 − λ)y) ≥ λf (x) + (1 − λ)f (y)

On obtient les définitions de strictement convexe et strictement concave en changeant dans les
définitions précédentes ∀λ ∈ [0, 1] en ∀λ ∈]0, 1[ et les inégalités larges en inégalités strictes.

Attention. Lorsqu’on veut démontrer qu’une fonction f est convexe ou concave (resp. strictement
convexe ou concave) sur un ensemble, on doit toujours commencer par démontrer que l’ensemble
sur lequel on l’étudie est convexe.

S’il existe un sous-ensemble S convexe de C sur lequel la fonction est convexe (respectivement con-
cave, strictement convexe, strictement concave) on dit que f est localement convexe (respectivement
localement concave, localement strictement convexe, localement strictement concave).
Remarque. f est alors globalement convexe (respectivement globalement concave, strictement con-
vexe, strictement concave) sur S. Autrement dit, la convexité est globale ou locale selon l’ensemble
sur lequel on définit la fonction.

Propriétés.
1) La somme de deux fonctions (resp. strictement) convexes (resp. concaves) est (resp. strictement)
convexe (resp. concave)
2) Soit f : IR → IR une fonction convexe sur IR. Alors la fonction (x1 , x2 , ...., xn ) ∈ IRn → f (x1 ) ∈ IR
est convexe sur IRn . De manière générale, pour i = 1, ...., n, la fonction (x1 , x2 , ...., xn ) ∈ IRn →
f (xi ) ∈ IR est convexe sur IRn .
Par exemple, la fonction p(x, y) = x2 est convexe sur IR2 car la fonction carrée est convexe sur IR.

Propriété.
Si f1 : IR → IR est convexe croissante sur IR et f2 : IRn → IR est convexe sur IRn alors f1 ◦ f2 est
convexe sur IRn .

Preuve. Soit f1 : IR → IR est convexe croissante sur IR et f2 : IRn → IR est convexe sur IRn ,
on veut montrer que f1 ◦ f2 convexe sur IRn , c’est à dire on veut montrer que

∀X, X 0 ∈ IRn , ∀λ ∈ [0, 1], f1 ◦ f2 (λX + (1 − λ)X 0 ) ≤ λf1 ◦ f2 (X) + (1 − λ)f1 ◦ f2 (X 0 )

Soit X, X 0 ∈ IRn , λ ∈ [0, 1].

f2 (λX + (1 − λ)X 0 ) ≤ λf2 (X) + (1 − λ)f2 (X 0 ) car f2 est convexe


⇒ f1 (f2 (λX + (1 − λ)X 0 )) ≤ f1 (λf2 (X) + (1 − λ)f2 (X 0 )) car f1 est croissante
⇒ f1 (f2 (λX + (1 − λ)X 0 )) ≤ λf1 (f2 (X)) + (1 − λ)f1 (f2 (X 0 )) car f1 est convexe

donc f1 ◦ f2 est convexe sur IRn .

Caractérisation des fonctions convexes de deux variables différentiables.


Proposition. Soit C ⊂ IR2 un ensemble ouvert convexe (de IR2 ) et f : C → IR une fonction de de
deux variables différentiable. Alors f est convexe sur C si et seulement si

∀x = (x1 , x2 ), y = (y1 , y2 ) ∈ C, f (y) ≥ f (x) + h∇f (x), y − xi

Caractérisation des fonctions concaves de deux variables différentiables.


Proposition. Soit C ⊂ IR2 un ensemble ouvert convexe (de IR2 ) et f : C → IR une fonction de de
deux variables différentiable. Alors f est concave sur C si et seulement si

∀x = (x1 , x2 ), y = (y1 , y2 ) ∈ C, f (y) ≤ f (x) + h∇f (x), y − xi

Définition. Soit une matrice carrée d’ordre 2


 
a b
A=
c d

On appelle déterminant de la matrice A le nombre réel défini par

det(A) := ad − bc

Définitions. Soit une matrice carrée d’ordre 2


 
a b
A=
c d

On dit que la matrice A est


1) semi-définie positive si [det(A) ≥ 0 et a ≥ 0, d ≥ 0]
2) semi-définie négative si [det(A) ≥ 0 et a ≤ 0, d ≤ 0]
3) définie positive si [det(A) > 0 et a > 0, d > 0]
4) définie négative si [det(A) > 0 et a < 0, d < 0]

Caractérisation des fonctions convexes de deux variables deux fois différentiables.


Proposition. Soit C ⊂ IR2 un ensemble ouvert convexe (de IR2 ) et f : C → IR une fonction
de de deux variables admettant des dérivées partielles d’ordre deux continues. Alors f est convexe
sur C si et seulement si sa matrice hessienne ∇2 f (x) est semi-définie positive en tout point de x de C.

Caractérisation des fonctions concaves de deux variables deux fois différentiables.


Proposition. Soit C ⊂ IR2 un ensemble ouvert convexe (de IR2 ) et f : C → IR une fonction de de
deux variables admettant des dérivées partielles d’ordre deux continues. Alors f est concave sur C
si et seulement si sa matrice hessienne ∇2 f (x) est semi-définie négative en tout point de x de C.
Optimisation libre

On s’intéresse ici aux méthodes d’optimisation d’une fonction f de 2 variables sur un ensemble C
convexe ouvert de IR2 .

Soit f : C ⊂ IR2 → IR, f est C 2


De manière générale, pour savoir si un point x donne un extremum, il faut étudier le signe de la
différence
∆fx (h) = f (x + h) − f (x)
Si pour tout h, cette différence ∆fx (h) est positive(resp. négative), alors x donne un minimum (resp.
maximum) global. Si pour tout h ”assez petit” (dans un voisinage de (0, 0)), ∆fx (h) est positive
(resp. négative), alors x donne un minimum (resp. maximum) local. Sinon, c’est à dire si pour tout
voisinage de (0, 0), ∆fx (h) change de signe, alors x ne donne ni un minimum ni un maximum pour f .
Parfois, l’étude de cette différence peut se faire directement, mais en général c’est délicat. Lorsque
la fonction est deux fois différentiable, les points critiques sont candidats à être extremas.

Etape 1: recherche des points critiques.


Ce sont les points x = (x1 , x2 ) qui annulent le gradient, c’est à dire tels que

∇f (x) = (0, 0)

Rappel
∂f ∂f
∇f (x) = ( (x), (x)) = (f10 (x), f20 (x))
∂x1 ∂x2
Etape 2: recherche de la nature des points critiques.
On calcule la matrice hessienne (ou hessien).

Rappel
La matrice hessienne ou hessien de f en x est le tableau à deux lignes et deux colonnes
 ∂2f ∂2f
 
(x) (x) 00 00

∂x21 ∂x1 ∂x2 f11 (x) f12 (x)
∇2 f (x) =  =
   
2
∂ f 2
∂ f 00 00
(x) (x) f21 (x f22 (x)
∂x2 ∂x1 ∂x2 2

00 00
En général si on est dans un cas assez continu on a f12 (x) = f21 (x) (cf le théorème de Schwarz)

On a
00 00 00 00
∀x ∈ C, le déterminant (det) est det∇2 f (x) = f11 (x)f22 (x) − f12 (x)f21 (x) et les termes diagonaux
00 00
(t.d.) sont f11 (x) et f22 (x)

00 00
Soit x un point critique. En x un point critique, le déterminant (det) est det∇2 f (x) = f11 (x)f22 (x) −
00 00 00 00
f12 (x)f21 (x) et les termes diagonaux (t.d.) sont f11 (x) et f22 (x)

Etude globale sur C.

critère hessien est f est .... sur .. x donne un


∀x ∈ C, det∇2 f (x) ≥ 0 et
semi-défini positif sur C convexe sur C minimum global
t.d.≥ 0
∀x ∈ C, det∇2 f (x) ≥ 0 et
semi-défini négatif sur C concave sur C maximum global
t.d.≤ 0

Etude locale en x
critère hessien est f est .... sur .. x donne un
en x, det∇2 f (x) > 0 et
défini positif en x convexe sur un voisinage de x minimum local
t.d. > 0
en x, det∇2 f (x) > 0 et
défini négatif en x concave sur un voisinage de x maximum local
t.d. < 0
si det∇2 f (x) < 0 en x, on conclut que x est un point-selle (point-col).

Attention (piège). Dans les autres cas, c’est à dire si det = 0 en x, on ne peut rien dire avec
ces critères et il faut revenir à l’étude de la différence ∆fx (h) = f (x + h) − f (x), en écrivant un
développement limité à l’ordre 2 au point critique x ou en faisant une étude directe de la différence


Optimiser f (x, y) = 28 − x2 − 2y 2
Exercice 6 Résoudre le problème (P) =
s.c. (x, y) ∈ IR2
Chercher cet exercice soigneusement en suivant les indications ci-dessous puis se reporter à sa solu-
tion à la fin du document. Continuer ensuite le cours avec l’exercice suivant.

Indications. La fonction f est C 2 sur IR2 . On peut procéder ici en deux étapes.
Etape 1: recherche des points critiques. Ce sont les couples de IR2 qui annulent le gradient ∇f .
Etape 2: recherche de la nature des points critiques. On étudie les propriétés graphiques de f sur IR2
(convexité, etc). On peut le faire en utilisant les propriétés des fonctins convexes/concaves (somme
de fonctions concaves, etc), par l’étude du hessien ∇2 f sur IR2 ou directement.

Autrement dit, répondre successivement aux questions suivantes


1) Calculer le gradient ∇f de f , c’est à dire le vecteur des dérivées partielles ∇f (x, y) = ( ∂f
∂x
(x, y), ∂f
∂y
(x, y))
2
2) Trouver tous les couples (x, y) de IR qui annulent le gradient, c’est à dire tous les couples (x, y)
de IR2 tels que ∇f (x, y) = 0. On obtient un système de deux équations à deux inconnues qu’on
résoud  ∂f
∂x
(x, y) = 0
∂f
∂y
(x, y) = 0
Une fois ce système résolu, on a obtenu les points critiques. Reste à trouver la nature des points
critiques. On le fera ici selon deux méthodes.
3) Méthode 1: en étudiant les propriétés graphiques de la fonction f (convexité, etc). On étudiera
ces propriétés graphiques de deux manières différentes
a) en étudiant la matrice hessienne ∇2 f sur IR2 .
b) en utilisant les propriétés sur les fonctions convexes (somme etc)
4) Méthode 2: en faisant une étude directe.

Optimiser f (x, y) = x2 y − 2xy 2 + 3xy + 4.
Exercice 7 Résoudre le problème (P) =
s.c. (x, y) ∈ IR2
Exercice 8
Optimiser les fonctions suivantes sur IR2
1) f (x, y) = 4x2 + 9y 2 + 8x − 36y + 24 2) g(x, y) = 31 x3 + y 2 + 2xy − 6x − 3y + 4
Optimisation liée

On s’intéresse ici à l’optimisation d’une fonction de deux variables avec contrainte d’égalité.

Cadre. Soit f une fonction réelle définie sur un sous-ensemble Df de IR2 (f : Df ⊂ IR2 → IR)
, et g une fonction réelle définie sur un sous-ensemble Dg de IR2 (g : Dg ⊂ IR2 → IR).
Soit U un sous-ensemble ouvert inclus à la fois dans les deux ensembles de définition Df et Dg .
on suppose que f et g sont au moins de classe C 1 sur U

Problème. On cherche à optimiser la fonction f sur U lorsque g(x) = 0 c’est à dire on cherche à
résoudre le problème 
Optimiser f (x1 , x2 )
(P ) =
sous contrainte g(x1 , x2 ) = 0

On pose E = {x = (x1 , x2 ) ∈ U/g(x) = 0}. On cherche à optimiser la fonction f sur E. Autre


écriture du problème 
Optimiser f (x1 , x2 )
(P ) =
s.c. (x1 , x2 ) ∈ E
Cas d’une liaison explicite. Lorsque la contrainte g(x1 , x2 ) = 0 est telle qu’on peut exprimer une
des variables en fonction de l’autre, on se ramène alors à un problème d’optimisation d’une fonction
d’une variable sans contrainte.

Autres cas.

Théorème.
Soient f et g deux fonctions de classe C 1 de U ⊂ IR2 dans IR.
Si x = (x1 , x2 ) donne un extremum (local ou global) pour f sur U sous la contrainte g(x1 , x2 ) = 0
alors x vérifie l’une des deux conditions suivantes:

(1) g(x) = 0 et ∇g(x) = 0

(on dit alors que x est un point critique de deuxième espèce du problème ou encore que la con-
trainte n’est pas qualifiée en x)

g(x) = 0 et ∇g(x) 6= 0
(2)
et il existe un réel λ tel que ∇Lλ (x) = 0
où Lλ , appelé Lagrangien du problème (P ), est la fonction de deux variables, définie par

Lλ (x1 , x2 ) = f (x1 , x2 ) − λg(x1 , x2 )

(on dit alors que x est un point critique de première espèce du problème ou encore que la contrainte
est qualifiée en x. Le réel λ est alors appelé le multiplicateur de Lagrange associé au point x.)

Remarque sur le théorème. On peut tout aussi bien définir le lagrangien par Lλ (x1 , x2 ) =
f (x1 , x2 ) + λg(x1 , x2 ), les valeurs trouvées pour λ seront simplement opposées.

Notation. On trouve aussi la notation L(x1 , x2 , λ)

Autrement dit, ce théorème nous dit que les points critiques x de 1ère et de 2ème espèce vérifient la
contrainte: g(x) = 0. Les points critiques de deuxième espèce sont ceux qui sont points critiques de
la fonction g associée à la contrainte. Les points critiques de première espèce sont ceux qui ne sont
pas points critiques de la fonction g associée à la contrainte et qui sont points critiques du lagrangien.

Méthode: recherche des points critiques.


1) Recherche des points critiques de deuxième espèce
On cherche tous les couples x = (x1 , x2 ) qui sont solutions du système

 x∈U
g(x) = 0
∇g(x) = 0

remarque: la plupart du temps, ce système n’a pas de solution

2) Recherche des points critiques de première espèce


On écrit le lagrangien
Lλ (x1 , x2 ) = f (x1 , x2 ) − λg(x1 , x2 )
et on cherche tous les couples x = (x1 , x2 ) qui sont solutions du système.

x ∈ U, ∇g(x) 6= (0, 0)






 ∂L
 ∂x1λ (x1 , x2 ) = 0

∂Lλ
(x1 , x2 ) =0


∂x2







g(x) = 0

Optimisation sur un compact


Théorème
Toute fonction continue sur une partie E fermée bornée (compacte) de IR2 à valeurs dans IR admet
un maximum et un minimum sur E.
Méthode: optimiser une fonction lorsque l’ensemble est compact
Si l’ensemble sur lequel on optimise est compact et que la fonction f à optimiser est continue, alors
il suffit de calculer la valeur de f en chacun des points candidats, on en déduit le(s) point(s) qui
donne(nt) le minimum et le(s) point(s) qui donne(nt) le maximum.

Théorème (condition suffisante CS)


Soit x un point critique de première espèce et λ le multiplicateur associé.
Si x est un extremum du lagrangien Lλ (x) = f (x) − λg(x) sur U, alors x est un extremum de même
nature de f sur U sous la contrainte g(x) = 0.

Attention: ce théorème ne permet pas de conclure pour les cas où le point critique considéré est
un point-selle du lagrangien.

Autres cas. Pour un point critique x de 1ère espèce, si le précédent théorème ne permet pas
de conclure, on peut assouplir l’étude du hessien du lagrangien Lλ (x) en n’étudiant le signe de la
forme quadratique pas pour tout (h1 , h2 ) 6= (0, 0) ∈ IR2 mais seulement pour les (h1 , h2 ) 6= (0, 0) tels
que g(x1 + h1 , x2 + h2 ) = 0. Pour un point critique de 1ère espèce, on admet qu’on peut remplacer
la contrainte g(x1 + h1 , x2 + h2 ) = 0 par son approximation affine au voisinage du point critique x.

g(x1 + h1 , x2 + h2 ) ∼ ∂g
= g(x1 , x2 ) + h1 ∂x1
∂g
(x1 , x2 ) + h2 ∂x2
(x1 , x2 )

= g(x1 , x2 ) + h1 g10 (x1 , x2 ) + h2 g20 (x1 , x2 )

Comme g(x1 , x2 ) = 0 puisque tout point critique vérifie la contrainte, cela signifie que l’on peut
∂g
étudier le signe de la forme quadratique seulement pour les (h1 , h2 ) 6= (0, 0) tels que h1 ∂x 1
(x1 , x2 ) +
∂g 0 0
h2 ∂x2 (x1 , x2 ) = 0 (ou encore tels que h1 g1 (x1 , x2 ) + h2 g2 (x1 , x2 ) = 0).

Théorème (linéarisation de la contrainte)


Soit x = (x1 , x2 ) un point critique de 1ère espèce, λ le multiplicateur associé et qLλ la forme quadra-
tique associée au hessien de Lλ
∂ 2 Lλ 2 ∂ 2 Lλ ∂ 2 Lλ
qLλ (h1 , h2 ) = (x)h1 + 2 (x)h h
1 2 + (x)h22
∂x21 ∂x1 ∂x2 ∂x22
alors

1) Si pour tout (h1 , h2 ) 6= (0, 0) tel que h1 g10 (x1 , x2 ) + h2 g20 (x1 , x2 ) = 0, on a qLλ (h1 , h2 ) > 0 alors le
point x donne un minimum local pour f sous la contrainte.
2) Si pour tout (h1 , h2 ) 6= (0, 0) tel que h1 g10 (x1 , x2 ) + h2 g20 (x1 , x2 ) = 0, on a qLλ (h1 , h2 ) < 0 alors le
point x donne un maximum local pour f sous la contrainte.

Méthode: recherche de la nature des points candidats.


Soit x un point candidat.
1) Si on optimise f continue sur un compact, alors on calcule les valeurs de f pour les différents
points candidats et on en déduit les points qui donnent le maximum et ceux qui donnent le minimum.
2) Sinon, si x point critique de 1ère espèce associé au multiplicateur λ, on étudie avec les critères
habituels (cf tableau) si x donne un extremum pour le lagrangien Lλ . Si oui, alors x donne un
extremum de même nature pour la fonction f sous la contrainte.
3) Sinon, en particulier si x est un point-selle du lagrangien Lλ , alors on étudie le signe de la forme
quadratique après avoir linéarisé la contrainte.
4) Sinon, on revient à l’étude directe, c’est à dire on étudie directement le signe de la différence
∆fx (h) = f (x + h) − f (x) pour h tel que (x + h) ∈ U et g(x + h) = 0. En particulier pour les points
critiques de 2ème espèce, faire une étude directe

En résumé: résoudre le problème d’optimisation



Optimiser f (x)
(P ) =
s.c. g(x) = 0

avec x = (x1 , x2 ) ∈ IR2

1) Ecrire les ensembles de définition Df , Dg de f et g.


2) Les fonctions f et g sont-elles deux fois continûment différentiables (C 2 ) sur leur domaine de
définition?
3) On optimise f sur l’ensemble

E = {x = (x1 , x2 ) ∈ IR2 /x ∈ Df , et x ∈ Dg et g(x) = 0}

Que peut-on dire de cet ensemble? Cet ensemble est-il compact?


On pourra le représenter graphiquement dans le plan des couples (x1 , x2 ) (x1 en abscisse, x2 en or-
donnée)
4) Rechercher les points candidats à être extremum (points critiques de 2ème et de 1ère espèce, points
sur la frontière, etc....)
Conclure à la fin de cette étape en faisant la liste de tous les points candidats
5) Rechercher la nature des points candidats
6) Conclure.

Interprétation du multiplicateur de lagrange.


On considère f, h : IR2 → IR deux fonctions C 1 et a ∈ IR et le problème

Optimiser f (x1 , x2 )
s.c. h(x1 , x2 ) = a

Pour résoudre ce problème, on pose g(x1 , x2 ) = h(x1 , x2 ) − a et on écrit le lagrangien, etc....

Lλ = f (x1 , x2 ) − λ(h(x1 , x2 ) − a)
Si on a une solution au problème, elle dépend de a: (x∗1 (a), x∗2 (a))

Théorème
On se place dans le cas où la solution du problème (x∗1 (a), x∗2 (a)) est un point critique de 1ère espèce
associé au multiplicateur λ∗ (a).
A l’optimum, la fonction objectif f vaut f (x∗1 (a), x∗2 (a)).
On définit la fonction F qui est égale à la valeur de f en fonction du paramètre a

F (a) = f (x∗1 (a), x∗2 (a))

alors F 0 (a) = λ∗ (a)

Corollaire. En particulier, pour h ∈ IR ”assez petit”, l’approximation affine donne

F (a + h) ≈ F (a) + F 0 (a)h

càd
F (a + h) − F (a) ≈ F 0 (a)h
et comme F 0 (a) = λ∗ (a)
F (a + h) − F (a) ≈ λ∗ (a)h
donc le multiplicateur permet de calculer une approximation de la variation de la valeur de l’optimum
lorsqu’on fait varier le paramètre a de manière ”assez petite” (h ”assez petit”)

Exercice 9 Résoudre le problème d’optimisation suivant


 2 2
Optimiser f (x1 , x2 ) = e4x1 −x2
s.c. g(x1 , x2 ) = 2x21 + x2 − 2 = 0

Les fonctions f et g sont définies sur IR2 (Df = Dg = IR2 ) et sont de classe C 2 sur IR2 (f composée
de l’exponentielle et d’une fonction polynôme, g fonction polynôme).

Comme la fonction exponentielle est strictement croissante, le problème est équivalent au problème
d’optimisation
Optimiser f˜(x1 , x2 ) = 4x21 − x22


s.c. g(x1 , x2 ) = 2x21 + x2 − 2 = 0


Les deux problèmes d’optimisation ont les mêmes solutions (mais pas les mêmes valeurs de la fonction
objectif donc pour trouver les solutions on peut travailler avec f˜ mais pour trouver la valeur de la
fonction objectif, il faut revenir à f )

Optimiser f˜ sous la contrainte g(x1 , x2 ) = 2x21 + x2 − 2 = 0 en utilisant deux méthodes:


1) en explicitant la contrainte
2) par la méthode de Lagrange.

Exercice 10
Résoudre le problème d’optimisation suivant

Optimiser f (x1 , x2 ) = x2
s.c. g(x1 , x2 ) = x21 + x22 − 4 = 0

Exercice 11
Optimiser les fonctions suivantes
4 2 2
1) f (x1 , x2 ) = ex1 +x2 −2x1 sur IR2
2) f (x1 , x2 ) = x21 + 2x22
a) sous la contrainte x1 + x22 = 1
b) sous la contrainte x21 − 14 x22 = 1

3) f (x1 , x2 ) = x1 + 2x2 sous la contrainte x21 + x22 − 2x1 − 4x2 = −1

4) f (x1 , x2 ) = x−1 −1 −2 −2
1 + x2 sous la contrainte x1 + x2 = 1

5) f (x1 , x2 ) = 31 x31 + 13 x32 − x1 x2 sous la contrainte x1 + x2 = 2

6) f (x1 , x2 ) = ln(x1 x2 ) sous la contrainte x21 + x22 = 1


4 2 2
7) f (x1 , x2 ) = ex1 +x2 −2x1
a) sous la contrainte x21 + x2 = 1
b) sous la contrainte x21 + x22 = 2
Solutions

Solution de l’exercice 1
On raisonnera en étudiant f et ses propriétés graphiques (convexité). En toute fin d’exercice, on
tracera le tableau de variations de f et on reliera le tableau de variations aux résultats trouvés.
1) a) f 0 (x) = 3x2 + 2x = x(3x + 2) et les points critiques sont x = 0 et x = − 23 .
b) f 00 (x) = 6x + 2 = 2(3x + 1)
c) donc f est localement convexe en x = 0 et x = 0 donne un minimum local pour f sur IR et f est
f est localement concave en x = − 32 et x = − 23 donne un maximum local pour f sur IR.
d) lim f (x) = −∞ donc f n’admet pas de minimum global sur IR et lim f (x) = +∞ donc f
x→−∞ x→+∞
n’admet pas de maximum global sur IR.
2) On a f (0) = 0 et f (− 23 ) = 27 4

a) Sur [− 13 ; 31 ], la fonction f est strictement convexe et 0 ∈ [− 31 ; 13 ], donc x = 0 donne un minimum


global pour f sur [− 13 ; 13 ] qui vaut f (0) = 0. On calcule f (− 31 ) = 27 2
et f ( 31 ) = 27
4
, donc x = 13 donne
1 1
un maximum global pour f sur [− 3 ; 3 ].
b) Sur [−1; − 31 ], la fonction f est strictement concave et − 23 ∈ [−1; − 13 ], donc x = − 23 donne un
maximum global pour f sur [−1; − 31 ] qui vaut f (− 23 ) = 27 4
. On calcule f (−1) = 0 et f (− 31 ) = 27 2
,
donc x = −1 donne un minimum global pour f sur [−1, − 31 ].
c) Sur [−1; − 13 ], la fonction f est strictement concave et − 23 ∈ [−1; − 13 ], donc x = − 32 donne un
maximum global pour f sur [−1; − 31 ] qui vaut f (− 32 ) = 27 4
. Sur [− 13 ; 13 ], la fonction f est strictement
convexe et 0 ∈ [− 31 ; 31 ], donc x = 0 donne un minimum global pour f sur [− 13 ; 13 ] qui vaut f (0) = 0.
Par ailleurs, f (−1) = 0 et f ( 31 ) = 274
. On en déduit que sur [−1; 13 ], la fonction f admet un minimum
global qui vaut 0 et qui est atteint en x = −1 et en x = 0, et qu’elle admet un maximum global qui
4
vaut 27 et qui est atteint en x = − 32 et en x = 13
d) On calcule f (1) = 2 et de manière analogue aux arguments du c), on conclue que sur [−1; 1] , la
fonction f admet un minimum global qui vaut 0 et qui est atteint en x = −1 et en x = 0, et qu’elle
admet un maximum global qui vaut 2 et qui est atteint en x = 1.
e) Sur [−2; 31 ] ∪ [1; 5], f admet un minmium global atteint en x = −2 et qui vaut f (−2) = et un
maximum global atteint en x = 5 et qui vaut f (5) =. x = 0 donne un minimum local pour f , x = − 23
donne un maximum local pour f , x = 31 donne un maximum local pour f sur E, et x = 1 donne un
minimum local pour f .

Vous pouvez compléter cet exercice en choisissant vous-mêmes d’autres ensembles E !

Solution de l’exercice 2
a) Df1 = {(x, y) ∈ IR2 , x − y 6= 0}, autrement dit Df1 est l’ensemble des points du plan privé de
la droite d’équation y = x. C’est un ensemble ouvert, non fermé, non borné, non compact et non
convexe.
b) Df2 = {(x, y) ∈ IR2 , 2x − y ≥ 0}, autrement dit Df2 est le demi-plan fermé délimité par la droite
d’équation 2x − y = 0 et qui contient le point (1, 1). C’est un ensemble non ouvert, fermé, non borné,
non compact et convexe.
c) Df3 = {(x, y) ∈ IR2 , 4 − x2 − y 2 > 0} = {(x, y) ∈ IR2 , x2 + y 2 < 4}, autrement dit Df3 est la boule
ouverte de centre (0, 0) et de rayon 2. C’est un ensemble ouvert, non fermé, borné, non compact et
convexe.
d) Df4 = {(x, y) ∈ IR2 , x > 0}, autrement dit Df4 est le demi-plan ouvert délimité par l’axe des
abscisses (celui-ci étant non inclus) et qui contient le point (1, 1). C’est un ensemble ouvert, non
fermé, non borné, non compact et convexe.

Solution de l’exercice 3
1) Df1 = IR2 . La courbe de niveau k = 1 est l’ensemble L1 = {(x, y) ∈ IR2 , f1 (x, y) = 1} = {(x, y) ∈
IR2 , xy = 1} = {(x, y) ∈ IR2 , y = x1 }, on obtient l’hyperbole d’équation y = x1 .La courbe de niveau
k = 0 est l’ensemble L0 = {(x, y) ∈ IR2 , f1 (x, y) = 0} = {(x, y) ∈ IR2 , xy = 0} = {(x, y) ∈ IR2 , x =
0 ou y = 0}, on obtient la réunion de l’axe des ordonnées et de l’axe des abscisses.
L’ensemble de niveau k = 1 est l’ensemble S1 = {(x, y) ∈ IR2 , f1 (x, y) ≤ 1} = {(x, y) ∈ IR2 , xy ≤
1} = {(x, y) ∈ IR2 , x = 0} ∪ {(x, y) ∈ IR2 , x > 0 et y ≤ x1 } ∪ {(x, y) ∈ IR2 , x < 0 et y ≥ x1 }, on obtient
l’ensemble “entre” les deux branches de l’hyperbole d’équation y = x1 . L’ensemble de niveau k = 0 est
l’ensemble S0 = {(x, y) ∈ IR2 , f1 (x, y) ≤ 0} = {(x, y) ∈ IR2 , xy ≤ 0}, on obtient la réunion Q1 ∪ Q2
des deux quarts de plans Q1 = {(x, y) ∈ IR2 , x ≥ 0 et y ≤ 0} et Q2 = {(x, y) ∈ IR2 , x ≤ 0 et y ≥ 0}.
2) Df2 = {(x, y) ∈ IR2 , x2 + y ≥ 0} = {(x, y) ∈ IR2 , y ≥ p −x2 }. La courbe de niveau k = 1 est
l’ensemble L1 = {(x, y) ∈ Df2 , f2 (x, y) = 1} = {(x, y) ∈ Df2 , x2 + y = 1} = {(x, y) ∈ Df2 , x2 + y =
1} = {(x, y) ∈ Df2 , y = 1 − x2 }, et comme pour tout x, on a y = 1 − x2 ≥ −x2 , on obtient
2
la parabole d’équation y = 1 − xp . La courbe de niveau k = 0 est l’ensemble L0 = {(x, y) ∈
Df2 , f2 (x, y) = 0} = {(x, y) ∈ Df2 , x2 + y = 0} = {(x, y) ∈ Df2 , x2 + y = 0} = {(x, y) ∈ Df2 , y =
−x2 }, on obtient la parabole d’équation y = −x2p . L’ensemble de niveau k = 1 est l’ensemble
S1 = {(x, y) ∈ Df2 , f2 (x, y) ≤ 1} = {(x, y) ∈ Df2 , x2 + y ≤ 1} = {(x, y) ∈ Df2 , x2 + y ≤ 1} =
{(x, y) ∈ Df2 , y ≤ 1 − x2 } = {(x, y) ∈ IR2 , −x2 ≤ y ≤ 1 − x2 }, on obtient la “bande” entre les
deux paraboles d’équation y = −x2 et y = 1 − xp 2
. L’ensemble de niveau k = p 0 est l’ensemble
S0 = {(x, y) ∈ Df2 , f2 (x, y) ≤ 0} = {(x, y) ∈ Df2 , x2 + y ≤ 0} = {(x, y) ∈ Df2 , x2 + y = 0} =
{(x, y) ∈ Df2 , x2 + y = 0} = {(x, y) ∈ IR2 , y = −x2 }, et comme y = −x2 ≥ −x2 , on obtient la
parabole d’équation y = −x2 .

Solution de l’exercice 4 1) Df = {(x, y) ∈ IR2 , y − x2 6= 0} = IR2 \{(x, y) ∈ IR2 , y = x2 }.


Graphiquement, on obtient l’ensemble de tous les points du plan sauf les points de la parabole
d’équation y = x2 .
2) Df n’est pas un ensemble convexe car A = (−1, 0) ∈ Df (puisque 0 6= (−1)2 ), B = (1, 0) ∈ Df
(puisque 0 6= (1)2 ), et le segment [A, B] n’est pas entièrement contenu dans Df puisque le milieu
du segment [A, B] qui est l’origine ( 12 A + 21 B = 12 (−1, 0) + 12 (1, 0) = (0, 0)) n’appartient pas à Df
(puisque 0 = 02 ).
2x2
3) a) La courbe de niveau k = 1 est l’ensemble L1 = {(x, y) ∈ Df , f (x, y) = 1} = {(x, y) ∈ Df , y−x 2 =
2 2 2
1} = {(x, y) ∈ Df , 2x = y − x } = {(x, y) ∈ Df , y = 3x }, autrement dit L1 est l’ensemble des
points de Df qui appartiennent à la parabole d’équation y = 3x2 , c’est à dire les points de cette
parabole sauf (0, 0).
b) De la même manière, on trouve que L−1 est l’ensemble des points de Df qui appartiennent à la
parabole d’équation y = −x2 , c’est à dire les points de cette parabole sauf (0, 0).
2x2
c) La courbe de niveau k = 0 est l’ensemble L0 = {(x, y) ∈ Df , f (x, y) = 0} = {(x, y) ∈ Df , y−x 2 =

0} = {(x, y) ∈ Df , x = 0} = {(0, y), y ∈ IR et (0, y) ∈ Df }, autrement dit L0 est la droite de vecteur


directeur (0, 1) passant par l’origine sauf l’origine (0, 0), c’est à dire L0 est l’axe des ordonnées privé
du point (0, 0).
d) La courbe de niveau L−2 est l’axe des abscisses privé du point (0, 0).
4) f (2, 1) = − 38 donc le point (2, 1) appartient à la courbe de niveau k = − 38 .
5) L’ensemble de niveau k = 4 est l’ensemble S4 = {(x, y) ∈ Df , f (x, y) ≤ 4}. On cherche donc
2x2
l’ensemble des points (x, y) de Df tels que y−x 2 ≤ 4.
2x2
1er cas: y − x2 < 0, c’est à dire y < x2 , et on a y−x2
≤ 4 ⇔ 2x2 ≥ 4(y − x2 ) ⇔ y ≤ 32 x2 et on obtient
l’intersection
3
{(x, y) ∈ IR2 , y < x2 } ∩ {(x, y) ∈ IR2 , y ≤ x2 } = {(x, y) ∈ IR2 , y < x2 }
2
c’est à dire l’ensemble des points situés “sous” la parabole d’équation y = x2 , les points de la parabole
non compris.
2x2
2ème cas: y − x2 > 0, c’est à dire y > x2 , et on a y−x 2 ≤ 4 ⇔ 2x
2
≤ 4(y − x2 ) ⇔ y ≥ 32 x2 et on
obtient l’intersection
3 3
{(x, y) ∈ IR2 , y > x2 } ∩ {(x, y) ∈ IR2 , y ≥ x2 } = {(x, y) ∈ IR2 , y ≥ x2 }\{(0, 0)}
2 2
c’est à dire l’ensemble des points situés “à l’intérieur” de la parabole d’équation y = 32 x2 , les points
de la parabole compris sauf le point (0, 0).
L’ensemble de niveau k = 4 est la réunion des ensembles trouvés, c’est à dire c’est la réunion de
l’ensemble des points situés “sous” la parabole d’équation y = x2 , les points de la parabole non
3 2
compris et de l’ensemble des points situés “à l’intérieur” de la parabole d’équation y = 2
x, les
points de la parabole compris sauf le point (0, 0).
6) Le calcul des dérivées partielles donne

∂f 4x(y − x2 ) − (−2x)(2x2 ) 4xy ∂f −2x2


(x, y) = 2 2
= et (x, y) =
∂x (y − x ) (y − x2 )2 ∂y (y − x2 )2
4xy −2x2
et donc le gradient ∇f (x, y) = ( (y−x 2 )2 , (y−x2 )2 ).

7) Le développement limité à l’ordre un de la fonction f au point x = (2, 1) s’ecrit


il existe une fonction ε : IR2 → IR continue en 0 telle que ε(0) = 0 et telle que pour h = (h1 , h2 ) au
voisinage de (0, 0),
f ((2, 1) + h) = f (2, 1) + h∇f (2, 1), hi + ||h||ε(h)
autrement dit
∂f ∂f
f (2 + h1 , 1 + h2 ) = f (2, 1) + h1 (2, 1) + h2 (2, 1) + ||h||ε(h)
∂x1 ∂x2

c’est à dire, comme ∇f (2, 1) = ( 89 , −8


9
),

8 8
f (2 + h1 , 1 + h2 ) = f (2, 1) + h1 − h2 + ||h||ε(h)
9 9

8) Pour h = (h1 , h2 ) assez proche de (0, 0), on a l’approximation


8 8
f (2 + h1 , 1 + h2 ) ∼ f (2, 1) + h1 − h2
9 9
Comme f (2, 08; 0, 98) = f (2 + 0, 08, 1 − 0, 02), pour h = (0, 08, −0, 02),
8 8
f (2, 08; 0, 98) = f (2 + 0, 08, 1 − 0, 02) ∼ f (2, 1) + × 0, 08 − × (−0, 02)
9 9
Solution de l’exercice 5
1) Df = {(x, y) ∈ IR2 , x + y 6= 0}, autrement dit c’est le plan privé de la droite d’équation x + y = 0.
2) Df n’est pas convexe car A = (1, 0) ∈ Df , B = (−1, 0) ∈ Df mais le segment [A, B] n’est pas
entièrement contenu dans Df puisque le milieu de [A, B] qui est 21 A + 21 B = (0, 0) n’appartient pas
à Df .
2 +y 2
3) a) f (x, y) = −2 ⇔ xx+y = −2 ⇔ x2 + y 2 = −2(x + y) ⇔ x2 + 2x + y 2 + 2y = 0 ⇔ (x + 1)2 −
1 + (y + 1)2 − 1 = 0 ⇔ (x + 1)2 + (y√+ 1)2 = 2 donc la courbe de niveau k = −2 est l’intersection du
cercle de centre (−1, −1) de rayon 2 avec le domaine de définition de f .
2 +y 2
b) f (x, y) = 4 ⇔ xx+y = 4 ⇔ x2 +y 2 = 4(x+y) ⇔ x2 −4x+y 2 −4y = 0 ⇔ (x−2)2 −4+(y −2)2 −4 =
0 ⇔ (x − 2)2 +√(y − 2)√2 = 8 donc la courbe de niveau k = 4 est l’intersection du cercle de centre
(2, 2) de rayon 8 = 2 2 avec le domaine de définition de f .
4) f (1, 1) = 1 donc (1, 1) appartient à la courbe de niveau k = 1.
2 +y 2
5) On cherche l’ensemble des points (x, y) de Df tels que xx+y ≤ 4.
2 2
1er cas: x + y < 0 et on a xx+y +y
≤ 4 est toujours vrai si x + y < 0, donc l’ensemble correspondant
est l’ensemble des (x, y) tels que x + y < 0, autrement dit le demi-plan ouvert P < délimité par la
droite d’équation x + y = 0 (passant par (0, 0) et (−1, 1)) qui contient le point (−1, −1) (la droite
non comprise).
2 +y 2
2ème cas: x + y > 0 et on a xx+y ≤ 4 ⇔ x2 + y 2 ≤ 4(x + y) ⇔ x2 − 4x + y 2 − 4y ≤ 0 ⇔

(x − 2)2 + (y − 2)2 ≤ 8 ⇔ (x, y) ∈ Bo ((2, 2), 2 2). Comme on a que si 2
√x + √ y 2 ≤ 4(x + y) alors
x + y > 0 sauf pour (0, 0), on obtient le disque de centre (2, 2) de rayon 8 = 2 2 privé de (0, 0).
L’ensemble de niveau k = 4 est la réunion des ensembles trouvés, c’est à √ dire c’est la réunion du
demi-plan P < d’équation x + y < 0 et du disque de centre (2, 2) de rayon 2 2 privé de (0, 0).
2 +2xy−y 2 y 2 +2xy−x2
6) ∇f (x, y) = ( x (x+y)2 , (x+y)2 ).
7) Le développement limité à l’ordre un de la fonction f au point x = (1, 1) s’ecrit
il existe une fonction ε : IR2 → IR continue en 0 telle que ε(0) = 0 et telle que pour h = (h1 , h2 ) au
voisinage de (0, 0),
f ((1, 1) + h) = f (2, 1) + h∇f (1, 1), hi + ||h||ε(h)
autrement dit
∂f ∂f
f (1 + h1 , 1 + h2 ) = f (1, 1) + h1 (1, 1) + h2 (1, 1) + ||h||ε(h)
∂x1 ∂x2
c’est à dire, comme ∇f (1, 1) = ( 12 , 21 ),
1 1
f (1 + h1 , 1 + h2 ) = f (1, 1) + h1 + h2 + ||h||ε(h)
2 2
8) Pour h = (h1 , h2 ) assez proche de (0, 0), on a l’approximation
1 1
f (1 + h1 , 1 + h2 ) ∼ f (1, 1) + h1 − h2
2 2
Comme f (1, 04; 0, 92) = f (1 + 0, 04, 1 − 0, 08), pour h = (0, 04, −0, 08),
1 1
f (1, 04; 0, 92) = f (1 + 0, 04, 1 − 0, 08) ∼ f (1, 1) + × 0, 04 + × (−0, 08)
2 2
Solution de l’exercice 6
Etape 1: recherche des points critiques
1) On calcule le gradient (qui est le vecteur des dérivées partielles d’ordre 1)
∂f ∂f
∇f (x, y) = ( (x, y), (x, y)) = (−2x, −4y)
∂x ∂y
∂f
∂x
(x, y)est la dérivée partielle de f par rapport à x c’est à dire en considérant f comme fonction de
la seule variable x et en la dérivant par rapport à cette seule variable, donc
∂f
(x, y) = −2x
∂x
∂f
∂y
(x, y)est la dérivée partielle de f par rapport à y c’est à dire en considérant f comme fonction de
la seule variable y et en la dérivant par rapport à cette seule variable, donc
∂f
(x, y) = −4y
∂y
2) Les points critiques sont ceux qui annulent le gradient. On obtient un système de deux équations
à deux inconnues dont on cherche les solutions.

−2x = 0
∇f (x, y) = (0, 0) ⇔
−4y = 0

x=0

y=0

On a un unique point critique (0, 0).

Etape 2: nature du point critique

3) Méthode 1 : en étudiant les propriétés graphiques de la fonction f


a) En étudiant la matrice hessienne. On calcule la matrice hessienne
 2
∂2f
 
∂ f 
∂x2
(x, y) ∂x∂y
(x, y) −2 0
∇2 f (x, y) =  =
   
2
∂ f 2
∂ f
∂y∂x
(x, y) ∂y2 (x, y) 0 −4
On a det ∇2 f (x, y) = (−2) × (−4) − 0 × 0 = 8 > 0 et −2 < 0 donc la fonction f est strictement
concave globalement et (0, 0) donne un maximum global pour f sur IR2 .
b) En utilisant les propriétés des fonctions convexes (c’est mieux mais ce n’est pas toujours possible)
La fonction x → x2 est strictement convexe sur IR donc x → −x2 est strictement concave sur IR donc
(x, y) → −x2 est strictement concave sur IR2 . De la même manière, (x, y) → −2y 2 est strictement
concave sur IR2 . Donc f est strictement concave sur IR2 comme somme de fonctions strictements
concaves sur IR2 , et on en déduit que (0, 0) donne un maximum global pour f sur IR2 .
4) Méthode 2: en faisant une étude directe
On peut ici conclure aussi en faisant une étude directe qui était simple ici. Sans étude de la convexité
de f , on aurait pu ici remarquer directement que

∀(x, y) ∈ IR2 , −x2 − 2y 2 ≤ 0

donc
∀(x, y) ∈ IR2 , 28 − x2 − 2y 2 ≤ 28
autrement dit
∀(x, y) ∈ IR2 , f (x, y) ≤ f (0, 0)
ce qui est exactement dire que (0, 0) donne un maximum global pour f sur IR2 .

Solution de l’exercice 7
Etape 1: recherche des points critiques
On calcule le gradient (qui est le vecteur des dérivées partielles d’ordre 1)

∇f (x, y) = ( ∂f
∂x
(x, y), ∂f
∂y
(x, y))

= (2xy − 2y 2 + 3y, x2 − 4xy + 3x)

∂f
∂x
(x, y)est la dérivée partielle de f par rapport à x c’est à dire en considérant f comme fonction de
la seule variable x et en la dérivant par rapport à cette seule variable, donc
∂f
(x, y) = 2xy − 2y 2 + 3y
∂x
∂f
∂y
(x, y)est la dérivée partielle de f par rapport à y c’est à dire en considérant f comme fonction de
la seule variable y et en la dérivant par rapport à cette seule variable, donc
∂f
(x, y) = x2 − 4xy + 3x
∂y

Les points critiques sont ceux qui annulent le gradient. On obtient un système de deux équations à
deux inconnues dont on cherche les solutions.

2xy − 2y 2 + 3y = 0
∇f (x, y) = (0, 0) ⇔
x2 − 4xy + 3x = 0

y(2x − 2y + 3) = 0

x(x − 4y + 3) = 0

y = 0 ou 2x − 2y + 3 = 0

x = 0 ou x − 4y + 3 = 0

On a 4 cas.
1) y = 0 et x = 0, on obtient le point critique (0, 0)
2) y = 0 et x − 4y + 3 = 0, donc x = −3 et on obtient le point critique (−3, 0)
3) 2x − 2y + 3 = 0 et x = 0 donc y = 32 et on obtient le point critique (0, 23 )
4) 2x − 2y + 3 = 0 et x − 4y + 3 = 0, on obtient le système
 
2x − 2y = −3 L1 pivot 2x − 2y = −3

x − 4y = −3 2L2 − L1 −6y = −3

x = −1

y = 12

et on obtient le point critique (−1, 21 )

En résumé
on obtient les 4 points critiques (0, 0), (−3, 0), (0, 23 ) et (−1, 21 )

Etape 2: nature des points critiques


on calcule la matrice hessienne

∂2f ∂2f

∂x2
(x, y) ∂x∂y
(x, y)
∇2 f (x, y) = 
 

∂2f ∂2f
∂y∂x
(x, y) ∂y 2
(x, y)
 
2y 2x − 4y + 3
∇2 f (x, y) =  
2x − 4y + 3 −4x
On a det ∇2 f (x, y) = −8xy − (2x − 4y + 3)2 qui n’est pas toujours positif pour tout (x, y) de IR2
puisque si xy ≥ 0, c’est à dire si les deux coordonnées x et y sont du même signe (les deux sont
négatifs ou les deux sont positifs) alors le déterminant est négatif. Il faut faire une étude locale en
chaque point critique.

En (0, 0), det ∇2 f (0, 0) < 0 → point-selle

En (−3, 0), det ∇2 f (−3, 0) < 0 → point-selle

En (0, 23 ), det ∇2 f (0, 32 ) < 0 → point-selle

En (−1, 21 ), det ∇2 f (−1, 12 ) = 4 − (−2 − 2 + 3)2 = 4 − 1 = 3 > 0 et 2y = 1 > 0, −4x = 4 > 0


donc f est localement convexe et (−1, 21 ) donne un minimum local pour f

En résumé
(0, 0), (−3, 0) et (0, 23 ) point-selle et f admet un minimum local atteint en (−1, 21 )

Solution de l’exercice 8
1) f est C 2 sur IR2 (fonction polynôme). On cherche les points critiques. ∇f (x, y) = (8x+8, 18y−36)
et on résoud le système ∇f (x, y) = (0, 0). On trouve  un  unique point critique (−1, 2). On
8 0
cherche la nature du point critique. ∇2 f (x, y) = et on a pour tout (x, y) ∈ IR2 ,
0 18
det ∇2 f (x, y) = 8 × 18 − 0 × 0 ≥ 0 et 8 > 0, 18 > 0 donc f est convexe sur IR2 et le point cri-
tique (−1, 2) donne un minimum global pour f sur IR2 .
2) g est C 2 sur IR2 (fonction polynôme). On cherche les points critiques. ∇g(x, y) = (x2 + 2y −
6, 2y + 2x − 3) et on résoud le système ∇g(x, y) = (0, 0). On trouve (par exemple en exprimant y
en fonction de x à l’aide de la 2ème équation du système et en remplaçant dans la 1ère équation
5 3
du système). On trouve deuxpoint critique (−1, 2 ) et (3, − 2 ). On cherche la nature des points cri-
2x 2
tiques. ∇2 g(x, y) = et on a pour tout (x, y) ∈ IR2 , det ∇2 g(x, y) = 4x − 4 = 4(x − 1). Le
2 2
déterminant n’est pas toujours positif pour tout (x, y) ∈ IR2 . On fait une étude locale. En (−1, 52 ),
det ∇2 g(−1, 25 ) < 0 donc point-selle. En (3, − 32 ), det ∇2 g(3, − 23 ) > 0 et 2 > 0 donc g admet un
minimum local en (3, − 32 ).

Solution de l’exercice 9
1) Méthode 1: en explicitant la contrainte.
g(x1 , x2 ) = 2x21 + x2 − 2 = 0 ⇔ x2 = 2 − 2x21
On calcule f˜(x1 , x2 ) lorsque x2 = 2 − 2x21 : f˜(x1 , 2 − 2x21 ) = 4x21 − (2 − 2x21 )2

on définit F (x) = 4x2 − (2 − 2x2 )2 et on optimise F sur IR.

Recherche des points critiques:

F 0 (x) = 0 ⇔ 8x − 2 × (−4x) × (2 − 2x2 ) = 0


⇔ 8x(1 + (2 − 2x2 )) = 0
⇔ x = 0 ou 1 + (2 − 2x2 ) = 0
⇔ x = 0 ou − 2x2 + 3 = 0
3
⇔ x = 0 ou x2 =q 2 q
3 3
⇔ x = 0 ou x = 2
ou x = − 2

q q
on a F 0 (x) = 8x(3 − 2x2 ) = 8x × (−2)(x − 3
2
)(x + 3
2
) et le tableau de variation
q q
x −∞ − 32 0 3
2
+∞
x − − 0 + +
2
−2x + 3 − 0 + + 0 −
F 0 (x) + 0 − 0 + 0 −
5 5
F (x) % & % &
−∞ −4 −∞

lim F (x) = lim 4x2 − (4 − 8x2 + 4x4 ) = lim (−4x4 ) = −∞


x→−∞ x→−∞ x→−∞
de même lim F (x) = −∞
x→+∞

F (0) = 4 × 02 − (2 − 2 × 02 )2 = −4
q q q q
F (− 32 ) = F ( 32 ) = 4 × ( 32 )2 − (2 − 2 × ( 32 )2 )2 = 6 − (2 − 3)2 = 5

0 donne un
q q minimum local pour F sur IR
3
2
et − 32 donnent un maximum global pour F sur IR

x1 = 0, x2 = 2 − 2x21 = 2 càd (0, 2) donne un minimum local pour f sous la contrainte


q q q q
3
x1 = 2
, x2 = 2 − 2x1 = −1 càd ( 2 , −1), et x1 = − 2 , x2 = 2 − 2x1 = −1 càd (− 32 , −1),
2 3 3 2

donnent un maximum global pour f sous la contrainte

2) Méthode 2: en cherchant les points critiques de 1ère et de 2ème espèce.

Points critiques de 2ème espèce


Le gradient de la contrainte ∇g(x1 , x2 ) = (4x1 , 1) 6= (0, 0) donc il n’y a pas de point critique de 2ème
espèce

Points critiques de 1ère espèce


On écrit le lagrangien Lλ (x1 , x2 ) = 4x21 − x22 − λ(2x21 + x2 − 2). Les points critiques de 1ère espèce
sont les solutions du système.
x ∈ U, ∇g(x) 6= (0, 0)






 ∂L
 ∂x1λ (x1 , x2 ) = 0

∂Lλ
(x1 , x2 ) =0


∂x2







g(x) = 0
c’est à dire dans notre cas

U = IR2 , et on peut enlever la condition ∇g(x) 6= (0, 0) puisqu’on a vu qu’elle est toujours vraie.

x ∈ IR2



8x1 − 4λx1 = 0 càd 4x1 (2 − λ) = 0






 −2x2 − λ = 0




 2
2x1 + x2 − 2 = 0

On obtient 

 x1 = 0 ou λ = 2



x2 = − 12 λ




 2
2x1 + x2 − 2 = 0
1er cas: x1 = 0. On cherche les solutions de


 x1 = 0



x2 = − 12 λ




 1
−2λ − 2 = 0

on trouve x1 = 0, λ = −4 et x2 = 2, on a donc un point critique de 1ère espèce qui est (0, 2), son
multiplicateur λ associé est λ = −4.

2ème cas: λ = 2. On obtient 



 λ=2



x2 = − 12 λ




 2
2x1 + x2 − 2 = 0
q q
1 3 3
on trouve x2 = −1 et avec la 3ème équation x21 =− x2 ) = donc x1 =
2
(2 2 2
ou x1 = − 32 ,
q q
on a donc deux points critiques de 1ère espèce qui sont ( 2 , −1) et (− 32 , −1) de multiplicateur λ
3

associé λ = 2.

En
q résumé: 3 points
q critiques
( 2 , −1) et (− 32 , −1) de multiplicateur λ associé λ = 2
3

(0, 2) de multiplicateur λ associé est λ = −4

Reste à trouver la nature des points critiques.

Pour λ = 2, L2 (x1 , x2 ) = 4x21 − x22 − 2(2x21 + x2 − 2) = −x22 − 2x2 + 2. Cette fonction est une
q q
2
fonction concave sur IR , donc les points critiques ( 2 , −1) et (− 32 , −1) donnent un maximum
3

global pour le lagrangien, donc donnent un maximum global pour f sous la contrainte.

Pour λ = −4, L−4 (x1 , x2 ) = 4x21 − x22 + 4(2x21 + x2 − 2) = 12x21 − x22 + 4x2 − 8

∇L−4 (x1 , x2 ) = (24x1 , −2x2 + 4)

∂ 2 L−4 ∂ 2 L−4
 
(x) (x)
 
∂x21 ∂x1 ∂x2 24 0
∇2 L−4 (x) =  =
   
∂ 2 L−4 ∂ 2 L−4 0 −2
∂x2 ∂x1
(x) ∂x22
(x)

donc det∇2 L−4 (x) = −48 < 0 pour tout x ∈ IR2 , donc (0, 2) est un point-selle du lagrangien. On ne
peut rien dire.

On essaye de linéariser la contrainte et d’étudier la forme quadratique associée à la matrice hessi-


enne du lagrangien. La linéarisation de la contrainte donne h1 g10 (x1 , x2 ) + h2 g20 (x1 , x2 ) = 0 càd
h1 × 4x1 + h2 × 1 = 0 avec (x1 , x2 ) = (0, 2), finalement la linéarisation de la contrainte donne h2 = 0

La forme quadratique s’écrit


qL−4 (h1 , h2 ) = 24h21 − 2h22
On en déduit que ∀(h1 , h2 ) 6= (0, 0) tel que h2 = 0 (donc tel que h1 6= 0)
qL−4 (h1 , h2 ) = 24h21 > 0. D’après le théorème, (0, 2) donne un minimum local pour f sous la con-
trainte.

Solution de l’exercice 10
Df = Dg = IR2 , les fonctions f et g sont des fonctions polynômes donc de classe C 2 sur IR2 .

L’ensemble E = {(x1 , x2 ) ∈ IR2 /x21 + x22 − 4 = 0} = C((0, 0), 2) est le cercle de centre O=(0,0)
et de rayon 2.

Un cercle est un compact. Donc il s’agit d’un problème d’optimisation d’une fonction continue
sur un ensemble compact.

On écrit le lagrangien
Lλ (x1 , x2 ) = x2 − λ(x21 + x22 − 4)
On cherche les points critiques de 2ème espèce.

 g(x1 , x2 ) = 0

∇g(x1 , x2 ) = (0, 0)

Comme g(x1 , x2 ) = x21 + x22 − 4, on calcule le gradient de g, ∇g(x1 , x2 ) = (2x1 , 2x2 )

 2
 x1 + x22 − 4 = 0

(2x1 , 2x2 ) = (0, 0)




 −4 = 0

(x1 , x2 ) = (0, 0)

Donc il n’y a pas de point critique de 2ème espèce.
On cherche les points critiques de 1ère espèce.

Points critiques de 1ère espèce.

x ∈ U, ∇g(x) 6= (0, 0)






 ∂L
 ∂x1λ (x1 , x2 ) = 0

∂Lλ
(x1 , x2 ) =0


∂x2







g(x) = 0
c’est à dire dans notre cas

U = IR2 , et on a vu que la condition ∇g(x) 6= (0, 0) s’écrit (x1 , x2 ) 6= (0, 0) (en fait on peut
l’enlever puisqu’on a vu qu’elle est toujours vraie dés que g(x) = 0).

x ∈ IR2 , (x1 , x2 ) 6= (0, 0)









 −2λx1 = 0

1 − 2λx2 = 0








 2
x1 + x22 − 4 = 0


 λ = 0 ou x1 = 0



1 − 2λx2 = 0




 2
x1 + x22 − 4 = 0
1er cas: λ = 0. 

 λ=0



1=0




 2
x1 + x22 − 4 = 0
impossible

2ème cas: x1 = 0. 

 x1 = 0



1 − 2λx2 = 0




 2
x2 − 4 = 0 ⇔ x22 = 4 ⇔ [x2 = −2 ou x2 = 2]
Cas où x2 = −2



 x1 = 0



1 + 4λ = 0 ⇔ λ = − 14




x2 = −2

Cas où x2 = 2



 x1 = 0



1
1 − 4λ = 0 ⇔ λ = 4




x2 = 2

En résumé: deux points critiques


(0, −2) de multiplicateur λ = − 14 et (0, 2) de multiplicateur λ = 14 .

Comme on optimise f sur l’ensemble qui est le cercle de centre (0, 0) et de rayon 2, on calcule
la valeur de f pour chaque point critique et on en déduit le minimum et maximum global.

f (0, −2) = −2 et f (0, 2) = 2 donc (0, −2) donne un minimum global pour f sous la contrainte
(sur le cercle) et (0, 2) donne un maximum global pour f sous la contrainte (sur le cercle).

Solution de l’exercice 11
4 2 2
1) f (x1 , x2 ) = ex1 +x2 −2x1 sur IR2
Df = IR2 et f est C 2 sur IR2 . La fonction exponentielle est une fonction strictement croissante,
optimiser f est équivalent à optimiser f˜(x1 , x2 ) = x41 + x22 − 2x21 .
Recherche des points critiques

˜ x1 = 0 ou x1 = −1 ou x1 = 1
∇f (x1 , x2 ) = 0 ⇔ donc les points critiques sont (0, 0), (−1, 0), (1, 0)
x2 = 0
Recherche de lanature des points  critiques
2
12x1 − 4 0
∇2 f˜(x1 , x2 ) = , det∇2 f˜(x1 , x2 ) = 2(12x21 − 4) n’est pas de signe constant sur IR,
0 2
étude locale: det∇2 f˜(0, 0) < 0 donc (0, 0) point-selle
det∇2 f˜(−1, 0) = det∇2 f˜(−1, 0) > 0 et 12 × 1 − 4 > 0, 2 > 0 donc (−1, 0) et (1, 0) donnent un
minimum local pour f˜ de valeur f˜(−1, 0) = f˜(1, 0) = −1. De plus, f˜(x1 , x2 ) = f˜1 (x1 ) + f˜2 (x2 ) avec
f˜1 (x1 ) = x41 − 2x21 , f˜2 (x2 ) = x22 , on montre que ∀x1 ∈ IR, f˜1 (x1 ) ≥ −1 et ∀x2 ∈ IR, f˜2 (x2 ) ≥ 0, d’où
∀(x1 , x2 ) ∈ IR2 , f˜(x1 , x2 ) ≥ −1 = f˜(−1, 0) = f˜(1, 0) donc (−1, 0) et (1, 0) donnent un minimum
global sur IR2 pour f˜ de valeur −1 et donc pour f de valeur e−1 .
2) f (x1 , x2 ) = x21 + 2x22
Df = IR2 , Dg = IR2 , f, g sont C 2 sur IR2
a) sous la contrainte x1 + x22 = 1
Méthode 1: en explicitant la contrainte
x22 = 1 − x1 , x1 ≤ 1
Pour x22 = 1−x1 , f (x1 , x2 ) = x21 +2(1−x1 ), on pose F (x1 ) = x21 +2(1−x1 )= x21 −2x1 +2, le problème
Optimiser F (x) = x2 − 2x + 2
d’optimisation initial est équivalent à résoudre le problème d’optimisation
s.c. x ≤ 1
0 00
Sur IR, F (x) = 2x − 2 donc un seul point critique x = 1 et F (x) > 0 donc F convexe sur IR donc
x = 1 donne un minimum global de F sur IR donc sur ] − ∞, 1]. Donc (1, 0) donne un minimum
global pour f sous la contrainte.
Méthode 2: par la méthode de Lagrange
g(x1 , x2 ) = x1 + x22 − 1 et Lλ (x1 , x2 ) = x21 + 2x22 − λ(x1 + x22 − 1)
Recherche des points critiques
Points
 critiques de 2ème espèce
 (points critiques en lesquels la contrainte n’est pas qualifiée):
g(x1 , x2 ) = 0 x1 + x22 − 1 = 0
⇔ impossible.
∇g(x1 , x2 ) = (0, 0) (1, 2x2 ) = (0, 0)
Points critiques de 1ère espèce (points critiques en lesquels la contrainte est qualifiée):
(x1 , x2 ) ∈ IR2 , (1, 2x2 ) 6= (0, 0)

 (x1 , x2 ) ∈ IR2 , ∇g(x1 , x2 ) 6= (0, 0)
 
 2x1 − λ = 0


2x1 − λ = 0

∇Lλ (x1 , x2 ) = (0, 0) ⇔ ⇔ 2x2 (2 − λ) = 0 ⇔
4x2 − 2λx2 = 0
g(x1 , x2 ) = 0 x1 + x22 − 1 = 0
 
 
x1 + x22 − 1 = 0


 x1 = 12 λ
x2 = 0 ou λ = 2
x1 + x22 − 1 = 0

1er cas: x2 = 0 alors x1 = 1, λ = 2, 2ème cas: λ = 2 alors x1 = 1, x2 = 0
un seul point critique (1, 0) de multiplicateur λ = 2.
Recherche de la  nature du point
 critique
2 0
∇2 Lλ (x1 , x2 ) = , pour λ = 2, det∇2 Lλ (x1 , x2 ) = 0, 2 > 0, donc (1, 0) donne un mini-
0 4 − 2λ
mum global pour L2 , donc (1, 0) donne un minimum global pour f sous la contrainte.
b) sous la contrainte x21 − 41 x22 = 1
Lλ (x1 , x2 ) = x21 + 2x22 − λ(x21 − 14 x22 − 1), pas de point critique de 2ème espèce, (−1, 0), (1, 0) points
critiques de 1ère espèce qui donnent un minimum global pour le lagrangien, donc pour f sous la
contrainte.
3) f (x1 , x2 ) = x1 + 2x2 sous la contrainte x21 + x22 − 2x1 − 4x2 = −1
Df = Dg = IR2 , g(x1 , x2 ) = 0 ⇔ (x1 − 1)2 + (x2 − 2)2 = 4 ⇒ E = C((1, 2), 2), pas de point critique
2
de 2ème √
espèce, points

critiques√de 1ère espèce Lλ (x1 , x2 ) = x1 +√ 2x2 − λ(x
√ 1
+ x22 − 2x
√1
− 4x2 + 1)
2 5 4 5 5 2 5 4 5 5
→ (− 5 + 1, − 5 + 2), λ = − 4 (donne un mini. global) et ( 5 + 1, 5 + 2), λ = 4 (donne un
maxi. global). on peut utiliser la matrice hessienne du lagrangien ou optimiser une fnct continue sur
un compact pour conclure

Détails pour les calculs et la nature des points critiques de 1ère espèce.

  1 − 2λx1 + 2λ = 0
∇Lλ (x1 , x2 ) = 0
⇔ 2 − 2λx2 + 4λ = 0
g(x1 , x2 ) = 0  2
x1 + x22 − 2x1 − 4x2 + 1 = 0


 x1 = 1+2λ

(λ = 0 est exclu car donne 1=0 dans la 1ère équation, impossible)



⇔ x2 = 2+4λ





 2
x1 + x22 − 2x1 − 4x2 + 1 = 0
 1

 x1 = 2λ +1



⇔ x2 = λ1 + 2




(x1 − 1)2 + (x2 − 2)2 = 4

Les calculs pour la dernière équation donnent

(x1 − 1)2 + (x2 − 2)2 = 4

1 2
⇔ ( 2λ ) + ( λ1 )2 = 4

1 1
⇔ 4λ2
+ λ2
=4

⇔ ( 41 + 1) λ12 = 4

5
⇔ 4
= 4λ2

5
⇔ 16
= λ2
q √ q √
5 5 5 5
⇔ λ = − 16 = − 4 ou λ = 16 = 4

On peut aussi garder l’écriture initiale de la contrainte x21 + x22 − 2x1 − 4x2 + 1 = 0 et les calculs pour
la dernière équation donnent
( 1+2λ

)2 + ( −2+4λ

)2 − 2( 1+2λ

) − 4( −2+4λ

)+1=0

(1+2λ)2 (−2+4λ)2
⇔ 4λ2
+ 4λ2
− 1+2λ
λ
− 2( −2+4λ
λ
)+1=0

⇔ (1 + 2λ)2 + (−2 + 4λ)2 − 4λ(1 + 2λ) − 8λ(−2 + 4λ) + 4λ2 = 0


√ √
5 5
et on retrouve la même équation du second degré de racines λ = − 4
et λ = 4
√ √
5 1+2λ 1 1√ 4√ √2 + 1 = − 2 5 + 1
Pour λ = − 4
, on trouve x1 = 2λ
= 2λ
+ 1 = 5
+ 1 = −2 5
+ 1 = − 5 5
−2 4
√ √ √
2+4λ 1 4 4 5 2 5 4 5
et x2 = 2λ = λ + 2 = − √5 + 2 = − 5 + 2 et le point critique (− 5 + 1, − 5 + 2) donne la valeur
√ √ √
de la fonction objectif f (− 2 5 5 + 1, − 4 5 5 + 2) = −2 5 + 5
√ √ √
Pour λ = 45 , on trouve√ x1 = 1+2λ = 2λ1
+ 1 = 2 5 5 + 1 et x2 = 2+4λ = 1 + 2√ = 4 5 5 + 2 et le
√ 2λ 2λ √ λ √
point critique ( 2 5 5 + 1, 4 5 5 + 2) donne la valeur de la fonction objectif f ( 2 5 5 + 1, 4 5 5 + 2) = 2 5 + 5

4) f (x1 , x2 ) = x−1 −1 −2 −2
1 + x2 sous la contrainte x1 + x2 = 1. On a les domaines Df = Dg = {(x1 , x2 ) ∈
2 2
IR , x1 x2 6= 0} = {(x1 , x2 ) ∈ IR , x1 6= 0 et x2 6= 0}.
pas de point critique de 2ème espèce
Détails pour les calculs et la nature des points critiques de 1ère espèce.
−2 −3

 −x1−2 + 2λx1−3 = 0

 ∇Lλ (x1 , x2 ) = 0

−x2 + 2λx2 = 0

g(x1 , x2 ) = 0 ⇔
x−2 −2
1 + x2 − 1 = 0
(x1 , x2 ) ∈ Df ∩ Dg
 

(x1 , x2 ) ∈ Df ∩ Dg

 −3

 x1 (−x1 + 2λ) = 0



 x−3

2 (−x2 + 2λ) = 0



x−2 −2
1 + x2 − 1 = 0








(x1 , x2 ) ∈ Df ∩ Dg



 x1 = 2λ




 x2 = 2λ



(2λ)−2 + (2λ)−2 − 1 = 0








(x1 , x2 ) ∈ Df ∩ Dg

Les calculs pour la dernière équation donnent en multipliant par (2λ)2 (qui est non nul d’après
l’équation −x−2 −3
1 + 2λx1 = 0)
√ √
1 2 2
2 − (2λ)2 = 0 ⇔ 2 − 4λ2 = 0 ⇔ λ2 = ⇔ [λ = ou λ = − ]
2 2 2
√ √ √
2
√ √
On obtient

deux points critiques ( 2, 2) de multiplicateur λ = 2
et (− 2, − 2) de multiplicateur
2
λ=− 2 .

On a ∇f (x1 , x2 ) = (−x−2 −3 −2 −3
1 + 2λx1 , −x2 + 2λx2 ) et
 −3
2x1 − 6λx−4
  −4 
2 1 0 x1 (2x1 − 6λ) 0
∇ f (x1 , x2 ) = =
0 2x−3
2 − 6λx2
−4
0 x−4
2 (2x2 − 6λ)
On a det∇2 f (x1 , x2 ) = x−4 −4
1 x2 (2x1 − 6λ)(2x2 − 6λ) n’est pas toujours positif ou nul pour tout
(x1 , x2 ) ∈ Df ∩ Dg (par exemple pour λ 6= 0, (4λ, 2λ) ∈ Df ∩ Dg et det∇2 f (4λ, 2λ) < 0). L’étude
locale
√ donne
√ √
en ( 2, 2) de multiplicateur λ = 22
√ √ √ √ √
det∇2 f ( 2, 2) = (( 2)−4 )2 [2 2 − 3 2]2 > 0 et les termes diagonaux sont strictement négatifs
donc on√ obtient
√ un maximum local. √
en (− 2, − 2) de multiplicateur λ = − 22
√ √ √ √ √
det∇2 f (− 2, − 2) = ((− 2)−4 )2 [−2 2 + 3 2]2 > 0 et les termes diagonaux sont strictement
positifs donc on obtient un minimum local.
5) f (x1 , x2 ) = 31 x31 + 13 x32 − x1 x2 sous la contrainte x1 + x2 = 2
(1, 1), λ = 0 seul point critique, donne un mini. local
6) f (x1 , x2 ) = ln(x1 x2 ) sous la contrainte x21 + x22 = 1
E = {(x1 , x2 ) ∈ IR2 /x1 x2 > 0, x21 + x22 = 1} (représenter graphiquement) √ √ √ √
pas de point critique de 2ème espèce, points critiques de 1ère espèce ( 22 , 22 ), (− 22 , − 22 ), λ = 1 qui
donnent un maxi. global.
4 2 2
7) f (x1 , x2 ) = ex1 +x2 −2x1 , Df = IR2 , f C 2 sur IR2
a) g(x1 , x2 ) = x21 + x2 − 1, Dg = IR2 , g C 2 sur IR2
Comme la fonction exponentielle est une fonction strictement croissante, le problème de l’énoncé
 4 2 2
Optimiser f (x1 , x2 ) = ex1 +x2 −2x1
s.c. x21 + x2 − 1 = 0

est équivalent au problème

Optimiser f˜(x1 , x2 ) = x41 + x22 − 2x21




s.c. x21 + x2 − 1 = 0

Rappel. Deux problèmes sont dits équivalents s’ils ont les mêmes solutions. Autrement dit, dire
que ces problèmes sont équivalents, c’est dire qu’ils atteignent leur maximum et minimum (etc) en
les mêmes points (x1 , x2 ) (mais bien sûr la valeur de la fonction objectif est différente puisque l’une
˜
est égale à exponentielle de l’autre: on a f = ef ).

Méthode 1: en explicitant la contrainte 1ère manière x2 = 1 − x21


On pose F̃ (x1 ) = f˜(x1 , 1 − x21 ) = 2x41 − 4x21 + 1, points critiques: 0, −1 et 1, F̃ n’est ni convexe ni con-
cave sur tout IR, étude locale: 0 donne un maximum local (qui n’est pas global lim F̃ (x1 ) = +∞),
x1 →+∞
−1, 1 donnent un minimum local. On en déduit (0, 1) donne un maximum local pour f sous la
contrainte, (−1, 0), (1, 0) donnent un minimum local pour f sous la contrainte.
2ème manière x21 = 1 − x2 , x2 ≥ 1
On pose H̃(x2 ) = (1 − x22 )2 − 4x22 + 2(1 − x2 ) = 2x22 − 1, un seul point critique: x2 = 0 qui donne un
minimum global pour H̃ sur IR et donc sur [1, +∞[, reste à voir le point de la frontière x2 = 1, qui
donne un maximum local pour H̃.
Méthode 2: par la méthode de Lagrange
g(x1 , x2 ) = x21 + x2 − 1 et Lλ (x1 , x2 ) = x41 + x22 − 2x21 − λ(x21 + x2 − 1)
Recherche des points critiques
pas de point critique de 2ème espèce, points critiques de 1ère espèce: (0, 1) de multiplicateur λ = 2,
(−1, 0) et (1, 0) de multiplicateur λ = 0.
Nature des points  critiques 
2 12x21 − 2(λ + 2) 0
∇ Lλ (x1 , x2 ) = , pour λ = 0, det∇2 L0 (x1 , x2 ) n’est pas de signe constant
0 2
sur IR2 , étude locale autour de (−1, 0), det∇2 L0 (−1, 0) > 0, au moins un des termes sur la diagonale
du hessien est > 0 donc (−1, 0) donne un minimum local pour f sous la contrainte, de même (1, 0)
donne un minimum local pour  f sous la  contrainte.
−4 0
pour λ = 2, ∇2 L2 (x1 , x2 ) = , det∇2 L2 (x1 , x2 ) n’est pas de signe constant sur IR2 , étude
0 2
locale autour de (0, 1), det∇2 Lλ (0, 1) < 0 donc (0, 1) point-selle du lagrangien, on ne peut rien
en déduire pour f sous la contrainte. On étudie directement le signe de la forme quadratique
q(h1 , h2 ) = −4h21 + 2h22 en linéarisant la contrainte c’est à dire pour les couples (h1 , h2 ) 6= (0, 0) tels
que < (h1 , h2 ), ∇g(0, 1) >= 0 càd tq h2 = 0. On a ∀(h1 , h2 ) 6= (0, 0) tel que h2 = 0, càd tq ∀h1 6= 0,
q(h1 , 0) = −4h21 < 0 donc (0, 1) donne un maximum local pour f˜ et donc pour f sous la contrainte.
Remarque: on cherche à optimiser f sur l’ensemble E = {(x1 , x2 ) ∈ IR2 /x21 + x2 = 1}. On a vu au
1) que ∀(x1 , x2 ) ∈ IR2 , f (x1 , x2 ) ≥ f (−1, 0) = f (1, 0), donc ∀(x1 , x2 ) ∈ E, f (x1 , x2 ) ≥ f (−1, 0) =
f (1, 0). Or (−1, 0), (1, 0) ∈ E donc (−1, 0) et (1, 0) donnent un minimum global pour f sur E.
b) g(x1 , x2 ) = x21 + x22 − 2, Dg = IR2 , g C 2 sur IR2
Comme la fonction exponentielle est une fonction strictement croissante, le problème de l’énoncé
 4 2 2
Optimiser f (x1 , x2 ) = ex1 +x2 −2x1
s.c. x21 + x22 = 2

est équivalent au problème

Optimiser f˜(x1 , x2 ) = x41 + x22 − 2x21




s.c. x21 + x22 = 2

Méthode 1: en explicitant la contrainte


Optimiser f˜(x1 , x2 )
 
Optimiser F̃ (x2 ) = x42 − x22
⇔ en étudiant F̃ , on cherche à
s.c. x21 + x22 = 2 s.c. x22 ≤ 2
√ √
optimiser une fonction continue sur l’ensemble compact [− 2, 2], on trouve les points critiques
√ √ √ √ √ √
0, 22 , − 22 ∈]− 2, 2[. En effet quand on étudie la fonction F̃ sur [− 2, 2]: F̃ 0 (x2√ ) = 4x32 −2x2 √=
√ √
2x2 (2x22 − 1) = 2x2 ( 2x2 − 1)( 2x2 + 1) d’où les points critiques de F̃ 0 : x2 = 0, x2 = 22 et x2 = − 22
√ √
qui appartiennent à [− 2, √ 2] et√la dérivée seconde de F̃ est F̃ 00 (x2 ) = 12x22 −2 = 2(6x22 −1) √
qui n’est

pas de signe constant sur [− 2, 2], la fonction F̃ n’est pas soit convexe soit concave sur [− 2, 2].
On construit le tableau des variations de F̃
√ √ √ √
x − 2 − 22 0 2
2
2
√ 2x − − 0 + +
√ 2x − 1 − − − 0 +
2x + 1 − 0 + + 0 +
0
F̃ (x) − 0 + 0 − 0 +
12 0 12
F̃ (x) & % & %
− 14 − 41
√ √
Les points 22 , − 22 donnent un minimum global, 0 donne un maximum local,les points de la frontière
√ √ √ √
− 2 et 2 donnent un maximum global sur [− 2, √2]. On√revient à la fonction f , on a x21 =
2 − x22 et on obtient pour f sous la contrainte, √(− √2, 0), ( √2, 0) donnent un maximum local,
√ √ 6 2 6

2

6

2
√ √
6 2
(0, − 2), (0, 2) donnent un maximum global, (− 2 , − 2 ), (− 2 , 2 ), ( 2 , − 2 ), ( 2 , 2 ) donnent
un minimum global

Méthode 2: par la méthode de Lagrange


Lλ (x1 , x2 ) = x41 + x22 − 2x21 − λ(x21 + x22 − 2)
pas de point critique de 2ème espèce.

Détails des calculs de la résolution du système pour les points critiques de 1ère espèce.

Lλ (x1 , x2 ) = x41 + x22 − 2x21 − λ(x21 + x22 − 2)


 3
 4x − 4x1 − 2λx1 = 0
 ∇Lλ (x1 , x2 ) = 0  1


2x2 − 2λx2 = 0
g(x1 , x2 ) = 0 ⇔
x2 + x22 − 2 = 0
(x1 , x2 ) ∈ Df ∩ Dg  1
 

(x1 , x2 ) ∈ IR2

 2x1 (2x21 − 2 − λ) = 0
⇔ 2x2 (1 − λ) = 0
 2
x1 + x22 − 2 = 0

 x1 = 0 ou 2x21 − 2 − λ = 0
⇔ x2 = 0 ou 1 − λ = 0
 2
x1 + x22 − 2 = 0

 x1 = 0 ou x21 = 2+λ
2
=1+ λ
2
⇔ x2 = 0 ou λ = 1
 2
x1 + x22 − 2 = 0
1) 1er cas: x1 = 0 et x2 = 0 qui est impossible (contradiction avec la 3ème équation)
√ √
2) 2ème cas: x1 = 0 et λ = 1, la 3ème équation donne x22 − 2 = 0 et x2 = − 2 ou√x2 = 2 √
3) 3ème cas: x21 = 1 + λ2 et x2 = 0, la 3ème équation donne x21 − 2 = 0 et x1 = − 2 ou x1 = 2, et
on trouve λ = 2(x21 − 1) = 2
4) 4ème cas: x21 = 1 + λ2 et λ = 1, c’est à dire x21 = 32 et avec la 3ème équation on obtient
q √ √ √ √ √ √
x22 = 2 − x21 = 21 , et donc x1 = 32 = √32 = √32√22 = 26 ou x1 = − 26 d’une part, et x2 = 22 ou

x2 = − 22 d’autre part.
√ √ √
6

2
√ √
6
En résumé, les pts critiques de 1ère espèce: (0, − 2), (0, 2) et (− , − ), (− , 22 ),
√ √ √ √ √ √ 2 2 2
( 26 , − 22 ), ( 26 , 22 ) de mult. λ = 1, (− 2, 0) et ( 2, 0) de mult. λ = 2
nature des points √ critiques? optimisation d’une fonction continue sur le cercle de centre √ (0, 0)
et de rayon 2 qui est compact, les valeurs de f aux diffts points candidats f (+/ − 2, 0) =

6

2 1
√ √
6

2
0, f (+/ − 2 , +/ − 2 ) = − 4 , f (0, +/ − 2) = 2, donc (+/ − 2 , +/ − 2 ) donnent un mini.global,
√ √
(0, +/ − 2) donnent un maxi.global, reste à voir (+/ − 2, 0)  
2
12x 1 − 4 0
on linéarise la contrainte et on étudie la forme quadratique ∇2 L2 (x1 , x2 ) = ,
0 −2

 
20 0
∇2 L2 (+/ − 2, 0) =
0 −2
linéarisation
√ de la contrainte: g(x1 + h1 , x2 + h2 ) ∼ = h1 g10 (x1 , x2 ) + h2 g20 (x1 , x2 ) avec (x√ 1 , x2 ) = (+/ −
2, 0) donc pour les (h1 , h2 ) 6= (0, 0) tels que g(x1 +h1 , x2 +h2 ) = 0 càd tels que +/−2 2h1 +0h√2 = 0
càd tels que h1 = 0, h2 6= 0, la forme quadratique qL2 (h1 , h2 ) = 20h21 − 2h22 < 0 donc (+/ − 2, 0)
donnent un maxi.local pour f sous la contrainte

Vous aimerez peut-être aussi