Académique Documents
Professionnel Documents
Culture Documents
I – Convexité/concavité
1. Ensembles convexes
• Définition générale (ensemble convexe) : Un sous-ensemble 𝐶 ⊂ ℝ𝑛 est dit convexe si :
∀𝑋, 𝑌 ∈ 𝐶 ; ∀𝜆 ∈ [0; 1] ; 𝜆𝑋 + (1 − 𝜆)𝑌 ∈ 𝐶
Il s’agit de la définition générale en 𝑛 variables, mais pour l’année de L1, on va se limiter aux cas 𝑛 = 1
(convexes de ℝ) et 𝑛 = 2 (convexes de ℝ2 ). Interprétons le cas 𝑛 = 2 en premier.
• Convexes de ℝ2 ∶
Soient 𝑋, 𝑌 ∈ ℝ2 fixés. L’ensemble {𝜆𝑋 + (1 − 𝜆)𝑌 ; 𝜆 ∈ [0; 1]} est le segment reliant 𝑋 à 𝑌 ; on le note [𝑋, 𝑌].
L’ensemble 𝐶 est donc convexe si : ∀𝑋, 𝑌 ∈ 𝐶 ; [𝑋, 𝑌] ⊂ 𝐶.
Autrement dit : L’ensemble C est convexe si, lorsqu’il contient deux points, il contient tout le segment qui
relie ces deux points.
• Convexes de ℝ ∶
Pour les convexes de ℝ, la caractérisation précédente est toujours valable, mais on a résultat plus précis :
Théorème : Les convexes de ℝ sont les intervalles : ]𝑎, 𝑏[ ; [𝑎, 𝑏], [𝑎, 𝑏[, ]𝑎, 𝑏] avec 𝑎, 𝑏 ∈ ℝ ∪ {−∞; +∞}.
En particulier, ℝ est convexe.
Interprétation graphique : 𝑓 est convexe si entre deux points 𝐴(𝑥 ; 𝑓(𝑥)) et 𝐵(𝑦 ; 𝑓(𝑦)), la courbe est située en
dessous du segment qui relie 𝐴 à 𝐵. En particulier, une fonction convexe sur ℝ à une courbe « tournée vers le haut ».
Autres notations : On préfère souvent les notations 𝑋 = (𝑥, 𝑦) et, à la place de 𝑌 : 𝑋′ = (𝑥′, 𝑦′)
La caractérisation de la convexité s’écrit alors :
∀𝑋, 𝑋′ ∈ 𝐶 ; ∀𝜆 ∈ [0; 1] ; 𝑓 (𝜆𝑥 + (1 − 𝜆)𝑥′ , 𝜆𝑦 + (1 − 𝜆)𝑦′ ) ≤ 𝜆𝑓(𝑥, 𝑦) + (1 − 𝜆)𝑓(𝑥′, 𝑦′)
f ( x, y ) = x 2 + y 2
L’ « inverse » de la convexité est la concavité ; cela correspond à une courbe ou une surface « tournée vers le bas ».
Exemples en 2 variables :
• Une fonction peut donc être convexe, concave, ni l’un ni l’autre (dans ce dernier cas, elle peut être convexe
sur certains intervalles et concave sur d’autres) ou alors, les deux à la fois ! par exemple, les fonctions
constantes et les fonctions affines sont à la fois convexes et concaves sur ℝ.
schéma
Plus « fort » que la convexité, il y a la stricte convexité et aussi la stricte concavité, et, contrairement à ce que l’on
vient de dire dans la remarque, une fonction ne peut pas être strictement convexe et strictement concave.
Interprétations :
• En une variable, 𝑓 est strictement convexe si entre deux points 𝑥 et 𝑦, la courbe est située strictement en dessous du segment qui relie 𝑥 à 𝑦.
En particulier, une fonction strictement convexe sur ℝ à sa courbe qui est « strictement tournée vers le haut » ; et en deux variables, c’est la
surface qui est « strictement tournée vers le haut ».
• En une variable, 𝑓 est strictement concave si entre deux points 𝑥 et 𝑦, la courbe est située strictement au-dessus du segment qui relie 𝑥 à 𝑦.
En particulier, une fonction strictement concave sur ℝ à sa courbe qui est « strictement tournée vers le bas » ; et en deux variables, c’est la
surface qui est « strictement tournée vers le bas ».
Remarques :
• Toute fonction strictement convexe est convexe, la réciproque est fausse.
• Toute fonction strictement concave est concave, la réciproque est fausse.
Dans ce paragraphe, nous allons voir des critères plus pratiques que les définitions qui permettent de déterminer si
une fonction est convexe ou concave. Si la fonction est « assez régulière », on a des résultats intéressants, on est
donc amené à définir la notion de fonction de « classe C2 ».
• Définition générale (fonction de classe C2) : 𝑓: 𝐶 ⊂ ℝ𝑛 → ℝ est dite de classe C2 si toutes les dérivées
partielles premières et seconde de 𝑓 existent et sont continues (on dit aussi que 𝑓 est deux fois continument
différentiable).
Autre caractérisation : 𝑓 est convexe ⟺ ∀𝑎, 𝑥 ∈ 𝐶, 𝑓(𝑥) ≥ 𝑓(𝑎) + 𝑓′(𝑎)(𝑥 − 𝑎) ⟺ le graphe de 𝑓 est au dessus de ses tangentes.
Exemples :
• f ( x) = x − 5 x + 4 ;
2
• ℎ(𝑥) = 𝑥 4
Propriété : Si 𝑓′′ s’annule en changeant de signe en un point 𝑎 ; alors, 𝑎 est un point d’inflexion ; il correspond à un
changement de convexité/concavité.
Exemple : 𝑘 (𝑥) = 𝑥 3
1
Autre exemple : h( x) =
x
Notations : Pour une fonction f de 2 variables C², on utilisera les notations r, s et t pour la matrice Hessienne de f
r s
(notation de Monge) : H ( x , y ) f = . C’est possible de n’utiliser que 3 lettres puisque la matrice est symétrique.
s t
Remarques :
• Si rt − s2 n’est pas positif pour tout couple (𝑥, 𝑦), alors 𝑓 n’est ni convexe ni concave.
• Les fonctions affines, de la forme f ( x, y ) = ax + by + c (a, b, c ∈ ℝ) sont à la fois convexes et concaves.
Propriété (stricte convexité/concavité des fonctions de 2 variables avec les notations de Monge) :
• Si pour tout couple ( x, y ) , r t − s ² 0 et r 0 ; alors f est strictement convexe.
• Si pour tout couple ( x, y ) , r t − s ² 0 et r 0 ; alors f est strictement concave.
Remarques :
• Si r t − s ² 0 ; alors forcément, r 0 donc, il n’y a pas de 3e cas ; de plus : r 0 t 0 et r 0 t 0
donc il est inutile de rajouter la condition t 0 ou t 0 dans la propriété.
• Les conditions pour la stricte convexité/concavité sont des conditions suffisantes non nécessaires (la
réciproque est fausse). Autrement dit, f peut être strictement convexe (ou strictement concave) avec
r t − s ² = 0 mais la propriété ne permet pas de le prouver. Il faudra dans ce cas, revenir à définition de la
stricte convexité ou de la stricte concavité.
• Si pour tout couple (x,y), 𝑟𝑡 − 𝑠 2 ≥ 0, 𝑟 > 0 et que l’ensemble {(𝑥, 𝑦) ; 𝑟𝑡 − 𝑠 2 = 0} ne contient aucun segment [𝑥, 𝑦] de longueur non nulle, alors 𝑓
est strictement convexe.
• 𝑔: (𝑥, 𝑦) ↦ −𝑥 4 − 𝑦 4 + 𝑥
• ℎ: (𝑥, 𝑦) ↦ −𝑥 4 − 𝑦 4 + 𝑥𝑦
2
Définition (extremum global) : Soit S un sous-ensemble de
Comment effectuer la recherche des extremums ? Rappel : en une variable, tous les extremums sont des points
critiques (valeur qui annulent la dérivée) ; c’est toujours le cas en 2 variables.
Théorème (condition nécessaire du premier ordre) : Si f admet un extremum en ( x0 ; y0 ) (local ou global) ; alors
Remarque : Ce sont les mêmes formules que la convexité/concavité mais ce n’est pas la même chose car ce sont des
conditions locales (c’est-à-dire, uniquement aux points critiques).
En résumé : Soit ( x0 ; y0 ) un point critique de f . Pour étudier sa nature, on est confronté aux cas suivants :
H(x0,y0)f
rt-s² = 0 On ne peut pas conclure
• f ( x, y) = x3 + 3xy
Remarque : En particulier :
• Si (𝑥0 ; 𝑦0 ) est un minimum local pour 𝑓 et que 𝑓 est convexe, alors (𝑥0 ; 𝑦0 ) est un minimum global.
• Si (𝑥0 ; 𝑦0 ) est un maximum local pour 𝑓 et que 𝑓 est concave, alors (𝑥0 ; 𝑦0 ) est un maximum global.
Remarque 2 :
• Si 𝑓 est convexe, alors : (𝑥0 ; 𝑦0 ) 𝑒𝑠𝑡 𝑢𝑛 𝑝𝑜𝑖𝑛𝑡 𝑐𝑟𝑖𝑡𝑖𝑞𝑢𝑒 ⟺ 𝑓 admet un minimum global en (𝑥0 ; 𝑦0 ).
• Si 𝑓 est concave, alors : (𝑥0 ; 𝑦0 ) 𝑒𝑠𝑡 𝑢𝑛 𝑝𝑜𝑖𝑛𝑡 𝑐𝑟𝑖𝑡𝑖𝑞𝑢𝑒 ⟺ 𝑓 admet un maximum global en (𝑥0 ; 𝑦0 ).
Remarque : Si la convexité ou la concavité est stricte, alors l’extremum (𝑥0 ; 𝑦0 ) est un extremum strict, c’est-à-dire
que : ∀(𝑥, 𝑦) ∈ ℝ2 , (𝑥, 𝑦) ≠ (𝑥0 ; 𝑦0 ) ⟹ 𝑓 (𝑥, 𝑦) ≠ 𝑓(𝑥0 ; 𝑦0 ) (autrement dit, (𝑥0 ; 𝑦0 ) est l’unique point en lequel 𝑓
atteint son extremum).
• g : ( x, y) − x 2 − y 2 + xy
Remarque : si la matrice Hessienne est constante, tout extremum local est aussi global.
L’optimisation sous contrainte est une des techniques les plus utilisées en économie. Il est important de comprendre
que les résultats obtenus de cette façon peuvent être tout à fait différents de ceux obtenus lors d’une optimisation
sans contrainte. Par exemple, si vous voulez acheter une maison, vous choisirez peut-être un château à la campagne
s’il n’y a pas de contraintes. Cependant, en présence de contraintes (budget, emplacement à rechercher proche du
travail, garage pour la voiture), peut-être vous rabattrez-vous sur un studio en banlieue.
Ce paragraphe est aussi très important en microéconomie où l’on sera amené à maximiser l’utilité d’un consommateur
sous une contrainte de budget.
Situation motivante : On dispose d’une corde de 20 mètres. Comment tracer le rectangle ayant la plus grande aire
possible en utilisant toute la corde ? 20m
D 9 C
1 9 m² 1
A B
9
D 6 C
4 24 m² 4
A B
6
D 3 C
21 m² 7
A B
3
Peut-on faire mieux que 24 m² en respectant la contrainte sur le périmètre qui est doit être égal à 20 m ?
Notons x la longueur du rectangle formé et y sa largeur.
D x C
y y
x.y m²
A B
x
L’aire du rectangle est x y et la longueur de la corde est 2 x + 2 y . Le problème revient donc à trouver le maximum
de f ( x, y) = x y sous la contrainte 2 x + 2 y = 20 c’est-à-dire g ( x, y ) = 0 avec g ( x, y ) = 2 x + 2 y − 20 .
Ici, la réponse est « connue », c’est pour x = y = 5 (un carré) mais le problème est plus général.
La condition de qualification de la contrainte garantit simplement qu’il n’y a pas de contraintes potentiellement contradictoires.
Théorème (condition nécessaire du 1er ordre au problème (P) : Optimiser 𝒇(𝒙, 𝒚) s.c 𝒈(𝒙, 𝒚) = 𝟎) :
Supposons que ( x0 ; y0 ) soit une solution du problème (P) et que la « condition de qualification de la contrainte » est
vérifiée en ( x0 ; y0 ) ; alors il existe un tel que : grad ( x0 , y0 , ) L = 0 ; c’est-à-dire que (𝑥0 ; 𝑦0 ; 𝜆) est solution
du système de trois équations à 3 inconnues suivant :
𝜕𝐿
(𝑥, 𝑦, 𝜆) = 0
𝜕𝑥
𝜕𝐿
(𝑥, 𝑦, 𝜆) = 0
𝜕𝑦
𝜕𝐿
( )
{𝜕𝜆 𝑥, 𝑦, 𝜆 = 0
Autrement dit : une solution du problème (P) est forcément un point critique du Lagrangien. C’est une condition
nécessaire mais pas suffisante : un point critique du Lagrangien n’est pas forcément une solution de (P).
Remarque : la condition grad ( x0 , y0 , ) L = 0 s’écrit sous la forme d’un système de 3 équations à 3 inconnues.
a b
Définition 1 (déterminant de taille 2) : Le déterminant d'une matrice carrée de taille 2 ; A = est :
c d
a b
det A = = ad −bc .
c d
r s
Remarque : Pour une matrice Hessienne, H ( x , y ) f = ; alors det H ( x , y ) f = r t − s ; formule utilisée pour
2
s t
l’optimisation et la convexité à deux variables.
Exemples :
•
Exemples :
1 2 3
• A = 4 5 6
7 8 9
1 0 1
• C = 2 4 3
3 0 2
On peut maintenant donner une condition suffisante d’optimalité locale au problème (P) : Optimiser (trouver le
maximum ou le minimum) d’une fonction de 2 variables f ( x, y) de classe C² sous la contrainte g ( x, y ) = 0 où g est
une fonction de classe C².
*Si det H( x0 , y0 ,0 ) L( x, y, ) 0 alors f admet un maximum (au moins) local en ( x0 ; y0 ) sous la contrainte g ( x, y ) = 0
2 L 2 L 2 L 2 L 2L g
x
2
xy x x 2 xy x
2 L 2 L 2 L 2 L 2L g
Remarque 2 : H( x , y , ) L( x, y, ) = = ; c’est la Hessienne du
xy y 2 y xy y 2 y
2 L 2 L 2 L g g
0
x y 2 x y
Lagrangien mais on l’appelle aussi matrice Hessienne de la fonction 𝑓 bordée de la contrainte ou juste : Hessienne
bordée.
1er critère : 𝑓 est convexe/concave et 𝑔 est affine, c’est-à-dire de la forme 𝑔(𝑥, 𝑦) = 𝑎. 𝑥 + 𝑏. 𝑦 + 𝑐 avec 𝑎, 𝑏, 𝑐 ∈ ℝ.
Théorème 1 : Si f est convexe ou concave et g est affine ; alors, les solutions du problème (P) sont les points critiques
du Lagrangien (s’il y en a) et ce sont des extremums globaux. Plus précisément :
Soit ( x0 ; y0 ; 0 ) un point critique du Lagrangien (s’il existe) :
• Si f est convexe, alors ( x0 ; y0 ) est un minimum global de f sous la contrainte g ( x, y ) = 0 .
• Si f est concave, alors ( x0 ; y0 ) est un maximum global de f sous la contrainte g ( x, y ) = 0 .
Remarque : dans cette situation simple, il ne sert à rien de calculer la matrice Hessienne du Lagrangien.
Remarque : autrement dit, (𝑥0 ; 𝑦0 ) est un extremum global sur l’ensemble des contraintes 𝐷 = {(𝑥, 𝑦); 𝑔(𝑥, 𝑦) = 0} de 𝑓.
2e critère : Le Lagrangien évalué avec le 𝜆 critique est une fonction de deux variables convexe ou concave.
Théorème 2 : Soit ( x0 ; y0 ; 0 ) un point critique du Lagrangien (s’il existe) et soit la fonction de deux variables :
𝐿0 (𝑥, 𝑦) = 𝑓(𝑥, 𝑦) + 𝜆0 𝑔(𝑥, 𝑦)
• Si 𝐿0 est convexe, alors ( x0 ; y0 ) est un minimum global de f sous la contrainte g ( x, y ) = 0 .
• Si 𝐿0 est concave, alors ( x0 ; y0 ) est un maximum global de f sous la contrainte g ( x, y ) = 0 .
Les applications en économie de l'optimisation d'une fonction à plusieurs variables sous contrainte, sont nombreuses.
On peut par exemple citer :
• La minimisation du coût total de production de fabrication de différents biens sous contrainte d'en livrer un
certain nombre au total.
• La maximisation d'une fonction d'utilité provenant de la consommation de plusieurs biens, sous contrainte de
respecter un budget donné.
• La minimisation d'un risque de placement sur les marchés boursiers sous contrainte d'acheter une certaine
somme d'argent en actions.
Déterminer la quantité d'articles A et B qu'il doit acheter pour maximiser son utilité sous la contrainte de dépenser
tout le budget.
2 1
r ( x, y) = x+ y
10 10
1 2 1 2 2
Ce placement comporte un risque, mesuré par sa variance. Elle est ici estimée à : V ( x, y) = x + y + xy.
5 25 25
L'investisseur souhaite connaitre le placement à risque minimum qui garantit un rendement moyen de 1000 euros.
Coût de production (en euros) dans l’usine 2 : f 2 ( y) = y + y + 100 pour y ordinateurs produits.
2
Déterminer le nombre d'appareils devant être produits dans chaque usine pour lui assurer un coût minimal de revient
sur cette commande.