Académique Documents
Professionnel Documents
Culture Documents
Optimisation Statique PDF
Optimisation Statique PDF
1 Prambule
1.1 Dfinitions prliminaires
Soit f : U R une fonction de n variables (x1 , x2 , ..., xn ) valeurs relles dont len-
semble de dfinition U constitue un sous-ensemble de Rn . On supposera toujours que f
est continue et deux fois diffrentiable.
Dterminant dune matrice : Le dterminant dune matrice est dfini par induction :
Une matrice (1,1) est juste un scalaire
! a. Le dterminant de cette matrice est gal a.
a b a b
Matrice (2,2) : soit M = . Le dterminant de M scrit = ad bc.
c d c d
a11 a12 a1n
a21 a22 a2n
Matrice (n, n) : soit M = . ..
.. .. Pour calculer le dterminant de M ,
.. . . .
an1 an2 ann
il suffit dutiliser la mthode dite du dveloppement selon la premire ligne :
1. on associe chaque coefficient a1i de la premire ligne de la matrice M un signe +
si i est impair et un signe - si i est pair.
2. Le dterminant de M peut scrire comme la somme des n dterminants dordre
n 1 obtenus en liminant de la matrice M la ligne et la colonne contenant le
coefficient a1i . Chacun de ces dterminants est multipli par (1)1+i a1i
1
a b c
Exemple : soit M = d e f . Le dterminant de la matrice M scrit :
g h i
a b c
e f d f d e
det(M ) = d e f = a b +c
h i g i g h
g h i
= a(ei f h) b(di f g) + c(dh eg)
Mineurs principaux dune matrice : Soit M une matrice carr symtrique de dimen-
sion (n, n). Un mineur principal dordre k est le dterminant de la sous-matrice de M
dordre k obtenue en supprimant n k lignes et les n k colonnes correspondantes dans
M.
a11 a12 a13
Exemple : soit M = a21 a22 a23 .
a31 a32 a33
Les trois mineurs principaux dordre 1 de M sont a11 , a22 et a33 .
a a a a a a12
11
Les trois mineurs principaux dordre 2 de M sont : 22 23 11 13 et
a32 a33 a31 a33 a21 a32
a a12 a13
11
Le mineur principal dordre 3 de M est : a21 a22 a23 .
a31 a32 a33
Mineurs principaux diagonaux dune matrice : Soit M une matrice carr sym-
trique de dimension (n, n). Le mineur principal diagonal dordre k (not Dk ) de la matrice
M est le dterminant de la matrice de taille (k, k) obtenue en liminant les n k dernires
lignes et n k dernires colonnes de la matrice M . Une matrice carr dordre n admet n
mineurs principaux diagonaux.
N.B. : Le mineur principal diagonal dordre k dune matrice est lun de ses mineurs
principaux dordre k.
a11 a12 a13
Exemple : soit M = a21 a22 a23 .
a31 a32 a33
Le mineur principal diagonal dordre 1 de M est a11 .
a a
Le mineur principal diagonal dordre 2 est 11 12 ;
a21 a22
a a12 a13
11
le mineur principal diagonal dordre 3 est a21 a22 a23 .
a31 a32 a33
2
Matrice hessienne : On appelle matrice hessienne H(x1 , x2 , ..., xn ) de f la matrice des
drives secondes de f values au point (x1 , x2 , ..., xn ) :
f11
f12
f1n
f21 f12 f2n
H(x1 , x2 , ..., xn ) =
.. .. .. ..
. . . .
fn1
fn2
fnn
Matrice dfinie positive : Soit M une matrice carre symtrique. Soit A un vecteur
colonne quelconque. On note A sa transpose. M est dite dfinie positive si et seulement
si :
A M A > 0 A 6= 0
N.B. : Les lments diagonaux aii dune matrice dfinie positive sont tous > 0.
Matrice semi-dfinie positive : Soit M une matrice carre symtrique. Soit A un vec-
teur colonne quelconque. On note A sa transpose. Une matrice M est dite semi-dfinie
positive si et seulement si :
A M A > 0 A
3
N.B. : Les lments diagonaux aii dune matrice semi-dfinie positive sont tous 0.
Matrice dfinie ngative : Soit M une matrice carre symtrique. Soit A un vecteur
colonne quelconque. On note A sa transpose. M est dite dfinie ngative si et seulement
si :
A M A < 0 A 6= 0
N.B. : Les lments diagonaux aii dune matrice dfinie ngative sont tous < 0.
Matrice semi-dfinie ngative : Soit M une matrice carre symtrique. Soit A un vec-
teur colonne quelconque. On note A sa transpose. M est dite semi-dfinie ngative si et
seulement si :
A M A 6 0 A
N.B. : Les lments diagonaux aii dune matrice semi-dfinie ngative sont tous 0.
(1 )x + y S, [0, 1]
Intuitivement, un ensemble convexe est tel que tout segment reliant deux points de cet
ensemble se trouve lintrieur de lensemble. La figure 1 donne un exemple densemble
convexe et un exemple densemble non convexe.
4
1.4 Fonctions concaves, fonctions convexes
Soit f une fonction de plusieurs variables dfinie sur un ensemble convexe S.
Autrement dit, une fonction f est concave ssi le segment reliant tout couple de points
situs sur la surface dfinie par f est situ au-dessous de cette surface.
La figure 2 donne un exemple de fonction strictement concave dans le cas une seule
variable.
Autrement dit, une fonction f est convexe si le segment reliant tout couple de points
situs sur la surface dfinie par f est situ au-dessus de cette surface.
N.B. : Il est important de ne pas confondre la notion densemble convexe avec celle de
fonction convexe.
Proprits importantes :
f concave f convexe
Si f et g sont des fonctions concaves (resp. convexes), alors (a, b) R2+ , (a.f + b.g) est
une fonction concave (resp. convexe).
Si f est une fonction concave et g est une fonction croissante et concave, alors la fonction
g f (x) est concave.
Si f est une fonction convexe et g est une fonction croissante et convexe, alors la fonction
g f (x) est convexe.
Une fonction affine est la fois concave et convexe.
5
Figure 1: Exemples dun ensemble convexe S et dun ensemble non convexe S .
Ensemble convexe S Ensemble non convexe S
10
x
-3 -2 -1 1 2 3
2.
6 3
4
2 f x,y
y
5.
2
4 0
3 -2
4 1.
3 1
y 2
2
1 3.
1 x 5.
4.
0
0 1 2 3 4
00 x
6
Figure 4: Fonction (strictement) convexe f (x) = x2 .
f x
x
-3 -2 -1 1 2 3
2.
8 3
6
4
f x,y
y
2 5.
4 2
3 0
4 1.
2 3 1
y
2
1 5.
3.
1 x 4.
0
0 1 2 3 4
00 x
7
Caractrisation pour les fonctions une seule variable :
f concave f (x) 6 0 x R.
f (x) < 0 x R f strictement concave (attention : la rciproque nest pas nces-
sairement vraie).
f convexe f (x) > 0 x R.
f (x) > 0 x R f strictement convexe (attention : la rciproque nest pas nces-
sairement vraie).
Noter quici, la matrice hessienne est indpendante de ses arguments x, y et z (ce nest
pas toujours le cas). Les mineurs principaux diagonaux de H sont D1 = 2 > 0, D2 =
4 > 0 et D3 = 8 > 0, donc H est dfinie positive, donc f est strictement convexe.
Fonctions quasi-concaves : Une fonction valeurs relles f dfinie sur Rn est dite
quasi-concave ssi ses contours suprieurs forment des ensembles convexes, c.--d. ssi len-
semble P = {xe Rn : f (x
e) > c} est convexe pour toutes les valeurs de c.
Une telle dfinition ne donne pas une reprsentation trs intuitive de la notion de
quasi-concavit dune fonction. Pour se faire une ide de ce que recouvre ce concept, il est
important davoir en tte un ou deux exemples de fonctions quasi-concaves.
8
Figure 6: Fonction (strictement) quasi-concave f (x, y) = exp (x2 ). La fonction est quasi
concave car lensemble des valeurs x telles que f (x) > c est un ensemble (ici un segment)
(strictement) convexe.
f x
0.8
0.6
0.4
0.2
x
-3 -2 -1 1 2 3
Figure 7: Fonction qui nest pas quasi-concave car lensemble des valeurs x telles que
f (x) > c est un ensemble (constitu ici de la runion de deux segments) non convexe.
f
x
1
0.8
0.6
0.4
0.2
x
-3 -2 -1 1 2 3
9
Dans le cas 2 variables, on pensera la fonction reprsente la figure 8. La surface
dessine par cette fonction est en cloche , cest--dire que ses bords sont convexes. Bien
que cette fonction ne soit pas convexe, lensemble de ses contours suprieurs forment des
ensembles convexes, comme on peut le voir sur le graphique de ses courbes de niveaux
(qui dlimitent ses contours suprieurs).
Figure 8: Fonction (strictement) quasi-concave f (x, y) = exp (x 2)2 (y 2)2 . Re-
prsentation en 3 dimensions et courbes de niveau.
1 2.5
0.75
2 0.3 0.5 0.4 0.2
0.5 f x,y
y
4 0.25 1.5
3 0
4 1
3
y 2 0.5
2
1
1 x 0
0 0.5 1 1.5 2 2.5 3 3.5
x
00
Dans le cas une seule variable, une fonction ne sera strictement quasi-concave que si
sa courbe ne comporte aucune section horizontale.
Dans le cas deux variables, une fonction quasi-concave ne sera strictement quasi-
concave que si ses contours suprieurs ne prsentent pas de sections horizontales et si la
fonction ne comporte pas de replats (qui se traduisent par des courbes dindiffrences
paisses ) (cf. figure 9).
Fonctions quasi-convexes : Une fonction valeurs relles f dfinie sur Rn est dite
quasi-convexe si ses contours infrieurs forment des ensembles convexes, c.--d. si len-
semble P = {x Rn : f (x) 6 c} est convexe pour toutes les valeurs de c.
Fonctions strictement quasi-convexes : Une fonction f dfinie sur Rn est dite stricte-
ment quasi-convexe si ses contours infrieurs forment des ensembles strictement convexes,
i.e. si lensemble P = {x Rn : f (x) 6 c} est strictement convexe pour toutes les valeurs
de c.
10
Figure 9: Courbes dindiffrence de fonctions quasi-concaves, mais pas strictement quasi-
concaves
Contre-exemple 1 Contre-exemple 2
La figure 10 montre le graphique dune fonction quasi-convexe dans le cas une seule
variable. Bien que cette fonction ne soit pas convexe, ses contours infrieurs sont convexes.
Elle est donc bien quasi-convexe.
Figure 10: Fonction (strictement) quasi-convexe f (x, y) = 1 exp (x2 ). La fonction est
quasi-concave car lensemble des valeurs x telles que f (x) 6 c est un ensemble (ici un
segment) convexe.
f x
0.8
0.6
0.4
0.2
x
-3 -2 -1 1 2 3
11
Figure 11: Fonction (strictement) quasi-convexe f (x, y) = 1exp (x 2)2 (y 2)2 .
Reprsentation en 3 dimensions et courbes de niveau.
1
2.5
0.75
0.5 2 0.7 0.5 0.6 0.8
f x,y
y
4 0.25 1.5
3 0
4 1
2 3
y
2 0.5
1
1 x
0
0 0.5 1 1.5 2 2.5 3 3.5
00 x
Proprits importantes :
f concave (resp. convexe) f quasi-concave (resp. quasi-convexe) (attention : la rci-
proque nest pas vraie).
f quasi-concave (f ) quasi-convexe.
La somme de deux fonctions quasi-concaves (resp. quasi-convexes) nest pas ncessaire-
ment une fonction quasi-concave (resp. quasi-convexe).
Toute transformation monotone dune fonction concave (resp. convexe) est une fonction
quasi-concave (resp. quasi-convexe) : si f est une fonction
concave (resp. convexe) et
g est une fonction monotone, alors la fonction g f (x) est quasi concave (resp. quasi-
convexe).
Caractrisation :
f quasi-concave les mineurs principaux diagonaux Dk de la matrice hessienne borde
de f alternent en signe partir de k = 3, avec Dk > 0 pour k impair et Dk 6 0 (k pair)
xe Rn (attention : la rciproque nest pas ncessairement vraie).
Les mineurs principaux diagonaux Dk de la matrice hessienne borde de f alternent en
signe partir de k = 2, avec Dk > 0 pour k impair et Dk < 0 (k pair) x e Rn f
quasi-concave.
f quasi-convexe les mineurs principaux diagonaux Dk de la matrice hessienne borde
de f sont tous 6 0 partir de k = 3 x e Rn (attention : la rciproque nest pas
ncessairement vraie).
Les mineurs principaux diagonaux Dk de la matrice hessienne borde de f sont tous < 0
partir de k = 2 xe Rn f quasi-convexe.
12
Solution : Soit H La matrice hessienne borde de f . Elle scrit :
0 fx fy 0 y x
H(x, y) = fx fxx fxy = y 0 1
fy fxy
fyy x 1 0
13
2 Gnralits sur loptimisation
2.1 Notations
Un programme doptimisation scrit typiquement sous la forme (avec s.c. pour sous
contraintes ) :
max f (x1 , x2 , ..., xn )
P x1 ,x2,...,xn
s.c. contrainte(j) j = 1, ..., m
sil sagit dun programme de maximisation sous contraintes et sous la forme :
min f (x1 , x2 , ..., xn )
P x1 ,x2 ,...,xn
s.c. contrainte(j) j = 1, ..., m
La fonction f est appele fonction objectif. Le programme consiste chercher les va-
leurs (x1 , x2 , ..., xn ) pour laquelle la valeur de cette fonction est maximale (ou minimale)
sous les contraintes. On appelle Optimum la solution dun programme doptimisation : il
sagit soit dun maximum, soit dun minimum.
2.2 Dfinitions
Maximum, minimum :
La valeur xe qui rsout le programme P est un maximum de la fonction f sous les
contraintes du programme.
La valeur xe qui rsout le programme P est un minimum de la fonction f sous les
contraintes du programme.
Optimum local :
La variable x est un maximum local dune fonction f dfinie sur lensemble convexe S
> 0 tel que f (x) 6 f (x ) x S et |x x | 6
La variable x est un minimum local dune fonction f dfinie sur lensemble convexe S
> 0 tel que f (x) > f (x ) x S et |x x | 6
Optimum global :
La variable x est un maximum global dune fonction f dfinie sur lensemble convexe
S f (x) 6 f (x ) x S
La variable x est un minimum global dune fonction f dfinie sur lensemble convexe
S f (x) > f (x ) x S
14
Figure 12: Fonction f admettant un maximum local en x et un maximum global en x
sur lensemble de son domaine de dfinition.
2.3 Remarques
N.B. : Dans les sections qui suivent, on crira tous les programmes doptimisation
comme des programmes de maximisation sous contraintes. On prcisera, en cas de be-
soin, comment adapter la mthode de rsolution au cas des programmes de minimisation
sous contraintes.
15
Conditions ncessaires et suffisantes dexistence dun optimum :
Pour trouver la solution x
e dun programme doptimisation quelconque, on distingue tra-
ditionnellement deux types de conditions :
Les conditions du premier ordre (CPO) sont les conditions ncessaires que doit
vrifier un optimum, sil existe. Ces conditions scrivent comme un systme dquations
ou dinquations dont la rsolution permet de trouver x e .
Les conditions du second ordre (CSO) garantissent que les conditions du premier
ordre sont suffisantes pour que x e soit bien la solution du programme doptimisation.
P : max f (x)
x
Solution :
16
3.2 Cas dune fonction plusieurs variables
Soit une fonction f n variables.
f (x
e )
= 0 i = 1, ..., n
xi
Solution :
fx (x , y ) = 0 3(y ) 3(x )2 = 0
fy (x , y ) = 0 3(x ) 3(y )2 = 0
(x , y ) est donc tel que x = (y )2 = (x )4 . Il y a deux solutions possibles : (0, 0) et (1, 1).
on a donc : ! !
0 3 6 3
H(0, 0) = et H(1, 1) =
3 0 3 6
17
Les mineurs principaux diagonaux de H(0, 0) sont D1 = 0 et D2 = 9, donc H(0, 0)
nest pas semi-dfinie ngative, donc (0, 0) nest pas un maximum local de f .
Les mineurs principaux diagonaux de H(1, 1) sont D1 = 1 et D2 = 27, donc H(1, 1)
est dfinie ngative, donc (1,1) est un maximum local de f .
Par ailleurs, comme H(0, 0) nest pas semi-dfinie ngative, H(x, y) nest pas
semi-dfinie ngative pour tout (x, y). Les conditions du second ordre ne permettent
donc pas de conclure que (1, 1) est un maximum global. En fait, on peut montrer que
ce nest pas le cas : f (1, 1) = 1, mais f (1, 1) = 5 (par exemple).
e, ) = f (x
L(x e) (g(x
e) c)
18
Matrice hessienne borde du Lagrangien dans le cas une seule contrainte :
On appelle matrice hessienne borde du Lagrangien H L value au point x e la matrice
des drives partielles secondes de L par rapport xi borde par les drives partielles
premires de la fonction contrainte g :
g g g
0 x1 x2 xn
g 2L 2L 2L
x1 x21 x1 x2 x1 xn
g 2L 2L 2L
e) =
H L (x x2 x1 x2 x22
x2 xn
.. .. .. .. ..
.
. . . .
g 2L 2L 2L
xn x1 xn x2 xn x2n
19
Lunique solution de ce systme de 3 quations 3 inconnues est (x , y , ) = (3, 3, 3).
Cette solution vrifie la condition de qualification de la contrainte puisque
gx (3, 3) = 1 6= 0 et gy (3, 3) = 1 6= 0.
Le mineur principal dordre 3 de cette matrice value en (3, 3) est gal 2 > 0. Il
est donc du mme signe que (1)n , puisque n = 2. Par consquent, le point (3, 3) est
un maximum local. En revanche, la fonction f ntant pas concave (elle est seulement
quasi-concave), la condition suffisante pour que (x , y ) soit un maximum global nest
pas vrifie.
max f (x
e)
P ex
s.c. gj (x
e) = cj j = 1, ..., m
N.B. : il existe dautres proprits (non indiques ici) portant sur les fonctions contraintes
qui permettent de garantir que la condition de qualification de la contrainte est vrifie.
20
Conditions du premier ordre : On suppose que la contrainte de qualification est v-
rifie. Si le vecteur x
e = (x1 , x2 , ..., xn ) est une solution du programme de maximisation
P, alors il existe un unique vecteur f tel que xe vrifie les n + m conditions suivantes :
m
e )
e ,
L(x f (x
e ) X gj (x
e )
=0 j . =0 i = 1, ..., n
xi xi j=1
xi
f )
e ,
L(x
=0 e ) = cj
gj (x j = 1, ..., m
j
21
Solution :
L(x, y, z, 1 , 2 ) = x2 + y 2 + z 2 1 (x + 2y + z 1) 2 (2x y 3z 4)
max f (x
e)
P ex
s.c. gj (x
e) 6 cj j = 1, ..., m
Soit x
e la solution de ce programme. Deux situations sont envisageables pour chaque
contrainte j
soit gj (x
e ) = cj : dans ce cas, on dit que la contrainte j est sature loptimum ;
soit gj (x
e ) < cj : dans ce cas, on dit que la contrainte j est non sature loptimum.
22
Comme prcdemment, on dfinit le Lagrangien comme la fonction L suivante :
m
X
L(x e = f (x
e, ) e) j (gj (x
e) cj )
j=1
Les conditions du premier ordre que doit vrifier toute solution x e du programme
P sont lgrement modifies par rapport au cas prcdent (contraintes prenant la forme
dquations) et portent le nom de conditions de Kuhn et Tucker . Elles ont notamment
pour proprit que le multiplicateur de Lagrange j associ la contrainte j est nul lorsque
cette contrainte nest pas sature lquilibre.
23
Conditions suffisantes du second ordre pour un optimum local : Supposons
quil existe un xe qui vrifie les CPO. Soit s le nombre de contraintes satures
loptimum. Sans perte de gnralit, on suppose quil sagit des s premires. On dsigne
par H L la matrice hessienne du Lagrangien borde par les drives premires des seules
contraintes satures. Cette matrice est symtrique dordre s + n.
Les n s derniers mineurs principaux diagonaux de la matrice H L (x e ) value
e ,
loptimum sont alternativement > 0 et < 0, le dernier dentre eux (Dn+s ) tant du
mme signe que (1)n x e est un maximum local.
Les n s derniers mineurs principaux diagonaux de la matrice H L (x e ) value
e ,
loptimum sont tous du mme signe (strictement) que (1)m x e est un minimum
local.
Dans les cas 2 et 3, si lune des drives partielles de f (notes fi ) est nulle au point
e ,
x alors x
e peut tre ou ne pas tre un maximum (ou un minimum) global. Pour le savoir,
il peut tre utile de calculer la valeur de f en x
e et de la comparer la valeur prise par f
pour dautres points vrifiant les conditions du premier ordre.
Pour pouvoir appliquer les conditions de Kuhn et Tucker voques ci-dessus, il suffit
de transformer le programme P en un programme de maximisation P :
max f (x
e)
P ex
s.c. gj (x
e) 6 cj j = 1, ..., m
24
Pour trouver la solution du programme, on cherche les conditions du premier ordre
associes ce Lagrangien.
Exemple : Rsoudre le programme de maximisation P :
h i
max (x 4)2 (y 4)2
x,y
P s.c. x+y 64
x + 3y 6 9
Solution :
CSO : la fonction f est concave et les deux contraintes sont linaires. Par consquent,
(x , y , 1 , 2 ) est un maximum global.
25
6 Optimisation sous contraintes prenant la forme dinqua-
tions incluant des contraintes de non-ngativit
Dans de nombreuses application conomiques, les programmes doptimisation consid-
rs imposent que les variables considres ne puissent pas tre ngatives (le travail ou le
capital dans la fonction de production, par exemple).
Condition de qualification des contraintes : Ce sont les mmes que dans le cas des
programmes doptimisation sous contraintes prenant la forme dinquations.
26
Conditions suffisantes du second ordre pour un optimum local : Elles sont
identiques celles du cas prcdent (programme doptimisation avec contraintes prenant
la forme dinquations).
Conditions suffisantes du second ordre pour un optimum global : Cf. cas prc-
dent.
Solution :
M(x, y, ) = xy (x + y 6)
Pour dterminer les solutions de ce systme, il faut thoriquement passer en revue tous
les cas de figures possibles portant sur la saturation des contraintes (sur x,y et x+ y 6),
ce qui fait 9 combinaisons diffrentes. En ralit, on peut aboutir la solution trs
rapidement en procdant comme suit :
27
Cas x > 0. Alors, daprs la troisime condition : y = .
Si y = 0, alors = 0, donc x 6 0 daprs la quatrime condition, ce qui est
contradictoire avec lhypothse de dpart (x > 0).
Donc y > 0, ce qui implique x = daprs la cinquime condition. La dernire
condition implique alors que x = y = = 3.
Cas x = 0. Alors :
Si y > 0, alors = x = 0 daprs la sixime condition. Mais alors, la premire
condition contredit lhypothse y > 0.
Donc y = 0. La dernire condition implique alors que x = y = = 0.
Finalement, on en dduit que les conditions de Kuhn et Tucker admettent deux
solutions pour (x , y , ) : (3, 3, 3) et (0, 0, 0).
CSO : La fonction f est deux fois drivable et quasi-concave et les contraintes sont
linaires. Par consquent, si les drives partielles fi de f values en (x , y , ) sont
non nulles, alors (x , y , ) est un maximum global. Cest le cas pour la solution
(x , y ) = (3, 3). En revanche, comme les drives partielles de f sannulent en (0,0),
on peut savoir ce stade si la solution (x , y ) = (0, 0) est ou non un maximum global.
Pour dterminer lequel de ces deux points est le maximum global du programme P, il
faut alors comparer les valeurs de f en ces deux points : comme f (3, 3) > f (0, 0), le
point (x , y ) = (3, 3) est le maximum global du programme.
28