Académique Documents
Professionnel Documents
Culture Documents
L3M1
Optimisation
et analyse convexe
EXERCICES CORRIGS
Jean-Baptiste Hiriart-Urruty
OPTIMISATION
ET
ANALYSE CONVEXE
Exercices et problmes corrigs,
avec rappels de cours
Jean-Baptiste Hiriart-Urruty
Collection dirige par Daniel Guin
Imprim en France
ISBN : 978-2-7598-0373-6
Tous droits de traduction, dadaptation et de reproduction par tous procds rservs pour tous
pays. Toute reproduction ou reprsentation intgrale ou partielle, par quelque procd que ce soit, des
pages publies dans le prsent ouvrage, faite sans lautorisation de lditeur est illicite et constitue une
contrefaon. Seules sont autorises, dune part, les reproductions strictement rserves lusage priv
du copiste et non destines une utilisation collective, et dautre part, les courtes citations justies
par le caractre scientique ou dinformation de luvre dans laquelle elles sont incorpores (art. L.
122-4, L. 122-5 et L. 335-2 du Code de la proprit intellectuelle). Des photocopies payantes peuvent
tre ralises avec laccord de lditeur. Sadresser au : Centre franais dexploitation du droit de copie,
3, rue Hautefeuille, 75006 Paris. Tl. : 01 43 26 95 35.
c 2009, EDP Sciences, 17, avenue du Hoggar, BP 112, Parc dactivits de Courtabuf,
91944 Les Ulis Cedex A
Introduction
Abrviations et notations
I
ix
1
1
2
3
II
III
IV
.
.
.
.
.
.
.
.
.
.
.
.
63
63
65
66
66
VI
iv
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
165
165
168
168
170
171
171
. 172
. 173
217
. 217
. 217
. 218
. 219
. 219
. 220
. 220
.
.
.
.
.
.
.
271
271
271
272
273
273
274
275
Sources
323
Rfrences gnrales
325
Notice historique
327
Index
331
INTRODUCTION
Introduction
Depuis sa publication il y a dix ans (en mars 1998), cet ouvrage a subi les vicissitudes dun document de formation destin un public (dtudiants en sciences)
en nette diminution. Il a t traduit en russe par des collgues de Kiev (Ukraine)
en 2004, mais la version franaise originelle nest plus disponible depuis 2006.
Ainsi, pour rpondre une demande de collgues et tudiants, un nouveau tirage
a t envisag. Je remercie les ditions EDP Sciences, notamment mon collgue
D. Guin (directeur de la collection Enseignement Sup Mathmatiques), davoir
accueilli ce projet. Aude Rondepierre a donn un coup de main pour reprendre
les chiers informatiques anciens ; quelle soit remercie de sa bonne volont et
ecacit.
Toulouse, printemps 2009
J.-B. Hiriart-Urruty
vii
ABRVIATIONS ET NOTATIONS
:=
R+
, R+ ou ]0, +[ : ensemble des rels strictement positifs.
+
u : partie positive du rel u.
x = (x1 , . . . , xn ) ou x = (1 , . . . , n ) : notation gnrique pour un vecteur
de Rn .
+
n
u+ signie (u+
1 , . . . , un ) lorsque u = (u1 , . . . , un ) R .
Lorque u et v sont deux vecteurs de Rn , u v signie ui vi pour tout
i = 1, . . . , n .
{uk } ou (uk ) : notations utilises pour les suites indexes par des entiers
naturels.
Pour une fonction f direntiable en x (resp. deux fois direntiable en x),
Df (x) dsigne la direntielle (premire) de f en x (resp. D 2 f (x) dsigne la
direntielle seconde de f en x). Si la variable est relle (et note t), on utilise la
notation f (t) (resp. f (t)) pour la drive de f en t (resp. la drive seconde de f
en t) [ce sont des lments de lespace darrive et non des applications linaires].
Pour une fonction numrique f dnie sur un ouvert O de Rn , direntiable
en x O (resp. deux fois direntiable en x O), f (x) (resp. 2 f (x)) dsigne
le (vecteur) gradient de f en x (resp. la matrice hessienne de f en x).
Lorsquelle existe, la drive directionnelle de f en x dans la direction d est
note f (x, d).
Pour une fonction vectorielle f : O Rn Rm direntiable en x O, Jf (x)
dsigne la matrice jacobienne de f en x (matrice m lignes et n colonnes).
dans des espaces de matrices : si X := Mm,n (R), le produit scalaire standard sur
X est dni par M, N
:= tr (M N ).
x
Abrviations et notations
xi
I
RVISION DE BASES : CALCUL
DIFFRENTIEL, ALGBRE LINAIRE
ET BILINAIRE
Rappels
I.1. Algbre linaire et bilinaire
Si l : Rn R est linaire, il existe un unique v Rn tel que l(x) =
v, x pour
tout x Rn ; les fonctions anes valeurs relles sont de la forme x
v, x+c,
o v Rn et c R. Mme chose si l est une forme linaire sur un espace euclidien
(E,
, ) : l scrit de manire unique sous la forme
v, , o v E.
Si q : Rn R est une forme quadratique, il existe un unique Q Sn (R) tel
1
que q(x) =
Qx, x pour tout x Rn (le coecient 1/2 est mis l pour simplier
2
les calculs).
Rappel du mcanisme de transposition :
Ax, y =
x, A y (produits scalaires
dans Rm et Rn respectivement).
Si H est un sous-espace vectoriel de Rn , H dsigne son sous-espace orthogonal. Rappel : si A est linaire, (KerA) = Im(A ).
Un rsultat-cl de lAlgbre linaire et bilinaire : si S Sn (R), toutes les
valeurs propres i de S sont relles et il existe une matrice orthogonale U telle
que U SU = diag(1 , . . . , n ) ; ainsi il existe des vecteurs propres xi unitaires (xi
n
associ i ) tels que S =
i xi x
i (ceci est appel une dcomposition spectrale
i=1
de S).
Sx, x
Sx, x
, min (S) = min
x = 0 x 2
x 2
Sn (R) est muni de lordre (partiel) suivant : A B dans Sn (R) lorsque A B est
semi-dnie positive (A B Pn (R)).
(1.1)
(1.3)
Enn deux ensembles de rsultats de Calcul direntiel sont essentiels en Optimisation : le thorme de la fonction implicite et le thorme dinversion locale ;
les dveloppements de Taylor sous leurs formes diverses. revoir si ncessaire.
(1.5)
(1.6)
(ii) f est strictement convexe sur C si et seulement si lingalit (1.6) est stricte
ds que x = x ;
(iii) f est fortement convexe sur C de module c si et seulement si
1
f (x) f (x) +
f (x) , x x + c x x 2 , pour tout (x, x) C C. (1.7)
2
L
d 2 pour tout (x, d) Rn Rn .
2
Figure 1.
f (x + td), ddt.
f (x + d) = f (x) +
0
Sachant que
f (x), d =
cdente en
f (x + d) f (x)
f (x), d =
1
0
(tL d 2 )dt =
L
d 2 .
2
Commentaire :
Prolongement de lexercice. On suppose prsent que f est deux fois direntiable sur Rn . Comment traduire alors en termes de 2 f lhypothse dans la
3e question ? Proposer ensuite une dmonstration de lingalit de la 3e question
qui sappuie sur une autre formule de Taylor.
Il importe de bien assimiler ce que reprsentent gomtriquement les objets
f (x) et 2 f (x) vis--vis des surfaces de niveau et du graphe de f .
* Exercice I.2.
Situations :
dterminer :
1 ) f : Rn R
x f (x) :=
c, x + .
2 ) F : Rn Rm
f (x), 2 f (x).
4 ) g : Rn R
g(x), 2 g(x).
x g(x) :=
[ri (x)]2 ,
i=1
Solution :
1 ) f (x) = c, 2 f (x) = 0 pour tout x Rn .
2 ) JF (x) = L (L est la partie linaire de la fonction ane F ).
3 ) f (x) = 12 A + A x + d, f (x) = Ax + d si A est symtrique.
2 f (x) = 12 A + A , 2 f (x) = A si A est symtrique.
m
ri (x)ri (x),
4 ) g(x) = 2
i=1
m
2 g(x) = 2
ri (x) [ri (x)] + ri (x)2 ri (x) .
i=1
Ainsi, si (r1 (x), ..., rm (x)) est proche de 0 dans Rm , on peut considm
ri (x) [ri (x)] est une bonne approximation de 2 g(x) ;
rer que 2
i=1
* Exercice I.3.
Situations :
Questions :
1 ) g : Rn R
x g(x) :=
m
2 ,
fi+ (x)
i=1
Rm
f
g := f A
R
o A : u Au = A0 u + b, avec
A0 Mm,n (R), et f deux fois direntiable.
Application : Soit : Rn R deux
fois direntiable, x0 Rn , d Rn .
On pose (t) := f (x0 + td).
i=1
Mais, en gnral, g nest pas deux fois direntiable en les points x o lun des
fi sannule.
Lorsque les fi sont de classe C 2 , la fonction g est dans une classe intermdiaire entre C 2 (Rn ) et C 1 (Rn ), celle des fonctions direntiables dont le gradient est localement lipschitzien.
2
2
2 ) g(u) = A
0 f (Au) ; g(u) = A0 f (Au)A0 .
(t) =
2 f (x0 + td)d, d.
** Exercice I.4. Soit Mn (R) structur en espace euclidien grce au produit scalaire A, B
:= tr A B ; soit louvert de Mn (R) constitu des matrices
inversibles. On considre les applications suivantes :
1 )
2 )
3 )
4 )
5 )
tr : A Mn (R) trA R
dt : A Mn (R) dtA R
g : A g(A) := ln|dtA| R
f1 : A f1 (A) := A1
p N , fp : A Mn (R) fp (A) := Ap Mn (R)
fp : A fp (A) := Ap .
Indiquer rapidement pourquoi ces applications sont direntiables. Dterminer en tout point de leurs domaines de dnition le gradient pour les trois
premires et la direntielle pour les dernires.
Commentaire : Si l : Mn (R) R est linaire (l est une forme linaire sur
Mn (R) donc), l est continue et il existe un unique M Mn (R) tel que
l(H) = M, H
pour tout H Mn (R).
8
D dt (A) : H = h , ..., h
dt a1 , ..., aj1 , hj , aj+1 , ..., an .
j=1
En dveloppant dt a1 , ..., aj1 , hj , aj+1 , ..., an par rapport la j e colonne, on
obtient :
n
hji (cofA)ij ,
dt a1 , ..., aj1 , hj , aj+1 , ..., an =
i=1
i,j=1
En dnitive,
dt(A) = cofA en tout A Mn (R).
3 ) Par application du thorme de composition des applications direntiables, g est direntiable et
Dg(A) : H
Donc
cofA, H
= A1 , H
.
dt A
g(A) = A1 en tout A .
9
4 ) Lapplication A cof A est direntiable car chacune de ses applicationscomposantes (qui sont des dterminants) est direntiable ; il sensuit que lap(cofA)
est direntiable. Le calcul de la diplication f1 : A A1 =
dtA
rentielle de f1 en A se fait rapidement partir de la relation
f1 (A)f1 (A) = In pour tout A ,
que lon direntie. On trouve :
Df1 (A) : H [D f1 (A)] H = A1 HA1 .
5 ) Lapplication qui (A1 , . . . , Ap ) Mn (R) . . . Mn (R) associe le produit A1 A2 . . . Ap est multilinaire (continue) ; elle est donc direntiable et sa
direntielle en (A1 , . . . , Ap ) est :
(H1 , . . . , Hp )
A1 . . . Ai1 Hi Ai+1 . . . Ap .
i=1
Il sensuit alors :
Dfp (A) : H [Dfp (A)] (H) =
i=1
i=1
Ax, x
. Calcu x 2
ler f (x) en x = 0 et le comparer la projection orthogonale de Ax sur le
sous-espace vectoriel Hx orthogonal x.
2
Solution : On a aisment f (x) =
[Ax f (x)x] .
x 2
Ax, x
Ax, x
x +
x est la dcomposition
La dcomposition Ax = Ax
2
x
x 2
orthogonale de Ax suivant Hx et (Hx ) = Rx. Donc, f (x) est au coecient
2
prs la projection orthogonale de Ax sur Hx .
multiplicatif
x 2
10
En x Rn \ {0} minimisant (ou maximisant) f sur Rn \ {0}, on a ncessairement f (x) = 0, soit Ax = f (x) x ; de tels x sont donc des vecteurs propres
associs la valeur propre f (x) ( suivre dans lExercice III.4).
Dg (A) : H [Dg (A)] (H) = 2 tr cof ABA ABH
= 2 cof ABA AB, H
et g(A) = 2 cof ABA AB.
En particulier, g(A) A = 2 cof ABA ABA = 2dt ABA Im .
11
1
L
1
2L
L
fx (x ) +
fx (x ), y x + y x 2 .
2
n
Le point x minimise fx sur R . Par suite
fx (x )
.
0 = fx (x) fx x
L
Daprs lingalit (1.8) dans laquelle on fait y = x
(0 ) fx
12
fx (x )
x
L
(1.8)
fx (x )
L
1
L fx (x )
fx (x )
fx (x ), fx x +
L
2
L
soit
0 fx (x )
1
fx (x ) 2
2L
e
4 ) Application 3. On remplace dans A la k colonne . par . ,
ank
a
nk
1
On pose d := (1 + A1 u, u )(1 + A1 v, v ) ( A1 u, v )2 . Montrer
que A + uu + vv est inversible ds lors que d = 0, avec
1
1
(1 + A1 v, v )A1 uu A1
= A1
A + uu + vv
d
+ (1 + A1 u, u )A1 vv A1
A1 u, v A1 vu A1 + A1 uv A1 .
13
0
1k
a1k a
.
..
..
..
.
e
u=
et v = 1 k ligne.
..
..
..
.
nk
ank a
0
le rsultat de la 1re question avec U :=
Pour la 5e question, on utilisera
u
M2,n (R)].
[u v] Mn,2 (R) et V :=
v
Solution : U V Mn (R), V A1 U Mm (R) par construction.
n
m
A1
V A1U
n
V
Donc, si
A1 u, v = 1, la matrice A + uv est inversible avec
1
= A1
A + uv
1
A1 uv A1 .
1 +
A1 u, v
(1.9)
Cas particuliers :
A = In : Si
u, v = 1, In + uv est inversible avec
In + uv
1
= In
1
uv .
1 +
u, v
(1.10)
1
uu .
1+ u 2
(1.11)
La formule (1.9) donne linverse dune matrice perturbe par une matrice
de rang 1 ; on rappelle en liaison avec (1.10) le rsultat suivant sur les dterminants :
dt In + uv = 1 +
u, v
( revoir si ncessaire) .
0
a1k a
1k
..
.
..
0
..
4 ) En prenant u =
et v = 1 k ligne,
..
0
.
..
..
.
.
nk
ank a
0
15
on constate queA = A
uv (cest fait pour !). Appliquons le rsultat de la
2e question : si A1 u k = 1, la matrice A est inversible et
ke colonne
A1
u1
1
= A1 +
A1 0 ... 0 A1
1 (A1 u)k
un
=
In + 1 (A1 u) 0
$%
#
1
A u 1
..
1
A .
1. 0
A u n
&
Ek
Explicitons A1
ke colonne
..
1 0 0.
..
0 1 0 . 0
!
"
..
(1)
0
0
1
.
,
= a
ij
: Ek est de la forme
..
.. 1 0 0
.
0 .. 0 1 0
..
.0 0 1
et A1 = Ek A1 ; do :
(1)
a
k,j
(1)
ak,j
1
1 (A1 u)k
(1)
= ak,j
1
n
l=1
n
si i = k,
(1)
a
i,j
(1)
aij
l=1
n
l=1
16
(1)
ail
alk
(1)
akl
alk
(1)
akj
(1)
aij
(1)
akl
;
a
lk
' n
l=1
(
(1)
ail
(1)
a
lk a
kj .
5 )
u
Avec U := [u v] et V :=
, on a
v
1
I2 V A
1 + A1 u,
u
A 1 u, v
U=
1 + A1 v, v
A1 u, v
( M2 (R)) .
= (1 + A1 u, u )(1 + A1 v, v ) ( A1 u, v )2 = 0.
Dans ce cas
1 1 1 + A1 v, v A1 u, v
1
.
=
I2 V A U
d A1 u, v 1 + A1 u, u
Lapplication de la formule dmontre la 1re question conduit alors
aprs quelques calculs, certes la formule annonce.
n
1
x 4
Ax, x
A1 x, x
+
x 4 ,
4
n
1
(1.12)
Ax, x =
t P P x, x =
(P x), P x ;
A1 x, x =
1 (P x), P x.
)*
1
+
n
n
1
+2
.
(1.13)
Considrons pour cela le graphe (et ce qui est au-dessus, appel lpigraphe)
de la fonction : x > 0 1/x. (Il est suppos que n < 1 , sinon il ny a
rien dmontrer.)
Figure 2.
y, y =
i
i=1
i=1
des i (resp. des 1/i ).
Pour k = 1, 2, ..., n, soit Mk le point du graphe de de coordonnes k
et 1/k .
18
1
;
i=1
1
1
facile).
crire que lordonne de M est suprieure celle de M conduit
n
i=1
1
1
, soit
1 y, y
y, y 1.
i
i=1
do
n
i=1
i i
+) n
i=1
1
i
i
1
y(),
i
1 + n
y =
1 n
u (1 + n u)
atteint son maximum pour
1 n
1 + n 2 1
1 + n
, lexpression y est majore par
, soit
u=
2
2
1 n
encore
)*
* +2
n
1
1
n
1 1
+
+2 =
+
.
4 n
1
4
n
1
Comme la fonction u
19
ab
(A) := (a, b, c).
bc
3 rapport
Dans
R
10
1
,
00
0
un repre
(O;i, j, k), reprsenter
orthonorm
0
11
,
et (P2 (R)).
1
11
ab
c) Montrer que toutes les matrices non nulles A =
se trouvant
bc
sur la frontire de P2 (R) sont de forme xx , ox est un lment non
ab
se trouvant sur
nul de R2 . En dduire une description des A =
bc
cette frontire laide de conditions sur les coecients a, b, c de A.
Indication. Parmi les matrices de Pn (R), il y a celles de la forme A = xx , avec
x Rn \ {0}. Pour ces matrices A et un B Sn (R), on note que A, B
=
Bx, x.
n
i xi x
De plus, si S Sn (R), une dcomposition spectrale de S est S =
i ,
i=1
(A + (1 )B)x, x =
Ax, x + (1 )
Bx, x 0,
x Rn ,
Ak x, x 0 pour tout x Rn ,
induit par passage la limite sur k :
Ax, x 0 pour tout x Rn . Par
consquent A Pn (R). Et Pn (R) est bien ferm dans Sn (R).
Soit A Pn (R) et n > 0 la plus petite valeur propre de A. Rappelons cet gard lingalit suivante (que lon reverra dans lExercice 3.4) :
soit A Pn (R).
de A), on a
B, A
= B,
n
i=1
i xi x
i
=
i
Bxi , xi 0.
i=1
Do B [ Pn (R)] .
Ce rsultat [Pn (R)] = Pn (R) apparat ainsi comme la gnralisation
de la relation de polarit (Rn+ ) = Rn+ dans lespace euclidien standard
(Rn ,
, ).
3 ) a)
ab
A=
P2 (R) (a > 0 et ac b2 > 0) ;
bc
a 0, c 0
ab
.
A=
P2 (R)
et ac b2 0
bc
b)
P1 =
P2 =
P3 =
10
00
10
01
11
11
Figure 3.
Remarquons que le produit scalaire A, B
nest pas le produit scalaire usuel de (A) et (B) dans R3 ; en eet
ab
a b
,
= aa + 2bb + cc ,
b c
bc
22
tandis que
,
ab
a b
= aa + bb + cc .
,
b c
bc
c) Les matrices de la frontire de P2 (R) sont les matrices semi-dnies positives singulires ; mise part la matrice nulle, il sagit donc de matrices
de rang 1, i.e. du type
2
x1 x1 x2
x1
[x1 x2 ] =
x2
x1 x2 x22
o x = (x1 , x2 ) est un lment non nul de R2 .
En dnitive, la frontire de P2 (R) peut tre dcrite comme
/
.
a ac
, a 0 et c 0 .
ac c
Remarque : On aurait pu utiliser
ab
: A :=
S2 (R) (A) := (a, 2 b, c) R3
bc
qui a lavantage
de conserver
les produits scalaires usuels dans S2 (R) et R3 , ou
ab
mieux, : A =
(A) := 12 (2b, c a, c + a) qui permet de reprbc
3 dquation w
de
R
u2 + v 2 et les lments de
senter (P2 (R)) par le cne
2x1 x2
x1
1
[x1 x2 ] = 2 x22 x21 par la frontire de ce cne, dquation :
x2
x22 + x21
w2 = u2 + v 2 , w 0.
** Exercice I.11. Soit A Mn (R) symtrique et inversible, soit H un sousespace vectoriel de Rn . Montrer quune condition ncessaire et susante pour
que A soit dnie positive est :
(C) et
23
A(x + y), x + y =
Ax, x + 2
x, Ay +
Ay, y,
avec :
Ax, x 0 puisque x H,
x, Ay = 0 puisque x H et Ay H ,
et
Ay, y =
x , A1 x puisque x := Ay H .
En dnitive,
A(x + y), x + y 0.
24
Pn (R) est un cne convexe ferm de Sn (R), dont lintrieur est Pn (R)
i1 i2 . . . ik ;
1i1 <<ik n
2 1 1
A = 1 2 1 S3 (R).
1 1 2
Le calcul des mineurs principaux de A se dcompose en :
3 dterminants de matrices (1,1) (tous gaux 2 ici),
3 dterminants de matrices (2,2) (tous gaux 3 ici),
1 dterminant de matrice (3,3) (ici dt A = 0).
Donc A est semi-dnie positive.
0 0
Considrons prsent A =
S2 (R). Bien que dt A1 0 et
0 1
dtA2 0, la matrice A nest pas semi-dnie positive (elle est mme semidnie ngative).
* Proprits de la forme quadratique qA :
n
(A
Pn (R)) (qA est une fonction convexe sur R )
** Exercice I.13. Soit Pn (R) lensemble des A Sn (R) qui sont dnies positives
(cest un ouvert convexe de Sn (R)). Soit
f : Pn (R) R
A f (A) := ln(dt A1 ).
2 ) Montrer que
(t) (0) =
i=1
1/2
1/2
HX0
IX0 ,H := {t R | X0 + tH Pn (R)}
est galement ouvert et convexe : cest limage inverse de Pn (R) par lapplication ane (continue) t X0 + tH.
1/2
1/2
1/2
X0 + tH = X0
H
X0 + tX0
2 ) De :
1/2
1/2
1/2
1/2
HX0
In + tX0
X0 ,
= X0
on tire :
1/2
1/2
1/2 1
1/2
HX0
X0
,
In + tX0
(X0 + tH)1 = X0
do :
ln dt (X0 + tH)
ln(dt X01 )
1/2
1/2 1
+ ln dt In + tX0
HX0
.
3 )
est strictement convexe sur IX0 ,H car > 0 sur IX0 ,H . Par suite, la
fonction f dont toute trace sur une droite passant par X0 Pn (R)
et dirige par H Sn (R) est strictement convexe, est elle-mme strictement
convexe.
28
Commentaire :
La proprit dmontre dans lexercice se traduit par : si A et B sont (symtriques) dnies positives et direntes, et si ]0, 1[ alors
dt(A + (1 )B) > (dtA) (dtB)1 .
2 ) Soit g : Pn (R) R
A g(A) := ln(dt A).
Sachant que g est deux fois direntiable sur Pn (R), dterminer le plus
:
f (x)(
a, h)2 + 2
f (x), h
a, h + 2 f (x)h, h 0 pour tout x O,
tout a Rn et tout h Rn ;
soit encore
f (x)u2 + 2
f (x), h u + 2 f (x)h, h 0 pour tout x O, tout u R
et tout h Rn .
Le trinme du second degr mis en vidence ci-dessus est positif sur R si
et seulement si son discriminant est ngatif ; cela se traduit par
(
f (x), h)2 f (x) 2 f (x)h, h 0.
Lquivalence de (iii) et (ii) est claire prsent.
b) Si f1 et f2 sont logarithmiquement convexes, toutes les fonctions x
ea,x f1 (x) et x ea,x f2 (x) sont convexes (daprs [(i) (iii)] de la question prcdente) ; par suite, toutes les fonctions x ea,x (f1 + f2 )(x) sont
convexes, et donc f1 + f2 est logarithmiquement convexe (daprs [(iii) (i)]
de la question prcdente).
Qx, x =
Qx, x + 0 Ax 2 =
(Q + 0 A A)x, x > 0.
31
[(i) (ii)]. Supposons que (ii) ne soit pas ralise. Pour tout n N il existe
donc un vecteur xn = 0 tel que
Qxn , xn + n Axn 2 0,
soit encore, en posant un := xn / xn ,
Qun , un
+ Aun 2 0.
n
On peut alors extraire de {un } une sous-suite {unk }k convergeant, lorsque
k +, vers un vecteur u de norme 1. En passant la limite dans lingalit ()nk , on obtient Au = 0. Or, daprs (i),
Qu, u > 0, ce qui implique que
Qunk , unk > 0 pour k assez grand. Ceci contredit lingalit ()nk .
()n
Commentaire : Il est clair que si Q + 0 A A est dnie positive pour un certain 0 , il en est de mme de Q + A A ds que 0 .
** Exercice I.17. Soit A et B dans Sn (R), A tant de plus dnie positive. Montrer que :
le spectre de AB est entirement rel ;
la plus grande valeur propre de AB est gal supu = 0
Bu, u
;
A1 u, u
AB est diagonalisable.
Indication. Considrer C := A1/2 BA1/2 ou, ce qui revient au mme, la rduction
de la forme quadratique associe B dans lespace euclidien (Rn ,
, A ) avec
u, vA :=
Au, v.
De plus
A1/2 BA1/2 x, x
x, x
x = 0
Bu, u
en posant
.
= sup
1
u = A1/2 x
u = 0
A u, u
2 ) Dmontrer que (P) a une solution et une seule (que lon notera x par la
suite).
r
Bx 2 (lagrangien augment).
2
xRN
xRN
RM
n+
B(xn x) = 0 ;
lim
n+
lim
A(xn x), xn x = 0.
n+
xn = x.
Bx=0
inf
f (x).
Bx = 0
x r
Lexistence dun minimum x de f sur Ker B sensuit. Lunicit de ce minimum vient de la stricte convexit de f .
6
3 ) (S)
Bx = 0
RM tel que Ax b + B = 0.
Ax, x
b, x
Ax, x
b, x ?
2
2
La fonction f tant convexe, on sait que f (x) f (x) +
f (x), x x, soit ici
f (x) f (x) +
Ax b, x x.
Mais Ax b Im(B ) = (Ker B) et x x Ker B, donc
Ax b, x x = 0.
On suppose que x minimise f sur Ker B. Tout dabord, Bx = 0. Ensuite
f (x + td) f (x) pour tout t R et d Ker B,
1 2
2 t
Ad, d
+ t
Ax b, d 0 pour tout t R et d Ker B.
Ceci nest possible que si
Ax b, d = 0. Donc Ax b (Ker B) =
Im(B ).
i.e.
36
Ax, x =
b, x.
Do f (x) = 12
Ax, x = 12
b, x.
B 1 ) a) Soit (x0 , 0 ) RN RM . Par dnitions,
inf L(x, ) L(x0 , 0 ) sup L(x, ).
xRN
Do :
sup
RM
RM
+
)
inf L(x, ) inf
sup L(x, ) .
xRN
xRN
RM
RM
xRN
RM
Par suite :
inf L(x, )
sup
N
RM xR
$%
&
#
supremum atteint pour =
xRN
sup L(x, ) .
RM
)
=
inf
xRN
sup L(x, )
= L(x, ).
RM
$%
&
#
inmum atteint pour x =
2 ) a) L(x, ) = f (x) +
, Bx ; Lr (x, ) = L(x, ) + 2r
B Bx, x. Alors :
maximise Lr (x, ) sur RM si et seulement si Lr (x, ) = Bx = 0 ;
x minimise la fonction quadratique convexe Lr (, ) sur RN si et seulement si
x Lr (x, ) = Ax b + B + rB Bx = 0.
b) Pour r 0 donn, un point-selle de Lr est exactement un couple (x, ) de
RN RM vriant
Bx = 0 et (A + rB B)x + B = b,
37
soit encore
Bx = 0 et Ax + B = b.
En comparant ceci (S), on voit donc que la solution x de (P) est prcisment la premire composante de tout point-selle de L (ou de Lr , ceci pour
un r > 0, ou quelque soit r 0 ).
C 1 ) Puisque xn est, par construction, un minimum de Lr (, n ) sur RN , il
est caractris comme suit :
(A + rB B)xn + B n = b.
On a vu quil existe eectivement un point-selle (x, ) de Lr sur RN RM et
que ce point-selle est caractris par les relations :
Bx = 0 et (A + rB B)x + B = b.
Par suite :
(A + rB B)(xn x) + B (n ) = 0,
()
()
On tire de () :
n+1 2 = n 2 + 2 n
B(xn x), n + 2n B(xn x) 2 .
Il vient de (), en faisant le produit scalaire des deux membres avec xn x :
A(xn x), xn x
soit
()
n 2 r +
B(xn x) 2
1
pour
tout
u
tel
que
Bu
=
0
et
<
2
r
+
Or : 1 Au,u
n
1
.
Bu2
Donc lingalit () a bien lieu.
38
Comme
A(xn x), xn x 1 B(xn x) 2 (voir la formulation variationnelle de et se rappeler que > 0), le second membre de lingalit
prcdente est 0.
Or n 2 n+1 2 0 quand n + (puisque la suite
de rels positifs ( n 2 )n est dcroissante) ; donc
1
B(xn x) 2 0 quand n +.
Utilisons prsent lingalit stricte 1 < 2 r + 1 :
A(xn x), xn x
2
A(xn x), xn x + (2r n ) B(xn x) 2
= 2
A(xn x), xn x 2 B(xn x) 2
#
$%
&
lment 0
1
(2(r + ) n ) B(xn x) 2
+
#$%&
$%
&
#
>0
Par consquent :
lim
n+
2(r+ 1 )1 >0.
B(xn x) 2 = 0, et limn+
A(xn x), xn
x = 0.
Comme
A(xn x), xn x xn x 2 , avec > 0 plus petite valeur
propre de A, il sensuit lim xn x = 0.
n+
39
3 )
RM = ImB Ker B
Tout multiplicateur de Lagrange (i.e., toute seconde composante de point7 + s, o
7 est la projection de lorigine sur
selle de Lr ) se dcompose en =
le sous-espace ane des multiplicateurs de Lagrange, et s Ker(B ).
Dsignons par p2 le projecteur orthogonal de RM dimage Ker(B ) (et de
noyau ImB). Puisque n+1 = n + Bxn , on a : p2 (n+1 ) = p2 (n ) pour tout
n N, donc :
p2 (n ) = p2 (0 ) = 0,2 pour tout n.
On sait que
lim
n+
xn x = 0, et lgalit
A + rB B (xn x) + B (n ) = 0
vue au 1 ) de C, donne :
lim
n+
B (n ) = 0.
B (n ) = B (idRM p2 )(n ) ,
lim (idRM p2 )(n ) = 0, soit
n+
7
lim (idRM p2 )(n ) = .
n+
7 + 0,2 quand n +.
En rassemblant : n
40
II
MINIMISATION SANS CONTRAINTES.
CONDITIONS DE MINIMALIT
Rappels
f : Rn R (ou mme R {+}) est dite 0-coercive (resp. 1-coercive) sur
C Rn lorsque
f (x)
= +).
lim
f (x) = + (resp.
lim
x + x
x +
xC
xC
Si C est convexe et si f : C R est strictement convexe sur C, alors il
existe au plus un x C minimisant f sur C.
S est ferm ;
(ii)
(iii)
(iv)
lim
f (x) = +.
x +
xS
Montrer que f est borne infrieurement sur S et quil existe x S tel que
f (x) = inf xS f (x).
Indication. On montrera que toute suite minimisante pour f sur S est borne,
ou bien on commencera par traiter le cas o S est born et on ramnera le cas
gnral ce cas grce lhypothse de 0-coercivit de f sur S (hypothse (iv)).
Solution : On rappelle tout dabord les direntes caractrisations de f est
semi-continue infrieurement sur Rn :
En tout point x Rn , on a lim inf x x f (x ) f (x) (ingalit dans
R {+}) ;
R, {x Rn | f (x) } est ferm ;
epif := {(x, r) Rn R | f (x) r} est ferm.
Montrons que {xk } est borne. Si ce ntait pas le cas, il existerait une
sous-suite {xkl }l de {xk } telle que xkl + quand l +. Par la
0-coercivit de f sur S (hypothse (iv)), cela impliquerait
f=
lim f (xkl ) = +,
l+
Figure 4.
Solution : 1 ) Soit
M1 = A1 + t1v1 , t1 R
M2 = A2 + t2v2 , t2 R,
de sorte que
M1 M2 2 = A2 A1 + t1v1 t2v2 2 .
f (t1 , t2 ) := M1 M2 2 ,
(t1 , t2 ) R2 .
On a :
2t2
A2 A1 , v2 + A2 A1 2 .
f est une fonction quadratique de la variable t = (t1 , t2 ), convexe mme
car
v1 2
v1 , v2
f (t1 , t2 ) = 2
(P)
(t1 , t2 ) R2 .
2 ) Les solutions t1 , t2 de (P) sont les solutions de f t1 , t2 = 0, soit
encore
(S)
t1 v1 2 t2
v1 , v2 =
A2 A1 , v1
t2 v2 2 t1
v1 , v2 =
A2 A1 , v2 .
t1 t2 v1 2 =
A2 A1 , v1 .
)
+
A2 A1 , v1
M 2 = A2 +
+ t1 v1 .
v1 2
A2 A1 , v1
v1 est orthogonal v1 (et v2 ).
videmment M 1 M 2 = A1 A2 +
v1 2
2e cas : v1 et v2 sont linairement indpendants. Dans ce cas, 2 f (t1 , t2 )
2
2
2
est
dnie positive pour tout (t1, t2 ) R ( v1 > 0 et dt f (t1 , t2 ) =
4 v1 2 v2 2 (
v1 , v2 )2 > 0 ), et le problme (P) a une et une seule
solution t1 , t2 . Ce t1 , t2 est lunique solution de (S) :
A2 A1 , v1 v2 2 +
A2 A1 , v2
v1 , v2
,
v1 2 v2 2 (
v1 , v2 )2
A2 A1 , v2 v1 2
A2 A1 , v1
v1 , v2
t2 =
v1 2 v2 2 (
v1 , v2 )2
t1 =
45
Et on vrie que M 1 M 2 = A1 A2 + t2v2 t1v1 est orthogonal v1 et v2 :
la droite (M1 M2 ) est la perpendiculaire commune D1 et D2 .
La distance minimale entre deux points de D1 et D2 se dduit donc de
f t1 , t2 = M 1 M 2 2 .
Dans le cas particulier o n = 3,
8!
"8
8
8
8 A1 A2 , v1 , v2 8
,
M 1M 2 =
v1 v2
"
!
o A1 A2 , v1 , v2 dsigne le produit mixte de A1 A2 , v1 , v2 , et v1 v2 le produit
vectoriel de v1 et v2 .
g : x Rn g(x) := f (x) +
xu.
f (v) f (u) ;
(ii) v u ;
(iii) x Rn , f (v) f (x) +
xv .
(2.1)
x Rn , f (v) + v u f (x) + x u .
v u f (u),
(2.2)
v u f + ,
do v u .
Enn lingalit x u x v + v u , introduite dans (2.1),
conduit
f (v) f (x) + x v .
soit
f (x + d) f (x )
d ;
f (x d) f (x ) d ,
soit
f (x d) f (x )
d .
f (x ) , d d et
f (x ) , d d ,
soit encore |
f (x ) , d | d . Cette dernire ingalit tant vraie pour
tout d Rn , il sensuit f (x ) .
x = (x1 , . . . , xn ) R f (x) := (1 + xn )
n
n1
x2i + x2n .
i=1
Rn )
Solution : On a :
i f (x) = 2xi (1 + xn )3
n f (x) = 3(1 + xn )2
n1
pour tout i = 1, . . . , n 1 ;
x2i + 2xn .
i=1
Alors (1) = (t0 ) [ (0) , (t1 )] et, daprs le thorme des valeurs
intermdiaires, il existe t2 [0, t1 ] tel que (t2 ) = (1) (= f (x)) . Par consquent, t2 ]0, t1 ] S , et puisque t1 < t0 , ceci contredit la dnition de t0
comme borne infrieure de S .
Figure 5.
Remarque : Dans lassertion de droite de lnonc, on ne peut pas remplacer minimum local de f par point critique de f ; prendre lexemple de
f : x R f (x) = x3 .
*** Exercice II.6. On dsigne par Pn (R)lensemble des matrices dnies posi
X Pn (R).
1 ) Quelles proprits de f , utiles pour sa minimisation (direntiabilit,
convexit, coercivit) peut-on dgager ? En dduire que le problme (P) a une
et une seule solution.
2 ) (i) Vrier que la solution de (P) est la (seule) matrice X vriant
XAX = B.
(ii) Donner, partir de BA (ou de AB), une procdure permettant de
construire X.
(iii) En dduire la valeur optimale dans (P) .
49
Ainsi g (ou f ) agit comme ce quil est convenu dappeler une fonctionbarrire sur . Il en rsulte ainsi quil existe bien X minimisant f
sur (cf. Commentaire suivant lExercice II.1).
Lunicit de X est une consquence de la stricte convexit de la fonction X B, X 1
, qui se voit mieux via la stricte convexit
de Y In , Y 1
= tr(Y 1 ).
2 ) (i) La direntielle Df (X) de f en X est facile obtenir :
Df (X) : H Sn (R) A X 1 BX 1 , H
.
Le problme (essentiellement sans contraintes) (P) tant celui de la minimisation dune fonction convexe direntiable, X est solution de (P) si et
1
1
seulement si A X BX = 0, soit XAX = B.
(ii) tant le produit de deux matrices dnies positives, BA est diagonalisable et son spectre est constitu exclusivement de rels > 0 (cf. Exercice 1.17).
Si on diagonalise BA avec P ,
P 1 (BA)P = diag(1 , . . . , n ) (i valeurs propres de BA),
la matrice M := P diag( 1 , . . . , n )P 1 vrie M 2 = BA, et il vient immdiatement que X = M 1 B est la solution cherche.
(iii) La valeur optimale dans (P) est
f (X) = tr(AM 1 B + B(M 1 B)1 )
= 2 trM ;
cest donc la somme des racines carres des valeurs propres de BA (ou de AB).
La symtrie en A et B de la valeur optimale pouvait tre note ds le
dpart, en raison de la forme particulire de (P).
51
(2.3)
(2.4)
Ax, x +
b, x + c,
2
Adk , dk
dk 4
,
f (xk+1 ) f = [f (xk ) f ] 1
Adk , dk
A1 dk , dk
tk =
(2.5)
1
, appel conditionnement de A.
n
2(f (x0 ) f )
xk x
n
1/2
c2 (A) 1
c2 (A) + 1
(2.6)
k
.
(2.7)
n
1
+
x 4 .
x Rn ,
Ax, x
A1 x, x
4
n
1
Quels commentaires peut-on faire partir des ingalits (2.6) et (2.7) quant
la rapidit de convergence de la mthode de gradient pas optimal ?
Adk , dk
Ensuite :
dk+1 = (Axk+1 + b) = Axk b tk Adk = dk tk Adk ,
dk+1 , dk =
dk , dk tk
Adk , dk = 0.
En dveloppant f (xk+1 ) = f (xk + tk dk ) on obtient
f (xk+1 ) = f (xk )
54
1 dk 4
,
2
Adk , dk
soit encore
dk 4
f (xk+1 ) f = [f (xk ) f ] 1
2(f (xk ) f )
Adk , dk
(toujours sous lhypothse f (xk ) = 0, qui est quivalente f (xk ) f > 0).
Un simple calcul prsent montre que
A1 dk , dk =
A1 (Axk + b), Axk + b
1 1
1
= 2
Axk , xk +
b, xk +
A b, b
2
2
1 1
car
A b, b = c f .
= 2 f (xk ) f
2
Do lexpression (2.5).
3 ) De lingalit de Kantorovitch on dduit (toujours lorsque dk = 0) :
'*
* (2
1 /n
1
n
dk 4
4
+
=4
Adk , dk
A dk , dk
n
1
(1 /n + 1)2
Ainsi, daprs (2.5) :
c2 (A)
k N, f (xk+1 ) f [f (xk ) f ] 1 4
(c2 (A) + 1)2
c2 (A) 1 2
.
[f (xk ) f ]
c2 (A) + 1
Lorsque n = 2, les courbes de niveau de f sont alors des ellipses trs eles,
et on observe facilement la convergence lente en zigzags de (xk ) vers x.
Pour tre sr davoir
k
f (xk )f
f (x0 )f
, il faudrait
c (A)
2
ln
c2 (A)1
4
ln
2 ln
c2 (A)+1
1
(quand c2 (A) +).
*** Exercice II.9. Soit O un ouvert de Rn et f : O R quatre fois direntiable en x O. On suppose que x est un minimum local de f , ce qui implique :
f (x) = 0, 2 f (x) est semi-dnie positive.
On suppose galement que 2 f (x) nest pas nulle et on pose H := Ker 2 f (x).
1 ) Montrer que lon a ncessairement :
(a) 3 f (x)(u, u, u) = 0 pour tout u H ;
2
(b) 4 f (x)(u, u, u, u)
2 f (x)v, v 3 3 f (x)(u, u, v) 0 pour tout
(u, v) H H .
o x = (0, 0) est
2 ) On prend lexemple dune fonction
fde deux variables,
2f
0
0
avec =
(x) > 0.
un point critique de f et o 2 f (x) =
0
x22
Quelles formes prennent les conditions (a) et (b) dans ce cas ?
Application. Soit f : R2 R
(x1 , x2 ) f (x1 , x2 ) := 3x41 4x21 x2 + x22 .
Au vu de ce qui a t tabli, dcider si x = (0, 0) est un minimum local de f ou
non.
Commentaire : Le cas o f (x) = 0 et 2 f (x) est semi-dnie positive est
ce quon peut appeler cas dincertitude , car les conditions de minimalit du
second ordre ne permettent pas de dcider. Les conditions (a) et (b) considres
ici sont des conditions ncessaires de minimalit dordre trois et quatre. Comme
bien entendu, on sattend des conditions susantes de minimalit locale en
remplaant lingalit au sens large de (b) par une ingalit stricte (pour tous les
vecteurs non nuls u et v).
56
t3 3
6 f (x)(u, u, u)
12
2 f (x)v, v + 123 f (x)(u, u, v) + 4 f (x)(u, u, u, u) + t4 (t),
(2.8)
o (t) 0 quand t 0.
Puisque f (x + tu + t2 v) f (x) pour t susamment petit, il vient du
dveloppement ci-dessus
t4
24
t3
f (x + tu + t2 v) f (x) / 3 f (x)(u, u, u) 0.
6 0
(2.9)
2f
4f
(x)
(x) 3
x22
x41
2
3f
(x) 0.
x21 x2
1
+
2 f (xk ) (x xk ) , x xk .
2
x1k resp. x2k est ainsi lapproximation de f fournie par linformation du
premier ordre (resp. du deuxime ordre) au point xk .
Montrer que pour tout x O :
8
8
8
8
8f (x) 1 (x)8 L x xk 2 , 8f (x) 2 (x)8 L x xk 3 .
xk
xk
2
6
dirences nies
centres
+
,
.
f (xk ) :=
2hj
1i,jn
Cette approximation est obtenue par dirences nies centres partir du
2 f (xk ) est une approximation de 2 f (xk ) .
gradient de f , le terme (i, j) de
ij
Montrer quil existe une et une seule matrice symtrique la plus proche de
2 f (xk ) au sens de la distance associe ||| |||, et dterminer cette matrice en
2 f (xk ) .
fonction de
0
f (xk + t (x xk )) , x xk dt,
(2.10)
f (x) = f (xk ) +
f (xk ) , x xk +
(2.11)
(1 t) 2 f (xk + t (x xk )) (x xk ) , x xk dt.
x1k
(x) =
0
1
0
Lt x xk 2 dt =
L
x xk 2 .
2
59
8
8
1
L 3
L
8
8
2 hj = h2j .
8 f (xk ) j j f (xk )8
2hj
6
6
A S, S =
tement de donnes exprimentales. Dune manire habituelle les choses se prsentent comme suit : on dispose de m donnes d1 , d2 , . . . , dm correspondant aux
valeurs t1 , t2 , . . . , tm dune variable t ; lobjectif est daccorder au mieux aux
donnes (t1 , d1 ), (t2 , d2 ), . . . , (tm , dm ), une fonction-modle t (t, x) qui
contient des paramtres ajustables x1 , x2 , . . . , xn .
En gnral la forme de la fonction-modle dpend du contexte dorigine des
donnes. On appelle rsidus les dirences entre la valeur de la fonction-modle
(ti , x) et la valeur di correspondant ti , cest--dire ri (x) = (ti , x) di (i =
1, . . . , m). Le critre mesurant lcart (dans Rm ) entre ((t1 , x), . . . , (tm , x))
et (r1 , . . . , rm ) fait lobjet dun choix : cest souvent le carr de la distance
euclidienne,
m
m
[(ti , x) di ]2 =
[ri (x)]2 .
x f (x) =
i=1
i=1
ti
0,2
0,4
0,6
0,8
0,9
0,95
di
0,7123
1,754
4.852
22,27
94,91
388,2
t (t, x) := x3 tx1
1
,
(1 t)x2
2
6
x3 tx1
d
.
i
(1 t)x2
i=1
Questions :
Mettre en uvre votre mthode de minimisation favorite pour obtenir un
jeu de paramtres (x1 , x2 , x3 ) acceptable (point de dpart suggr : (1,1,1)).
Dterminer la valeur f (x) de la somme des carrs des rsidus.
Tracer sur un mme graphique la fonction t (t, x) et les donnes
(ti , di ), i = 1, . . . , 6.
Solution : x1 = 0, 5532 ;
x2 = 1, 9897 ;
x3 = 1, 0298 ;
f (x) = 0, 0205.
62
III
MINIMISATION AVEC CONTRAINTES.
CONDITIONS DE MINIMALIT
Rappels
III.1. Conditions de minimalit du premier ordre
Soit f : O Rn IR direntiable sur un ouvert O de Rn , soit S un
ensemble-contrainte dcrit par m galits et p ingalits
S := {x Rn | h1 (x) = 0, . . . , hm (x) = 0, g1 (x) 0, . . . , gp (x) 0}
o les m + p fonctions hi , gj : Rn R sont supposes continment direntiables sur Rn .
m
i hi (x) +
i=1
p
j=1
j gj (x) = 0 ;
j=1
Theor`eme. Dans la situation dcrite par (C) ci-dessus, les conditions de KKT
sont susantes pour que x soit un minimum de f sur O S.
Dans le contexte dcrit par (C), il y a une condition dnonc simple assurant
(QC)x en tout point de S ; cest la condition dite de Slater que voici : en notant
64
hi : x hi (x) =
ai , x bi les fonctions-contraintes du type galit, et Ax = b
la conjonction des m contraintes du type galit hi (x) = 0, i = 1, . . . , m,
65
s, c x 0 pour tout c S.
Lensemble des directions normales S en x est appel cne normal S en x, et
not N (S, x). Lorsque S est un convexe ferm, N (S, x) nest autre que le cne
polaire de T (S, x) :
N (S, x) = [T (S, x)]
x x, c x 0 pour tout c S.
m
i=1
66
i hi (x) .
(ii) 2xx L x, d, d 0 pour toute direction d dans le sous-espace tangent
T (S, x) = {d Rn |
hi (x) , d = 0 pour tout i = 1, . . . , m}.
Theor`eme. Soit x O S. Supposons les h1 (x), . . . , hm (x) linairement indpendants, et supposons quil existe Rm tel que :
(i) x L x, = 0
et
(ii) 2xx L x, d, d > 0 pour toute direction non nulle d dans le sous-espace
tangent T (S, x) = {d Rn |
hi (x) , d = 0 pour tout i = 1, . . . , m} .
Alors x est un minimum local strict de f sur S.
Rfrences. Chapitre III de [11].
s, v r = r
(daccord ?)
r R tel que v r v + r s = 0.
(3.1)
v r v, s + r s 2 = 0
do, avec la 1re relation de (3.1) , r = s,vr
s2 .
Par suite
s, v r
vr = v
s.
s 2
v v r est dirig par s, ce qui est... normal.
La distance de v Hr vaut donc |s,vr|
s .
2
est drivable
2 ) La fonction r R d(r) := 12 v r v 2 = 12 (s,vr)
s2
sur R et
s, v r
= r .
d (r) =
s 2
Ainsi, la sensibilit au 1er ordre de la valeur minimale d(r) aux variations de r (second membre dans lquation de Hr ) est donne, au signe prs,
par le multiplicateur de Lagrange associ la contrainte dans (Pr ).
68
k
:
pni i .
i=1
;+
pi = 1
i=1
Figure 6.
Comme f est nulle sur la frontire relative de k , les p se trouvent ncessairement dans lintrieur relatif de k , i.e. pi > 0 pour tout i = 1, . . . , k
( relatif signie dans le sous-espace ane engendr par k , savoir lhyperk
pi = 1).
plan ane dquation
i=1
i=1
k
i=1
ni
pour tout i = 1, . . . , k.
N
(3.2)
x=1
x1
On demande des dmonstrations bases sur des techniques et rsultats dOptimisation, sans recourir des rsultats dAlgbre bilinaire (comme une dcomposition spectrale de A).
Solution : Soient f : x Rn f (x) :=
Ax, x et S := {x Rn |
x = 1}. Il est clair que S peut tre reprsent comme une contrainte du
type galit, h(x) = 0, avec h(x) := x 2 1.
La fonction-objectif f tant continue et S compact, il existe bien x S
tel que f (x) = maxxS f (x). Comme h est continment direntiable et
h (x) = 2x = 0, il existe R (unique) tel que f (x) = h (x), soit
70
Ax, x = max
Ax, x = .
x=1
Posons := maxx1
Ax, x . Il va de soi que 1 et 0.
Si = 1 , on a 1 0 videmment. Montrons la rciproque, savoir :
(1 0) (
Ax, x 1 pour tout x tel que x 1).
Si x = 0, lingalit voulue est bien vrie ; si x = 0, x 1, on note
que
,
x
x
,
1.
Ax, x = x A
x x
2
Posons := min
Ax, x . Il est clair que n et 0.
x1
* Exercice III.5. Soit A Sn (R) . quelle condition les deux problmes suivants sont-il quivalents
6
6
Min
Ax, x
Min
Ax, x
(P)
P
x=1
x1
(au sens o les valeurs optimales et les solutions sont les mmes dans (P)
?
et (P))
71
sont les mmes si, et seuleSolution : Les valeurs optimales dans (P) et (P)
ment si, la plus petite valeur propre n de A est 0 (voir exercice prcdent).
Mais on demande plus ici : on veut que les solutions soient les mmes dans (P)
ne soit
ou, ce qui revient au mme, on veut quaucune solution x de (P)
et (P)
n
intrieure la boule unit (euclidienne) de R ( x < 1). Or une solution x
est intrieure la boule unit (euclidienne) de Rn si, et seulement si,
de (P)
A est semi-dnie positive (daccord ?).
sont quivalents si, et seulement si, n < 0.
Donc, (P) et (P)
.
Min f (x) :=
x = 1.
1
2
Ax, x +
b, x
Ap x, x +
b, x .
2
Min fp (x)
x 1.
Montrer que
1
inf {fp (x) : x 1} = inf {f (x) : x = 1} + p
2
et que les solutions de (P) et Pp sont les mmes.
72
Solution :
De plus
1 )
x = 1, f (x) = f ( x = 1 et Ax = n x) .
Les solutions de (P) sont, dans ce cas, les vecteurs propres unitaires associs
n .
2 ) (a) On a 2 fp (x) = Ap pour tout x Rn , et par choix de p
Ap x, x =
Ax, x + p x 2 (1 + p) x 2
< 0 si x = 0.
Donc fp est une fonction strictement concave (et mme fortement concave
sur Rn ).
(b) Notons que inf {fp (x) : x 1} est ncessairement atteint en
des points x tels que x = 1. En eet, si cette borne
infrieure tait atteinte
en un point x intrieur lensemble-contrainte de Pp on aurait : fp (x) = 0
et 2 fp (x) semi-dnie positive, ce qui est exclu.
Il sensuit
inf {fp (x) : x 1} = inf {fp (x) : x = 1}
p
= inf {f (x) : x = 1} +
2
p
(puisque fp (x) = f (x) + lorsque x = 1).
2
Dune manire claire :
x est solution de Pp fp (x) = inf {fp (x) : x 1} et x = 1 ;
fp (x) = inf {fp (x) : x = 1} et x = 1 ;
p
p
f (x) + = inf {f (x) : x = 1} + et x = 1 ;
2
2
x est solution de (P) .
Les solutions de (P) et Pp sont bien les mmes.
Remarque : Lensemble-contrainte dans Pp est un convexe compact simple
(la boule unit ferme pour la norme euclidienne) et la fonction minimiser est
strictement concave. Ce nest pas pour autant un problme simple, et la stricte
73
74
** Exercice III.8. tant donn a1 , . . . , an des rels dirents de zro, on considre lellipsode plein (ou convexe compact elliptique) de Rn dni comme suit :
;
6
n
ui 2
n
1 .
E := u = (u1 , . . . , un ) R |
ai
i=1
Soient x
/ E x et x sa projection sur E. Montrer que
xi =
a2i xi
pour tout i = 1, . . . , n,
a2i +
n
i=1
a2i x2i
= 1.
(a2i + )2
Minimiser f (u) := x u 2
n
(P)
ui 2
1.
sous la contrainte
ai
i=1
n 2
xi
i=1
ai
1 (daccord ?). La condition de minimalit caractrisant x est : il existe un multiplicateur 0 tel que
xi xi +
xi
= 0 pour tout i = 1, . . . , n.
a2i
a2 x
i=1
La fonction d () :=
n
i=1
a2i x2i
(a2i +)2
n
i=1
x2i
a2i
> 1 (car x
/ E)
soit en minimisant d
f (xk ) , d + 12 2 f (xk ) d, d sur Rn
soit
d
f (xk ) , d sous la contrainte
2en minimisant
f (xk ) d, d 1.
Montrer que les directions obtenues comme solutions de ces deux problmes
de minimisation sont les mmes une constante positive multiplicative prs.
Solution : Le premier problme (sans contraintes) est celui de la minimisation
dune fonction quadratique strictement convexe sur Rn : sa solution est celle
de lquation
1
f (xk ) .
f (xk ) + 2 f (xk ) d = 0, soit d = 2 f (xk )
Dans le deuxime problme (avec contrainte) il sagit de minimiser une
forme
non
nulle sur le convexe compact (elliptique) dcrit par linga linaire
2
lit f (xk ) d, d 1.
sur
La solution d est donc ncessairement
la frontire de lensemble
contrainte (frontire dquation 2 f (xk ) d, d = 1) et elle est caractrise
par lexistence de 0 (le multiplicateur) tel que
f (xk ) + 22 f (xk ) d = 0.
2
1
f (xk )
f (xk )
.
0 (car f (xk ) =
0), il sensuit d =
Comme =
2
n :=
x = (x1 , . . . , xn )
Rn
| xi 0 pour tout i et
n
i=1
76
;
xi = 1 .
Solution :
jJ(x)
o J (x) dsigne {j |
aj , x = bj } .
Dans le cas prsent, si lon pose a0 = (1, . . . , 1) , a1 = (1, 0, . . . , 0) , . . . ,
an = (0, . . . , 0, 1) , n est reprsent comme conjonction de n + 2 ingalits
anes
a0 , x 1,
a0 , x 1,
a1 , x 0, . . . ,
an , x 0.
Les deux premires contraintes-ingalits sont toujours actives en x n ,
et certaines parmi les n autres peuvent ltre (de aucune presque toutes
(n 1)). En consquence :
6
Tn (x) =
d = (d1 , . . . , dn ) R |
n
di 0,
i=1
6
Nn (x) = Ra0
di 0,
i=1
i (0, . . . , 1, 0, . . . , 0) | i 0 si xi = 0
i=1
;
et i = 0 si xi > 0 .
78
x + tk dk S c pour tout k.
(1 k ) tk
tk k
dk +
dk .
k := k tk + (1 k ) tk , k :=
k
k
Alors : {k } R+
converge vers 0 ;
{k } converge vers d (car chaque k est une combinaison convexe de dk et
dk , do k d max( dk d , dk d )) ; x + k k frS pour tout k.
Donc, d T (frS, x).
79
(3.3)
(3.4)
Rciproquement, soit p [T (S, x)] et supposons que (3.3) nait pas lieu.
Il existe donc > 0, une suite {xk } S convergeant vers x, tels que
(3.5)
p, d > 0
ce qui entre en contradiction avec le fait que p [T (S, x)] .
2 ) Supposons quil existe {xk } S, xk = x, xk x telle que f (xk )
f (x) pour tout k. Posons dk := xxkk x
x , de sorte que xk = x + xk x dk .
Quitte prendre une sous-suite, on peut supposer que dk d quand k +.
videmment d = 1 et d T (S, x) . Posant tk := xk x
0
f (x + tk dk ) f (x)
f (xk ) f (x)
=
f (x, d) > 0.
tk
tk
k +
Do contradiction.
Si f tait direntiable en x, f (x, d) =
f (x), d pour tout d Rn , et
la condition (3.4) deviendrait alors :
En rsum :
Si f nest pas direntiable en le point x considr, on peut esprer avoir
une condition susante de minimalit du 1er ordre pour f (base sur f (x, )).
En minimisation sans contraintes, une condition ncessaire de minimalit
du 1er ordre comme f (x) = 0 ne donne une information (du type dtre un
minimum local) que sur la fonction perturbe f + x .
82
Solution : Lapplication M
A, M
est une forme linaire sur Mn (R),
donc continue (pourquoi ?). La sphre-unit S tant compacte, il existe bien
M S telle que
N (A) = A, M
= sup { A, M
: M S} .
Si M S, il en est de mme de M , do N (A) R+ .
Les proprits suivantes sont immdiates :
N (0) = 0 ;
A Mn (R) , R, N (A) = || N (A) ;
A1 Mn (R) , A2 Mn (R) , N (A1 + A2 ) N (A1 ) + N (A2 ) .
Comme A, M
N (A) N (M ) pour tout (A, M ) Mn (R)
Mn (R) ,
(N (A) = 0) ( A, M
0 pour tout M Mn (R)) , soit A = 0.
N est bien une norme sur Mn (R) .
Il est clair que N (A) est galement le maximum de A,
sur B. En
fait N est ce quon appelle la fonction dappui de B (ou de S) ; cest la norme
duale de N . Mais attention, N nest pas ( ,
)1/2 !
1 ) Si 0 = M Mn (R) , M/N (M ) S de sorte que
1
M
=
f (M ) max f (S).
f
SS
N (M )
[N (M )]n
Ainsi, dans tous les cas, f (M ) [N (M )]n maxSS f (S).
En particulier, f (M ) maxSS f (S) pour tout M
maxM B f (M ) est gal maxSS f (S).
B, do
En X inversible, X 1 = 1 (cof X) , do f (X) = dtX X 1 .
dt X
La condition ncessaire de maximalit voque plus haut devient :
1
, M X
0 pour tout M B (car dt X > 0)
X
soit
1
1
1
,M
X
, X
= tr X X = n pour tout M B.
X
1
n.
Par suite, N X
Figure 8.
84
En une solution x de ce problme, on crit la condition ncessaire doptimalit du 1er ordre, savoir : f (x) [T (S, x)] .
Comme f (x) = (x x), le rsultat annonc est dmontr.
Remarque : Si g est la fonction 12 d2S , on peut montrer que g admet en tout x
/S
une drive directionnelle (tangentielle) qui est
d g (x, d) = min {
x x, d | x PS (x)} .
On en dduit que g est direntiable en x si et seulement si PS (x) est rduit
un seul lment.
i hi (x) +
i=1
j gj (x) .
j=1
p
Soit , un lment quelconque de Rm (R+ ) et soit x, un point de
Rn minimisant L , , sur Rn .
Vrier que x, est solution du problme doptimisation (P ) suivant :
6
(P )
o
5
4
I := i : i = 0 et i := hi x, pour i I,
5
4
J := j : j > 0 et j := gj x, pour j J.
85
f (x) +
jJ
i hi (x) +
iI
(3.6)
jJ
Solution : 1 ) Lapplication linaire A : Rn Rm tant surjective, lensemblecontrainte de (Pb ) est un convexe ferm non vide de Rn , et ce quel que soit
b Rm (cest en fait un sous-espace ane de Rn dont la direction est le
sous-espace vectoriel KerA).
La fonction f est convexe (fortement convexe mme) sur Rn et
lim f (x) = +.
x+
86
Ax = b ;
Il existe Rm tel que f (x) + A = 0
soit Qx + c + A = 0.
Comme Q est inversible, ceci est quivalent :
Ax = b et x + Q1 c + Q1 A = 0
ou encore
Ax = b et AQ1 A + AQ1 c + b = 0.
(3.7)
@ ?
@
?
AQ1 A y, y = Q1 A y , A y = 0
m
h
(x)+
f
(x)
+
i
i
i=1
p
j+ gj (x)
j=1
h (x)
1
h2 (x)
F (x, c) := ..
Rn Rm Rp
hm (x)
g (x) +
1
1
g2 (x) + 2
..
gp (x) + p
o j+ := max (0, j ) et j := min (0, j ).
1 ) F est-elle continue ? direntiable ? Donner des conditions susantes
portant sur les donnes du problme de minimisation pour que F soit localement
lipschitzienne.
2 ) Montrer que x vrie les conditions de KKT si, et seulement si, il existe
c = (1 , . . . , m , 1 , . . . , p ) tel que F (x, c) = 0.
Solution : 1 ) F est continue, mais nest pas direntiable ( cause des fonctions j j+ et j j qui ne sont pas direntiables en 0).
Les fonctions f, hi , gj tant de classe C 1 , elles sont localement lipschitziennes (comme fonctions de x, donc de (x, c)) ; par ailleurs les fonctions
j j+ et j j sont lipschitziennes. Par consquent, F sera localement lipschtzienne sur Rn Rm Rp ds lors que les f, hi , et gj sont
localement lipschitziennes sur Rn .
2 ) Rappelons que x vrie les conditions
de mKKT psi hi (x) = 0 pour tout
i, gj (x) 0 pour tout j, et sil existe , R R tel que :
p
m
i hi (x) +
j gj (x) = 0
(i) f (x) +
i=1
j=1
Alors F (x, c) = 0.
Rciproquement, soit (x, c), avec c = (, ), tel que F (x, c) = 0. On a tout
dabord :
hi (x) = 0 pour tout i = 1, . . . , m
j = j pour tout j = 1, . . . , p.
Alors , vrie les conditions dans (i) , (ii) , (iii) nonces plus haut.
Montrer que
a, x < 0 ncessairement et donc que le multiplicateur 2
associ cette contrainte est nul.
1
En distinguant selon que la contrainte x
est active ou pas en x,
2
dterminer x et le multiplicateur 1 associ cette contrainte (on sera amen
discuter sur les valeurs prises par a ).
Solution : 1 ) Il y a au moins deux faons de montrer que fa est strictement
convexe sur louvert convexe .
(i) La fonction x (x) := 1 x 2 est strictement concave sur ; la
fonction y (y) := ln y est strictement dcroissante et convexe sur R+
.
2
Par suite, la fonction : x ln(1 x ) est strictement convexe sur
; en eet :
]0, 1[, x, x , x = x ,
x + (1 ) x > (x) + (1 ) x ;
do
!
"
( ) x + (1 ) x (x) + (1 ) x
( ) (x) + (1 ) ( ) x .
2 fa (x) =
4
(1 x
xx
2 )2
2
In .
1 x 2
Ainsi :
x, d2 +
d Rn , 2 fa (x) d, d = (1x
2 )2
2
fa (x) d, d > 0 si d = 0.
2
1x2
d 2 0 ;
1 = 0 si g1 (x) < 0.
90
(3.8)
(3.9)
Supposons g2 (x) =
a, x = 0. En faisant le produit scalaire avec a
dans (3.8), on obtient (1 + 2 ) a 2 = 0, ce qui oblige avoir a = 0.
Donc g2 (x) < 0 et 2 = 0. Les conditions (3.8) et (3.9) simplies deviennent :
2x
+ a + 21 x = 0,
1 x 2
1
1 = 0 si x <
2
(3.10)
(3.11)
1
, et (3.10) pour un certain 1 0.
2
Aprs quelques calculs, on constate que ceci na lieu que pour
4
a , auquel cas :
3
4
a
1 = a et x =
3
2a
En rsum :
a
4
21 ,
1+
a
Si 0 < a < , la solution de (Pa ) est x =
3
a 2
lintrieur de Ca ;
4
a
, sur la frontire de Ca .
Si a , la solution de (Pa ) est x = 2a
3
2e possibilit pour x : x =
3 1 + 2 1 = 0, (1 + ) 2 = 0, = 0 si 1 + 2 9 < 0.
Il en ressort deux possibilits :
1 , 2 = (0, 0) avec = 0,
9
1 , 2 = (3, 0) avec =
2
92
12
2
22
2
(ii) Examinons successivement tous les cas de gure : x est sur lune des
artes (1), (2), (3), puis x est lun des sommets (1 2), (2 3), (1 3).
2
(1-2)
(1)
(2)
C
(2-3)
(3)
(1-3)
1
(1) : T (C, x) = {(d1 , d2 ) | d1 + d2 0} , [T (C, x)] = N (C, x) = R
.
1
+ 1
.
(2) : T (C, x) = {(d1 , d2 ) | d1 0} , N (C, x) = R
0
0
.
(3) : T (C, x) = {(d1 , d2 ) | d2 0} , N (C, x) = R+
1
(1 2) : T (C, x) = {(d1 , d2 ) | d1 + d2 0 et d1 0} ,
.
/
1
1
+ 2
| 1 0, 2 0 .
N (C, x) = 1
1
0
(1 3) : T (C, x) = {(d1 , d2 ) | d1 + d2 0 et d2 0} ,
.
/
1
0
+ 2
| 1 0, 2 0 .
N (C, x) = 1
1
1
(2 3) : T (C, x) = {(d1 , d2 ) | d1 0 et d2 0} ,
.
/
1
0
+ 2
| 1 0, 2 0 .
N (C, x) = 1
0
1
La condition ncessaire du 1er ordre que doit satisfaire un minimum (mme
local) de f sur C est : f (x) N (C, x). Or un seul
vrie cette condi point
1 2
,
.
tion : il se trouve sur larte (1) de C et cest x =
3 3
Par consquent, x = 13 , 23 est le seul point de C minimisant f sur C. La
valeur minimale de f sur C est f (x) = 11
6 .
94
5
4
(3.12)
E := x Rn | A1 x, x 1 ,
o A Sn (R) est dnie positive.
1 ) Montrer que E dcrit en (3.12) est aussi {Bu | u 1}, avec B :=
A1/2 . En dduire que le volume de E est proportionnel dt A.
2 ) On considre le problme qui consiste chercher l (ou les) ellipsode(s)
E contenu(s) dans P de volume maximal.
a) Montrer que linclusion E P est traduite par les contraintes de type
ingalit
Minimiser ln(dt A1 )
(P) A Pn (R)
Aa , a 1 pour tout i = 1, . . . , m
i
d) Montrer que la solution A de (P) est caractrise par les conditions suivantes :
A Pn (R) ;
Aa
,
a
1 pour tout i = 1, . . . , m ;
i
i
1
A
=
i ai a
i=1
i = n.
i=1
E P n E.
1
A x, x 1 quivaut A1/2 x 1. Grce au changement de variable
u := A1/2 x, on voit que
A1/2 x 1 (x = Bu, u 1) .
E est ainsi limage par B de la boule-unit ferme de Rn .
Le volume de E est donc
n
+1 ,
dt B n/2 /
2
n
n/2
/ 2 + 1 tant le volume de la boule-unit ferme de Rn . Comme
sup |
Bai , u | = Bai 1.
u1
dt A, ou encore
Minimiser f (A)
(P)
A Pn (R)
1
ln(dt A ) = ln(dt A) + lorsque A Pn (R) A0 fr Pn (R) .
(la fonction A ln(dt A) joue le rle de fonction-barrire ou de
+
i ai a
A
i = 0,
i=1
i Aai , ai 1 = 0 pour tout i = 1, . . . , m.
m
i=1
1
1/2
la relation A
=
e) En pr-multipliant et en post-multipliant par A
i ai a
i , il vient :
In =
1/2
1/2
i A
ai a
,
i A
i=1
i Aai , ai
i=1
i=1
puisque
ai , x2 1
m
@
?
1
m
A
x, x =
i
ai , x2 n
.
=
n
pour
tout
i
=
1,
...,
m
et
i
i=1
i=1
98
Commentaire :
m
m
1
1
La relation A
=
i ai a
i = n, indique que A
/n est
i , allie
i=1
i=1
(3.13)
99
Solution : 1 ) Linclusion E {x Rn |
ai , x bi } se traduit par
ai , c + sup
ai , Bu bi
u1
ai , c + Bai bi .
Soit gi : Rn Sn (R) R la fonction qui (c, B) Rn Sn (R) associe gi (c, B) :=
ai , c + Bai bi . Il est immdiat que gi est convexe
(daccord ?). Donc linclusion E P quivaut au jeu dingalits convexes
gi (c, B) 0 pour tout i = 1, . . . , m.
est convexe (strictement convexe mme) sur Pn (R) (cf. Exercice I.13 par
exemple).
Le volume de lellipsode dcrit comme en (3.13) est dt B, une constante
multiplicative prs (xe, indpendante de B ; cest le volume de la boule-unit
ferme de Rn ). Maximiser dt B quivaut maximiser ln(dt B), ou encore
minimiser ln(dt B).
Le problme de la recherche dun ellipsode E (dcrit comme en (3.13))
contenu dans P de volume maximal se formalise donc en le problme de minimisation convexe suivant (pos dans Rn Sn (R)) :
B Pn (R),
100
Minimiser
1
X B 2 parmi les X Sn (R) vriant Xs = y,
2
Xs = y ;
(L)
u Rn tel que X B = us + su
2
c) Vrier que X := B +
ss est la
s 2
s 4
solution de (P).
yy .
y, s
(
y, s)2
B 1 yy B 1
ss
y, s
B 1 y, y
y, s
sy + ys
fait laaire.
Si
y, s = 0, X :=
s 2
b) l (u) est la seule matrice symtrique vriant
l (u)
Xs = y et X B Im l .
c) l tant injective (puisque l est surjective), il ny a quun u Rn rpondant la question. On vrie que
u := 2
y Bs
y Bs, s
s
s 2
s 4
Q
Minimiser
1
X B 2 parmi les X Sn (R) vriant X s = y .
2
W (y Bs), W 1 s
W 1 ss W 1 ;
W 1 s 4
X = W BW +
W (y Bs), W 1 s
W 2 ss W 2 .
W 1 s 4
X = B +
W 2 s = y, W 1 s 2 = W 1 s, W 1 s = W y, W 1 s =
y, s ,
W (y Bs), W 1 s =
y Bs, s .
Do lexpression annonce de X .
B 1 yy B 1
ss
et posons A := B 1 ,
y, s
B 1 y, y
1
1
et := 1
; nous avons donc inverser
u := s, v := B 1 y, :=
y, s
B y, y
b) Partons de Y := B 1 +
103
1
rappelons que
Bs, s
,
1 + A u, u = 1 +
y, s
y, s = W 1 s 2 > 0
1 + A1 v, v = 0,
2
s, y
1 + A1 v, v A1 u, v
=
d := 1 + A1 u, u
B 1 y, y
Par suite
14
(1 + A1 u, u A1 vv A1
d
A1 u, v A1 vu A1 + A1 uv A1
(Y )1 = A1
=B
ys B + Bsy
Bs + y, s
+
yy ,
y, s
(
s, y)2
(
s, x)2 ( B 1 y, x )2
Y x, x = B x, x +
s, y
B 1 y, y
En posant := B 1/2 x et := B 1/2 y, la formulation ci-dessus devient
Y x, x =
2 2 (
, )2 (
s, x)2
+
2
s, y
104
ncesXs, s )
sairement dnie positive, pour cela il faudrait quau
moins
y,
s
(=
1
W (X B)W 2 parmi les X Sn (R) vriant Xy = s.
2
ss .
s, y
(
s, y)2
B 1 ss B 1
yy
y, s
B 1 s, s
Les expressions de X et X sont la base des formules de mise jour de la mthode DFP (pour Davidon-Fletcher-Powell) et BFGS (pour Broyden-FletcherGoldfarb-Shanno).
105
pour tout i = 1, . . . , n 1.
n1
i (ei ei+1 ) = 0,
i=1
x1 u1 + 1 = 0
x2 u2 + 2 1 = 0
..
x ui + i i1 = 0
i
..
.
xn1 un1 + n1 n2 = 0
xn un n1 = 0 ;
1 0, . . . , n1 0 et
(x x ) = 0 pour i = 1, . . . , n 1.
i
106
i+1
(3.14)
i
i
uj
xj (xi xi+1 ) = 0 pour tout i = 1, . . . , n 1
j=1
j=1
(un xn ) (xn1 xn ) = 0.
Rciproquement, (x1 , . . . , xn ) vriant les conditions ci-dessus vrie les
i
i
uj
xj pour tout i = 1, . . . , n 1.
conditions (3.14) o on a pos i =
j=1
j=1
En dnitive nous avons la caractrisation suivante, exempte de toute rfrence des multiplicateurs i :
x = (x1 , . . . , xn ) est solution du problme pos si, et seulement si,
x1 x2 . . . xn
x
uj pour tout i = 1, . . . , n 1
j=1
j=1
n
n
xj =
uj
j=1
j=1
i
i
uj
xj (xi xi+1 ) = 0 pour tout i = 1, . . . , n 1
j=1
j=1
(un xn ) (xn1 xn ) = 0.
3 ) Dans lexemple propos, on cherche x1 x2 x3 x4 tels que
x1 2, x1 + x2 3, x1 + x2 + x3 8, x1 + x2 + x3 + x4 = 12,
(2 x1 ) (x1 x2 ) = 0, (3 x1 x2 ) (x2 x3 ) = 0,
(8 x1 x2 x3 ) (x3 x4 ) = 0, (4 x4 ) (x3 x4 ) = 0.
107
Solution : 1 ) La fonctionh de la
contrainte du type galit est continment
1
= (0, 0) . Si x = (0, 0) est un minimum
direntiable et h(x) =
22
local (ou un maximum local) de f sous la contrainte h(x) = 0, il existe R
tel que f (x) + h(x) = 0. Cest bien le cas ici avec = 2.
2 ) Le sous-espace tangent lensemble-contrainte en x = (0, 0) est
H := {0} R.
De plus
2
f (x) + 2 h(x) d, d = 2(1 2)d22
pour tout d = (0, d2 ) H.
Par suite :
si > 12 , x = (0, 0) ne peut tre un minimum local de f sous la contrainte
h(x) = 0 ;
si < 12 , x = (0, 0) est un minimum local strict de f sous la contrainte
h(x) = 0 ;
si = 12 , on ne peut dcider laide des seules conditions du 1er et
2e ordre.
108
0 0 1
x = (1 , 2 , 3 ) 2 f (x) = 0 0 1 .
1 1 0
Mais 2 f (x) ntant pas semi-dnie positive, f nest pas convexe. Le
problme pos nest donc pas un problme de minimisation convexe.
2 ) Un point x = 1 , 2 , 3 vrie les conditions ncessaires de minimalit
du 1er ordre lorsque :
.
1 + 2 + 3 = 3 ;
R tel que 1 3 + = 0 et 2 1 + = 0.
Ce systme dquations conduit = 2 et aux points x = 1 , 2 1 , 1 ,
1 R.
Le sous-espace H tangent lensemble-contrainte (not S) en x est lhyperplan dquation d1 + d2 + d3 = 0. Ensuite :
Donc, en fait, tous les points 1 , 2 1 , 1 sont des minima globaux de f
sur S.
Le fait quon nait
pu vrierla condition susante de minimalit (stricte)
en un point x = 1 , 2 1 , 1 sexplique aisment par le fait que f est
constante sur toute la droite {(1 , 2 1 , 1) | 1 R} .
110
soit encore :
(1)
ou bien
(2)
1 + 2 1 < 0,
+
+
1
0
2
1
2
=
+ 2a
0
1
2
1 + 2 1 = 0,
0
+
+
1
+
2
1
2
=
, 0.
+ 2a +
0
1
2
Lventualit
(2) ne se produit que pour
1
1
1 a , a et = 13a
a .
1
4
a
1
3,
1
3,
auquel cas x =
auquel cas x =
2e cas : 0 < a < 14 . Il y a deux points de C vriant les conditions ncessaires de minimalit du 1er ordre, savoir :
1 1
sur la frontire de C ;
x1 = 1 ,
a a
1
2a
,
lintrieur de C.
x2 =
1 4a
1 4a
Quid des conditions ncessaires de minimalit du 2e ordre ?
En x1 , le sous-espace considrer est H = {(d1 , d2 ) R2 | :
g(x1 ), d =
0}, soit H = {(d1 , d2 ) R2 | d2 = d1 }. Alors :
Do 2 fa (x1 )d, d > 0 pour tout d = 0 dans H : le point x1 est donc
un minimum local strict de fa sur C.
En x2 , le sous-espace considrer est H = R2 , et on a dj vu que
2
fa (x2 ) ntait pas semi-dnie positive. Donc x2 ne saurait tre un minimum local de fa sur C.
Reste savoir si x1 est un minimum global de fa sur C.
En fait, fa est une fonction quadratique dont la valeur en x = (1 , 2 ) peut
tre dcompose comme suit :
2 2
1 2
+ 1 .
+ a
fa (1 , 2 ) = 1 +
2
4 2
111
1
4
1
1
a
4
3
1
<a
3
solution
valeur optimale
1 1
1 ,
a a
1
2a
,
1 4a 4a 1
2a 1
a
a
1 4a
** Exercice III.28. On se propose dans cet exercice dobtenir les conditions ncessaires de minimalit de Karush-Kuhn-Tucker pour un problme de minimisation avec contraintes du type galit et ingalit partir des conditions ncessaires de minimalit du 1er et 2e ordre pour un problme de minimisation avec
contraintes du type galit seulement.
Soit donc
.
S := {x Rn | hi (x) = 0 pour i = 1, . . . , m
Min f (x)
(P)
, o
xS
et gj (x) 0 pour j = 1, . . . , p}.
On supposera f, h1 , . . . , hm , g1 , . . . , gp deux fois direntiables. Au point
x S minimum local de f sur S, il est suppos
(QC)x : h1 (x) , . . . , hm (x) , gj (x) , j J (x), sont linairement indpendants.
suivant, plongement du proOn considre le problme de minimisation (P)
n
p
blme (P) dans R R :
Min f (x)
hi (x) = 0 pour i = 1, . . . , m
P
112
1, . . . , h
m+p : Rn Rp R comme
On dnit les fonctions f, h
(x, y) Rn Rp ,
f(x, y) := f (x),
i (x, y) := hi (x) pour i = 1, . . . , m,
h
m+j (x, y) := gj (x) + y 2 pour j = 1, . . . , p.
h
j
m+j (x, y) =
1 ) Pour x S considrons (y 1 , . . . , y p ) Rp tel que h
2
gj (x) + y j = 0 pour j = 1, . . . , p. Notons que y j = 0 exactement pour les
j J (x) . Limplication suivante est alors claire :
k (x, y) = 0 .
:= (x, y) Rn Rp | h
S
local de f sur S
pour k = 1, . . . , m + p}
2 ) Observons la structure particulire de la matrice jacobienne de H :=
m+p ) en (x, y)
(h1 , . . . , h
%
h1 (x)
..
.
..
.
[JH(x, y)]T =
..
.
0
..
.
&#
...
$
hm (x)
..
.
..
.
..
.
0
..
.
&#
g1 (x)
..
.
..
.
2y 1
0
...
..
gp (x)
..
n
.
..
.
2y p
En eet :
gj (x)
..
.
m+p
p
m
(x)
h
i
k (x, y) =
2y j
k h
i
m+j
+
0=
0
..
i=1
j=1
k=1
.
0
implique
/ J (x)
m+j yj = 0 pour j = 1, . . . , p, do m+j = 0 si j
puis
0=
i hi (x) +
i=1
m+j gj (x) ;
jJ(x)
et ceci nest possible que si tous les coecients k sont nuls.
Par consquent, il existe 1 , . . . , m , 1 , . . . , p Rm+p unique tel que
0 = f(x, y) +
i (x, y) +
i h
i=1
j=1
m
i=1
i hi (x) +
j gj (x)
j=1
et
0 = j y j pour tout j = 1, . . . , p.
/ J (x) .
Cette dernire relation signie encore : j = 0 ds lors que j
Il ne reste plus qu dmontrer que les j sont positifs. Cela rsultera des
conditions ncessaires de minimalit du 2e ordre crites en (x, y) minimum
local de f sur S.
m+p (x, y) sont linairement indpen 1 (x, y), . . . , h
tant donn que les h
dants, et sachant que y j = 0 lorsque j J(x), nous avons :
pour i = 1, . . . , m
hi (x) , d = 0
(x, y)
gj (x) , d = 0
pour j J(x)
(d, ) T S,
/ J(x).
gj (x) , d + 2y j j = 0 pour j
114
Concernant le lagrangien
L : (Rn Rp ) (Rm Rp ) R
(x, y, , ) L (x, y ; , ) = f(x, y) +
i hi (x, y) +
i=1
m+j (x, y)
j h
j=1
nous avons :
associ au problme de minimisation (P),
m
n { 2xx f (x) 0
2xx hi (x)
+
i
2(x,y;x,y)L x, y; , =
0
0
0
p{
# $% & #$%& i=1
n
0
0
2xx gj (x)
0
0
..
j
2
..
.
..
.
j=1
...
..
.
...
j
de sorte que
@
?
2(x,y;x,y) L x, y; , (d, ) , (d, ) =
B
A
m
2xx f (x) +
i 2xx hi (x) +
j 2xx gj (x) d, d + 2
j j2 .
i=1
jJ(x)
jJ(x)
lim
x+
f (x) = +) ;
m
2
gi+ (x) ,
i=1
o gi+ (x) dsigne max(gi (x), 0). (Pk est une version pnalise de f .)
1 ) Montrer quil existe xk minimisant globalement Pk sur Rn .
2 ) Vrier que la suite {Pk (xk )} est croissante et majore par la valeur
optimale f de (P).
3 ) Montrer que
lim
k+
m
2
gi+ (xk ) = 0.
i=1
4 )
tablir que la suite {xk } est borne et que toute limite de sous-suite
convergente de {xk } est solution de (P).
5 ) Montrer que
lim k
k+
6 )
m
2
gi+ (xk ) = 0.
i=1
tiables.
a) Pk est-elle convexe direntiable ?
b) Comment caractriser les xk minimisant Pk sur Rn ?
i=1
f (xk+1 ) + (k + 1)
#
116
m
$% i=1
=Pk+1 (xk+1 )
2
gi+ (xk+1 ) .
&
m
2
gi+ (x) pour tout x Rn ,
i=1
m
m
2
2
+
gi+ (xk ) f (xk ) + k
gi (xk ) = Pk (xk ) f ,
i=1
i=1
do
0
m
i=1
2 f r
,
gi+ (xk )
k
et donc
gi+ (xk ) 0 quand k +, pour tout i = 1, . . . , m.
4 ) Si lim xkl = + pour une sous-suite {xkl }l de {xk }, on aurait
l+
l+
m
i=1
m
2
gi+ (xkl ) pour tout l.
i=1
Quitte prendre une sous-suite de la suite (borne) {xkl }, on peut supposer que {xkl }l est convergente. Sa limite x est solution de (P), daprs ce qui
a t dmontr dans la 4e question. On a donc :
f f (xkl ) Pkl (xkl ) f (xkl ) > 0 pour tout l
et
f (xkl ) f (x) = f quand l +,
do une contradiction.
6 ) a) La fonction gi tant convexe, il en est de mme de gi+ = max(0, gi )
et donc de (gi+ )2 (daccord ?). La fonction gi tant direntiable, il en est de
mme de (gi+ )2 .
Donc Pk est une fonction convexe direntiable.
b) xk minimise Pk sur Rn si, et seulement si, Pk (xk ) = 0. Cela sexprime
par
m
gi+ (xk )gi (xk ) = 0.
f (xk ) + 2k
i=1
gi (x) 0, i = m + 1, . . . , p,
o f, hi , gi : Rn R sont des fonctions deux fois direntiables sur Rn .
Pour tout c = (c1 , . . . , cp ) (R+ )p , on dnit la fonction pc par :
x Rn pc (x) := f (x) +
ci |hi (x)| +
i=1
ci gi+ (x).
i=m+1
d Rn , 3 (x, d) = max {
1 (x), d ,
2 (x), d} .
Par application de ce rsultat nous avons :
d Rn , pc (x, d) =
f (x), d +
m
i=1
ci |
hi (x), d| +
ci [
gi (x), d]+ .
iI(x)
119
i hi (x) +
i=1
i gi (x) = 0,
i=m+1
pc (x, d)
f (x) +
i hi (x) +
i=1
B
i gi (x) , d
= 0.
iI(x)
8
t2 2
f (x)d, d +
ci 8 2 hi (x)d, d 8
pc (x + td) pc (x) =
2
i=1
+
2
ci gi (x)d, d
+ o(t2 ).
+
iI(x)
Alors :
8
pour 1 i m, i 2 hi (x)d, d ci 8 2 hi (x)d, d 8 ;
+
.
pour i I(x), i 2 gi (x)d, d ci 2 gi (x)d, d
120
Lhypothse (H2 ) implique que lune des ingalits ci-dessus est stricte. Par
consquent :
m
8
8
pc (x + td) pc (x) 2
f
(x)d,
d
+
ci 8 2 hi (x)d, d 8
=
2
t0
t /2
i=1
+
2
+
ci gi (x)d, d
lim
iI(x)
m
> 2 f (x)d, d +
i 2 hi (x)d, d
i=1
i gi (x)d, d
iI(x)
0
.
pc (x + td) pc (x)
est > 0. Dans les deux cas de gure (d
/ L(x)
t2 /2
et d L(x)), x est un minimum local de pc dans la direction d.
Donc lim
t0
Montrer, sans calculer son expression explicite, que f ne saurait tre drivable en 0.
121
2
2
1 + 2 + 2 = 0 ;
+
)
0
2 1
R tel que 3 2 4 1 + 2 + 1 = 0.
2
2
2
Solution :
2
xx L x2 , 2 d, d = 0 pour tout d H. Les conditions susantes du second ordre de minimalit locale ne sont pas satisfaites en x2 .
3 ) Les conditions susantes du second ordre de minimalit locale tant
satisfaites en x1 , on a le rsultat suivant : il existe un intervalle ouvert A
contenant 0 et une application A x1, drivable en 0 tels que :
(i) x1,0 = x1 et, pour tout A, x1, est un minimum local strict de f
sous la contrainte h(x) = ;
= f (x2 ) f (0)h(x2 ).
Mais conditions ncessaires doptimalit du 1er ordre on a :
f (x1 ) + 1 h(x1 ) = 0 et f (x2 ) + 2 h(x2 ) = 0.
On pose, pour x Rn ,
I(x) := {1 i p | fi (x) = g(x)} .
2 ) On suppose que les fi sont toutes direntiables en x. quelle condition
(ncessaire et susante) portant sur les fi (x), i I(x), la fonction g est-elle
direntiable en x ?
3 ) On dnit 0 , 1 , . . . , p : Rn R R de la manire suivante :
(x, r) Rn R, 0 (x, r) := r,
i (x, r) := fi (x) r pour i = 1, . . . , p.
Vrier que si x est un minimum local de g, alors (x, g(x)) est un minimum
local de 0 sur lensemble-contrainte
S := {(x, r) Rn R | i (x, r) 0 pour tout i = 1, . . . , p} .
Quelle condition ncessaire de minimalit (en x) peut-on dduire de cette
observation ?
Solution : 1 ) En posant gj := max {f1 , f2 , . . . , fj } pour j = 1, . . . , p, on a :
1
(gj + fj+1 + |gj fj+1 |) .
2
Grce la continuit de g1 = f1 , de f2 , . . . , fp , et celle de |h| lorsque h est
continue, la formule ci-dessus conduit par rcurrence la continuit de gp = g.
gj+1 = max {gj , fj+1 } =
(3.15)
(3.16)
Pour x assez voisin de x, g(x) = fi (x) o i est un certain indice de I(x) (cela
rsulte de (3.15)). En consquence, il vient de (3.16) : > 0 tel que
(x x ) (|g(x) g(x)
v, x x| x x) .
On a ainsi dmontr que g est direntiable en x et g(x) = v.
[]. Supposons g direntiable en x. Soit i quelconque dans I(x). Puisque
g fi (par dnition mme de g), que (g fi )(x) = 0 (car i I(x)), et que
g fi est direntiable en x, on a (g fi )(x) = 0. Do g(x) = fi (x).
3 ) Soit V un voisinage de x sur lequel g(x) g(x). Un simple jeu
dingalits permet de voir que lon a
r g(x) pour tout (x, r) (V R) S.
Donc (x, g(x)) est un minimum local de 0 sur S. (Il est dailleurs intressant
de visualiser sur une gure ce passage de Rn Rn R).
Concernant 0 et i nous avons :
Rn
0
fi (x)
, i (x, g(x)) =
dans ;
0 (x, g(x)) =
1
1
R
par ailleurs, dans le problme de minimisation de 0 sur S, les indices des
contraintes-ingalits actives en (x, g(x)) sont exactement ceux pour lesquels
fi (x) = g(x), cest--dire ceux de I(x). Comme lhypothse de qualication
des contraintes (QC)(x,g(x)) , qui requiert lexistence de (d, ) Rn R tel que
,
d
fi (x)
,
< 0 pour tout i I(x),
1
fi (x)
0 +
i
= 0,
1
1
i=1
= 0 si i
/ I(x).
i
125
Une condition ncessaire de minimalit locale (du 1er ordre) vrie en x est
donc :
Une combinaison convexe des fi (x), i I(x), est gale (au vecteur) 0.
Autre manire de dire la mme chose : (le vecteur) 0 est dans le plus
petit polydre convexe construit partir des fi (x), i I(x).
i fi (x) |
i = 1 et i 0 pour tout i I(x) .
g(x) :=
iI(x)
iI(x)
est un singleton ;
g est direntiable en x si et seulement si g(x)
126
IV
MINI-MAXIMISATION. DUALISATION DE
PROBLMES DE MINIMISATION CONVEXE
Rappels
IV.1. Points-selles (ou cols) ; problmes
de mini-maximisation
Soit l : X Y R. Un couple (x, y) X Y est appel point-selle (ou col)
de l sur X Y lorsque
l (x, y) l (x, y) l (x, y) pour tout (x, y) X Y.
Lensemble des points-selles de l sur X Y a ncessairement une structure
trs particulire : cest un produit cartsien densembles (qui peut tre vide, cela
va sans dire). La valeur l(x, y) est constante pour tous les points-selles (x, y) de l
sur X Y : elle est appele valeur-selle.
Un exemple de rsultat dexistence de points-selles est fourni par le thorme
qui suit.
Les dnitions mmes dinf et de sup font que lon a toujours les ingalits :
(y) l(x, y) (x) pour tout (x, y) X Y . Et (x, y) est un point-selle de
l sur X Y si et seulement si (y) (x) ; dans ce cas (y) = (x) est la
valeur-selle de l sur X Y.
Il est naturel dassocier l les deux problmes doptimisation suivants :
Minimiser sup l(x, y) (problme de minimisation de sup )
(1)
yY
pour x X;
(2)
Maximiser inf l(x, y) (problme de maximisation dinf )
xX
pour y Y.
Alors, une condition ncessaire et susante pour que l ait des points-selles sur
X Y est
min (x) = max (y)
xX
yY
Minimiser f (x)
(P)
hi (x) = 0 pour i = 1, . . . , m et
i hi (x) +
i=1
j gj (x).
j=1
p
Theor`eme. Les points-selles de L sur Rn Rm (R+ ) sont exactement les
x, , tels que :
(i) x minimise L , , sur Rn ;
(ii) x C ;
(iii) j gj (x) = 0 pour tout j = 1, . . . , p.
x, , est un point-selle de L sur Rn
En particulier,
si
p
Rm (R+ ) ,alors x est une solution du problme (P).
Supposons maintenant que (P) soit un problme de minimisation convexe : f
et les gj sont convexes, les hi sont anes.
Theor`eme. Sous les hypothses de convexit dcrites ci-dessus, les deux noncs
suivantssont
:
quivalents
p
(i) x, , est un point-selle de L sur Rn Rm (R+ ) ;
(ii) x est solution de (P) et , est un multiplicateur de Lagrange.
Dans tous les exercices considrs dans ce chapitre, le problme de minimisation convexe (P) aura des solutions (lensemble S des solutions de (P) ne sera
pas vide), et des hypothses de qualication des contraintes seront faites pour
quil y ait des multiplicateurs de Lagrange (lensemble M des multiplicateurs de
Lagrange
vide). Donc lensemble des points-selles du lagrangien L sur
ne sera pas
p
Rn Rm (R+ ) sera le produit cartsien des deux convexes ferms S et M.
sup
(,)Rm (R+ )p
L (x, , ) .
129
x l(x1 , y1 ) x l(x2 , y2 ), x1 x2
y l(x1 , y1 ) y l(x2 , y2 ), y1 y2
(ii)
Dautres appellations sont parfois utilises ; ainsi entendre parler de foss de dualit avec
laccent qubcois est charmant...
130
et
()
l(x2 , y2 ) l(x1 , y1 )
x l(x1 , y1 ), x2 x1 +
y l(x2 , y2 ), y2 y1 .
P (x1 x2 ), x1 x2
Q(y1 y2 ), y1 y2 0
pour tout (x1 , y1 ) et (x2 , y2 ) dans Rn Rm .
Ceci est certainement vrai lorsque P est semi-dnie positive et Q semi-dnie
ngative.
2 ) [(j) (jj)] . (x, y) X Y est un point-selle de l sur X Y signie :
x est un minimum sur X de la fonction convexe direntiable l(, y)
et
y est un maximum sur Y de la fonction concave direntiable l(x, ).
Ce quexpriment les ingalits de (jj) ne sont que les conditions ncessaires
et susantes doptimalit correspondantes.
[(jj) (jjj)] . Immdiat.
x
,
x
yY
yY
xX
A(xy a), xy a = 1,
> 0 tel que y + 2A(xy a) = 0.
1
A1 y
A1 y, y
xX
A1 y, y,
On dnit :
l : (x, y) Rn Rm l(x, y) :=
yi fi (x) ;
i=1
X := Rn ;
Y est le simplexe-unit de Rm , cest--dire
6
(y1 , . . . , ym ) R
| yi 0 pour tout i, et
;
yi = 1 .
i=1
i=1,...,m
Les x dun point-selle (x, y) de l sur X Y sont ceux pour lesquels (x) = l,
cest--dire ceux qui minimisent maxi=1,...,m fi sur Rn .
De mme, les y dun point-selle (x, y) sont ceux de Y pour lesquels
m
y i fi (x) et (x) = max fi (x), cela
l(x, y) = (x). Sachant que l(x, y) =
i=1,...,m
i=1
a2i xi
, i = 1, . . . , n.
a2i +
() =
n
i=1
a2i x2i
2 1 pour tout 0.
2
ai +
/ E ; est donc maximise au seul point > 0 annu (0) > 0 car x
lant .
Exemple. ai = i pour i = 1, . . . , 7 ; xi = 10 pour i = 1, . . . , 7.
Valeur approche de : 87, 67846859.
Valeur approche de () : 494, 9439304.
136
Commentaire :
Soit g : u g(u) :=
n 2
ui
i=1
ai
1, de sorte que E =
{u Rn | g(u) 0} . On vrie sur le cas trait dans lexercice que la seule manire dassurer
u () E et g (u ()) = 0
(ce qui revient ici : > 0 et g (u ()) = 0), est davoir = .
1
x 2
c, x +
s, x .
2
2 ) est une fonction concave que lon doit maximiser sur R+ (cest notre
problme dual (D)). Ici, est une fonction polynomiale du 2e degr en , avec
() =
c s, s =
c, s s 2 . Deux cas sont distinguer :
c, s 0, auquel cas la seule solution de (D) est =
c,s
.
s2
Alors
1
(
c, s)2 1
c 2 .
() = c s 2 =
2
2 s 2
2
c, s < 0, auquel cas le supremum de sur R+ est atteint en = 0.
Alors
1
() = c 2 .
2
3 ) Le problme (P) a une seule solution x. La minimisation de la fonction
strictement convexe L (, ) sur Rn donnera automatiquement la solution x
cherche.
c, s < 0. Ici L (x, ) = 12 x 2
c, x et le minimum de L (, ) est
atteint en x = c. La valeur optimale est
1
L (x, ) = f (x) = () = c 2 .
2
c, s 0. Alors L (x, ) =
L (, ) est minimise en
x=c
1
2
x 2
c, x +
c,s
s2
s, x . La fonction
c, s
s = c s.
s 2
Finalement
f (x) = L (x, ) = () =
138
(
c, s)2 1
c 2 .
2 s 2
2
n
xi
Minimiser
xi ln
ri
(P)
i=1
(4.1)
n
i=1
ri e(A )i
x ()i = n
A
(
)
i
ri e
i=1
) n
+
(A )i + ,c
ri e
= () .
i=1
(D)
n
Minimiser
ri e(A )i
i=1
m
sur le cne (R+ ) .
+ ,c
Minimiser f (x)
n
(P)
0
pour
tout
i
=
1,
.
.
.
,
n
et
xi = 1.
sous
les
contraintes
:
x
i=1
140
i=1
inf
x(R+ )n
L(x, )
i=1
i=1
R+
fi (xi ) + = i 0.
Do le rsultat escompt.
141
d) Si les fi sont convexes, f est convexe et les conditions de KKT prcdentes caractrisent les solutions de (P).
2 ) La fonction f est strictement convexe. Il existe un et un seul x solution
de (P), caractris par :
x 0 pour tout i,
xi = 1 ;
i
i=1
i=1
i=1
ai bi
1
1
ai
1 +
ln
=
ai bi
bi
{i | x()i > 0}
{i | x()i > 0}
) n
+
n
1 ai bi +
+
ai 1
+
1 .
ln
=
ai bi
bi
i=1
142
i=1
1 ;
ai 1 ai bi +
Si a1 b1 , () =
bi ln
i=1
i=1
1 .
ai +
ln
() =
bi
bi
i=k+1
i=k+1
i=k+1
En observant que
lim
(ak bk )
() =
lim
(ak bk )+
i=1
() = 1 pour an bn .
ai bi
1
pour les i tels que ai bi > ,
xi = bi ln
0, () = (1 ) 2 1
3
2
5
)
+
+
+
3
5 +
1
2
1
ln
ln
+ ln
+
+
1 ;
3 + 1
5 +
1 + 2
ln
ln
+
+
1.
> 0, () = ln
144
;
bi xi = 1 .
i=1
(1 + xi )2
ai + bi 0 pour tout i tel que xi = 0.
2 ) On considre le lagrangien usuel
) n
+
+ n
R L(x, ) = f (x) +
bi xi 1
L : (x, ) R
i=1
inf
x(R+ )n
L(x, ).
b) En tudiant les proprits de sur R+ (notamment sa drivabilit) montrer quil existe un et un seul > 0 maximisant sur R+ .
Exprimer alors les coordonnes xi de la solution (P) en fonction de et
a1 , . . . , an , b1 , . . . , bn .
145
2ai
, . . .)
(1 + xi )3
ai
i + bi = 0
(1 + xi )2
pour tout i = 1, . . . , n.
(KKT )
i xi = 0
Si i est tel que xi > 0 (il y a ncessairement de tels i), i = 0 de sorte que
ai
+ bi = 0.
(1+x
)2
i
n
(R+ )
R L (x, ) =
n
i=1
ai
1+xi
n
bi xi 1 .
i=1
cest--dire
ai
1
, i = 1, . . . , n.
de Rn de composantes
bi
Par suite
ai +
ai bi
() = L (x () , ) =
i
|
x()
=0
i
|
x()
>0
}
}
{
{
i
i
*
ai
bi
1 1 .
+
bi
{i | x()i >0}
Or
{i
ai +
| x()i =0}
et
{i
{i
| x()i >0}
*
bi
| x()i >0}
ai bi =
n
i=1
'
ai 1
*
1
bi
ai
++ (
+
*
n
ai
ai
1 =
1
bi
,
bi
bi
i=1
de sorte que
++ (
+ ;
*
bi
ai
1
ai 1 1
+ bi
() =
ai
bi
i=1
+)
6
)*
++ ;
*
n
bi
bi
ai 1 +
1
1
.
=
ai
ai
n
'
i=1
147
Si
ak ak+1
bk , bk+1
!
, () a pour expression
ai +
i=1
ai bi 2
i=k+1
bi
ai
+
.
+
La fonction est nie sur R+ et continue sur R+
(puisque concave sur R ).
tudions sa drivabilit sur R+
.
!
"
ak+1
, de drive
Il est clair que est drivable sur abkk , bk+1
)*
() =
i=k+1
lim
() =
Notons que
ak
bk
ai bi
bi
1.
+
lim
() ; donc est drivable sur R .
ak
bk
mal x().
!
"
an
,
strictement
dcroissante
sur
0,
La fonction est continue sur R+
bn ,
et de plus :
lim () = + ;
0+
() = 1 pour
an
bn
ai
ai
xi =
1 pour tous les i tels que
> ,
bi
bi
a
1
1
1
1
+3 1 +
+ 4 1+
;
3
3
5
5
)*
> 0, () =
++ )*
++
)*
++
4
1
3
5
1
1
1
+
+
1.
Minimiser f (x) := 1
M x, x +
q, x
2
(P)
sous la contrainte Ax + b 0,
o M Mn (R) est symtrique dnie positive, q Rn , A Mm,n (R) et
b Rm .
1 ) Dterminer la fonction duale associe au lagrangien
L : (x, ) L (x, ) :=
M x, x +
q, x +
, Ax + b .
2
149
(1)
M x + q + A = 0,
+ m
(2)
tel que
, Ax + b = 0
= (1 , . . . , m ) R
j = 0 si
aj , x + bj < 0 .
1 ) () est par dnition inf xRn L(x, ).
x, le minimum de L(, ) sur Rn est atteint en x () =
M 1 q + A .
Do :
@
1?
() = M 1 A + q , A + q +
b,
2
@
1 1
1 ?
AM 1 A , + b AM 1 q,
M q, q .
=
2
2
2 ) (i) Le problme dual (D) de (P) est :
6
Maximiser ()
(D)
m
sous la contrainte (R+ ) .
On sait que ce problme de maximisation dune fonction quadratique
m
concave sur (R+ ) a des solutions (ce qui ne se voit pas directement puisque
AM 1 A est certes semi-dnie positive, mais pas ncessairement dnie positive).
(ii) Une solution de (D) est caractrise par :
m
m
R+
et () est normal R+
en ;
150
soit encore
m
m
R+ , AM 1 A + AM 1 q b R+
et
?
@
AM 1 A + AM 1 q b, = 0.
(iii) Si m n et A est surjective, alors A est injective de sorte que
AM 1 A est dnie positive. En eet
@
@ ?
?
0
AM 1 A y, y = M 1 A y , A y
et
@
?
AM 1 A y, y = 0 A y = 0 (y = 0) .
Alors, (D) a une et une seule solution .
Cela se voit aussi partir de (1) : les solutions de (D) sont les multiplicateurs de (P), ils vrient (1) et (2) ; de (1) on tire
A = M x q.
Un tel dont on est assur de lexistence est unique.
(iv) Connaissant une solution de (D), la solution de (P) est le point minimisant L(, ) sur Rn , i.e. x () . Il ny a pas lieu de distinguer les minima
de L(, ) qui sont admissibles et ceux qui ne le sont pas : x () est forcment
admissible.
Minimiser f (x) := 2
A0 x, x +
b0 , x + c0
sous les contraintes
(P)
gj (x) := 12
Aj x, x +
bj , x + cj 0, j = 1, . . . , m.
1 ) Quelles proprits de (P), utiles pour sa rsolution, peut-on noter ?
151
2 ) Soit
L : (x, ) R R
n
L(x, ) = f (x) +
j gj (x)
j=1
/
1
A () x, x +
b () , x + c () .
2
x () = [A ()]1 b () ,
do
@
1?
1
() = [A ()] b () , b () + c () .
2
Le problme dual (D) de (P) consiste maximiser la fonction (concave)
m
sur (R+ ) .
152
*** Exercice IV.11. Soient a1 , . . . , am dans Rn , b1 , . . . , bm dans R, et soit P
+
)
m
a
,xb
j
j
e
pour x Rn .
le problme qui consiste minimiser f (x) := ln
j=1
1 ) Montrer que P est quivalent (en des termes quon prcisera) au problme (avec contraintes) (P) pos dans Rn Rm suivant :
Minimiserf (x, y) := ln
eyj
(P)
j=1
inf
(x,y)Rn Rm
{f (x, y) +
, Ax b y} .
Ax b = y et x est solution de P .
2 ) Il sagit de calculer
@
?
eyj
, y
, b + A , x
.
ln
inf
(x,y)Rn Rm
j=1
eyj
, y .
infm ln
yR
(4.2)
j=1
Situation o
m
j = 1.
j=1
153
m
m
yj
e
j yj .
, y ln m + max yj
ln
j
j=1
j=1
k
k
pour tout j (ou m
pour tout j) et en
En prenant par exemple yj = m
faisant k +, on constate aisment qualors
yj
e
, y = .
(4.3)
ln
inf
yRm
j=1
eyj
, y = infm ln
eyj
j yj .
infm ln
yR
yR
j=1
jJ+
jJ+
= j
pour tout j = 1, . . . , m,
eyj
j=1
cest--dire si et seulement si
m
j=1
m
j=1
154
j ln j .
() =
j ln j
, b si A = 0,
j=1
j = 1 et j 0 pour tout j ;
j=1
sinon
j ln j
, b
Maximiser
(D)
j=1
j = 1 et j 0 pour tout j.
: R
+ p
() := infn f (x) +
xR
j gj (x)
j=1
155
1
ln (gj (x)) .
: x C (x) := f (x)
j=1
j=1
p
+ p
() = infn f (x) +
j gj (x)
: R
xR
j=1
2 ) a) La fonction gj : C R
est convexe et direntiable ; la fonction
ln(y)
est
convexe,
croissante
et direntiable. Il sensuit que la
y R
compose des deux, qui nest autre que x C ln(gj (x)), est convexe
et direntiable sur C .
fr C.
(x) + quand x C x
Par consquent tous les ingrdients sont l pour quil existe x minimisant
1
gj (x ) = 0.
x C et f (x ) +
gj (x )
(4.4)
j=1
157
c) La fonction x Rn f (x) +
sur Rn . Comme f (x ) +
f+
p
j=1
p
j=1
j gj sur Rn .
Ainsi
( )
j=1
f (x) +
p
j=1
On a :
f (x ) f = inf f (x) =
xC
et
( ) = f (x ) +
p
j=1
puisque
1
gj (x )
:= inf xRn
p
+
j gj (x)
> .
sup () ( ) ,
(R+ )p
j gj (x )
p
1
= f (x ) +
j=1
pour tout j = 1, . . . , p.
d) joue le rle de fonction-barrire (ou de fonction pnalise par lintrieur) rgle par le paramtre > 0.
x est un chemin central dont on espre quil nous conduira
une solution x de (P) lorsque +.
La recherche de x est un problme de minimisation sans contraintes, et
on peut envisager de trouver x en rsolvant le systme doptimalit (4.4) (par
une mthode de Newton par exemple).
Lencadrement f (x ) f f (x ) p est fort utile pour grer un test
darrt sur lincrmentation en .
On peut aussi voir x comme rsultat dune perturbation ad hoc des conditions de minimalit. En eet :
p
x C et il existe (R+ ) tel que :
f (x) + g (x) = 0 ;
(x est solution de (P))
j
,
j
j=1
j gj (x) = 0 pour tout j = 1, . . . , p
alors que x est caractris par
p
x C et il existe (R+ ) tel que :
p
f (x ) + g (x ) = 0 ;
j=1
j gj (x ) = 1 pour tout j = 1, . . . , p.
158
r
2
m
i=1
6
Min fr (x)
h1 (x) = 0, . . . , hm (x) = 0.
Lr (x, ) : = fr (x) +
i hi (x)
i=1
m
r
= f (x) +
2
[hi (x)] +
i=1
i hi (x)
i=1
(4.5)
le lagrangien usuel pour le problme (Pr ) ; on lappelle lagrangien augment
du problme (P).
Comparer Lr et le lagrangien usuel L du problme (P).
crire le problme dual (Dr ) (dit augment) driv de Lr .
2 ) On dsire dnir un lagrangien augment pour le problme de minimisation avec contraintes du type ingalit ci-dessous :
6
Min f (x)
(Q)
g1 (x) 0, . . . , gp (x) 0.
suivant, plongement du problme
Pour ce faire, on considre le problme (Q)
n
p
(Q) dans R R :
6
Min f (x)
Q
gj (x) + yj2 = 0 pour j = 1, . . . , p.
159
inf
(x,y)Rn Rp
yR
a) Dmontrer que
Lr (x, ) = f (x) +
r (j , gj (x)),
j=1
o r : (, t) R R r (, t) :=
1
2r
[max {0, + rt}]2 2 .
L(x, ) = f (x) +
i hi (x),
i=1
r 2
hi
2
m
Lr = L +
i=1
= f (x) +
j=1
p
j=1
j=1
r
r 4
yj + [j + rgj (x)]yj2 + j gj (x) + gj (x)2 .
2
2
La structure spare de Lr (x, y, ) en les variables yj facilite la minimisation de Lr (x, , ) sur Rp . En posant u := yj2 , on est en fait rduit la
minimisation de la fonction quadratique convexe u 2r u2 + [j + rgj (x)]u +
j gj (x) + 2r gj (x)2 sur R+ . Deux cas sont alors envisager :
j
r ,
j +rgj (x)
;
r
gj (x)
u=
gj (x) >
j
r ,
.
/2
/
.
1
r
j
j
max gj (x),
=
{[max{0, j +
+ j max gj (x),
2
r
r
2r
rgj (x)}]2 2j } (si, si !), do lexpression escompte de Lr (x, ).
b) Voici ci-aprs des exemples de fonctions t r (, t).
Les fonctions r (, ) sont convexes, croissantes et drivables (mais pas
deux fois drivables). De plus, lorsque 0,
r (, t) t pour tout t R (daccord ?),
de sorte que
Lr (x, ) f (x) +
j gj (x) si = (1 , . . . , p ) (R+ )p .
j=1
Figure 9.
f (x) +
j gj (x) = L(x, ) si = (1 , . . . , p ) (R+ )p ,
lim Lr (x, ) =
j=1
r0+
(D)
6
Max ()
Rp .
4
5
max 0, j + rgj (x) gj (x).
j=1
163
V
POLYDRES CONVEXES FERMS.
OPTIMISATION DONNES AFFINES
(PROGRAMMATION LINAIRE)
Rappels
, dnote le produit scalaire usuel dans Rn ; les formes linaires sur Rn sont
du type x Rn
c, x, o c Rn .
Les hyperplans anes de Rn peuvent tre dcrits de la manire suivante :
{x Rn |
ai , x = bi } ,
(5.1)
ai , x bi respectivement).
(5.2)
(5.3)
Lorsquun sous-espace ane est reprsent comme en (5.3) avec des ai linairement indpendants (i.e. A est surjective), ce sous-espace est de dimension
n m.
Les polydres convexes compacts (cest--dire ferms borns) de Rn , appels
aussi polytopes de Rn quand ils sont dintrieur non vide. Il y a deux manires
quivalentes de reprsenter un polydre convexe compact C de Rn :
C = {x Rn | Ax b} et C est born,
ou bien
C = conv {v1 , . . . , vk } ,
(5.4)
(5.5)
Il y a deux manires quivalentes de reprsenter un cne convexe ferm polydrique K de Rn : comme en (5.5) , ou bien
K=
6 k
;
ti vi | ti 0 pour tout i = 1, . . . , k
(5.6)
i=1
(plutt que cne-conv {v1 , . . . , vk }). Le passage dune description lautre se fait
par polarit : si K est un cne convexe ferm polydrique de Rn , son cne polaire
K := {s Rn |
s, d 0 pour tout d K}
est encore un cne convexe ferm polydrique de Rn ; de cette manire :
K = cne {a1 , . . . , am } lorsque K est dcrit comme en (5.5) ;
K = {x Rn |
vi , x 0 pour tout i = 1, . . . , k}
lorsque K est dcrit comme en (5.6) .
(5.7)
(5.8)
(5.10)
(5.11)
N (C, x) = {s Rn |
s, c x 0 pour tout c C}
a, x = b et
a, x b pour tout x C.
F C est une face (expose) de C sil existe un hyperplan dappui H C tel
que F = C H. Si un tel hyperplan a pour quation
a, x = b, on dira que F est
expose par a.
Une face F de C est un polydre convexe ferm, de dimension comprise entre
0 et n 1. Si dim F = 0 on retrouve la notion de point extrmal (ou sommet) de
C ; si dim F = 1 on dira que F est une arte de C ; si dim F = n 1 on parlera
de F comme dune facette de C.
Un polydre convexe ferm a un nombre ni de faces.
Maximiser
c, x
(P)
Ax b,
x0
o c Rn , b Rm et A Mm,n (R).
(5.13)
Minimiser
c, x sous les contraintes Ax b et x 0 conduit au mme
type de problme (en changeant c en c). La prsentation (5.13) est appele
168
forme canonique dun programme linaire ; une autre prsentation est la forme
dite standard (1) :
Maximiser
c, x
(P) Ax = b
(5.14)
x 0.
On passe de la forme canonique (avec A, b, c) la forme standard, de la manire
suivante :
)
+
)
+
ai , x bi
Il existe ui 0 tel que
devient
;
ai , x + ui = bi
dans Rn
do
Ax b
x0
dans Rn
+
Ax + Im u = b
.
x 0, u 0
)
devient
Maximiser
c , x
P
Ax =b,
x 0
o x = (x, u) Rn Rm ,
(5.15)
Ces appellations ne sont pas universelles, certains auteurs les permutent mme. Canonique
doit tre compris ici au sens de naturelle, toujours possible dans lespace des variables x ;
standard au sens de on peut toujours sy ramener, quitte ajouter des variables .
169
Theor`eme. Soit C dcrit comme en (5.16) . Alors les points extrmaux (ou sommets) de C sont exactement les lments de base admissibles.
(P)
Maximiser
c, x
(D)
Ax b
x0
Minimiser
b, y
A y c
y0
(5.17)
(D) est appel problme dual (ou programme linaire dual ) de (P).
Dans le cas de programmes linaires (P) crits sous forme standard, les problmes duaux (D) se prsentent comme suit :
(P)
(P)
Maximiser
c, x
(D)
Ax = b
x0
Minimiser
b, y
Minimiser
c, x
(D)
Ax = b
x0
Maximiser
b, y
(5.18)
A y
c
(5.19)
A y
c
ct de la transformation symtrique (5.17), retenons dans les transformations asymtriques (5.18) et (5.19) les points suivants : maximiser
devient minimiser et vice versa ; les contraintes du type galit deviennent des
contraintes du type ingalit, il ny a plus de conditions de signe sur les variables
duales y.
171
Maximiser
c, x
(P)
Ax b
x0
et
(D)
Minimiser
b, y
A y c
y 0.
(i) Si x est admissible pour (P) et si y est admissible pour (D), alors
c, x
b, y .
(ii) Si x est admissible pour (P), si y est admissible pour (D) et si
c, x =
Theor`eme. Considrons
Minimiser
c, x
(P)
Ax = b
x0
Maximiser
b, y
et
(D)
A y c.
(i) Si x est admissible pour (P) et si y est admissible pour (D), alors
c, x
b, y .
(ii) Si x est admissible pour (P), si y est admissible pour (D) et si
c, x =
Theor`eme. (i) Si lun des problmes (P) ou (D) a une valeur optimale nie, alors
il en est de mme de lautre, et les valeurs optimales sont gales.
(ii) Si le supremum dans (P) est +, alors lensemble-contrainte de (D) est
vide ; si linmum dans (D) est , alors cest que lensemble-contrainte de (P)
est vide.
Tous les cas possibles sont rassembls dans le tableau synoptique ci-dessous ;
pour englober tous les cas de valeurs optimales dans (P) ou (D) (+ et
ventuellement), on conviendra que inf = + et sup = .
172
Lensemble-contrainte
de (P) nest pas vide
(P) a des
solutions
(P) na pas
de solutions
Lensemble- (D) a
O.K.
contrainte
des
max = min Impossible
de (D)
solutions (P) (D)
nest pas
D na
vide
pas de Impossible Impossible
solutions
Lensemble
contrainte
de (P)
est vide
Impossible
inf dans (D) =
sup dans (P) =
Minimiser
c, x
Maximiser
b, y
(P)
Ax = b
et (D)
x0
A y c.
aj , y cj xj = 0
,
et y est solution de (D)
pour tout j = 1, . . . , n
Maximiser
c, x
Minimiser
b, y
Ax b
A y c
(P)
(D)
y 0.
x0
aj , y cj xj = 0
+
)
pour
tout
j
=
1,
.
.
.
,
n
,
et
(
ai , x bi ) y i = 0
pour tout i = 1, . . . , m
Rfrences
[7] Concis et dense. Trs bon.
[26] [21], [22] et [24] contiennent de nombreux exemples simples et des illustrations ; elles intgrent la Programmation linaire dans un domaine plus vaste,
rpertori sous le vocable de Recherche Oprationnelle .
[27] Description et analyse des principales mthodes de rsolution numrique
des problmes de programmation linaire reposant sur lalgorithme du simplexe, ainsi que les programmes ncessaires leur mise en uvre sur microordinateur.
[28] [CS] Trs complets sur la question ; de vritables Bibles . Longtemps domine par les algorithmes du type mthode du simplexe , la rsolution
numrique des programmes linaires a subi un vritable rvolution avec lapport de N. Karmarkar (1984). Les techniques du type points intrieurs
(cf. lExercice V.25 pour une ide) commencent prendre place dans les
formations du niveau 2e cycle : voir le chapitre 4 de [8] et les chapitres XIII
et XIV de [24] par exemple. La 4e partie de [4] et les ouvrages [20] et [25]
sont consacrs pour lessentiel ces nouvelles approches.
* Exercice V.1. Soit lensemble-contrainte dun programme linaire dans R5 dcrit de la manire suivante :
6
2x1 + x2 + x3 = 8, x1 + 2x2 + x4 = 7, x2 + x5 = 3
xi 0 pour tout i = 1, . . . , 5.
1 ) Combien y a-t-il de bases au plus ? Quelles sont ces bases et les lments
de base associs ?
2 ) Dterminer toutes les bases admissibles.
Solution : Lensemble-contrainte est dcrit sous la forme
6
Ax = b
, avec A M3,5 (R) de rang 3.
x0
5
Il y a au plus
= 10 bases.
3
Bases
J = {1, 2, 3}
x = (1, 3, 3, 0, 0)
x = 52 , 3, 0, 32 , 0
admissible
J = {1, 2, 4}
non admissible
175
J = {1, 2, 5}
x = (3, 2, 0, 0, 1)
admissible
J = {2, 3, 4}
admissible
non admissible
J = {3, 4, 5}
x = (0, 3, 5, 1, 0)
x = 0, 72 , 92 , 0, 12
x = (0, 0, 8, 7, 3)
admissible
J = {1, 3, 5}
x = (7, 0, 6, 0, 3)
non admissible
J = {1, 4, 5}
x = (4, 0, 0, 3, 3)
admissible
J = {2, 4, 5}
x = (0, 8, 0, 9, 5)
non admissible
J = {1, 3, 4}
J = {2, 3, 5}
Statut
ei = (0, . . . , 0, 1, 0, . . . , 0) , 1 i n
lments de la base canonique de
Rn
Tous
admissibles.
.
exactement m composantes > 0
moins m composantes > 0
i=1
i = 1.
(5.20)
i=1
i xi j = 0 pour tout j J,
i=1
do xi j = 0 pour tout j J, ce qui voudrait dire que xi a l > n m
composantes nulles au moins. Ceci entre en contradiction avec le fait que xi a,
par hypothse, m composantes > 0.
Dans le cas du simplexe-unit C de Rn , les n points extrmaux ei de C ont
exactement 1 composante > 0, mais les lments de C peuvent avoir 1, 2, . . .
ou n composantes > 0.
177
(x, u = b Ax) de C.
Montrer lquivalence suivante :
(x est extrmal dans C) (x, u = b Ax) est extrmal dans C .
Solution : Considrons x extrmal dans C. Posons u = b Ax, de sorte que
(x, u) soit le point de C correspondant x. Montrons que (x, u) est extrmal
dans C.
On va pour cela raisonner par labsurde : en supposant que (x, u) nest pas
on va tre conduit une contradiction.
extrmal dans C,
il existe ]0, 1[ , (x1 , u1 ) et (x2 , u2 )
Si (x, u) nest pas extrmal dans C,
o z1 et z2 C,
Donc x est bien extrmal dans C.
178
* Exercice V.5. Soit C le polydre convexe ferm de R2 dcrit laide des ingalits suivantes :
8
x1 + x2 4, x1 + x2 2, 2x1 3, x1 0, x2 0.
3
1 ) crire C sous la forme standard (cest--dire comme la projection sur
x = b, x
0).
R2 dun polydre convexe ferm C de R5 dquation : A
Commentaire :
n
C = {x R |
ai , x < bi pour tout i = 1, . . . , m} ;
/
.
frC = x C | max {
ai , x bi } = 0 = {x C | I(x) = } .
i=1,...,m
ai , x = bi ,
ai , y bi ,
ai , z bi .
Mais alors
ai , y bi =
ai , z bi = 0 ncessairement. Nous avons dmontr que I (x) I(y) I(z).
180
Maintenant, puisque AI(x) est de rang n, il existe I I (x) de cardinal n telle que la matrice AI ( Mn (R)) soit rgulire. Le systme AI u = bI
na quune seule solution, et comme il a t observ que AI x = bI , AI y =
bI , AI z = bI , il sensuit x = y = z ncessairement. Ceci entre en contradiction
avec une assertion du dbut du raisonnement. Lhypothse faite au dpart est
donc absurde : x est un point extrmal de C.
rang de AI(x) < n (x nest pas un point extrmal de C) .
Si rang de AI(x) < n, le systme AI(x) u = 0I(x) a une solution non nulle,
que nous notons u.
Si i
/ I (x) ,
ai , x < bi de sorte que
ai , x + u < bi et
ai , x u < bi
pour = 0 susamment petit. On prend = 0 faisant laaire pour tous
les i
/ I (x) .
Mais comme AI(x) (x u) = AI(x) (x) AI(x) (u) = bI(x) , on a
A (x u) b en tout tat de cause. Il en rsulte que x + u et x u sont
dans C, et du coup x nest pas extrmal dans C puisque x = 1/2 (x + u) +
1/2 (x u) .
Commentaire : En un point extrmal x de C, on a card I (x) n ; lorsque
card I (x) = n, le point x est appel point extrmal non-dgnr.
Le rsultat de
lexercice
conduit un majorant du nombre de points ex
m
trmaux de C, cest
. Toutefois ce majorant est trs grossier en gnral, et
n
une autre majoration a t donne par McMullen en 1970 : le nombre de points
extrmaux de C est major par
n+2
n+1
m
m
+
,
2
2
e (m, n) :=
mn
mn
o [k] dsigne la partie
entire
de k. Cet entier e(m, n) est en gnral considram
blement plus petit que
.
n
On peut complter lexercice en cernant un peu plus les points extrmaux
non-dgnrs de C :
un point extrmal non-dgnr x a exactement n points extrmaux adjacents xi (cest--dire que les segments de droites joignant x aux xi sont des artes
de C) ;
181
(5.21)
i=1
i = 1.
i=1
Il sensuit
x = i0 vi0 + (1 i0 )
i = i0
i
vi ,
1 i0
Figure 10.
C na pas de point extrmal ici. La raison en est que C contient une droite
entire.
On peut en eet montrer que si C ne contient pas de droite, cest--dire en
fait si K (K) = {0}, alors C a eectivement au moins un point extrmal.
y = (y1 , . . . , yn ) Rn |
yi 0 pour tout k = 1, . . . , n 1
i=1
et
;
yi = 0 .
i=1
183
x, di 0 pour tout i = 1, . . . , n 1,
o di := (0, . . . , 0, 1, 1, 0, . . . , 0) .
(i + 1)e
ie
position position
2 ) Il vient de la reprsentation ci-dessus de K1 :
K1
6n1
;
i di | i 0 pour tout i = 1, . . . , n 1 .
i=1
K1 = (K1 ) = cne {1 , . . . , n , n } .
y1 = 1 n , y2 = 2 1 , . . . , yn1 = n1 n2 , yn = n1 .
Sachant que les i sont tous positifs ou nuls, il sensuit :
yn 0, yn1 + yn 0, . . . , yk + . . . + yn 0, y1 + . . . + yn 0.
Rciproquement, partant de y1 , . . . , yn vriant les conditions ci-dessus,
posons :
n = (y1 + . . . + yn ) ,
n1 = yn , n2 = (yn1 + yn ) , . . . , k = (yk+1 + . . . + yn ) , . . . ,
1 = (y2 + . . . + yn ) .
185
On a :
i 0 pour tout i = 1, . . . , n
et
(y1 , . . . , yn ) =
i di .
i=1
y = (y1 , . . . , yn ) R |
n
;
yi 0 pour tout k = 1, . . . , n .
i=k
A :=
1 0 0 ... ...
1
2
1
3
1
2
1
3
1 1
n n
0 ... ...
3 0 ... .
..
1
... ... n
y, x 0 pour tout x K3 ,
caractrisant un lment y de K3 , est quivalente
y, A1 x 0 pour tout x K1 ,
soit encore
cest--dire
A1
186
?
A1
@
y, x 0 pour tout x K1,
1
y K1 .
A
1 0
1 2
1
0 2
A =
..
.
0 0
0 0
0 0
3 0
...
...
...
..
.
(5.22)
0
0
0
. . . . . . (n 1) n
(5.23)
y1 +y2
2
y1 +y2 +y3
3
...
y1 +...+yn
n
et y1 + . . . + yn = 0.
Finalement
6
(5.24)
y1 + . . . + yk
y1 + y2
...
...
2
k
;
n
y1 + . . . + yn
et
yi = 0 .
...
n
K3 = y = (y1 , . . . , yn ) Rn | y1
i=1
187
Solution :
N (C, x) =
ti ai +
i=p+1
iI(x)
ti ai | ti 0 pour i I(x) .
Cest la somme (vectorielle) de deux ensembles : le cne convexe engendr par les ai , i I(x), et le sous-espace vectoriel engendr par les
ai , i {p + 1, . . . , q} .
ir N (C, x) =
ti ai +
iI(x)
q
i=p+1
dni par :
2
([aij ] B2 )
i=1
.
aij = 1 pour tout (i, j )
j=1
Solution : De par les conditions imposes, une matrice M de B2 est ncessairement de la forme
1
M=
, avec [0, 1] .
1
Ainsi M =
188
10
01
+ (1 )
, o [0, 1] .
01
10
10
Les deux matrices distinctes M0 :=
et M1 :=
01
extrmits du segment de droite B2 (ou encore les points
01
sont donc les
10
extrmaux de B2 ).
i=1
ti ai .
i=1
m
i ai = 0. On sar-
i=1
range pour que I := {i | i < 0} ne soit pas vide. Tout vecteur x de K peut
alors scrire
.
/
m
ti
ti + ti ai , o t := min
(0) .
x=
iI
i
i=1
Par choix de t, ti + ti 0 pour tout i, mais lun dentre eux au moins est
nul, disons celui correspondant i0 . Ainsi
C
i ai | i 0 pour tout i = i0 .
v|v=
K=
i0 =1
i = i0
j vj : j 0 pour tout j
cne {v1 , . . . , vp } :=
j=1
est ferm.
!c , . . . , c "
1
n
Mm+1,n (R) et dsignons par K le cne convexe de
Soit A :=
A
m+1
engendr par les vecteurs Ae1 , . . . , Aen .
R
190
n
j=1
n
j=1
(xk )j Aej .
c, xk
c, xk
et que la suite {Axk }
=
2 ) Notons que Axk =
Axk
b
.
converge, quand k +, vers
b
Le cne K tant ferm, la limite de {Axk } se trouve encore dans K.
n
Ainsi, il existe = (1 , . . . , n ) (R+ ) tel que
n
j Aej ,
=
b
j=1
cest--dire, puisque Aej =
cj
,
Aej
j cj et b = A.
j=1
Donc C et
c, = = inf xC
c, x ; en clair est une solution
de (P L) .
C :=
x = (x1 , . . . , xn ) Rn |
xj 1, xj 0 pour tout j = 1, . . . , n
j=1
Figure 11.
193
(I)
i = m,
i=1
(5.25)
i=1
i=m+1
)
i xi
i=m+1
i=m+1
xm =
(1 i ) xm
i=1
(1 i ) xi .
i=1
Do
n
i=1
i xi =
m
i=1
i xi +
n
i=m+1
i xi
m
i=1
i xi +
m
i=1
(1 i ) xi =
xi .
i=1
Figure 12.
max
x, = max
x, .
Em
(5.26)
y, dkl
x, dkl pour tout x C.
Un passage la limite sur l (l +) conduit :
y, d x, d pour tout x C,
(Pk )
196
6
Max
x, dk
x C.
Figure 13.
x1 + 43 x2 + 2x3 = 32
x2 + 3x3 = 32
x1 + x2 + x3 + x4 = 1
x 0, . . . , x 0.
1
4
1 ) Lister les points extrmaux de C.
2 ) Rsoudre
(P)
4
3
6
Min 3x1 + x2 + x3 + x4
(x1 , x2 , x3 , x4 ) C.
1
), on remplace 43 par
3 ) Pour > 0 susamment petit (disons 0 < < 10
re
dans la 1 quation dnissant C, ce qui donne un nouveau polydre C .
Rsoudre prsent
6
Min 3x1 + x2 + x3 + x4
(P )
(x1 , x2 , x3 , x4 ) C .
Conclusions ?
197
a1 , x b1 = 0
a , x b = 0
2
2
(S)
...
am , x bm = 0,
on cherche le (ou les) point(s) minimisant
x f (x) := maxi=1,...,m |
ai , x bi | sur Rn (problme appel (P1 ) dans
la suite).
1 ) Que reprsente gomtriquement |
ai , x bi | lorsque ai = 1 ?
Quelle est la signication gomtrique du problme pos ci-dessus lorsque
tous les ai sont de norme gale 1 ?
2 ) Formaliser (P1 ) comme un problme de programmation linaire, et en
tirer toutes les consquences.
198
Solution : 1 ) Lorsque ai = 1, |
ai , x bi | reprsente la distance (euclidienne) du point x lhyperplan Hi dquation
ai , x bi = 0.
Lorsque tous les ai sont des vecteurs unitaires, le problme pos revient
donc chercher les points x de Rn minimisant la plus grande des distances de
x aux hyperplans Hi .
2 ) tant donn que |
ai , x bi | = max (
ai , x bi , bi
ai , x), chercher
x Rn rendant maxi |
ai , x bi | le plus petit possible revient chercher
(x, y) Rn R vriant
ai , x bi y
ai , x + bi y
pour tout i = 1, . . . , m,
Min y
A
(P)
x1
b1
.. .
. ..
..
. bm
,
.. b1
. .
.
.
xn
bm
y
1
..
.
1
1
..
.
199
(5.27)
(5.28)
o
C0 = conv {u1 , . . . , us } est un convexe compact (de Rn ),
K = cne {v1 , . . . , vr } un cne convexe ferm,
L = vect {w1 , . . . , wp } un sous-espace vectoriel.
On considre le programme linaire suivant :
(P)
6
Minimiser
c, x ,
xC
o c Rn est donn.
1 ) Montrer que la fonction f : x f (x) :=
c, x est borne infrieurement
sur C si, et seulement si,
(C)
200
c, vi 0 pour tout i = 1, . . . , r et
c, wj = 0 pour tout j = 1, . . . , p.
2 ) Montrer que sous la condition (C), lensemble des solutions de (P) est
dcrit comme suit :
.
p
i ui +
j vj +
k wk ;
= xC|x=
iI1
jJ2
k=1
i 0,
/
i = 1, j 0, k R ,
iI1
4
5
o I1 := i |
c, ui = f , J2 := {j |
c, vj = 0} , f := inf xC f (x).
3 ) On suppose K = L = {0}, cest--dire C = C0 born, et = C.
c, ui f
, o d dsigne la fonction-distance .
On pose alors : := min
d (ui )
iI
/ 1
(5.29)
Montrer que : x C0 , d (x) c,xf
Minimiser
ti
i=1
(P L)
ai , x bi = ti zi pour i = 1, . . . , m
ti 0, zi 0 pour i = 1, . . . , m.
1 ) Vrier que pour tout x Rn , le vecteur (x, (Ax b)+ , (b Ax)+ ) est
admissible pour (P L) .
2 ) tablir que toute solution de (P L) est de la forme (x, 0, b Ax), o
x C.
En dduire, laide du rsultat de la 3e question de la 2e partie, quil existe
> 0 tel que :
m
1
(
ai , x bi )+ .
(5.30)
x Rn , dC (x)
i=1
201
s
i=1
avec :
i 0
i ui +
j vj +
j=1
k wk ,
k=1
pour tout i, 1 + . . . + s = 1 ;
(5.31)
pour tout j ; k R pour tout k.
i
c, ui +
j
c, vj +
k
c, wk avec les
1 ) Puisque
c, x =
j 0
c, vj 0 pour tout j = 1, . . . , r
et
c, x f pour tout x C
.
c, wk = 0 pour tout k = 1, . . . , p
Ceci est une manire de dire que c doit se trouver dans le cne normal
K et dans le sous-espace orthogonal L.
2 ) On suppose que la condition (C) est vrie. Le problme (P) a alors
des solutions
; il est, en eet, clair que tout x est solution de (P) car
i
c, ui = f .
c, x =
iI1
202
Rciproquement, soit x =
on a :
i ui +
i
c, ui +
j
j
c, vj
j vj +
i
c, ui +
j
c, vj = f
c, x
< f ).
i
c, ui f = 0
Ensuite, sachant que
c, ui f pour tout i, lgalit
i
) s
i=1
+
i ui
i=1
i d (ui ) .
i=1
c, x f
i
d (x)
iI
/ 1
3 e partie
Le programme linaire (P L) est pos dans Rn Rm Rm en les variables
x1 , . . . , xn , t1 , . . . , tm , z1 , . . . , zm .
1 ) Pour x quelconque dans Rn , posons pour i = 1, . . . , m
ti := (
ai , x bi )+ , zi := (bi
ai , x)+ .
Le vecteur
x1 , . . . , xn , (
a1 , x b1 )+ , . . . , (
am , x bm )+ ,
b1
a1 , x)+ , . . . , (bm
am , x)+
dC (x) d x, (Ax b)+ , (b Ax)+
m
1
(
ai , x bi )+ .
i=1
Min
c, x +
d, x + ,
(P)
xC
o c et d sont des vecteurs de Rn , et des rels, et o on suppose que
Min
c, y + z
Ay zb 0
P
d, y + z = 1
y 0, z 0.
alors z > 0 ncessairement.
1 ) Montrer que si (y, z) est admissible pour (P),
alors x := y/z est une
2 ) Dmontrer que si (y, z) est une solution de (P),
solution de (P).
204
c, y + z
,
c,
d, x +
c, x +
=
d, x +
d, x +
c, y + z =
c, x +
c, y + z
=
d, y + z
d, x +
Do le rsultat annonc.
5
21100
8
Max
c, x
, b = 7 .
(P)
Ax b
, o A = 1 2 0 1 0 , c =
0
x 0
0
3
01001
0
Quel est le problme dual (D) de (P) ?
Vrier que x = (3, 2, 0, 0, 1) et y = (1, 2, 0) sont solutions de (P) et (D)
respectivement.
Solution : Le problme dual (D) de (P) secrit :
Min
b, y
(D)
A y c
y 0.
On constate que les x et y proposs sont admissibles pour (P) et (D) respectivement, avec, de plus, lgalit
c, x =
b, y = 22. En consquence, x et
y sont solutions de (P) et (D) respectivement.
205
Solution : Lensemble-contrainte de (P) nest pas vide (il contient 0) et, par
hypothse, val(P) < +.
Le problme dual de (P) scrit :
(D)
6
Min
0, y
A y c
x1 + x2 + x3 x4 2
, o est un paramtre rel.
(P )
2x1 + 2x2 + x3 + x4
x1 0, . . . , x4 0
1 ) crire le problme dual (D ) de (P ).
2 ) Rsoudre (D ) suivant les valeurs de ; en dduire les solutions de (P ).
(D )
206
Max 2y1 + y2
y 2y 3, y + 2y 4,
1
2
1
2
y1 + y2 1, y1 + y2 1,
y1 0, y2 0.
Solutions
y = (1, 0)
{y = (y1 , 1 y1 ) | 0 y1 1}
y = (0, 1)
Valeur optimale
2
2
.
2
Cest donc une arte du polydre des contraintes, qui se rduit un sommet
pour = 2.
xi 0 pour tout i = 1, 2, . . . , n.
1 ) Dcrire dune manire dtaille le problme dual (D) de (P).
2 ) Montrer que tout lment admissible y = (y1 , . . . , yn ) de (D) (et donc
toute solution de (D)) vrie
yk + yk+1 + . . . + yn < k
pour tout k = 2, . . . , n.
207
Figure 14.
1
1
2
2
b = . , c = . et A =
.
.
.
.
n
n
1 0 0 ...
1 1 0 ...
1 1 1 0
..
..
.
.
1 1 1 ...
...
...
...
y1 + y2 + . . . + yn 1
y2 + . . . + yn 2
y3 + . . . + yn 3
(D)
...
yn n
yi 0 pour tout i = 1, 2, . . . , n.
A y
208
(1, 1, . . . , 1) est admissible pour (P), (0, . . . , 0) est admissible pour (D) :
donc
val(P) = val(D) R.
2 ) Soit y = (y1 , . . . , yn ) admissible pour (D). Pour k 2,
yk + yk+1 + . . . + yn y1 + . . . + yn (puisque tous les yi sont 0)
(daprs la 1re contrainte de
1
type ingalit dans (D).)
< k.
Daprs les relations de complmentarit liant les solutions du problme
primal (P) et celles du dual (D), on a :
)
+
x = (x1 , . . . , xn ) solution de (P)
[
ak , y ck ] xk = 0
.
et
pour tout k = 1, . . . , n
y = (y 1 , . . . , y n ) solution de (D)
Or, ici,
ak , y = yk + yk+1 + . . . + yn < k = ck pour tout k = 2, . . . , n. En
consquence, xk = 0 pour tout k = 2, . . . , n.
3 ) Si x est solution de (P),
c, x = x1 . Rsoudre (P) revient donc minimiser x1 sous les contraintes x1 1, x1 2, . . . , x1 n et x1 0 ; do
x1 = n.
La solution de (P) est donc x = (n, 0, . . . , 0), et val(P) = val(D) = n.
Minimiser
c, x
(P) Ax = b
, o c Rn , b Rm et A Mm,n (R),
x0
et son problme dual
(D)
6
Maximiser
b, y
A y c
Maximiser
b, y
(y Rm , u Rn ).
(D)
A y + u = c
u0
209
x, u 0,
et
(
x, u = 0) (x est solution de (P) et (y, u) est solution de (D)).
:
En dduire la caractrisation suivante des solutions de (P) et de (D)
(SO)
A y + u = c, u 0 .
et
x, u = 0
(y, u) est solution de (D)
i.e.
Dsignons par C lassociation des ensembles-contraintes de (P) et de (D),
C := (x, y, u) Rn Rm Rn | Ax = b, x 0, A y + u = c, u 0 ,
le couplage des problmes (P) et (D)
suivant :
et par (P D)
6
Minimiser
x, u
(P D)
(appel problme primal-dual ).
(x, y, u) C
Pour toute la suite on fait les hypothses que voici : A est de rang m et il existe
(x, y, u) C tel que x > 0 et u > 0 (v > 0 dans Rn signie que toutes les
composantes vi de v sont > 0).
par pnalisation
tant donn > 0, on propose une approximation de (P D)
intrieure (ou addition dune fonction-barrire) dnie comme suit :
6
Minimiser f (x, y, u)
(P D)
(x, y, u) C0 ,
o C0 := {(x, y, u) C | x > 0 et u > 0} et f : (x, y, u) C0 f (x, y, u) :=
n
ln(xi ui ).
x, u
i=1
2 )
+
)
Ax() = b
(x(), y(), u()) est
(SO)
A y() + u() = c
.
solution de (P D)
x()i u()i = pour tout i
210
Minimiser x1 + x2 + x3
x + x = 0
1
2
(P)
=
1
x
3
x1 0, x2 0, x3 0.
Illustrer sur cet exemple les rsultats obtenus dans les questions prcdentes
en dterminant (x(), y(), u()) ainsi que (x , y , u ).
Solution : On rappelle au pralable le lien qui existe entre les solutions de
:
(D) et celles de (D)
;
(y est solution de (D)) ((y, c A y) est solution de (D))
(u = c A y et y est solution de (D)).
((y, u) est solution de (D))
Notons aussi quen raison du caractre injectif de A (d au fait que A est
surjective),
(y 1 , u) solution de (D)
(y 1 = y 2 ) .
et
x, u = x, c A y =
x, c
Ax, y
=
x, c
b, y .
Mais puisque y est admissible pour (D),
c, x
b, y , do
x, u 0.
Avoir
x, u = 0 quivaut avoir
c, x =
b, y . Ceci traduit le fait que x
est solution de (P) et y est solution de (D) (soit encore (y, u = c A y) est
solution de (D)).
211
i=1
, 0, . . . , 0, x1 , . . . , xn
.
f (x, y, u) = u1 , . . . , un
x1
xn # $% &
u1
un
#
$%
&
$%
&
#
Rm
Rn
Rn
A$
A :=
se dcompose en :
x1 , . . . , un
x
1
u1 , . . . , xn
xn
et
un
Im A
(5.32)
Ker A.
u 1
1
= w = 1
w
x 1
1
1
Im(A ) et w Ker (A).
w
w
Mais comme (A) = A , les deux sous-espaces Im(A ) et Ker(A) sont
orthogonaux, do w w1 = 0, cest--dire xi ui = pour tout i = 1, . . . , n.
3 ) Aprs un passage la limite ( 0), on obtient que
Ax = b, x 0
A y + u = c, y 0
x , u
(5.33)
= 0,
?
@
0 =
A(x() x ), y() y = x() x , A (y() y )
(5.34)
=
x() x , u u() .
Par ailleurs
x() x , u() u =
x(), u() (
x , u() +
x(), u ) ,
213
x , u() +
x(), u =
i=1
Divisons les deux membres de la dernire galit ci-dessus par (= x()i u()i
pour tout i = 1, . . . , n) ; il sensuit
n
ui
xi
+
= n.
x()i u()i
(5.35)
i=1
Comme x 0, u 0 et
x , u = 0, on a xi ui = 0 pour tout i, de sorte
que (5.35) se rcrit en
u
x
i
i
+
=n
x()i
u()i
iI
(5.36)
iJ
et
ui
= 1 si i
/ I,
0 u()i
lim
Maximiser y2
y 1
1
(D)
y1 1
y2 1.
(P) et (D) peuvent tre rsolus graphiquement : x = (0, 0, 1) est la seule solution de (P) tandis que {(y1 , 1) | 1 y1 1} est lensemble-solution de (D).
(SO) devient ici :
y1 + u1 = 1,
y1 + u2 = 1, (u1 > 0, u2 > 0, u3 > 0)
y2 + u3 = 1,
x1 u1 = x2 u2 = x3 u3 = .
214
Commentaire : Voir lExercice 4.12 pour une approche analogue dans la rsolution dun problme de minimisation convexe direntiable (moyennant le changement de paramtre = 1/). Comme ici, x() (resp. (y(), u()) est
appel chemin central conduisant une solution de (P) (resp. une solution
de (D)).
Prolongement de lexercice : Dmontrer que, sous les hypothses qui ont
t faites, lensemble {(x, y, u) C0 | f (x, y, u) r} est born pour tout r R.
Cette proprit, combine la continuit de f , dclenche le rsultat dexistence
admis la 2e question.
La proprit particulire de la solution x = (x1 , . . . , xn ) de (P) et des
mise en vidence dans la 3e question, est
variables dcart u1 , . . . , un de (D),
appele de Goldman et Tucker .
215
VI
ENSEMBLES ET FONCTIONS CONVEXES.
PROJECTION SUR UN CONVEXE FERM
Rappels
VI.1. Ensembles convexes
Bien des notions et proprits rappeles ci-aprs ont dj t vues propos
des polydres convexes ferms (rappels du Chapitre 5) ; seuls sont souligns ici les
aspects qui en dirent.
C Rn est dit convexe (ou est un convexe) lorsque x + (1 )x C ds
que x et x sont dans C et ]0, 1[ .
Stabilit de la convexit par certaines oprations sur les ensembles :
Si C1 et C2 sont des convexes de Rn , il en est de mme de C1 + C2 ;
Si C1 est un convexe de Rp et C2 un convexe de Rq , alors C1 C2 est
un convexe de Rp Rq ;
Si (Ci )iI est une collection de convexes, Ci est encore convexe.
iI
218
s, x = r et
s, x r pour tout x C.
Rsultat important : Si C est convexe et si x fr C, alors il y a (au moins) un
hyperplan dappui C en x.
Soit = S Rn . On appelle fonction dappui de S, et on note S , la fonction
S : Rn R {+} dnie de la manire suivante :
d Rn S (d) := sup
s, d .
sS
s, x1
s, x2 pour tout x1 C1 et tout x2 C2 .
Theor`eme de separation (au sens strict). Si C1 est un convexe ferm et C2 un
convexe compact de Rn , et sils sont disjoints, il existe un hyperplan ane qui
les spare strictement, i.e. un vecteur s = 0 de Rn et r R tels que :
x x, c x 0 pour tout c C.
Dans le cas o C est un cne convexe ferm, la caractrisation ci-dessus se
simplie quelque peu : Soit K un cne convexe ferm de Rn et K son cne
polaire ; alors x K est pK (x) si, et seulement si,
x x K et
x x, x = 0.
Une proprit fondamentale de lapplication pC : Rn C Rn est comme
suit :
pC (x1 ) pC (x2 )2
pC (x1 ) pC (x2 ), x1 x2
pour tout x1 et x2 dans Rn .
Il en dcoule notamment :
pC (x1 ) pC (x2 ) x1 x2 pour tout x1 et x2 dans Rn .
220
i=1
Si f : x R+
f (x) est convexe sur R+ , il en est de mme de la
fonction
1
+
.
g : x R g(x) := xf
x
Rfrences. Chapitres III et IV de [12].
(2)
et on le note x1 , x2
"
!
(k) (k)
x . . . x1 , x2 . . . [x1 , x2 ] ,
(k)
(k)
lim x1 = lim x2 = x.
k+
k+
i=1
A(x) = A0 +
xi Ai Sn (R)
i=1
est ane, et C nest autre que limage inverse par cette application du cne
convexe ferm Pn (R) .
Commentaire :
Contrairement ce quon peut imaginer au premier abord, C nest pas
polydrique. On peut aussi dcrire C par la conjonction dingalits polynomiales
en x (tous les mineurs principaux dordre k de A(x), k = 1, . . . , n, doivent tre
positifs).
Le problme doptimisation
6
Min
c, x
(P)
A(x) semi-dnie positive (x C)
est un problme-modle trs gnral ; sy ramnent des problmes classiques doptimisation (optimisation quadratique, de valeurs propres, etc.) ou dingnierie
(thorie et commande des systmes).
222
s, x = r,
s, y r,
s, z r.
Par suite,
0 = r
s, x = [r
s, y] + (1 ) [r
s, z] ,
do
s, y =
s, z = r. Ainsi y et z se trouvent aussi dans H. Mais alors le
caractre extrmal de x dans C H fait que x = y = z. Le point x est donc
extrmal dans C.
En conclusion, C H contient bien des points extrmaux de C.
de Rk .
Puisque x
/ S, on a ncessairement k 2. On peut supposer, sans perte
de gnralit, que 0 < k < 1. Ainsi
k1
i
xi ,
x = k xk + (1 k )
1 k
i=1
o y := xk et z :=
k1
i=1
i
1k xi
/ S). La reprsentation de x
sinon, x = xk , ce qui est impossible vu que x
sous la forme
x = k y + (1 k )z, avec y et z dans C, y = z et 0 < k < 1,
entre alors en contradiction avec le caractre extrmal de x.
223
1
(y + z) avec y et z dans C, y = z.
2
(6.1)
224
dans R2 ,
ajout dans R3
dans R3 , 2 copies de
Figure 15.
Solution :
i=1
i=1
donc
k
i=1
i=1
s, x1
s, x2 pour tout x1 (R
) et tout x2 C2 .
(S)
k
Puisque (R )k est ladhrence de (R
) , lingalit (S) reste vraie pour tout
k
x1 (R ) et tout x2 C2 . Prenons x2 = 0 (qui est dans C2 ) dans cette
ingalit, il sensuit :
s, x1 0 pour tout x1 (R )k ,
do s (R+ )k (daccord ?). Ainsi si 0 pour tout i = 1, . . . , k.
Faisons x1 = 0 dans lingalit (S) (prolonge) ; on a alors :
A k
B
k
si
d, ai =
si ai , d 0 pour tout d K,
s, x2 =
i=1
autrement dit :
k
i=1
si ai K .
i=1
i=1
i ai conv {a1 , . . . , ak } (K ).
i=1
227
Ax, x 0 et
Bx, x 0 pour un certain x de norme 1
est impossible daprs (i).
228
et
(6.2)
(6.3)
En faisant (x1 , x2 ) = (0, 0) dans (6.3), il vient que r > 0. De plus, comme
(tx1 , tx2 ) R R+ ds que (x1 , x2 ) R R+ et avec t > 0 arbitrairement
grand, il rsulte de (6.3) : s1 0, s2 0.
Figure 17.
Bx, x <
s2
ce qui est contraire lhypothse faite sur B.
Par suite,
s2
r
pour tout (x1 , x2 ) C,
x1 + x2 >
s1
s1
soit encore
Ax, x +
r
s2
Bx, x >
pour tout x de norme 1.
s1
s1
229
Remarque :
Curieusement, lquivalence ne stend pas au cas de plus de deux matrices
symtriques. Soient A, B1 , . . . , Bm des lments de Sn (R) : alors
(i) (
B1 x, x 0, . . . ,
Bm x, x 0 et x = 0) (
Ax, x > 0)
et
(ii) Il existe 1 0, . . . , m 0 tels que A 1 B1 . . . m Bm soit dnie
positive
ne sont pas des assertions quivalentes ; seule [(ii) (i)] a lieu.
Par une technique similaire celle utilise dans lExercice (on spare (au
2
sens large) C et (R
) ), on dmontre le rsultat parent suivant : Soient A et B
deux lments de Sn (R) ; alors
(i) max {
Ax, x,
Bx, x} 0 pour tout x Rn
quivaut
(ii) Il existe 1 0 et 2 0, non tous deux nuls, tels que 1 A + 2 B soit
semi-dnie positive.
Solution : A convA, B convB, et (convA) (convB) est convexe (produit cartsien de deux convexes). Par consquent, conv(A B) (convA)
(convB).
Dmontrons linclusion rciproque. Soient u convA et v convB ; alors
il existe
(1 , . . . , p ) dans le simplexe-unit de Rp ,
i ai , v =
i=1
Do
(u, v) =
j bj .
(6.5)
i j (ai , bj ).
(6.6)
j=1
q
p
i=1 j=1
230
i=1
j=1
Il rsulte donc de (6.6) que (u, v) est bien dans conv(A B).
i ai +
i=1
Comme
p
i=1
i =
q
j bj .
(6.7)
j=1
j=1
u+v =
q
p
i j (ai + bj ).
(6.8)
i=1 j=1
unit de Rpq . Il en rsulte avec (6.8) que u + v est bien dans conv(A + B).
(ii) Ds quil y a une enveloppe convexe ferme en jeu, il faut penser
loutil fonction dappui .
conv(A + B) est un convexe ferm dont la fonction dappui est celle de
A + B, soit
(6.9)
d Rn A+B (d) = sup
a + b, d .
aA
bB
231
(6.10)
bB
, (rappel :
2i
(daccord ?).
i=1
M n pour tout M 1 .
1 est donc born : cest un convexe compact de Sn (R).
2 ) Montrons que 1 est lenveloppe convexe des xx , o x est de norme 1 :
(6.11)
1 = conv xx | x = 1 .
232
Figure 18.
Daprs lexpression (6.11) de 1 , les points extrmaux de 1 gurent ncessairement parmi les matrices de la forme xx , o x = 1.
Rciproquement, soit xx avec x = 1 et montrons quil sagit dun
point extrmal de 1 . Supposons que lon ait la dcomposition
xx = M + (1 )N,
(6.13)
]0, 1[ ,
M et N dans 1 ,
et montrons que cela conduit ncessairement xx = M = N.
En faisant le produit scalaire ,
avec xx dans chaque membre de
la 1re ligne de (6.13), on obtient
1 =
M x, x + (1 )
N x, x .
(6.14)
233
Comme
M x, x 1 (M ) 1 (1 (M ) dsignant la plus grande valeur propre de M ) et
N x, x 1 (N ) 1, il vient de (6.14) que
1 (M ) = 1 (N ) = 1.
Puisque les valeurs propres de M (et de N ) sont positives et de somme
gale 1, la seule possibilit pour M (et N ) est dtre de rang 1, M = uu
avec u = 1 (et N = vv , avec v = 1). Avec la 1re ligne de (6.13), on
conclut ensuite xx = uu = vv .
Commentaire :
On aurait pu aussi dmontrer que 1 est lensemble des matrices de la forme
U diag(1 , . . . , n )U , o U est orthogonale et (1 , . . . , n ) dans le simplexe-unit
n de Rn . La recherche des points extrmaux de 1 revient alors celle des points
extrmaux de n .
Consquence sur la formulation variationnelle usuelle de la plus grande valeur
propre dune matrice symtrique relle : Soient A Sn (R) et 1 (A) sa plus grande
valeur propre ; alors
1 (A) = max {
Ax, x | x = 1} (classique, cf. Exercice III.4)
@@
??
|x=1
= max
A, xx
= max {
A, M | M 1 } .
5
4
Prendre le max de
Pour dmontrer ce rsultat, on commence par montrer que m est lensemble des matrices de la forme U diag(1 , . . . , n )U , o U est orthogonale et
(1 , . . . , n ) dans le polydre convexe compact m suivant :
6
m :=
(1 , . . . , n ) Rn |0 i 1 pour tout i = 1, . . . , n
et
;
i = m .
i=1
M, A
M m
se trouve tre
A m (A) = somme des m plus grandes valeurs propres de A.
Cette formulation variationnelle est due Ky Fan (1949).
*** Exercice VI.13. Soit K(Rn ) lensemble des compacts non vides de Rn .
1 ) Soient A, B, C dans K(Rn ). Montrer que :
(A + B = A + C) (conv B = conv C).
2 ) Soit B arbitraire dans K(Rn ). Montrer que :
n(conv B) + B = n(conv B) + conv B.
Montrer sur un exemple que ce rsultat ne saurait tre vrai avec, au lieu de
n, un coecient strictement infrieur n.
3 ) Dduire de ce qui prcde : Si B et C sont dans K(Rn ),
+
)
+
)
B et C sont
A K(Rn ),
.
(A + B = A + C) (B = C)
convexes
Solution : 1 ) Les fonctions dappui A , B et C de A, B et C sont des
fonctions convexes partout nies sur Rn ; lgalit A + B = A + C implique en
termes de fonctions dappui :
A + B = A + C ,
235
1
n+1
; sans perte de
n+1
1
1
x1 + 1
x1 +
i xi
c=
n+1
n+1
i=2
1
n
x1 +
n+1
n+1
n+1
o (1 , . . . , n+1 ) n+1 .
i xi ,
i=1
Par consquent,
(n + 1)c = x1 + n
)n+1
+
i xi
ext C + nC.
i=1
(1 , . . . , n ) Rn |
;
i 1 et i 0 pour tout i .
i=1
xi .
i=1
dim LC (x) =
i=1
avec :
xi convAi pour tout i,
/ Ai } n (cest le thorme de Shapley et Folkman).
Card {i | xi
On suppose que xi0 int(convAi0 ) pour un certain i0 . Que peut-on dire des
autres xi ?
238
= (1 , . . . , k ) | i 0 pour tout i,
;
i = 1 .
i=1
i=1
i bi .
i=1
k
i bi , =
i=1
(6.15)
i=1
i = 1.
x0 + LC (x0 ) est un sous-espace ane, do a(FC (x0 )) x0 + LC (x0 ).
241
(6.16)
ou encore
A : FC (x0 ) FA(C) (y0 )
est injective et, par consquent, la dimension de LC (x0 ) est infrieure la
dimension de LA(C) (y0 ).
Illustration : A est la projection orthogonale de R3 sur R2 .
Figure 19.
conv
) k
+
Ai
i=1
conv Ai .
i=1
i=1
243
(6.17)
i=1
Par suite,
Card {i | dim LconvAi (xi ) 1} n.
(6.18)
Figure 20.
244
i + di 0 pour tout i = 1, . . . , k.
(6.20)
En bref,
(d = (d1 , . . . , dk ) Lk ())
di = 0
i=1
Limplication inverse est facile vrier. En dnitive, Lk () est le sousespace vectoriel dquation
6
di = 0 pour tout i tel que i = 0,
d1 + . . . + dk = 0,
ce qui implique
dim Lk () = n() 1.
b) On prend C = k . Avec A : Rk Rn dnie par A() :=
k
i bi ,
i=1
i bi
i=1
Soit y un tat qui peut tre atteint en utilisant une squence de contrles
admissibles. Daprs le rsultat de la 5e question, il existe u = (u(0), . . . , u(T ))
dans U (0) . . . U (T ) tel que
dim LU (0)...U (T ) (u) dim LA(C) (y),
soit
k=0
Par consquent,
Card {k | u(k) nest pas extrmal dans U (k)} n.
(v) f (x), pT (C,x) (f (x)) 0.
Solution : On rappelle la caractrisation suivante de llment pD (x) :
x D et
x x
, y x
0 pour tout y D) .
(
x = pD (x)) (
Dans le cas particulier o lon projette sur un cne convexe ferm K,
K et
x x
, x
= 0) .
(
x = pK (x)) (x x
[(i) (ii)]. De la dnition mme de f (x) et de lingalit f (x)
f (x) +
f (x), x x valable pour tout x Rn , il vient :
x C minimise f sur C
f (x), x x 0 pour tout x C.
(6.21)
(6.22)
soit encore
(6.23)
u pT (C,x) (u), pT (C,x) (u) = 0,
soit
(6.24)
f (x), pT (C,x) (f (x)) 0,
cest--dire, daprs (6.24),
pT (C,x) (f (x)) 2 = 0,
ce qui quivaut (iv).
247
Solution : Il sagit de montrer lquivalence des deux inquations variationnelles gurant dans les caractrisations (i) et (ii).
Figure 21.
c cx , x c = c cx 2 +
x cx , c cx .
Limplication voulue sensuit.
[(ii) (i)]. Pour t ]0, 1[ soit
c(t) := cx + t(c cx ) ;
observant que c(t) C, on a :
t
c cx , x cx t2 c cx 2 0.
En divisant par t, puis en faisant tendre t vers 0, on trouve lingalit
de (i).
(6.25)
249
Commentaire :
Plus gnralement, si A : Rn Rn est un oprateur (pas ncessairement un
gradient), la recherche de x C vriant
250
Solution : 1 ) On a :
xS
x PS (x) et
.
x x 2 x c 2 pour tout c S
1
c x 2 pour tout c S et t ]0, 1].
t
(6.26)
Figure 22.
2 ) Soit x
PS (x + t(x x)), 0 t < 1, et montrons que x
= x ncessairement.
Daprs la caractrisation (ii) de la 1re question,
, c x
x + t(x x) x
1
cx
2 pour tout c S.
2
251
1
xx
2 .
2
Or x PS (x), do
x x, c x
1
c x 2 pour tout c S,
2
x
et par consquent
x x, x
1
2
x
x 2 .
x
x 2 0, do x
= x.
En dnitive, (1t)
2
La signication gomtrique de ce rsultat est claire : si xt := x + t(x x)
est un point du segment [x, x[, lintersection de S et de la boule ferme centre
en xt et de rayon xt x est rduite {x} .
3 ) Contrairement au cas convexe, langle de x x et c x, c S, nest
pas ncessairement obtus : on a simplement une majoration de
x x, c x
par 12 c x 2 . De plus, lorsque t > 1, xt := x + t(x x) ne se projette
pas ncessairement en x. En clair, on ne peut laisser t + dans lingalit (6.26) .
Commentaire :
Les rsultats ci-dessus stendent sans dicult au cadre hilbertien. La
grande dirence est que lorsque S est un ferm de lespace de Hilbert de dimension innie H, on nest pas assur davoir PS (x) = . Notons toutefois les
rsultats suivants :
{x H | PS (x) = } est dense dans H,
{x H | PS (x) est un singleton} est dense dans H.
Depuis Bunt (1934), on sait que si S est un ferm de Rn tel que PS (x) soit
un singleton pour tout x Rn , alors S est convexe. La mme question, pose
dans un cadre hilbertien gnral, reste sans rponse complte ce jour.
** Exercice
ferms de Rn
E VI.20. Soient {Ck } une suite dcroissante de convexes
n
et C := Ck suppos non vide. Montrer que pour tout x R :
k
quand k +.
252
Solution :
Puisque C Ck , pCk (x) est lment du compact B :=
{u | u x dC (x)} .
Considrons une sous-suite de {pCk (x)} qui converge vers u B, donc telle
que u x dC (x).
Nous disons que u Ck pour tout k. En eet, si ce ntait pas le cas, si
u
/ Ck0 pour un certain k0 , alors, en raison de la dcroissance de
E{Ck } , u ne
pourrait pas tre limite dune sous-suite de {pCk (x)} . Donc u Ck = C, de
k
2 e partie
Soit f : Rn R continment direntiable.
1 ) Rappeler, sous ses direntes formes quivalentes, la condition de minimalit du 1er ordre ncessairement vrie en x lorsque x est un minimum local
de f sur C.
2 ) Considrons gx : R+ R dnie par gx (t) := f [pC (x tf (x))].
(i) Montrer que la drive droite de gx en 0 existe et vaut
pT (C,x) (f (x)) 2 .
(ii) Vrier que la drive droite de gx en 0 est strictement ngative
lorsque x ne vrie pas la condition de minimalit du 1er ordre rappele la 1re
question.
3 ) On propose lalgorithme suivant (dit du gradient projet) :
x0 C, xk+1 := pC (xk tk f (xk )),
o tk est choisi minimisant gxk : t R+ gxk (t) := f [pC (xk tf (xk ))] sur
R+ (on suppose quun tel tk existe).
Dmontrer que toute limite dune sous-suite convergente de {xk } est un
point x de C vriant la condition ncessaire de minimalit du 1er ordre.
Solution : 1re partie
1 ) Daprs la caractrisation de u = pD (u) pour dirents D et u (qui est,
rappelons-le : u D et
u, u u 0 pour tout D), on a :
C x
et
x + tv C i .e. v
(x + tv = pC (x + td))
(x + td) (x + tv), c (x + tv) 0
pour tout c C
cx
2
(i.e., t d v, t v 0 pour tout c C) ;
,
cx
C x
et d v,
v 0 pour tout c C .
v = p Cx (d) v
t
t
t
Donc :
pC (x + td) x
= p Cx (d).
t
t
y x
:= 1
=
avec
y
2 ) a) Si 0 < t1 < t2 et y C, yx
t2
t1
Par consquent, (C x)/t2 (C x)/t1 .
254
t1
t2
x+
t1
t2 y
C.
b)
(C x) = T (C, x).
>0
c) (i) vk = p Cx (d) =
tk
pC (x+tk d)x
tk
1
tk
, de sorte que (C x)
Cx
tk ;
do :
d vk , u vk 0 (puisque vk = p Cx (d)).
tk
(f pC )(x + td) (f pC )(x)
t0+ f (x), pT (C,x) (d) .
t
255
(gx )+ (0) = f (x), pT (C,x) (f (x)) = pT (C,x) (f (x)) 2 .
(ii) Lorsque x ne vrie pas lune des conditions quivalentes du 1 ), on a
(gx )+ (0) < 0 comme cela est clair daprs lexpression de (gx )+ (0) ci-dessus.
3 ) Par construction : xk C et f (xk+1 ) f (xk ) pour tout k.
Soit {xkn }, extraite de {xk } , convergeant vers x (x C ncessairement).
Raisonnons par labsurde et supposons que pT (C,x) (f (x)) 2 < 0.
Si t minimise t gx (t) := f [pC (x tf (x))] sur R+ , t > 0 ncessairement et gx (t) < gx (0) = f (x).
Ainsi, pour n assez grand,
f [pC (xkn tf (xkn ))] < f (x).
(6.27)
Do la contradiction.
Donc pT (C,x) (f (x)) = 0, ce qui est une des formes de la condition du
1er ordre ncessairement vrie par un minimum local x de f sur C.
256
z = x + y, x K, y K , et
x, y = 0 ;
x = pK (z), y = pK (z).
A, B := trace de AB ; K est le
cne des matrices (symtriques) semi-dnies positives ; llment dcomposer
est un lment quelconque de Sn (R).
(matrice diagonale dont les lments diagonaux sont les valeurs propres (relles) de Z).
+
X := diag (+
1 , . . . , n ) , Y := diag (1 , . . . , n ) .
Commentaire : Lopration de projection sur un convexe ferm ainsi que la dcomposition de Moreau, dont quelques proprits ou exemples font lobjet des
exercices prcdents, prennent toute leur importance dans le contexte des espaces
de Hilbert rels (espaces fonctionnels de rfrence dans ltude de problmes variationnels).
ui xi +
iI0 (x)
u = (u1 , . . . , un ) N (C, x) ;
(6.28)
iI1 (x)
ui x
i +
iI0 (x)
ui (
xi 1) 0 pour tout x
= (
x1 , . . . , x
n ) {0, 1}n ; (6.30)
iI1 (x)
iI0 (x)
u+
i +
u
i =0 ;
(6.31)
iI1 (x)
ui 0 si i I0 (x) et ui 0 si i I1 (x).
(6.32)
iI1 (x)
Puisque u+
i et ui sont toujours positifs ou nuls, avoir (6.31) signie :
u+
i = 0 pour tout i I0 (x) et ui = 0 pour tout i I1 (x) ; cest-dire (6.32) .
1 si j = i,
= (
x1 , . . . , x
n ) dni par x
j := 1 si j I1 (x),
Si i I0 (x), posons x
0 sinon.
ui x
i +
ui (
xi 1) = ui 0 daprs (6.30) .
Alors
iI0 (x)
iI1 (x)
dni par
De manire
similaire, si i I1 (x), posons x
6
0 si j {i} I0 (x),
x
j :=
1 sinon.
Daprs (6.30) , ui 0.
Il est bon de visualiser ces rsultats avec les points extrmaux de [0, 1]2 ou
[0, 1]3 .
3 ) x C est un minimum de f sur C si, et seulement si, loppos de
f (x) est dans N (C, x). Dans le cas o x {0, 1}n , cela se traduit donc par :
f
(x) 0 pour tout i I0 (x)
xi
et
f
(x) 0 pour tout i I1 (x).
xi
Commentaire :
Un exemple typique est avec f : x x a 2 , o dsigne la norme
euclidienne usuelle de Rn et a Rn ; alors le point de C le plus loign de a est
ncessairement un point extrmal de C.
Prolongement. Soit C un compact non vide de Rn (que lon peut prendre
convexe sans perte de gnralit) ; on suppose que pour tout a Rn , il ny a quun
point qui soit le plus loign de a dans C. Montrer que C est ncessairement rduit
un point. H h...
xx ,
xt := (1 t)x + tx.
et
f (x u) < f (x)
f (x + u) < f (x).
o les ck sont des rels positifs et les aik des rels quelconques (ventuellement
< 0).
Des problmes dingnierie, de gnie chimique notamment, conduisent des
problmes de minimisation du type :
Min f0 (x)
x
( rel > 0)
(P)
fi (x) pour i = 1, . . . , m,
o les fonctions f0 , f1 , . . . , fm sont du type (G).
Montrer que, grce un changement de variables adquat, (P) peut tre
transform en un problme de minimisation convexe qui lui est quivalent.
Solution : Posons yi = ln xi (i = 1, . . . , n), de manire quune fonction f de
la forme (G) se transforme en
p
n
y1
yn
ck eak ,y ,
y = (y1 , . . . , yn ) R g(y) := f (e , . . . , e ) =
k=1
,y
x S.
(P) on associe le problme doptimisation suivant, paramtr par R :
6
Minimiser g(x) h(x)
(P )
x S.
1 ) Montrer que la fonction () := minxS {g(x) h(x)} est
concave, continue, strictement dcroissante, et que lquation () = 0 a une
seule solution.
2 ) Montrer :
si x est solution de (P), alors := f (x) vrie () = 0 ;
si () = 0, alors tout x S tel que f (x) = est solution de (P).
3 ) On suppose : S convexe, g convexe positive sur S, h concave sur S.
Quelles mthodes peut-on prconiser pour approcher dune manire itrative la
valeur optimale dans (P) ?
Solution : 1 ) La fonction est linmum de la famille de fonctions anes
ax : R g(x) h(x), indexe par x S ; elle est donc concave sur R.
La fonction (, x) (, x) := g(x) h(x) tant continue et S compact, la fonction () = minxS (, x) est continue (ceci est ais
vrier).
Prenons 1 < 2 et considrons une solution x1 de (P1 ) ; alors
(1 ) = g(x1 ) 1 h(x1 ) > g(x1 ) 2 h(x1 ) (car h(x1 ) > 0)
min {g(x) 2 h(x)} =: (2 ).
xS
262
g(x)
et
h(x)
g(x0 )
< ; il sensuit que ( ) < 0 et (+ ) > 0.
h(x0 )
Il existe donc un seul tel que () = 0.
2 ) Soit x une solution de (P). On a :
x S,
g(x)
g(x)
=: ,
h(x)
h(x)
do
min {g(x) h(x)} 0, g(x) h(x) = 0,
xS
soit () = 0.
Rciproquement, soit R tel que () = minxS {g(x) h(x)} = 0 et
considrons x S tel que g(x) h(x) = 0, i.e. = f (x). Alors :
x S, g(x) h(x) g(x) h(x) = 0,
soit encore :
x S,
g(x)
g(x)
=
,
h(x)
h(x)
263
n
) n +
p
i
i=1
.
qi
I (p, q)
n
i=1
qi
i=1
On dnit
:
R par
:= x( x1 ).
(i) est-elle convexe ?
(ii) Comment se comparent I et I ?
2 )
R+
(x)
I dans les cas suivants : (t) =
3 ) Donner
2les expressions de et
t ln t, (1 t) , t avec > 1, (t 1)2 , | t 1 | .
+ ) R dnie par f (x, y) := y x . Il
Solution : 1 ) Soit f : (R+
)
(R
nous sut de vrier que f est convexe. cet eet, prenons (x, y) et (u, v)
dans (R+ ) (R+ ) et 0 < < 1. En notant = 1 , la convexit de
implique
y x
v u
x + u
=
+
y + v
y + v y
y + v v
u
x
y
v
+
.
y
v
y + v
y + v
Aprs multiplication par y + v, on obtient
u
x
x + u
y
+ v
,
(y + v)
y
v
y + v
ce qui est lingalit de convexit (sur
nf ) cherche.
n
ti xi
ti (xi ), faisons ti =
Dans lingalit de Jensen
qi
n
i=1
, xi =
qi
pi
qi .
i=1
i=1
2 ) (i) Oui. Cest un rsultat classique sur les fonctions convexes de la variable relle (rappel en dbut de chapitre), mais qui est aussi une consquence
de ce qui a t dmontr au-dessus.
(ii) I (p, q) = I (q, p).
3 ) I (p, q) est une sorte de mesure de proximit entre p et q ; elle joue un
rle important lorsque
1 , . . . , pn ) et q = (q1 , . . . , qn ) sont des distribup = (p
tions de probabilit ( pi = qi = 1) notamment.
i
264
n
pi ln
i=1
(t) = (1
pi
qi .
n
(pi ) (qi )1 .
i=1
1
t
2, I (p, q) =
n
i=1
n
(pi qi )2
.
qi
| pi q i | .
i=1
** Exercice VI.29.
Sur lesprance mathmatique de linverse dune matrice
alatoire
1
Si X est une variable alatoire strictement positive, E X1 E(X)
pourvu
1
que E(X) et E X existent. Dans cet exercice, on propose une gnralisation
de cette proprit au cas matriciel.
On dsigne par matrice alatoire une matrice A dont les coecients aij
sont des variables alatoires. Lorsque les aij sont intgrables, on dira que A est
intgrable et on posera E(A) := [E(aij )]1i,jn .
Soit A une matrice carre alatoire telle que, presque srement, A() =
[aij ()]1i,jn soit relle, symtrique et dnie positive ; on suppose que A et
A1 sont intgrables. On se propose de dmontrer que E(A1 ) [E(A)]1 .
1re approche
1 ) Soient U et V deux matrices relles symtriques dnies positives de
taille n, et c un lment de Rn . On dnit f : [0, 1] R comme suit :
t [0, 1], f (t) := [(1 t)U + tV ]1 c, c .
Montrer que f est continue sur [0,1] et deux fois drivable sur ]0,1[. En dduire
que f est convexe.
2 ) En dduire :
t [0, 1], [(1 t)U + tV ]1 ! (1 t)U 1 + tV 1 .
3 ) Montrer alors, laide de lingalit de Jensen,
E A1 c, c [E(A)]1 c, c .
265
2 e approche
4 ) On pose () := A() E(A). tablir
E(A1 ) = [E(A)]1 + [E(A)]1 E(A1 )[E(A)]1 .
5 ) Vrier que [E(A)]1 E(A1 )[E(A)]1 est semi-dnie positive. En
dduire lingalit E(A1 ) [E(A)]1 .
I := t R | (1 t)U + tV Pn (R)
est un intervalle ouvert de R contenant [0,1].
On peut voir f comme la compose des applications suivantes :
1
t I 1 (t) := (1 t)U + tV
M Pn (R) 2 (M ) := M 1
A Pn (R) 3 (A) :=
Ac, c .
1 est une fonction ane, donc de classe C , et 1 (t) = V U pour tout
t I.
2 est galement une fonction de classe C , et sa direntielle premire
en M est donne par
H D2 (M )(H) = M 1 HM 1 .
3 est linaire (continue), donc de classe C , et D3 (A) = 3 en tout A.
Par suite, f = 3 2 1 est C sur I [0, 1] et, pour tout t I,
[(1 t)U + tV ]1 c, c .
266
= 2 [(1 t)U + tV ]1 v, v .
Do f (t) 0 puisque [(1 t)U + tV ]1 est symtrique dnie positive.
f est bien convexe sur I.
2 ) Lingalit de convexit (de base) relative f conduit :
t [0, 1], [(1 t)U + tV ]1 c, c [(1 t)U 1 + tV 1 ]c, c ,
et ce pour tout c Rn . Do lingalit annonce.
3 ) De par les rsultats des questions prcdentes, lapplication F :
E A1 ()c, c [E(A)]1 c, c ,
soit
2 e approche
4 ) ()A1 ()() = A() + E(A)A1 ()E(A) 2E(A),
do :
E[()A1 ()()] = E(A) + E(A)E(A1 )E(A)
et
*** Exercice VI.30. Soit Pn (R) le cne convexe ouvert des matrices symtriques
x Rn , A Pn (R), f (x, A) := A1 x, x
(
, tant le produit scalaire usuel sur Rn ).
Lapplication f est-elle convexe ?
267
A
x,
x
1A x,
convexit de (x, A) A x, x comme fonction du couple (x, A) qui est
prouve ici.
Soit tout dabord A := diag(a1 , . . . , an ), B := diag(b1 , . . . , bn ), avec les
ai et bi strictement positifs et ]0, 1[. Alors :
f (x + (1 )y, A + (1 )B) =
n
(xi + (1 )yi )2
ai + (1 )bi
n
y2
x2
=
i + (1 ) i (1 )(bi xi ai yi )2
ai
bi
i=1
n
yi2
x2i
+ (1 )
= f (x, A) + (1 )f (y, B).
ai
bi
i=1
i=1
f (x, A) = A1 x, x = QT A1 Q1 Qx, Qx
@
?
= (QAQ )1 Qx, Qx = f (Qx, QAQ ) ;
donc
f (x, A) + (1 )f (y, B) f (x + (1 )y, A + (1 )B)
= f (Qx, QAQ ) + (1 )f (Qy, QBQ )
= f (Qx + (1 )Qy, QAQ + (1 )QBQ ),
0 daprs le rsultat du 1er point.
f (x), x x = 0 et f (
268
(6.34)
Comme
x), x x
=
H(x x
), x x
,
0 =
f (x) f (
) = 0 ncessairement.
et que H est symtrique semi-dnie positive, H(x x
x) = 0 daprs lvaluation (6.35) .
Do f (x) f (
2 ) Lensemble des points minimisant f sur C est
=
b, x et A
x = Ax} .
C {
x Rn |
b, x
269
VII
INITIATION AU CALCUL
SOUS-DIFFRENTIEL
ET DE TRANSFORMES
DE LEGENDRE-FENCHEL
Rappels
Les fonctions f : Rn R {+} qui seront considres, quelles soient
convexes ou non, vrieront au minimum les deux proprits suivantes :
;
Il y a un point au moins en lequel f est nie ;
.
(7.1)
Il existe une fonction ane minorant f sur Rn
Pour de telles fonctions f , on appelle domaine de f lensemble des x en
lesquels f prend une valeur nie (dom f := {x Rn | f (x) < +}), et pigraphe de f lensemble des (x, r) Rn R au-dessus du graphe de f
(epi f := {(x, r) Rn R | f (x) r}). Si lingalit est stricte dans la dnition
de epi f , on parlera de lpigraphe strict de f , et on notera epis f cet ensemble.
Rn
(7.2)
1
x 2 si x S, +, sinon ;
2
alors,
(fS ) : s Rn (fS ) (s) =
(7.3)
1
s 2 d2S (s) ,
2
o dS dsigne la fonction-distance S.
Notation : 0 (Rn ) dsigne lensemble des f : Rn R {+} qui sont
convexes semi-continues infrieurement sur Rn et nies en au moins un point
de Rn . On a dja signal que f 0 (Rn ) ds que f vrie (7.1).
(7.4)
inf
x1 +x2 =x
Alors dom(f1 f2 ) = dom(f1 ) + dom(f2 ) et epis (f1 f2 ) = epis (f1 ) + epis (f2 ).
La conjugue de f1 f2 est f1 + f2 , et ce sans aucune hypothse additionnelle sur
f1 et f2 .
Soient deux fonctions f1 et f2 de 0 (Rn ) telles que les intrieurs relatifs
de leurs domaines se coupent (i.e., ir(dom f1 ) et ir(dom f2 ) ont un point en
commun) ; alors la conjugue de f1 + f2 est f1 f2 et cette inf-convolution est
exacte, cest--dire : si s domf1 f2 , il existe (s1 , s2 ) dom f1 dom f2 tel
que s = s1 + s2 et f1 f2 (s) = f1 (s1 ) + f2 (s2 ).
Si f 0 (Rn ), la fonction f := (f ) nest autre que f. La transformation
f f est en fait une involution de 0 (Rn ).
(7.5)
f (x ) f (x) + s, x x pour tout x Rn .
La dnition stend sans dicult aux f dnies sur un espace euclidien
(E,
, ).
Lensemble des sous-gradients de f en x est appel sous-direntiel de f en x
et not par le graphisme f (x).
Une caractrisation des s f (x), venant immdiatement de (7.5), est comme
suit :
(s f (x)) (f (s) + f (x)
s, x = 0) ;
273
t0+
f (x + td) f (x)
,
t
appele drive directionnelle de f en x. En consquence, f 0 (Rn ) est direntiable en x int(dom f ) si et seulement si f (x) est un singleton (cest--dire
quil ny a quun sous-gradient de f en x) ; auquel cas f (x) = {f (x)} .
Soit f 0 (Rn ) ; alors : (s f (x)) (x f (s)).
Ceci est rsum symboliquement sous la forme f = (f )1 .
Soit f : Rn R strictement convexe, deux fois direntiable et 1-coercive
sur Rn . Supposons de plus que 2 f (x) soit dnie positive pour tout x Rn .
Alors f jouit des mmes proprits et le calcul direntiel sur f partir de celui
sur f sopre comme suit :
f (s) = (f )1 (s),
1
2 f (s) = 2 f ((f )1 (s))
.
(7.6)
(7.7)
fi (x) ,
(7.8)
( max fi )(x) = conv
i=1,...,k
iI(x)
6n+1
i=1
i f (xi ) | x =
n+1
i xi , i 0 pour tout i
i=1
et
n+1
;
i = 1 ;
i=1
n+1
i xi et (conv f )(x) =
i=1
n+1
i f (xi ).
i=1
k
i si = 0.
i=1
>
0, . . . , k
>
0, tels que
k
i si
0, et
i=1
Commentaire : Pour visualiser ces conditions (Pi ), il est conseill de reprsenter graphiquement la fonction x maxi=1,...,k
si , x ainsi que le cne normal
son pigraphe en lorigine (de Rn+1 ).
276
[(P2 ) (P1 )]. Il est clair que (P2 ) implique lgalit (pour tout x)
i
si , x = 0. Sil existait x tel que maxi=1,...,k
si , x < 0, on aurait (sa-
i=1
k
i
si , x < 0. Do contradiction.
i=1
k
i si .
i=1
c p0 , 0 p0 =
p0 , p0 c 0 pour tout c L(k ).
Cest notamment le cas pour c = si , i = 1, . . . , k. Do
si , p0
p0 , p0 = p0 2 < 0,
ce qui induit maxi=1,...,k
si , p0 < 0. Do contradiction avec (P1 ).
2 ) Les deux propositions (P3 ) et (P4 ) sont quivalentes.
[(P4 ) (P3 )]. Supposons quil existe x = 0 tel que maxi=1,...,k
si , x 0
et montrons quon arrive une contradiction. Comme
0=
A k
B
i si , x
i=1
i
si , x
i=1
si , x = 0 pour tout i = 1, . . . , k.
277
s, x =
i
si , x
i=1
lon peut prendre les i tous strictement positifs. Dsignons par K le cne
convexe engendr par les vecteurs si , cest--dire
;
6 k
ti si | ti 0 pour tout i = 1, . . . , k .
K :=
i=1
Nous savons que K est ferm (cf. Exercice V.12). Considrons prsent la
k
si sur (le cne convexe ferm) K ; cette projection est de la
projection de
forme
k
i=1
i=1
si
ti si K (cne polaire de K)
i=1
i=1
et
B
A k
k
k
si
ti s i ,
ti si = 0.
i=1
i=1
i=1
i=1
278
k
(1 + ti )si = 0. Do le
i=1
rsultat escompt.
Commentaire : Des exemples simples montrent quon ne peut se contenter de
i 0 pour tout i dans (P4 ), et quon ne peut se dispenser de lhypothse
vect{s1 , . . . , sk } = Rn .
Prolongement de lexercice : Montrer que (P4 ) quivaut aussi
cne {s1 , , sk } = Rn .
** Exercice VII.2. Soit f 0 (R) telle que f (t) = f (t) pour tout t R.
Rassembler toutes les proprits possibles de f , notamment celles concernant f
et f.
Solution : Le domaine de f est un intervalle symtrique :
si 0 t dom f, [t, +t] dom f.
0 dom f et minimise f sur R. En eet, puisque f est paire et convexe
1
f (0) [f (t) + f (t)] = f (t) pour tout t R.
2
f est galement paire.
279
Figure 24.
280
0 si 1 s +1,
1
2 (|
s | 1)2 si | s | > 1.
* Exercice VII.5. Soit A Sn (R) dnie positive. Montrer, laide dun simple
calcul de conjugue de fonction convexe, lingalit suivante
A + A1 2In .
Solution : Soit f
: x Rn f (x) :=
f (s) = 12 A1 s, s .
Lingalit de Fenchel indique :
1
2
Ax, x . Alors f : s Rn
x Rn , s Rn ,
Ax, x + A1 s, s 2
x, s .
En faisant x = s, on trouve lingalit demande.
s R,
Ainsi, lapplication fa,c est une bijection de ]c a, c+ a[ sur R dont la bijec ) . Pour ce qui est de la drive seconde, nous sommes dans
tion inverse est (fa,c
) par la formule suivante :
les conditions o nous pouvons relier fa,c et (fa,c
1
, o x = as(1 + s2 )1/2 + c.
) (s) =
s R, (fa,c
fa,c (x)
Notons aussi sur cet exemple le comportement suivant :
(s) I (s) = cs pour
Lorsque a 0, fa,c (x) I{c} (x) pour tout x, et fa,c
{c}
tout s.
qm,0 := I{m} .
Calculer (qm, ) .
En dduire qm, qm , .
282
(s) = 1 2 s2 + ms.
Solution : qm,
: s R qm,
2
Par suite,
Analyse convexe
addition de rels
inmum de rels
multiplication de rels
addition de rels
convolution
inf-convolution
transformation de Fourier
(fonctions caractristiques)
transformation de Legendre-Fenchel
(fonctions conjugues)
+x .
f (s) = sup sx x ln x
2
x0
283
f (s) =
1
[l(es )]2 + l(es ).
2
* Exercice VII.10. Soit f 0 (Rn ) majore sur Rn . Que peut-on dire dune
telle fonction ?
Solution : Elle est ncessairement constante. En eet, de lingalit
f (x) M pour tout x Rn ,
on tire f I{0} M (fonction qui vaut partout + sauf en 0 o elle vaut
M ).
Par consquent, f = I{0} C pour un certain C R, do f = f C.
** Exercice VII.11. Soient f et g dans 0 (Rn ) telles que f + g soit une fonction
ane sur Rn . Montrer que f et g sont ncessairement anes sur Rn .
Indication. Calculer (f + g) .
Solution : Soient s Rn et r R tels que f + g =
s, + r. De cette galit,
il vient que f et g sont partout nies sur Rn et donc continues sur Rn . Par
conjugaison, il sensuit :
(f + g) = f g = I{s} r.
Comme dom (f g ) = dom f + dom g et epis (f g ) = epis f + epis g ,
la seule possibilit pour vrier la relation au-dessus est davoir :
f = I{s1 } r1 , g = I{s2 } r2 , s = s1 + s2 , r = r1 + r2 .
Do
284
f = (f ) =
s1 , r1 et g = (g ) =
s2 , r2 .
Donc
1
2
s, d 0 (resp.
s, d 0).
b) Soit x ir C, s f (x) et x C. Il vient tout dabord :
f (s) + f (x)
s, x = 0.
Or x x V, do
s, x x = 0 daprs le rsultat du point prcdent.
Comme f (x ) = f (x), il vient
286
(7.11)
(7.12)
r(x xr ) f (xr ).
c) En crivant les conditions de minimalit pour le problme de minimisation
dnissant fr (x), montrer que :
I + 1r f est une multi-application surjective de Rn dans Rn ;
1
(x) = xr.
x Rn , I + 1r f
(7.13)
(7.15)
287
(7.16)
(7.17)
.
/
1
1
2
2
f (xk+1 ) + xk+1 xk = minn f (u) + xk u .
uR
2
2
(7.19)
La fonction fr est une fonction convexe de Rn dans R, donc localement lipschitzienne sur Rn ; alors lunique lment r(xxr ) de fr (x) dnit la direntielle (au sens de Frchet) de fr en x comme suit : h Rn
r(x xr ), h .
Ainsi fr (x) = r(x xr ).
c) Le point xr est caractris par la condition suivante :
r
0 f + x 2 (xr ),
2
ce qui revient
0 f (xr ) + r(xr x) (condition dj rencontre en (7.19)),
1
(7.20)
I + f (xr ).
r
Daprs ce qui a t vu plus haut, pour tout x Rn , llment xr , solution
de lquation multivoque (7.20) , est dni de faon unique.
En consquence :
la multi-application I + 1r f est surjective (i.e., I + 1r f (Rn ) = Rn ) ;
linverse de la multi-application I + 1r f est en fait univoque ; il dnit
xr prcisment :
1
1
n
(x).
(7.21)
x R , xr = I + f
r
ou encore
s, u + + x u 2 = u +
2
2
r
2 r
2
Il sensuit :
s
s 2
+
s, x + .
xr = x , fr (x) =
r
r
On peut aussi calculer4(immdiatement)
xr grce (7.21) .
5
b) fr (x) = inf uC 2r x u 2 = r2 d2C (x), o dC dsigne la fonctiondistance C.
Quant xr , ce nest autre que la projection de x sur C : xr = pC (x).
c) Comme f (u) = {Au} pour tout u, il est ais de dterminer xr
via (7.21) :
A 1
(x).
xr = I +
r
290
Axr , xr + x xr 2
2
2
'
(
1
A 1
A 1
=
Ar x, x , o Ar := A I +
=r I I+
.
2
r
r
fr (x) =
(7.22)
u R ,
g(u), u u + f (u) f (u) 0.
(7.23)
Avec g : u g(u) = r2 u x 2 , elles donnent prcisment les conditions (7.14) et (7.15) attendues.
La premire condition, cest--dire (7.22), a dj t vue puisquelle est
quivalente
g(xr ) = r(x xr ) f (xr ).
Seule la condition (7.15), traduction de (7.23), a un caractre nouveau.
Si lon considre lexemple b) de la question prcdente, on obtient :
(7.24)
(7.25)
(7.26)
do
xr yr x y .
Donc lapplication x xr est monotone et lipschitzienne de rapport 1.
291
b) On a :
(x xr ) (y yr )2 = (x y) (xr yr ) 2
= x y 2 + xr yr 2 2
x y, xr yr
x y 2 daprs (7.26) .
Lapplication x fr (x) = r(xxr ) est ainsi lipschitzienne de rapport r.
c) Puisque r(y yr ) fr (y), on a lingalit
fr (x) fr (y) r
y yr , x y .
En retranchant r
x xr , x y aux deux membres, on obtient :
fr (x) fr (y) r
x xr , x y r x y 2 + r
x y, xr yr
r x y 2 ,
soit encore
fr (y) fr (x) r
x xr , y x r x y 2 .
Une autre mthode consisterait utiliser la proprit de Lipschitz de fr
dans un dveloppement de Taylor-Lagrange (ou Taylor avec reste sous forme
dintgrale) du 1er ordre de fr .
5 ) a) Comme cela a dj t dit, fr : Rn R est convexe, donc localement
lipschitzienne sur Rn . Comme
fr (x) f (xr ) infn f (x),
xR
Rn
ds que f lest.
1
s 2 .
b) La conjugue Nr de Nr est s Rn Nr (s) = 2r
s Rn , fr (s) = f (s) +
1
s 2 .
2r
En particulier
fr (0)
concide avec
f (0)
(7.27)
1
s0 2 1 s0
1
0
f (x)
xr x +
x 2 + x 2 +
r
2
r
2 r
2
r
Ensuite
x+
f (x) = +.
a) La
5 f, sa semi-continuit et sa coercivit font que f >
4 convexit de
et que x | f (x) = f est un convexe compact non vide de Rn .
b) Par dnition mme de xk+1 , on a :
1
xk+1 xk 2 f (xk ).
2
La suite {f (xk )} est videmment dcroissante (et borne infrieurement
par f ).
Consquences :
f (xk+1 ) +
f (xk ) f quand k +.
(7.28)
(7.30)
Consquences
5
4 :
;
La suite xk x 2 est dcroissante, donc convergente
4
5
2
2
xk+1 x xk x k+ 0 (la suite xk x 2 tant
convergente) ;
xk+1 xk k+ 0 (cela rsulte de (7.30)).
Revenons prsent la suite {f (xk )} .
Comme f est convexe, on a
f = f (x) f (xk+1 ) + f (xk+1 , x xk+1 ).
294
(7.31)
1
2
xk u 2 ,
f (xk+1 , x xk+1 ) +
xk+1 xk , x xk+1 0.
(7.32)
k+
Do on tire grce (7.31) : lim f (xk ) . Ce qui, avec (7.28), nous permet
k+
** Exercice VII.16. Soit f : Rn R convexe et de classe C 2 sur Rn . Montrer que lapplication c : Rn Rn dnie par c(p) := p + f (p) est un C 1 diomorphisme de Rn sur lui-mme.
Indication. Pour dmontrer le caractre bijectif de c, on pourra minimiser la fonction g : u Rn g(u) := f (u) + 12 u x 2 , o x Rn est donn.
Solution : c est bijective. Pour x donn, considrons
g : u g(u) = f (u) +
1
2
u x 2 .
La fonction f tant convexe, elle est minore par une fonction ane : il
existe s0 Rn et 0 R tels que f (u)
s0 , u + 0 pour tout u Rn .
Par consquent,
1
g(u)
s0 , u + 0 + u x 2
2
1
1
x 2
+ 0 ,
u + s0 x 2 s0 x 2 +
2
2
2
do on dduit :
lim
u+
sur Rn . Il
Caractre C 1 de c1 . La direntielle de c en x est reprsente par la matrice jacobienne Jc(x) qui vaut ici In +2 f (x). Comme 2 f (x) est symtrique
semi-dnie positive, Jc(x) a un dterminant suprieur dt In = 1. Daprs
le thorme dinversion locale, c1 = p est C 1 sur Rn avec
Jp(x) = [Jc(p(x))]1 pour tout x Rn .
Autrement dit :
1
pour tout x Rn .
Jp(x) = In + 2 f (p(x))
!
fr (x) = r In In +
pr (x) = In +
296
f
r
1
(x).
2 f (pr (x))
r
"1
2 f (p
!
r (x))
In +
2 f (pr (x))
r
"1
** Exercice VII.18. Soit f : Rn R convexe (mais pas ncessairement direntiable). On dsigne par f (x) le sous-direntiel de f en x.
Soient x Rn et y < f (x) ; on dsigne par (x, y) la projection de (x, y) sur
lpigraphe de f.
Vrier que y = f (x) et y < f (x).
Montrer que
xx
f (x).
f (x) y
Solution : Rn R est structur en espace euclidien grce au produit scalaire
(x, r), (x , r ) Rn+1 := x, x Rn + rr .
Lpigraphe de f , epi f := {(x, r) Rn R | f (x) r}, est ici un convexe
ferm de Rn R. Il peut tre vu comme lensemble de sous-niveau (ou tranche)
de la fonction g : (x, r) g(x, r) := f (x) r au niveau 0, i.e.,
epi f = {(x, r) Rn R | g(x, r) 0} .
Comme g est une fonction convexe (continue) et quil existe (x0 , r0 )
Rn R tel que g(x0 , r0 ) < 0 (hypothse de Slater donc), on a :
int(epi f ) = {(x, r) | g(x, r) < 0} = epi f \ gr f,
fr(epi f ) = {(x, r) | g(x, r) = 0} = gr f.
Par hypothse, (x, y)
/ epi f ; la projection (x, y) de (x, y) sur epi f se
trouve donc sur la frontire de epi f , do f (x) = y.
Llment (x, f (x)), projection de (x, y) sur epi f , est solution de linquation variationnelle suivante :
(7.33)
Il sensuit :
y f (x) 0 (sinon on arrive une contradiction dans (7.33) en prenant
(u, v + ) epi f et en faisant +) ;
y < f (x) en fait (sinon, avec y = f (x), lingalit (7.33) indique que
Cette dernire ingalit, crite pour tous les (u, f (u)), u Rn , conduit :
,
xx
,u x
pour tout u Rn ,
f (u) f (x) +
f (x) y
cest--dire
xx
f (x)y
f (x).
Figure 25.
, (rappel :
S, X f (X)} .
XE
tr X
1
In 2 pour tout X E. En dduire
1 ) Vrier que f (X) = X
n
n
que f est convexe sur E.
2 ) a) Montrer que le supremum de la fonction X
S, X f (X) sur
E est ni et atteint si, et seulement si, tr S = 0.
En dduire f (S) lorsque tr S = 0.
b) Montrer que f (S) = + si tr S = 0.
298
Indication. La dcomposition E = V V , o V = {X E | tr X = 0} et V =
RIn , peut tre utile dans lorganisation des calculs.
Solution : 1 ) En utilisant la rgle de calcul
M N 2 = M 2 + N 2 2
M, N ,
on obtient
tr X
In
X
n
=X +
tr X
n
2
In 2
2
(tr X)2 .
n
Comme In 2 =
In , In = tr(In2 ) = n, il vient
2
tr X 2
tr X
In
= X 2
.
X
n
n
Do lexpression annonce de f (X).
Lapplication X E X trnX In E est ane, la fonction U E
1
2
n U R est convexe ; par consquent la compose des deux, qui nest
autre que f , est convexe.
2 ) a) La fonction g : X E g(X) :=
nS
2 .
En
f (S) =
quand
k +.
, (rappel :
(7.34)
(7.35)
SE
(1 (S), . . . , n (S)) f (1 (M ), . . . , n (M ))
et il existe
(7.36)
U M U = diag (1 (M ), . . . , n (M ))
(7.37)
ln(xi ) si
i=1
x = (x1 , . . . , xn ) Rn f (x) := x > 0 pour tout i = 1, . . . , n ;
i
+ sinon.
Indication. Pour dmontrer lingalit dans (7.35) et dmontrer (7.36), on
pourra utiliser le rsultat suivant : pour M et S dans E,
tr(SM ) =
i (SM )
i=1
i (S)i (M ),
i=1
sup
(x1 ,...,xn )
6 n
;
si xi f (x1 , . . . , xn ) . (7.38)
i=1
n
n
si xi =
s(i) x(i) , f (x1 , . . . , xn ) =
Si est une permutation de {1, . . . , n},
i=1
i=1
4
5
f (x(1) , . . . , x(n) ), et (x(1) , . . . , x(n) )|(x1 , . . . , xn ) Rn = Rn ; il est ainsi
clair, partir de (7.38), que
SE
SE
SE
sup
(s1 ,...,sn )Rn
6 n
;
i (M )si f (s1 , . . . , sn ) .
i=1
i=1
f (1 (M ), . . . , n (M )) = Vf (M ).
Consquences de (7.35)
(7.35) exprime que Vf est la conjugue de Vf ; donc Vf 0 (E).
Par ailleurs, f tant son tour une fonction de 0 (Rn ) symtrique,
Vf 0 (E). Il sensuit (Vf ) = (Vf ) = Vf .
302
2 )
Fonctions de 0 (Rn )
symtriques
Vf (M ) = plus grande
valeur propre de M.
ln xi si
f (x1 , ..., xn ) =
i=1
+ sinon.
) n
+
1/xi si
1/
f (x1 , ..., xn ) =
i=1
+ sinon.
ln(dt M ) si M est
dnie positive,
Vf (M ) =
+ sinon.
1/tr(M ) si M est
dnie positive,
Vf (M ) =
+ sinon.
3 ) a) Nous avons :
S Vf (M )
S, M = Vf (M ) + (Vf ) (S)
= Vf (M ) + Vf (S) (daprs la 1re question).
Or :
lingalit (de Fenchel)
f (1 (M ), . . . , n (M )) + f (1 (S), . . . , n (S))
i (M )i (S)
i=1
S, M = tr(SM )
n
i (S)i (M ).
i=1
303
Il sensuit :
S Vf (M )
f (1 (M ), . . . , n (M )) + f (1 (S), . . . , n (S))
i (M )i (S)
=
i=1
et
i (M )i (S).
tr(SM ) =
i=1
La
1re
304
i=1
Dtermination de la conjugue
Le calcul de f est ais, de6par la structure dcompose de f :
ln x si x > 0
la conjugue de : x
est
+ sinon
6
1 + ln 1s si s < 0,
: s
+ sinon ;
do
n
1
n +
ln
si si < 0 pour tout i,
si
f : s = (s1 , . . . , sn ) f (s) =
i=1
+ sinon.
Il sensuit :
n ln(dt S) si S
+ sinon.
Calcul direntiel
f est direntiable en (1 (M ), . . . , n (M )) lorsque i (M ) > 0 pour tout i,
cest--dire lorsque M est dnie positive. Alors, la rgle de calcul tablie
en (7.37) conduit retrouver le rsultat
Vf (M ) = M 1 .
(7.39)
il est intressant de savoir que la rciproque est vraie : toute fonction convexe V
sur E (vriant (7.39) est de la forme Vf .
Pour les fonctions de valeurs propres du type Vf , le calcul de la conjugue et
du sous-direntiel reviennent ceux plus simples du calcul de la conjugue
et du sous-direntiel de f.
Le rsultat (7.37) est quelque peu curieux : lexpression de Vf (M ) ne
dpend pas de la matrice orthogonale U ayant servi diagonaliser M .
305
(7.40)
Commentaire : Les exemples traits dans lexercice montrent que 1 (C) nest
pas ncessairement polydral lorsque C lest.
Prolongement de lexercice : Montrer que M est un point extrmal de 1 (C)
si, et seulement si, (1 (M ), . . . , n (M )) est un point extrmal de C.
306
Figure 26.
307
Supposons que (conv f1 ) (x0 ) > (conv g1 ) (x0 ) et arrivons une contradiction. Nous avons :
si x x0 ,
g1 (x) f1 (x) (conv f1 )(x) (conv f1 )(x0 ) + (conv f1 ) (x0 )(x x0 )
et, daprs le rsultat de la 1re tape (appliqu h := g1 , a := (conv f1 ) (x0 )
et b := (conv f1 )(x0 )), il vient que (conv f1 )(x0 ) < ( conv g1 )(x0 ).
si x x0 ,
f1 (x) g1 (x) (conv g1 )(x) ( conv g1 )(x0 ) + (conv g1 ) (x0 )(x x0 )
et, toujours daprs le rsultat de la 1re tape (appliqu h := f1 , a :=
(conv g1 ) (x0 ) et b := (conv g1 )(x0 )), il vient que (conv g1 )(x0 ) < (conv f1 )(x0 ).
i=1
i=1
i=1
Posons x :=
k
i=1
g(x) := f (x) +
s, x x est une minorante ane de f , concidant avec f en x.
Nous disons que g concide avec f en tous les xi , i = 1, . . . , k. Si ce ntait
pas le cas, nous aurions
g(x) =
k
i=1
i g(xi ) <
i f (xi ) = f (x),
i=1
do contradiction.
309
k
i xi ,
i=1
)
f
+
i xi
i=1
k
i=1
k
i=1
g
f
) k
i=1
) k
+
i xi
i xi
(puisque g minore f ),
i=1
do f (x) = g(x).
f (x) = + si x
/ C. La fonction conv f est-elle alors direntiable sur C ?
Solution : Non. Voici un contre-exemple. Soit C le polydre convexe compact de R2 de sommets (1,0), (1,2), (0,3), (1,2) et (1,0) ; soit f : (1 , 2 )
R2 f (1 , 2 ) := 1 12 si (1 , 2 ) C, + sinon. Alors conv f nest pas
direntiable sur le segment L joignant (1,2) (1,2).
Figure 27.
310
lexercice ci-dessus est continue sur C (puisque conv f est convexe et C est le
domaine de conv f ), mais il peut arriver quelle ne soit pas continue en des points
de la frontire de C.
n+1
i=1
i xi
et (conv fS )(x) =
fS (xi ).
i >0
311
Figure 28.
fS (1) = (conv fs )(1) = 1, 32 = {s se projetant sur S en 1} .
En x = 32 , PS (x) = {1, 2} et fS (x) = [1, 2].
Dans le 2e exemple, lensemble S de R2 est comme suit :
Figure 29.
Remarque : Dans le cadre plus gnral o S est un ferm non vide dun espace
de Hilbert, on montre facilement linclusion PS (x) fS (x), x H, de sorte que
conv PS (x) fS (x). Mais lorsque H est de dimension innie, cette inclusion peut
tre stricte. Toutefois, bien des proprits de la multi-application x PS (x), la
monotonie par exemple, se dduisent des proprits de x fS (x) grce cette
inclusion.
312
o
1 ) Comment trouver une dcomposition de f sous la forme f = g h,
(H1 )
xk+1 xk 2 < +.
k=0
d) Montrer que si x
est limite dune suite extraite de la suite {xk }, alors x
est un point T-critique de (P).
e) Soit : t (t) := f [txk+1 + (1 t)xk ]. En supposant xk+1 = xk ,
montrer que est strictement dcroissante sur [0,1]. En dduire que f (xk+1 ) <
f (xk ).
4 ) On considre le problme (Q) suivant (dans Rn+1 ) :
6
Minimiser g(x) y
(Q)
sous la contrainte : (x, y) Rn R, h(x) y.
tablir les relations existant entre les solutions et valeurs optimales de (P)
et celles de (Q).
313
Donc il existe d Rn tel que g (x, d)h (x, d) = f (x, d) < 0, ce qui contredit la condition (f (x, d) 0 pour tout d Rn ) satisfaite en tout minimum
(mme local) de f.
3 ) Choisir xk+1 de sorte que sk g(xk+1 ) revient choisir xk+1 minimisant x g(x)
sk , x sur Rn .
314
c
xk xk+1 2
2
(7.41)
(7.42)
c+d
xk xk+1 2 .
2
(7.43)
h(xk+1 ) h(xk ) +
sk , xk+1 xk +
(d tant un module de forte convexit de h).
En additionnant (7.41) et (7.42), on obtient :
g(xk ) h(xk ) g(xk+1 ) h(xk+1 ) +
La suite {f (xk ) = g(xk ) h(xk )}k est bien dcroissante. Elle est minore
par f := inf xRn f (x).
b) Puisque f (xk ) f (x0 ) pour tout k et que {x | f (x) f (x0 )} est born
par hypothse, la suite {xk } est borne.
Comme limage dun born par h est un born et que sk h(xk ), la
suite {sk } est galement borne.
c) On tire de (7.43) :
do
+
c+d
2
K1
k=0
xk+1 xk 2 < +.
k=0
Il sensuit :
c
2 2 ,
x
1 x
2
d
h(
x2 ) h(
1 x
x1 ) +
s1 , x
2 x
1 + x
2 2 ,
2
x2 ) +
s2 , x
1 x
2 +
g(
x1 ) g(
2 = (t2 t1 ) x
k x
k+1 > 0,
do, puisque x
1 x
x1 ) h(
x1 ) g(
x2 ) + h(
x2 ) >
s2 s1 , x
1 x
2 .
(t1 ) (t2 ) = g(
(7.44)
Mais
1 x
2 =
sk s2 , x
2 x
1 +
s1 sk , x
2 x
1
s2 s1 , x
(7.45)
et
1 = (t2 t1 )(xk+1 xk ),
x
2 x
2 = (1 t2 )(xk+1 xk ),
xk+1 x
do :
1 =
x
2 x
t2 t1
(xk+1 x
2 ),
1 t2
x
1 xk = t1 (xk+1 xk ), do
x
2 x
1 =
t2 t1
(
x1 xk ).
t1
s2 s1 , x
t2 t1
t2 t1
sk s2 , xk+1 x
2 +
s1 sk , x
1 xk .
1 t2
t1
Or
x2 )) (
sk s2 , xk+1 x
2 0) ,
(sk g(xk+1 ), s2 g(
x1 )) (
s1 sk , x
1 xk 0) ,
(sk h(xk ), s1 h(
2 0, et (7.44) permet de conclure (t2 ) < (t1 ).
do
s2 s1 , x1 x
En particulier (1) < (0), soit f (xk+1 ) < f (xk ).
4 ) (Q) est quivalent (P) au sens suivant :
si (x, y) est solution de (Q), alors x est solution de (P) et y = h(x) ;
si x est solution de (P), alors (x, h(x)) est solution de (Q).
316
Commentaire :
Un problme analogue (Q) est le problme (R) suivant (toujours dans
Rn+1 ) :
6
Maximiser h(x) y
(R)
sous la contrainte : (x, y) Rn R, g(x) y.
Alors, (R) est quivalent (P) au sens suivant :
si (x, y) est solution de (R), alors x est solution de (P) et y = g(x) ;
si x est solution de (P), alors (x, g(x)) est solution de (R).
(Q) et (R) ressemblent des problmes de minimisation convexe, mais lune
des convexits (dans la dnition de la contrainte ou dans la fonction-objectif)
est rebours .
Lassociation de f := h g f = g h se trouve fort productive
quant la comparaison de points T-critiques, de valeurs optimales, etc. ; en plus,
direntes dcompositions de f en g h donnent lieu dirents f .
*** Exercice VII.28. Soit f 0 (Rn ), soit 0 (Rn ) vriant les hypothses
suivantes :
(x)
= +.
(7.46)
est nie en 0 ; lim
x+ x
On se propose dans cet exercice de donner des formes explicites de solutions
dquations aux drives partielles (dites de Hamilton-Jacobi ) suivantes :
f (y) si (y) + s 0,
+ sinon.
n
si t > 0,
inf uR f (u) + t t
n
F : (x, t) R R F (x, t) := f (x) si t = 0,
+ si t < 0.
317
(7.47)
(7.48)
F + 1 x F 2 = 0,
t
2
lim F (, t) = F (, 0) = f.
(7.49)
t0+
9
F + 1 + F 2 = 0,
x
t
limt0+ F (, t) = F (, 0) = f.
(7.50)
{
y, x + st f (y)} .
sup
y Rn
(y) + s 0
Il sensuit :
Si t < 0, H (x, t) = + (pour voir cela, faire s dans (7.51)).
Si t = 0, H (x, t) = supyRn {
y, x f (y)}
= f (x) = f (x) (car f 0 (Rn )).
Si t > 0, H (x, t) = supyRn {
y, x t (y) f (y)} = (f + t ) (x).
Mais la fonction ayant t suppose 1-coercive sur Rn (cest la deuxime
partie de lhypothse (7.46)), sa conjugue est partout nie. Nous sommes
donc (largement) dans les hypothses assurant que
(f + t ) = (f ) (t ) .
Or f = f et (t ) : x Rn t xt = t xt . En conclusion :
Si t > 0, H (x, t) = [f t( t )](x).
(7.52)
Il sensuit :
/
.
F (x, t) sup
x, y f (y) t infn (y)
yRn
yR
t0+
de plus
F (x, t) = H1 (x z, t u) + H2 (z, u) ;
(7.53)
(7.54)
(7.55)
(7.56)
(7.57)
,z
.
H2 (z, t) =
t
t
t
t
De par la relation (7.55), on a toujours :
H1 (x z, 0) = f (x z) R.
Ces informations permettent de conclure avec (7.57) :
que F (x, t) est rduit un seul lment, cest--dire F est direntiable
en (x, t) ;
que x F (x, t) = zt et
z 1 ?
z @
F
(x, t) =
,z .
t
t
t
t
320
do nalement :
z
t
z @
z
1?
, z =
,
t
t
t
F
(x, t) = (x F (x, t)).
t
Avec =
x u2
f (u) +
2t
;
.
(7.58)
9
1 + 2 , on a
9
(x) = 1 x2 si x 1, + sinon.
:xR
n
inf
uxt
f (u)
t2
x u
/
.
(7.59)
t
321
SOURCES
Martinez-Legaz ; 6.27 : W. Dinkelbach ; 6.28 : I. Csiszr et A. Ben-Tal, A. BenIsrael et M. Teboulle ; 6.29 (2 ) : S. K. Mitra ; 6.30 : G. Letac ; 6.31 : O.L. Mangasarian ; 7.1 : RMS, M. Volle ; 7.3 : F. Flores ; 7.8 : J.-P. Quadrat ; 7.9 : J.M.
Borwein ; 7.13 : L. Thibault ; 7.14 : O. Mangasarian et C. Gonzaga ; 7.15 : J.-J.
Moreau et B. Martinet ; 7.19 : A. Seeger ; 7.20-7.21 : A. Lewis ; 7.23 : J.-C. Rochet
et J. Benoist ; 7.27 : J. Toland et C. Michelot ; 7.28 : Ph. Plazanet.
Peuvent tre considrs comme des grands classiques du domaine les exercices suivants : 1.4, 1.9, 1.13, 1.16, 1.18, 2.1, 2.7, 2.8, 2.10, 3.4, 3.16, 4.7, 4.9, 5.6,
5.12, 5.13, 5.18, 6.3, 6.4, 6.5, 6.10, 6.11, 6.17, 7.3, 7.12, 7.15.
324
RFRENCES GNRALES
[15] J.-B. Hiriart-Urruty et Y. Plusquellec, Exercices dAlgbre linaire et bilinaire, CEPADUES-ditions (1988).
[16] R.A. Horn and C.R. Johnson, Matrix analysis, Cambridge University Press
(r-impression de 1992).
[17] B. Lemaire et C. lemaire-Misonne, Programmation linaire sur microordinateur, Collection Mthode + Programmes, Masson (1988).
[18] D.G. Luenberger, Linear and nonlinear programming, Addison-Wesley,
2e dition (1984).
[19] M. Minoux, Programmation mathmatique : Thorie et Algorithmes, Vol. I,
Dunod (1983).
[20] C. Roos, T. Terlaky and J-Ph. Vial, Theory and algorithms for linear optimization: an interior point approach, J. Wiley (1997).
[21] Roseaux (nom collectif), Exercices et problmes rsolus de Recherche Oprationnelle, Tome III, Masson (1985).
[22] M. Sakarovitch, Optimisation combinatoire. Graphes et Programmation linaire, Herman (1984).
[23] A. Schrijver, Theory of linear and integer programming, J. Wiley (1987).
[24] J. Teghem, Programmation linaire, collection Statistique et Mathmatiques
Appliques, ditions de lUniversit de Bruxelles et ditions Ellipses (1996).
[25] S.J. Wright, Primal-dual interior point methods, SIAM Publications (1997).
[26] [21], [22] et [24] contiennent de nombreux exemples simples et des illustrations ; elles intgrent la Programmation linaire dans un domaine plus vaste,
rpertori sous le vocable de Recherche Oprationnelle .
[27] Description et analyse des principales mthodes de rsolution numrique
des problmes de programmation linaire reposant sur lalgorithme du simplexe, ainsi que les programmes ncessaires leur mise en uvre sur microordinateur.
[28] [CS] Trs complets sur la question ; de vritables Bibles . Longtemps domine par les algorithmes du type mthode du simplexe , la rsolution
numrique des programmes linaires a subi un vritable rvolution avec lapport de N. Karmarkar (1984). Les techniques du type points intrieurs
(cf. lExercice V.25 pour une ide) commencent prendre place dans les
formations du niveau 2e cycle : voir le chapitre 4 de [8] et les chapitres XIII
et XIV de [24] par exemple. La 4e partie de [4] et les ouvrages [20] et [25]
sont consacrs pour lessentiel ces nouvelles approches.
326
NOTICE HISTORIQUE
Bien des noms (Euler, Lagrange, Legendre, Lipschitz, etc.) ont t rencontrs dans
dautres contextes par ltudiant-lecteur. Nous voquons ici ceux cits dans ce recueil
et/ou ayant marqu les dveloppements modernes de lOptimisation et de lAnalyse
convexe.
K. ARROW, L. HURWICZ et H. UZAWA. Associs deux par deux ou tous
les trois, ce sont guids par des problmes dorigine conomique que ces conomistesmathmaticiens ont publi ou dit les mthodes algorithmiques portant prsent leurs
noms. Lconomie mathmatique a beaucoup interagi avec lOptimisation, et ce ds le
dbut des annes cinquante. Notons dailleurs que beaucoup de laurats du Prix Nobel
dconomie (instaur en 1969) ont eu des activits trs mathmatises : R. Frisch
(18951973, norvgien, Prix Nobel en 1969) proposa en 1954 un type de pnalisation
intrieure (ou de fonction-barrire) pour la programmation linaire, K. Arrow (1921,
amricain, Prix Nobel en 1972), L.V. Kantorovitch (19121986, russe, Prix Nobel en
1975), J.F. Nash (1928, amricain, Prix Nobel en 1994), sans oublier G. Debreu (1921
2004, dorigine franaise, Prix Nobel en 1983).
R. BAIRE (18741932) est un mathmaticien franais dont la priode active ainsi que la
carrire universitaire furent rduites une douzaine dannes par des maladies nerveuses
qui lont conduit la mort. Il a enrichi lAnalyse de notions fondamentales, par exemple
la semicontinuit qui savre essentielle dans les rsultats dexistence dans un problme
doptimisation (cf. Exercice II.1).
G. BIRKHOFF (19111996). Garret de son prnom, il est souvent confondu avec
George Birkho son pre ; tous les deux sont des mathmaticiens amricains de renom qui
furent longtemps professeurs luniversit de Harvard aux tats-Unis. Un des rsultats
les plus connus de Garret Birkho est celui qui dit que les sommets de lensemble des
matrices bistochastiques sont les matrices de permutation (1946), cf. Exercice V.11,
dont les applications en gomtrie convexe sont importantes.
C. CARATHODORY (18731950). Mathmaticien allemand dorigine grecque. Le
lecteur-tudiant a rencontr ou rencontrera son nom dans des domaines tels que la Thorie
de la mesure et le Calcul des variations. Un de ses fameux thormes est : Si S est une
partie dun espace vectoriel de dimension n, tout point de lenveloppe convexe de S est
combinaison dune partie nie de S de cardinal au plus n + 1 (cf. Chapitre VI).
A.L. CHOLESKY (18751918). Peu dtudiants en Analyse numrique savent que
Cholesky nest pas un obscur polonais mais bel et bien un ingnieur militaire franais
originaire de la rgion Poitou-Charentes. Cest dans le but dapplications la godsie
que Cholesky tudie la rsolution de systmes dquations linaires et introduit la factorisation qui porte son nom. Le procd du commandant Cholesky fut publi de manire
posthume en 1924 dans le Bulletin godsique de Toulouse. Nimporte quel cours dAnalyse numrique matricielle, nimporte o dans le monde, fait rfrence la factorisation
de Cholesky ; comme quoi, rien ne sert de... il faut publier point. quand le nom de
Cholesky sur le site du Futuroscope ?
I. EKELAND (1944). Mathmaticien franais, professeur retrait de lUniversit de
Paris IX Dauphine. Ses travaux portent sur les problmes variationnels, la commande
optimale et lconomie mathmatique. Sa condition ncessaire doptimalit pour solutions
approches dun problme doptimisation, tablie dans un contexte despace mtrique
complet (1974) (cf. Exercice II.3 pour une version simplie), est devenue un outil classique de lAnalyse variationnelle. I. Ekeland est galement auteur de plusieurs ouvrages
de popularisation des mathmatiques.
(KY) FAN (1914). Mathmaticien amricain dorigine chinoise. Arriv comme boursier Paris en 1939 avec tout viatique le plan du mtro de Paris (comme il le raconte
lui-mme) et un grand dsir de faire des mathmatiques, Ky Fan obtient son doctorat
en 1941 sous la direction de M. Frchet. Aprs tre rest en France jusquen 1945 puis
occup ensuite plusieurs postes aux tats-Unis, il sinstalle Santa Barbara (Californie)
en 1965 ; retrait, il y est toujours. Le champ dactivits de Ky Fan a t trs vaste :
thorie des oprateurs, analyse convexe et ingalits, analyse matricielle (avec des ingalits trs nes sur les valeurs propres), topologie et thormes de point xe. On lui
doit un des tous premiers thormes de mini-maximisation (cf. Chapitre IV) et une formulation variationnelle de la somme des m plus grandes valeurs propres dune matrice
symtrique (cf. Exercice VI.12). Ky Fan est docteur honoris causa de luniversit de Paris
IX-Dauphine (1990).
G. FARKAS (18471930). Mathmaticien hongrois qui a contribu la thorie de la
Physique ; dans ce domaine, les plus connus sont ses rsultats en Mcanique et Thermodynamique. La premire preuve (complte et correcte) de son thorme sur les ingalits
linaires homognes (cf. Chapitre V) fut publie en 1898.
W. FENCHEL (19051988), J.-J. MOREAU (1923) et R.T. ROCKAFELLAR
(1935). Le dveloppement de lAnalyse convexe moderne doit beaucoup ces trois personnes. W. Fenchel, mathmaticien danois dorigine allemande avait une approche trs
gomtrique de la convexit ; J.-J. Moreau ( ne pas confondre avec lactrice de cinma de
mme nom) est un mathmaticien-mcanicien de Montpellier qui, selon ses dires, appliquait la Mcanique aux Mathmatiques . R.T. Rockafellar est un mathmaticien amricain dont les racines sont (huguenotes) franaises ( Rocquefeuille ) comme les nanciers
de noms voisins ; le concept de problme dual a t un des ls directeurs de lapproche
328
Notice historique
de cet auteur. R.T. Rockafellar est docteur honoris causa de luniversit de Montpellier II
(1995).
P. de FERMAT (16011665). Tout le monde en a entendu parler... y compris rcemment. Ses clbres questions dArithmtique ont fait un peu oublier son principe
variationnel en Optique gomtrique (le premier, historiquement, sans doute) et ses implications sur la loi de rfraction de la lumire ; une de ses citations est : La nature
agit toujours par les voies les plus courtes . En 1629, soit treize ans avant la naissance
de Newton, Fermat conut sa mthode De maximis et minimis sappliquant la dtermination des valeurs qui rendent maximum ou minimum une fonction ainsi que celles
des tangentes aux courbes, ce qui revenait poser les fondements du Calcul direntiel.
la Salle des Illustres du Capitole Toulouse (Htel de ville) se trouve une statue de P.
de Fermat avec la mention inventeur du calcul direntiel , et le Guide du Routard
dajouter encore merci ! ( Beaumont-de-Lomagne, village natal de Fermat). Alors,
tudiants-lecteurs, si vous avez des problmes en calcul direntiel, vous savez qui vous
plaindre...
J.W. GIBBS (18391903). Physicien amricain (un phnomne ...) auteur de travaux
trs profonds, en Thermodynamique entre autres. Le rle de la convexication en Thermodynamique a t essentiellement tudi par lui. Dans ses travaux se trouvent aussi les
racines des conditions de KKT (cf. Exercice IV.7). Une de ses citations : Mathematics
is the language of science .
P. GORDAN (18371932). Mathmaticien allemand connu pour ses travaux en Algbre
et Gomtrie. Cf. Exercices VI.8 et VII.1 pour un lemme portant son nom.
L.V. KANTOROVICH (19121986). Mathmaticien russe ayant contribu lAnalyse
applique, lAnalyse fonctionnelle et la Programmation linaire. Bien que de formation
entirement mathmatique, il montra une perception trs pertinente des problmes de nature conomique auxquels il appliqua les techniques mathmatiques. Considr comme un
des pres-fondateurs (avec G. Dantzig (19142005) aux tats-Unis) de la Programmation
linaire, L. Kantorovitch partagea le prix Nobel dEconomie 1975 avec T. Koopmans. De
nature robuste (des collgues lont vu avaler dun trait une bouteille de vodka et plonger
pour traverser un lac la nage), il et nanmoins sourir de svices sous Staline.
W. KARUSH, H. KUHN et A.W. TUCKER. Non, non ce nest pas la 3e ligne de
lquipe de rugby dAustralie que doit rencontrer prochainement le Stade Toulousain...
Alors que la rgle de Lagrange (i.e. conditions doptimalit dans des problmes avec des
contraintes du type galit) tait connue ds le dbut du XIXe sicle, il faut attendre le
milieu du XXe sicle pour quon sintresse (par ncessit) aux conditions doptimalit
dans des problmes avec des contraintes du type ingalit. A.W. Tucker (mathmaticien
amricain dorigine canadienne, rcemment dcd) et son lve H. Kuhn ont publi en
1951 in article fondamental ce sujet. Il sest avr quils avaient t prcds par W.
Karush dans un travail publi en 1948 qui tait pour lessentiel son mmoire de Matrise
de 1938 (tudiants-lecteurs, tous les espoirs vous sont permis !). Il est donc juste dassocier
ces trois noms dans les conditions de KKT (cf. Chapitre III). Une citation : The
KKT theorem provides the single most important tool in modern economic analysis both
from the theoretical and computational point of view (D. Gale, 1967).
329
J. JENSEN (18591925). Mathmaticien danois, autodidacte. Il noccupa aucune position universitaire mais fut longtemps expert dans une compagnie tlphonique de Copenhague. Lingalit de convexit qui porte son nom (cf. Chapitre VI) date de 1906.
La tradition de convexit chez les mathmaticiens scandinaves est commmore par la
amme de la poste danoise ci-dessous.
F. JOHN (19101994) (on trouve souvent crit Fritz John) est aussi un mathmaticien
de ce sicle qui a tabli les conditions qui portent son nom (cf. Chapitre III) en 1948.
Le travail de F. John tait motiv par des questions de nature gomtrique ; les ellipsodes pleins de volume extrmal mis en vidence dans les Exercices III.21 et III.22 sont
dailleurs appels ellipsodes de John (ou de Loewner-John). On doit aussi au mathmaticien dorigine tchque Ch. Loewner (ou K. Lwner) lordre partiel dans Sn (R).
H. MINKOWSKI (18641909). Mathmaticien allemand considr comme le fondateur
de la gomtrie des nombres entiers ; il sest intress aussi la Physique mathmatique
(les fameux espaces de Minkowski de dimension 4) et a, le premier, procd une tude
systmatique de la convexit dans les espaces de dimension nie.
J. (VON) NEUMANN (19031957). Il y a plusieurs mathmaticiens du nom de
Neumann. Celui-ci, Von Neumann (John) est un mathmaticien amricain dorigine hongroise, mort relativement jeune, et qui fut pionnier dans ses ides et recherches en Mathmatiques appliques. Et quand il attaquait un problme, il nenfonait pas des portes
ouvertes ! On lui doit notamment un thorme de mini-maximisation (cf. Chapitre IV).
330
INDEX
H
Hamilton-Jacobi (quations) : VII.28
I
inversion de matrices alatoires : VI.29
inversion de matrices perturbes : I.8
K
Kantorovitch (ingalit) : I.9
L
lagrangien augment : I.18(B), IV.13
logarithme du dterminant : I.13, I.14
logarithmiquement convexe (fonction) : I.15
M
matrices dnies positives : I.10, I.11, I.12
minimum local vs. minimum global : II.5
moindres carrs : I.2 (4 ), II.11
Moreau-Yosida : VII.15, VII.17
N
Newton (direction de) : III.9
normal (cne) : VI.23
P
pnalisation exacte : III.30
pnalisation intrieure (cf. barrire)
pnalisation extrieure : III.29
perturbation dun programme linaire : V.16,
V.17
point extrmal dun convexe : VI.3, VI.4, VI.5,
VI.6, VI.7, VI.12, VI.14, VI.24
point xe : VI.18
point-selle : I.18 (B), IV.1, IV.2, IV.3
polaire (cne) : V.8, V.9, VI.22
projection sur un ensemble non convexe : III.14,
VI.19
projection sur un convexe ferm : VI.15,
VI.16, VI.17, VI.18, VI.20, VI.21,
VII.18
projection sur un hyperplan : III.2
PSB : III.23
332
quasi-convexe : VI.25
quasi-Newton : III.23
R
rgression monotone : III.24
S
sparation de convexes ferms : VI.8, VI.9
Shapley-Folkman : VI.14
sommets dun polydre convexe ferm : V.3, V.4,
V.5, V.6, V.7, V.11, V.14, V.15
sous-direntiel (calcul) : VII.2, VII.3, VII.13,
VII.14, VII.18, VII.20, VII.26
spectrales (fonctions) : VII.20
T
tangent (cne) : III.10, III.11, III.12, III.20,
VI.15