Vous êtes sur la page 1sur 73

CONVEXIT

E ET APPLICATIONS
cours redige par
Rozenn Texier-Picard
picard@bretagne.ens-cachan.fr
Preparation ` a lAgregation
ENS Cachan Bretagne / Universite Rennes 1
1
2
INTRODUCTION
Bien que la notion de convexite soit connue depuis lAntiquite, cest essentiellement au
debut du 20`eme si`ecle que, avec lessor de lanalyse fonctionnelle, la convexite a trouve
de nouvelles applications en analyse.
Dans ce cours, on se limitera ` a des notions assez fondamentales, ` a linterface entre
geometrie, analyse fonctionnelle et analyse. De nombreux livres de geometrie enoncent
les resultats de ce cours, le plus souvent en dimension nie. Lorsque cest possible et
interessant, nous nous poserons la question de la generalisation ` a la dimension innie,
souvent ` a la base de theor`emes importants de lanalyse.
Les sections signalees par une asterisque, plus diciles, peuvent permettre denrichir
une le con sur le sujet avec des applications de haut niveau.
Les resultats enonces pourront notamment etre utilises dans les le cons suivantes :
Fonctions monotones, fonctions convexes, exemples et applications,
Parties convexes, fonctions convexes dune ou plusieurs variables, applications
Barycentres dans un espace ane reel de dimension nie ; convexite. Applications.
mais aussi, entre autres,
Applications dierentiables denies sur un ouvert de R
n
. Exemples et applications.
Probl`emes dextremums.
Continuite et derivabilite des fonctions reelles dune variable reelle. Exemples et
contre-exemples.
Suites et series de fonctions. Exemples et contre-exemples.
Formes lineaires et hyperplans en dimension nie. Exemples et applications.
Probl`emes dangles et de distances en dimension 2 ou 3.
Applications anes. Groupe ane.
Le dernier chapitre est en cours de redaction. Par ailleurs, ces notes contiennent encore
certainement quelques erreurs ou imprecisions. Le lecteur qui en trouvera est prie de les
signaler ` a lauteur par courrier electronique : picard@bretagne.ens-cachan.fr
3
Bibliographie
[1] Dominique Aze, Elements danalyse convexe et variationnelle
[2] Jean-Baptiste Hiriart-Urruty, Claude Lemarechal, Convex Analysis and Minimization
Algorithms I, Springer-Verlag, 1996
[3] Claude Zuily, Herve Queelec, analyse pour lagregation.
[4] Ham Brezis, Analyse fonctionnelle, Theorie et applications
[5] Patrice Tauvel, Geometrie
[6] Marcel Berger, Geometrie, tome 2
[7] Jean-Baptiste Hiriart-Urruty, Optimisation et analyse convexe, Exercices corriges
[8] Gregoire Allaire, Analyse numerique et optimisation
4
Table des mati`eres
1 Parties convexes dun espace ane 7
1.1 Denition et le theor`eme fondamental . . . . . . . . . . . . . . . . . . . . . 7
1.1.1 Denition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.1.2 Theor`eme fondamental de la geometrie ane* . . . . . . . . . . . . 8
1.2 Enveloppe convexe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.2.1 Denitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.2.2 Le theor`eme de Caratheodory . . . . . . . . . . . . . . . . . . . . . 12
1.2.3 Vrai ou faux ? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.3 Jauge dun convexe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.4 Projection sur un convexe ferme, applications . . . . . . . . . . . . . . . . 18
1.4.1 Dimension nie, norme euclidienne . . . . . . . . . . . . . . . . . . 18
1.4.2 le cas de la dimension innie* . . . . . . . . . . . . . . . . . . . . . 19
1.4.3 Application 1 : theor`emes de point xe* . . . . . . . . . . . . . . . 21
1.4.4 Application 2 : le theor`eme de Stampacchia* . . . . . . . . . . . . . 25
1.5 Hahn-Banach et theor`emes de separation . . . . . . . . . . . . . . . . . . . 28
1.5.1 Les theor`emes de separation classiques . . . . . . . . . . . . . . . . 28
1.5.2 Preuve dans le cas hilbertien . . . . . . . . . . . . . . . . . . . . . . 29
1.5.3 Preuve dans le cas dun evn* . . . . . . . . . . . . . . . . . . . . . 29
1.5.4 Autres resultats* . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
1.5.5 Des applications* . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
1.6 Points extremaux et hyperplans dappui . . . . . . . . . . . . . . . . . . . 36
1.6.1 Hyperplans dappui . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
1.6.2 Points extremaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
1.6.3 Exemples et Applications . . . . . . . . . . . . . . . . . . . . . . . 38
1.6.4 Vrai ou faux ? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2 Fonctions convexes 41
2.1 Denitions, premi`eres proprietes . . . . . . . . . . . . . . . . . . . . . . . . 41
2.1.1 Convexite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
2.1.2 Premiers exemples . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
5
2.1.3 Caracterisations et proprietes . . . . . . . . . . . . . . . . . . . . . 44
2.2 Caracterisations dans le cas dierentiable . . . . . . . . . . . . . . . . . . . 46
2.2.1 Encore une caracterisation geometrique . . . . . . . . . . . . . . . . 47
2.2.2 Fonctions monotones . . . . . . . . . . . . . . . . . . . . . . . . . . 48
2.2.3 Encore des exemples . . . . . . . . . . . . . . . . . . . . . . . . . . 50
2.3 Quelques resultats importants sur les fonctions convexes . . . . . . . . . . 54
2.3.1 Inegalites de convexite . . . . . . . . . . . . . . . . . . . . . . . . . 54
2.3.2 Inegalite de Jensen . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
2.3.3 Continuite des fonctions convexes . . . . . . . . . . . . . . . . . . . 56
2.3.4 Derivabilite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
2.4 Probl`emes dextrema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
2.4.1 Existence du minimum, sans hypoth`ese de convexite . . . . . . . . . 62
2.4.2 Existence du minimum - Cas convexe . . . . . . . . . . . . . . . . . 63
2.4.3 Applications . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
2.4.4 Caracterisation du minimum - Cas sans contrainte . . . . . . . . 67
2.4.5 Minimisation sous contraintes dinegalite/egalite . . . . . . . . . . . 69
2.4.6 Condition doptimalite - cas de contraintes convexes . . . . . . . . . 72
6
Chapitre 1
Parties convexes dun espace ane
Dans toute cette partie, E sera un expace vectoriel, de dimension nie ou innie (even-
tuellement un espace ane). On pourra, lorsque cest necessaire, munir E dune topologie
(metrique pour simplier), et on supposera quelle est compatible avec la structure des-
pace vectoriel (i.e. laddition et la multiplication par un scalaire sont continues).
1.1 Denition et le theor`eme fondamental
1.1.1 Denition
Denition 1.1.1 C E est convexe si
x, y C, ]0, 1[, x + (1 )y C.
Exemples (faciles) :
sous-espace ane ;
simplexe de R
k
:
k
= (R
+
)
k
,
k

i=1

i
= 1 ;
Les convexes de R sont les intervalles.
Remarque 1.1.1 une intersection quelconque de convexes est convexe ;
la somme de Minkowski de deux convexes A et B, denie par
A + B = a + b, a A, b B,
est convexe ;
le produit cartesien de deux convexes est convexe.
7
1.1.2 Theor`eme fondamental de la geometrie ane*
Theor`eme 1.1.1 (Theor`eme fondamental de la geometrie ane)
Soit E un espace ane de dimension n 2. Alors
1. toute bijection de E dans E qui envoie un convexe sur un convexe est une bijection
ane ;
2. toute bijection qui envoie trois points alignes sur trois points alignes est ane.
Remarque 1.1.2 Ce resultat est clairement faux en dimension 1, puisque toute appli-
cation continue envoie un convexe sur un convexe.
Preuve. (voir par exemple, Berger t.1 p. 77 ou Bourbaki, Espaces Vectoriels To-
pologiques, exercice 6 p. 183 et Alg`ebre, exercice 7 p. 201.)
On utilisera dans cette preuve le resultat suivant, admis : le seul automorphisme de
corps de R est lidentite. La demonstration se fait en plusieurs etapes.
1. Remarquons dabord que la 2`eme armation implique la premi`ere.
Soit f une bijection veriant les hypoth`eses du point 1, et g = f
1
. Verions que g
envoie trois points alignes sur trois points alignes. Il sut de montrer que
x, y, z E, tels que z [x, y], g(z) [g(x), g(y)],
Le segment [g(x), g(y)] est convexe, donc son image f([g(x), g(y)]) lest. Or cette
image contient x = f(g(x)) et y = f(g(y)) donc elle contient le segment [x, y]. En
particulier, elle contient z = f(g(z)). Il en decoule que g(z) [g(x), g(y)] et donc (en
admettant provisoirement le resultat 2.) que g est ane. Ainsi f est ane.
Montrons maintenant larmation 2. Soit donc g une bijection qui envoie trois points
alignes sur trois points alignes. On proc`ede par etapes et on montre les lemmes
suivants.
2. Lemme 1.1.2 Si F est un sous-espace ane de E, alors g
1
(F) est un sous-espace
ane.
Soit F un sous-espace ane, et G = g
1
(F). Pour montrer que G est un sous-espace
ane, il sut de montrer quil est non-vide (ok puisque g est bijective) et que,
x, y G, (x, y) G.
Soient donc x, y G, z (x, y), alors par hypoth`ese g(x), g(y), g(z) sont alignes,
donc g(z) (g(x), g(y)). Or F est un sea et g(x), g(y) F donc (g(x), g(y)) F.
Do` u g(z) F et donc z G.
8
3. Lemme 1.1.3 Si x
0
, x
k
sont anement independants, alors g(x
0
), g(x
k
) le
sont aussi.
On compl`ete (x
0
, x
k
) en un rep`ere ane de E : (x
0
, x
n
). On va montrer que
(g(x
0
), g(x
n
)) est un rep`ere ane de E. Lindependance ane des points en
decoulera. Le cardinal de la famille etant egal ` a la dimension de lespace +1, il
sut de montrer que la famille (g(x
0
), g(x
n
)) engendre E.
Soit donc F le sous-espace ane engendre par (g(x
0
), g(x
n
)). Dapr`es le lemme
ci-dessus, g
1
(F) est un sous-espace ane. De plus, il contient tous les x
i
, 0 i n,
donc il est egal ` a E. Do` u F = E (g bijective).
4. Lemme 1.1.4 Si D est une droite, alors g(D) est une droite.
On sait dej` a (par hypoth`ese) que g(D) est inclus dans une droite, que nous nom-
merons D

. Soit maintenant y = g(x) D

. Supposons x , D. Considerons deux


points distincts a, b D, alors leurs images g(a), g(b) sont sur D

. On a donc a, b, x
anement independants, et g(a), g(b), g(x) alignes. Ceci contredit le lemme 1.1.3.
Donc x D, et D

= g(D).
De la meme fa con, on montre que si P est un plan de E, alors g(P) est un plan.
5. Lemme 1.1.5 Si D et D

sont deux droites parall`eles, alors g(D) et g(D

) sont
deux droites parall`eles.
Si D = D

, OK. Sinon, D D

= . Soit P le plan contenant ces deux droites, alors


g(P) est un plan (cf ci-dessus), qui contient g(D) et g(D

). Ainsi, g(D) et g(D

) sont
coplanaires et disjointes (car g bijective) donc parall`eles.
6. Preuve du theor`eme :
Il reste ` a montrer que g est ane, i.e. pour O E, O

= g(O), lapplication denie


sur lespace vectoriel associe

E par
g(x) = g(O +x) O

9
est lineaire. Il faut donc montrer les deux proprietes suivantes :
x, y

E, g(x +y) = g(x) +g(y) (1.1)
x

E, R, g(x) = g(x). (1.2)
Pour alleger lecriture, on omet ci-dessous les `eches.
Montrons dabord (1.2). On a clairement g(0) = 0, donc la propriete est vraie pour
x = 0, R. Supposons maintenant x ,= 0. Les points 0, x et x etant alignes, et g
conservant lalignement, il existe une fonction
x
: R R telle que R, g(x) =

x
()g(x). On va montrer que
x
est un automorphisme de corps.
Il est clair que
x
(1) = 1.
Soient , R, montrons que ( +) = () +(), soit g((+)x) = g(x) +
g(x)). La dimension etant superieure ou egale ` a 2, il existe y , (0x). Le dessin
ci-dessous permet de se convaincre de legalite cherchee.
Soient , R, montrons que () = ()(), soit g(()x) =
x
()g(x)).
La dimension etant superieure ou egale ` a 2, il existe y , (0x). Le dessin ci-dessous
permet de se convaincre de legalite cherchee.
On admet que lidentite est le seul automorphisme de corps sur R. Donc
x
= id et
on a montre (1.2).
Montrons maintenant (1.1). Si x et y sont lies, le resultat est vrai dapr`es (1.2). Si
par contre x, y lineairement independants, alors 0, x, x +y, y sont les sommets dun
parallelogramme. Lapplication g preserve le parallelisme, donc 0, g(x), g(x + y),
g(y) sont les sommets dun parallelogramme. Do` u g(x + y) = g(x) + g(y).
10
Ainsi g est lineaire et donc g est ane.
1.2 Enveloppe convexe
1.2.1 Denitions
Denition 1.2.1 Soit S E, E espace vectoriel norme ; alors
lenveloppe convexe de S est lintersection de tous les convexes contenant S. On la
notera co(S).
lenveloppe convexe fermee de S est lintersection de tous les convexes fermes conte-
nant S. On la notera co(S).
Vrai ou faux ? Lenveloppe convexe fermee de S est ladherence de lenveloppe convexe
de S.
Cest vrai. La preuve est elementaire, et repose uniquement sur la denition et la pro-
priete que la fermeture dun convexe est encore convexe (pour sen convaincre, raisonner
avec des suites et faire un dessin).
Exercice 1.2.1 Montrer que
co(S) =
_
x E, k N

,
k
, (x
1
, x
k
) S
k
, x =
k

i=1

i
x
i
_
.
Schema de la preuve : On note, pour k N

,
C
k
=
_
x E,
k
, (x
1
, x
k
) S
k
, x =
k

i=1

i
x
i
_
, C =
kN
C
k
.
Pour montrer que co(S) = C, on montre les etapes suivantes.
C est convexe (facile),
S C (facile, car S = C
1
),
pour tout convexe K contenant S, K contient C (par exemple, on montre par
recurrence sur k que K contient tous les C
k
).
C est donc bien le plus petit convexe contenant S.
Cet exercice montre donc que les points de lenveloppe convexe de S sont exactement
les combinaisons convexes dun nombre arbitraire (mais ni) de points de S. On verra
quen dimension nie n, on peut se contenter de n + 1 points, voir theor`eme 1.2.1.
Exercice 1.2.2 S R
n
, borne. Alors co(S) = co(

S).
11
Attention! Ce resultat est faux si S est non borne. En particulier, lenveloppe convexe
dun ferme nest pas toujours fermee ! Contre-exemple : S = (0, 0) (R 1).
1.2.2 Le theor`eme de Caratheodory
Theor`eme 1.2.1 (Caratheodory) Soit S R
n
, alors tout point de co(S) est combinai-
son convexe de n + 1 elements de S, i.e :
co(S) =
_
x R
n
,
n+1
, (x
1
, x
n+1
) S
n+1
, x =
n+1

i=1

i
x
i
_
.
Preuve. Linclusion decoule de lexercice 2.1, donc seule linclusion est ` a
montrer. Soit x coS, alors
k 1, x =
k

i=1

i
x
i
.
Si k n + 1, rien ` a demontrer. Supposons donc k > n + 1, et
1
,
k
> 0.
Alors les points x
1
, x
k
sont anement dependants, cest-` a-dire que les vecteurs
x
2
x
1
, , x
k
x
1
sont lineairement dependants. Donc il existe
2
,
k
R, non tous nuls, tels que
k

i=2

i
(x
i
x
1
) = 0.
En notant
1
=

k
i=2

i
, il vient
k

i=1

i
x
i
= 0,
k

i=1

i
= 0.
Necessairement lun au moins des
i
est strictement positif. Notons alors
t = min
_

i
, i = 1, ...k,
i
> 0
_
.
Posons

i
=
i
t
i
. Alors on a bien,
_

_
pour tout i,

i
0,

k
i=1

i
=

k
i=1

i
= 1,
i,

i
= 0,
x =

k
i=1

i
x
i
.
12
Donc x est combinaison convexe de k 1 elements de S. On peut reiterer ce procede
tant que k > n + 1.
Application : Ce theor`eme fournit un algorithme de construction de lenveloppe convexe
(en dimension nie) : Notons S
1
=
x,yS
[x, y] et, pour tout k N, S
k+1
=
x,yS
k
[x, y].
Alors lalgorithme est ni : S
n
= co(S).
Corollaire 1.2.2 Soit S un compact de R
n
, alors son enveloppe convexe est compacte.
Preuve. Soit lapplication denie par
:

n+1
S
n+1
co(S)
(
1
,
n+1
, x
1
, x
n+1
)

i
x
i
Elle est continue et surjective sur un compact, do` u le resultat.
Remarque 1.2.1 En dimension innie, lenveloppe convexe dun compact nest pas
necessairement fermee !
Prenons pour contre-exemple un Hilbert H, muni dune base hilbertienne (e
n
)
nN
. Soit
K le compact deni par
K =
_
e
n
n + 1
, n N
_
0.
Notons
v
n
=
6

2
_
n

i=0
e
i
(i + 1)
3
+

i=n+1
1
(i + 1)
2
e
0
_
coK.
La limite de cette suite existe et vaut
v =
6

2
_

i=0
e
i
(i + 1)
3
_
.
Ce vecteur v ne peut pas secrire comme combinaison convexe (nie) des elements de K,
donc v , coK.
13
1.2.3 Vrai ou faux ?
1. C est convexe si et seulement si x, y C, (x + y)/2 C.
FAUX. Contre-exemple : Q nest pas convexe. Par contre, le resultat est vrai si on
suppose que C est ferme (par densite des rationnels dyadiques dans [0, 1]).
2. E espace metrique ; si C est convexe, alors son interieur et son adherence sont
convexes.
VRAI. Les demonstrations ne posent pas de diculte majeure (sappuyer sur un
dessin).
3. Pour tout S R
n
, un point x co(S) est toujours combinaison convexe de deux
elements de S.
VRAI pour n = 1 (cest Caratheodory). FAUX pour n 2. Contre-exemple : S forme
de trois points non alignes. Lenveloppe convexe est le triangle (bord + interieur),
alors que les combinaisons convexes de 2 elements de S donnent seulement les c otes
du triangle.
4. S R
n
. Alors coS = co(

S).
FAUX. Contre-exemple : S = (0, 0) (R 1).
VRAI si on ajoute lhypoth`ese : S borne. Alors on peut utiliser le corollaire du
theor`eme de Minkowski, qui montre que co(

S) est compact donc ferme.


5. P C[X], non constant. Alors les racines de P

sont dans lenveloppe convexe des


racines de P.
VRAI (cest le theor`eme de Gauss-Lucas).
Preuve. On note P(X) =

d
i=1
(X
i
)
m
i
. Alors
P

(X)
P(X)
=
d

i=1
m
i
X
i
.
Soit z une racine de P

, on veut verier quelle est dans lenveloppe convexe des


i
,
1 i d. Si P(z) = 0 rien ` a demontrer. Sinon, on peut ecrire :
0 =
d

i=1
m
i
z
i
=
d

i=1
m
i
( z

i
)
[z
i
[
2
.
Par passage au conjugue, on obtient,
0 =
d

i=1
t
i
(z
i
), t
i
=
m
i
[z
i
[
2
0.
Notons T la somme des t
i
; on obtient ainsi z =

d
i=1
t
i
/T
i
.
14
6. Tout convexe ferme borne est homeomorphe ` a la boule unite fermee.
FAUX car il existe des convexes fermes dinterieur vide (ex : un segment dans R
2
).
Par contre, on a : si C convexe borne dinterieur non vide, B boule ouverte, alors il
existe un homeomorphisme tel que
(intC) = B, (

C) =

B, (C) = B.
On le construit ` a partir de la jauge de C, voir section suivante.
1.3 Jauge dun convexe
Soit C un convexe tel que 0 est dans linterieur de C. On appelle jauge de C lapplication

C
: E R
+
denie par

C
(x) = inf
_
> 0,
x

C.
_
Exemples :
pour C = E, la jauge
E
est identiquement nulle ;
pour C borne, on montre aisement que
C
(x) = 0 x = 0.
Proposition 1.3.1
C
verie les proprietes suivantes :
1.
C
est positivement homog`ene : x E, 0,
C
(x) =
C
(x) ;
2. x E,
C
(x) = 1 = C, x E,
C
(x) < 1 = intC ;
3.
C
est sous-additive : x, y E,
C
(x + y)
C
(x) +
C
(y) ;
4.
C
est continue ;
Preuve. (voir par exemple, Brezis, Analyse Fonctionnelle)
1. La propriete 1 est immediate dapr`es la denition.
2. Il est clair que si x C, alors
C
(x) 1.
Montrons maintenant que x E,
C
(x) < 1 C. Soit x tel que
C
(x) < 1. Alors
]0, 1[ tel que
x

C. On a aussi 0 C et par convexite on en deduit que x C.


Avant de nir la demonstration de la propriete 2, etudions les proprietes 3 et 4.
3. Montrons la sous-additivite. Soient > 0, x, y C, on note
x =
x

C
(x) +
, y =
y

C
(y) +
.
15
On a :
C
( x) < 1,
C
( y) < 1 donc x et y sont dans C (dapr`es ce que nous venons
de montrer au point 2). Posons
=

C
(x) +

C
(x) +
C
(y) + 2
, z = x + (1 ) y.
On a donc z C, donc
C
( z) 1. Par ailleurs, on obtient apr`es calcul :
z =
x + y

C
(x) +
C
(y) + 2
.
Il vient :
C
(x + y)
C
(x) +
C
(y) + 2. En faisant tendre vers 0 on obtient le
resultat voulu.
4. Montrons la continuite de
C
. Elle repose sur le fait que 0 est interieur ` a C. Plus
precisement, soit r > 0 tel que la boule B(0, r) soit incluse dans C. On a alors :
y R
n
,
y
|y|
r C,
do` u on deduit aisement que

C
(y)
|y|
r
.
De plus, on a, en utilisant la sous-additivite :

C
(x + y)
C
(x) +
C
(y),
C
(x)
C
(x + y) +
C
(y),
de sorte que
[
C
(x + y)
C
(x)[ max(
C
(y),
C
(y))
1
r
|y|.
Do` u la continuite (et meme le caract`ere lipschitzien) de la jauge.
Nous pouvons maintenant terminer la preuve de la propriete 2. Nous avons dej` a
montre que
x E,
C
(x) < 1 C x E,
C
(x) 1.
En prenant les interieurs de chaque partie, et en utilisant la continuite de la jauge,
nous obtenons
x E,
C
(x) < 1 = int C;
En procedant de meme avec les adherences, nous obtenons
x E,
C
(x) 1 =

C.
En considerant C =

Cint C, nous obtenons le resultat enonce.
Corollaire 1.3.2 Soit C un convexe borne dinterieur non vide dun evn E. Alors il
existe un homeomorphisme f : E E qui envoie intC sur la boule ouverte B(0, 1), et
C sur la sph`ere B(0, 1).
16
Preuve. On denit f : E E par
f(x) =
_
0, si x = 0,

C
(x)
x
x
sinon.
f est clairement continue en tout x ,= 0. La continuite en 0 decoule de la remarque

C
(x)
1
r
|x|.
Par ailleurs, f est bijective, dinverse
f
1
: x
_
0, si x = 0
x

C
(x)
x sinon.
La continuite de f
1
en dehors de 0 ne pose pas de probl`eme. La continuite en 0 decoule
de la remarque

C
(x)
1

|x|,
o` u est le rayon dune boule centree en 0 et contenant C. f est donc bien un homeomor-
phisme. La propriete 2 de la proposition 1.3 montre quil envoie intC sur la boule ouverte,
et C sur la sph`ere.
17
1.4 Projection sur un convexe ferme, applications
1.4.1 Dimension nie, norme euclidienne
Theor`eme 1.4.1 Soient C un convexe ferme non vide de R
N
, et x R
N
, alors :
1. il existe un unique y C tel que [y x[ = inf
zC
[z x[. y sappelle projete de x sur
C et est note y = p
C
(x).
2. y est caracterise par la propriete :
z C, x y, z y) 0.
Preuve.
1. Lexistence vient du fait que C est ferme, et que la dimension est nie : on se ram`ene
` a un compact en considerant lintersection de C avec une boule

B(x, [x y[), o` u y
est un poit quelconque de C. Sur ce compact, la fonction y [y x[ est continue
donc minoree et atteint son min. Autre presentation : de toute suite minimisante on
peut extraire une suite convergente, sa limite est un projete. Lunicite provient de la
convexite de C et du theor`eme de Pythagore (importance de la norme euclidienne) :
si deux projetes dierents y
1
et y
2
existent, alors le milieu m de [y
1
y
2
] est dans C ; le
triangle xy
1
y
2
etant isoc`ele en x, on a [mx[ < [xy
1
[ ce qui contredit la denition du
projete.
2. Caracterisation. : Soit z C, on pose z

= y + (z y), pour ]0, 1[. Alors


z

C. Par denition de y on a :
[z

x[
2
=
2
[z y[
2
+ 2z y, y x) +[y x[
2
[y x[
2
.
En divisant par > 0 et en faisant tendre vers 0 on obtient linegalite cherchee.
: Soient y veriant la caracterisation et z C. On a :
0 x y, z y) = x y, z x + x y)
= [x y[
2
+x y, z x)
[x y[
2
[x y[[z x[ (Cauchy-Schwarz)
do` u [z x[ [y x[.

Remarque 1.4.1 Ce resultat est faux si la norme nest pas euclidienne (on perd luni-
cite) : prenons par exemple R
2
muni de la norme | |

. Alors le point (0, 1) a une innite


de projetes sur la droite dequation y = 0.
18
Remarque : le theor`eme de Motskin enonce une reciproque de ce resultat.
Theor`eme 1.4.2 Soit A un ferme non vide de R
N
. Si x R
n
, !y A, d(x, A) =
[x y[, alors A est convexe.
Preuve. voir par exemple Tauvel. (Ce nest pas tr`es dicile mais cest un peu long
pour faire un developpement dagreg.)
Voici une idee de la preuve sur un dessin :
si A non convexe, on peut trouver x, y A, z ]x, y[ et > 0 tel queB(z, ) A = .
On consid`ere toutes les boules fermees contenant B(z, ) et dont linterieur ne rencontre
pas A, et on montre quil existe parmi elles une boule de rayon maximal. Par unicite
du projete, elle rencontre A en un seul point. Mais alors, en la decalant un peu on peut
obtenir une boule disjointe de A et de meme rayon, ce qui contredit la maximalite.
Proposition 1.4.3 Continuite de la projection. On a la propriete :
x
1
, x
2
R
N
R
N
, [p
C
(x
1
) p
C
(x
2
)[
2
[p
C
(x
1
) p
C
(x
2
)[[x
1
x
2
[.
Preuve. Il sut dutiliser la caracterisation du theor`eme 1.4.1 :
x
2
p
C
(x
2
), p
C
(x
1
) p
C
(x
2
)) 0,
x
1
p
C
(x
1
), p
C
(x
2
) p
C
(x
1
)) 0.
En sommant et en appliquant Cauchy-Schwarz, on aboutit au resultat recherche.
1.4.2 le cas de la dimension innie*
Attention!
19
1. Dans un espace de Hilbert, on garde lexistence et lunicite du projete, et la ca-
racterisation enoncee dans la proposition 1.4.1. La demonstration reste valable, sauf
pour lexistence (voir Brezis). Soit (y
n
) C
N
une suite minimisante ; en fait, on
peut montrer que cette suite est de Cauchy. Pour cela, ecrivons lidentite du pa-
rallelogramme :

x
y
n
+ y
m
2

2
+

y
n
y
m
2

2
=
1
2
_
[x y
m
[
2
+[x y
n
[
2
_
.
Notons d
n
= [x y
n
[, d = lim
n
d
n
. On a :
y
n
+ y
m
2
C donc

x
y
n
+ y
m
2

d.
On en deduit :

y
n
y
m
2

1
2
_
d
m
2
+ d
n
2
_
d
2
.
Le second membre tend vers 0 quand n, m tendent vers +. Ainsi, la suite (y
n
) est
de Cauchy, et donc converge vers y, qui verie bien d = [xy[. Le reste de la preuve
est identique au cas de la dimension nie.
2. Dans un espace de Banach reexif, on garde lexistence (les boules sont compactes
pour la topologie faible-etoile) mais on perd lunicite (cf contre-exemple de la re-
marque 3.1).
3. Dans un espace de Banach quelconque, on na pas necessairement existence dun
projete. Un contre-exemple est propose dans lexercice ci-dessous.
Exercice 1.4.1 On consid`ere E = f C
0
([0, 1], R), f(0) = 0. E est un espace de
Banach pour la norme |.|

. Considerons le sous-espace C = f E,
_
1
0
f = 0.
Lintegration de 0 ` a 1 etant une operation continue pour la norme consideree, C est
un hyperplan ferme, donc un convexe ferme non vide de E. Montrer que la fonction
f
0
= id
[0,1]
na pas de projete sur C !
On montre dans un premier temps que
f C, |f f
0
| >
1
2
.
Ensuite, on construit comme sur le dessin une suite de fonctions f
n
anes par mor-
ceaux continues, telles que
|f
n
f
0
|
1
2
+
1
n
.
20
Il est ` a noter que ce theor`eme de projection 1.4.1 est souvent absent dans les livres
de geometrie... Il a pourtant de tr`es nombreuses applications en analyse ; nous citons
ici deux exemples : un theor`eme de point xe, et le theor`eme de Stampacchia. Dautres
applications existent, par exemple en analyse numerique (algorithme dUzawa, etc.)
1.4.3 Application 1 : theor`emes de point xe*
On admet le theor`eme de point xe de Brouwer, demontre en 1910 (Luitzen Egbertus
Jan Brouwer, mathematicien neerlandais, 1881-1966) :
Theor`eme 1.4.4 Soit B la boule unite fermee de R
N
. Alors toute application continue
f : B B a un point xe.
De nombreuses preuves de ce theor`eme existent dans la litterature...
A partir de ce resultat, on souhaite demontrer le theor`eme de Schauder (1930) :
Theor`eme 1.4.5 Soit C un convexe compact non vide dun espace vectoriel norme E.
Alors toute application continue f : C C a un point xe.
Remarque : en dimension innie, un compact est necessairement dinterieur vide ; sinon,
il contiendrait une boule, et les boules ne sont pas compactes... Plus precisement, un
convexe compact engendre necessairement un sous-espace ane qui est de dimension
nie. Ainsi, le theor`eme ci-dessus est en realite un resultat de dimension nie.
Par contre, on peut montrer le resultat suivant, qui est plus puissant et a eectivement
des applications en dimension innie :
Theor`eme 1.4.6 Soit C un convexe ferme non vide dun espace vectoriel norme E.
Alors toute application continue f : C C, dimage relativement compacte, a un point
xe.
21
Preuve. (voir Chambert-Loir, Fermigier, Maillot, analyse t.1)
La preuve consiste en deux etapes : on commence par le cas o` u E est de dimension
nie, puis, dans le cas general : on se ram`ene ` a la dimension nie par compacite.
1. Commen cons par le cas o` u E est de dimension nie. f(C) etant compact, il est inclus
dans une boule fermee B, elle-meme compacte. On denit lapplication
g = f p
C
: B f(C) B,
g est continue comme composee dapplications continues. Dapr`es le theor`eme de
Brouwer, elle a donc un point xe x = g(x). Or limage de g est incluse dans C, donc
x C, et donc g(x) = f(p
C
(x)) = f(x) = x. Ainsi, f a un point xe dans C.
(Alternativement, on peut construire un homeomorphisme de C sur B, voir section
2.)
2. Etudions maintenant le cas o` u E est de dimension innie.
On va se ramener ` a la dimension nie en considerant des intersections avec des sous-
espaces de dimension nie, quitte ` a perturber notre application f. Il faudra ensuite
montrer que la suite des points xes des applications modiees tend bien vers un
point xe de f.
Fixons n 1 et recouvrons f(C) par des boules ouvertes de rayon
1
n
:
f(C)
xf(C)
B(x,
1
n
).
f(C) etant relativement compact, on peut extraire un sous-recouvrement ni, i.e.
k N

, x
1
, x
k
, f(C)
k
j=1
B(x
j
,
1
n
).
(Notons que k et les x
i
dependent aussi de n. Pour simplier lecriture, on ne fait
pas apparatre cette dependance.)
Considerons le sous-espace ane E
n
engendre par les x
j
, 1 j k, et notons
C
n
= E
n
C.
C
n
est convexe ferme comme intersection de convexes fermes. Lapplication f est
bien denie sur C
n
, mais ` a valeurs dans f(C). Il faut donc composer ` a gauche avec
une application ` a valeurs dans C
n
.
Dans le cas hilbertien, il sut de considerer T
n
= p
n
f
|Cn
, o` u p
n
est la projection
sur le convexe ferme non vide C
n
. Lapplication T
n
: C
n
C
n
est continue, et son
image T
n
(C
n
) = p
n
(f(C
n
)) est relativement compacte (image dun relativement
22
compact par p
n
qui est continue), donc dapr`es le point 1 elle a un point xe
a
n
= p
n
(f(a
n
)) C
n
.
Faisons tendre n vers +. La suite f(a
n
) reste dans le compact f(C) C, donc
on peut en extraire une sous-suite qui converge vers l C. Il reste ` a prouver que
l est un point xe de f.
`
A n xe, on a :
|f(a
n
) a
n
| = |f(a
n
) p
n
(f(a
n
))| = d(f(a
n
), C
n
).
Or f(a
n
) f(C)
k
j=1
B(x
j
,
1
n
) donc
d(f(a
n
), C
n
) min(|f(a
n
) x
i
|, i = 1, k)
1
n
.
On en deduit que |f(a
n
) a
n
| tend vers 0 quand n tend vers +. Or f(a
n
) tend
vers l, donc il en resulte que a
n
tend vers l. De plus, f etant continue, on obtient
f(l) = l.
Dans le cas dun evn general, on ne peut plus utiliser la projection. Il faut donc
denir ` a la main une application continue p
n
qui envoie C dans C
n
, et verie :
x f(C), |p
n
(x) x|
1
n
.
On va construire p
n
comme combinaison convexe des x
i
, en posant
p
n
(x) =

k
i=1

i,n
(x)x
i

k
i=1

i,n
(x)
, avec
i,n
(x) = sup
_
1
n
|x x
i
|, 0
_
.
Avec cette denition, p
n
verie bien les hypoth`eses requises. Le reste de la demonstration
est identique au cas hilbertien.

Remarque 1.4.2 Il est interessant de noter que ce resultat est valable en dimension
innie, bien que sa demonstration sappuie sur un resultat de dimension nie (Brouwer)
et utilise (dans la version generale : E evn quelconque) la projection en dimension nie
uniquement.
Lenonce du theor`eme 1.4.6 (en dimension innie) peut permettre de demontrer le
theor`eme de Cauchy-Peano sans passer par les solutions approchees par la methode dEu-
ler : on se ram`ene ` a un argument de point xe (comme dans la demonstration classique du
theor`eme de Cauchy-Lipschitz) en transformant le probl`eme de Cauchy en une equation
integrale...
23
Theor`eme 1.4.7 (Cauchy-Peano) Soit E un espace de dimension nie, et f une ap-
plicaton continue de E dans lui-meme. Alors, pour t
0
R, y
0
E, le probl`eme de Cauchy
y

= f(y), y(t
0
) = t
0
(1.3)
admet une solution (non necessairement unique) sur un voisinage de t
0
.
Preuve. On remarque que le syst`eme (1.3) est equivalent ` a
y(x) = y
0
+
_
x
0
f(y(t))dt,
o` u y est continue sur un intervalle de la forme [t
0
, t
0
+ ], > 0.
On applique le theor`eme du point xe de Schauder (theor`eme 1.4.6) sur lespace
X = (
0
([t
0
, t
0
+ ]),
muni de la norme innie, o` u r et sont ` a denir, et pour lapplication F denie par
F(y)(x) = y
0
+
_
x
0
f(y(t))dt.
Le convexe considere est de la forme
C = (
0
([t
0
, t
0
+ ], B
f
(y
0
, r)),
o` u r est ` a denir. Il est ferme et non vide.
La continuite de F ne pose pas de probl`eme. On obtient la compacite de F(C) en
utilisant le theor`eme de Arzela-Ascoli, pour un r et bien choisis. Les details sont laisses
au lecteur.
Attention : on rappelle que ce theor`eme est valable seulement en dimension nie (si E
est de dimension innie, la boule B
f
(y
0
, r) nest plus compacte et donc F(C) nest plus
relativement compacte dans X...)
24
1.4.4 Application 2 : le theor`eme de Stampacchia*
Ce theor`eme generalise le theor`eme de Lax-Milgram. Il semble quil soit souvent presente
` a loral de lagreg, sans que les candidats soient toujours en mesure den donner une ap-
plication ni meme de motiver ce resultat (voir rapports du jury).
Theor`eme 1.4.8 (Stampacchia) Soit H un espace de Hilbert, K un convexe ferme non
vide. Soit a : H H R une forme bilineaire continue et coercive, i.e.
> 0, C > 0, u, v H, [a(u, v)[ C[u[[v[, a(v, v) [v[
2
.
Alors pour toute H

, il existe un unique u K, tel que


v K, a(u, v u) , v u)
H

,H
Remarque 1.4.3 Dapr`es le theor`eme de Lax-Milgram, qui sapplique sous les memes
hypoth`eses sur a, on sait dej` a que, pour donnee : il existe un unique w H, tel que
v H, a(w, v) = , v)
H

,H
Ici, on veut imposer en plus ` a la solution de rester dans un sous-ensemble convexe K de
H. Si w est dans K, alors cest notre u, mais sinon il faut trouver un autre element, et
en general on naura pas egalite mais seulement une inegalite.
Exemple : si la forme bilineaire a est tout simplement le produit scalaire, alors u sera
le projete de w sur K.
Ce theor`eme est souvent applique en prenant pour K un sous-espace ane, de sorte que
linegalite precedente devient une egalite. Voir par exemple lapplication citee ci-dessous.
Preuve. (voir par exemple Brezis)
Dapr`es le theor`eme de Riesz-Frechet, il existe une unique f H telle que
, v) = (f, v), v H.
De plus, ` a u xe, v a(u, v) est lineaire, donc il existe un unique element de H, note
Au, tel que a(u, v) = (Au, v), v H. A est clairement un operateur lineaire continu de
H dans lui-meme.
Le probl`eme se ram`ene donc ` a trouver u K tel que
(Au f, v u) 0, v K,
ou, de fa con equivalente, en xant > 0,
(f Au + u u, v u) 0, v K.
25
Dapr`es la caracterisation du projete, cette relation signie que u = P
K
(f Au + u).
Pour obtenir lexistence et lunicite de u, il sut donc montrer que, si est bien choisi,
lapplication S de K dans lui-meme denie par
S : v K P
K
(v + f Av)
est contractante, i.e. verie : [Sv
1
Sv
2
[ k[v
1
v
2
[, k < 1.)
Verions que cest le cas pour

_
0,
2
C
2
_
.
Soient v
1
, v
2
H, P
K
etant 1-lipschitzienne, on a :
|Sv
1
Sv
2
|
2
|v
1
v
2
A(v
1
v
2
)|
2
|v
1
v
2
|
2
+
2
C
2
|v
1
v
2
|
2
2A(v
1
v
2
), v
1
v
2
)
(1 +
2
C
2
2)|v
1
v
2
|
2
.
On montre que le coecient est bien inferieur strictement ` a 1 lorsque

_
0,
2
C
2
_
.

Exemple dapplication : EDP avec donnee non homog`ene


On sinteresse au probl`eme
_
u

+ u = f, x I =]0, 1[
u(0) = u(1) = 0.
o` u f L
2
(]0, 1[). On consid`ere lespace H = H
1
0
(I). Lexistence et lunicite dune solution
faible decoulent du theor`eme de Lax-Milgram, avec a(u, v) =
_
I
(u

+uv) et (v) =
_
I
fv.
On sinteresse maintenant au probl`eme avec donnees au bord non homog`enes :
_
_
_
u

+ u = f, x I =]0, 1[
u(0) = ,
u(1) = .
o` u f L
2
(]0, 1[), , R. On ne peut plus appliquer Lax-Milgram, car lespace des
fonctions H
1
veriant la donnee au bord nest plus un espace de Hilbert. On consid`ere
donc lespace H = H
1
(I), et on denit
K = v H, v(0) = , v(1) = .
26
Alors K est un convexe de H. Lexistence et lunicite dune solution faible decoulent du
theor`eme de Stampacchia, avec a et denies comme ci-dessus.
Remarque : on aurait pu aussi utiliser Lax-Milgram dans H
1
0
en cherchant la solution
u sous la forme u = u
0
+w, u
0
satisfaisant les conditions au bord (par exemple ane) et
w dans H
1
0
...
Autre exemple : le probl`eme de lobstacle
Il sagit dun mod`ele mathematique pour un probl`eme classique dorigine mecanique :
trouver la forme prise par un elastique tendu au-dessus dun obstacle.
Supposons donne un obstacle dont le bord a pour equation y = (x), etant une
fonction continue sur [0, 1], avec (0) < 0, (1) < 0. On xe un elastique aux points (0,0)
et (1,0), au-dessus de lobstacle. Quelle forme prend-il ? On admet que sa forme peut etre
donnee par une equation y = u(x), x [0, 1]. La fonction u est telle que la longueur totale
de lelastique est minimale. Elle est donc solution du probl`eme :
_
_
_
u K = v H
1
0
(0, 1), v pp
J(u) J(v), v K
o` u
J(v) =
_
1
0
_
1 + v

(x)
2
dx.
Lorsque u

est petit, ou pour modeliser des probl`emes dierents du type propagation de


la chaleur, on remplace J ci-dessus par
J(v) =
_
1
0
v

(x)
2
dx.
Le lien avec le theor`eme de Stampacchia est donne par le resultat suivant :
Proposition 1.4.9 Soient H, K, a et comme dans le theor`eme de Stampacchia. On
suppose de plus que a est symetrique. Alors on a equivalence entre les probl`emes :
_
u K,
v K, a(u, v u) , v u)
H

,H
et
_
u K,
v K, J(v) J(u), o` u J(v) =
1
2
a(v, v) , v).
La preuve de cette proposition est facile et laissee en exercice. On obtient ainsi un
resultat dexistence et dunicite de la solution du probl`eme de lobstacle.
27
1.5 Hahn-Banach et theor`emes de separation
Desormais E est un espace vectoriel norme. On dit que H est un hyperplan ane
[ferme] de E sil existe une forme lineaire [continue] f : E R et un reel tels que
H = x E, f(x) = .
1.5.1 Les theor`emes de separation classiques
Theor`eme 1.5.1 Soient A et B deux convexes disjoints non vides de E.
1. Si A est ouvert, alors il existe un hyperplan ferme H qui separe A et B au sens large,
i.e.
(f, ) E

R, a A, b B, f(a) f(b).
2. Si A est ferme et B compact, alors il existe un hyperplan ferme H qui separe A et
B au sens strict, i.e.
(f, ) E

R, > 0, a A, b B, f(a) < + f(b).


Remarque : de mani`ere equivalente, on dira que lhyperplan ferme H = x E, f(x) =
separe A et B au sens large si
sup
aA
f(a) inf
bB
f(b)
et au sens strict si
sup
aA
f(a) < < inf
bB
f(b).
Nous verrons que la demonstration de ce theor`eme repose sur des arguments tr`es
dierents, selon quon se place dans le cadre hilbertien ou dans un espace vectoriel norme
quelconque.
Remarquons aussi que la separation stricte nest pas possible si on remplace lhypoth`ese
B compact par B ferme. Il sut de considerer le contre-exemple suivant :
A = (x, y) (R
+
)
2
, xy 1, B = R] , 0].
28
1.5.2 Preuve dans le cas hilbertien
On va demontrer uniquement le resultat de separation stricte (point 2 du theor`eme).
Ici, la preuve repose essentiellement sur le theor`eme de projection dej` a enonce (voir par
exemple HUL).
1. On commence par le cas o` u B est un singleton x
0
, avec x
0
, A. Alors le vecteur
s = x
0
p
A
(x
0
) verie
s, x
0
) > sup
yA
s, y).
2. Prenons maintenant A et B comme dans le point 2. Notons
AB = a b, a A, b B,
alors A B est convexe (somme de convexes), ferme (somme dun ferme et dun
compact), et ne contient pas 0. Dapr`es le point ci-dessus, il existe s E tel que
s, 0) = 0 > sup
(a,b)AB
s, a b).
On en deduit
inf
bB
s, b) > sup
aA
s, a).
On a demontre le point 2. du theor`eme.
Remarque 1.5.1
On a utilise le resultat A ferme, B compact A+ B ferme.
Rappelons que A, B fermes nimplique pas A + B ferme. Citons le contre-exemple
A = (x, y) (R
+
)
2
, xy 1, B = R 0, A + B = R]0, +[.
1.5.3 Preuve dans le cas dun evn*
Ici, la preuve repose essentiellement sur le theor`eme de Hahn-Banach (voir par exemple
Brezis). Rappelons la forme analytique du theor`eme :
Theor`eme 1.5.2 (Hahn-Banach) Soit E un R-ev, p : E R une application positive-
ment homog`ene et sous-additive (voir denitions page 15). Soit S un sous-espace vectoriel
de E et f : S R une application lineaire telle que
f(x) p(x), x S.
Alors il existe F forme lineaire sur E telle que F
|S
= f et F(x) p(x), x E.
29
On rappelle que ce theor`eme se demontre en utilisant le lemme de Zorn, qui dit quun
ensemble ordonne inductif non vide poss`ede un element maximal.
On admet ce theor`eme (voir Brezis) et on montre comment en deduire les resultats de
separation enonces. Procedons par etapes.
1. Montrons le point 1 dans le cas o` u A est un convexe ouvert contenant 0 et o` u B
est un singleton x
0
. Il sut pour cela dappliquer le theor`eme de Hahn-Banach
avec S = Rx
0
, f(tx
0
) = t, et p =
A
la jauge du convexe A. On a dej` a montre
quelle veriait les hypoth`eses du theor`eme. On obtient donc une forme lineaire F
qui prolonge f et verie
x E, F(x)
A
(x).
En particulier, on obtient , x A, F(x) 1 F(x
0
). On a donc separe A et B au
sens large par lhyperplan dequation F(x) = 1.
Verions que cet hyperplan est ferme, i.e. que F est continue. On a, pour tout x E,
F(x) p(x) M|x| et F(x) = F(x) p(x) M|x|.
La continuite de F sen deduit ; H est donc un hyperplan ferme.
2. Par translation, le meme resultat est valable si x
0
= 0 , A.
3. Montrons le point 1. On pose C = AB, alors C est convexe, de plus il est ouvert
comme reunion douverts :
C =
yB
(Ay).
On a aussi 0 , C. Dapr`es ce qui prec`ede, on peut separer 0 et AB, i.e. il existe
f forme lineaire continue sur E telle que
a A, b B, f(a) < f(b).
Do` u la separation large de A et B par lhyperplan ferme H dequation
f(x) = = sup
aA
f(a) inf
bB
f(b).
4. Il reste ` a montrer le point 2. Soient donc A et B convexes fermes disjoints, B compact.
Pour tout > 0 on denit
A

= A+ B(0, ), B

= B + B(0, ).
Alors A

et B

sont ouverts, convexes, non vides, et verient, pour assez petit,


A

= (la distance dun ferme ` a un compact disjoint est strictement positive).


On utilise le point 1. pour separer A

et B

au sens large. Ainsi, on separe A et B


strictement.
30
1.5.4 Autres resultats*
En dimension nie, on peut facilement etendre le resultat de separation large. En di-
mension innie, on verra que la situation est beaucoup plus compliquee et contre-intuitive,
en particulier il existe des convexes denses quon ne pourra pas separer dun singleton dis-
joint...
Exercice 1.5.1 En dimension nie, on peut toujours separer deux convexes fermes
disjoints non vides par un hyperplan ferme (au sens large).
Preuve. (voir par exemple Hiriart-Urruty Lemarechal) Soient A et B deux convexes
fermes disjoints et non vides de R
d
. Fixons a A, b B, et posons A
n
= A

B(a, n).
Ainsi A
n
est compact.
Dapr`es le theor`eme de separation stricte, il existe un hyperplan ferme H
n
separant A
n
et B strictement. Notons N
n
un vecteur unitaire normal ` a H
n
et c
n
= H
n
[a, b]. c
n
est
bien deni, car a et b sont de part et dautre de H
n
(par denition de la separation), et
on a :
H
n
= x R
d
, x c
n
, N
n
) = 0.
Les suites (c
n
) et (N
n
) sont relativement compactes, donc ` a une sous-suite pr`es elles
convergent vers c, N. Par passage ` a la limite dans les inegalites, on obtient que lhyperplan
H = x R
d
, x c, N) = 0 separe A et B au sens large.
Ce resultat est faux en dimension innie. On propose le contre-exemple suivant (voir
Bourbaki EVT, II p. 83, exo 10) :
Exercice 1.5.2 Dans E = l
1
(N), on consid`ere les ensembles suivants :
D = u E, u
n
= 0, n 1, A =
n1
u E, [n
3
u
n
n[ u
0
, n 1.
1. Montrer quils sont convexes, fermes, non vides.
2. Verier que A D = .
3. Montrer que AD est dense dans E.
4. En deduire quon ne peut pas separer A et D au sens large par un hyperplan ferme.
On peut aller encore plus loin et montrer le resultat suivant :
31
Exercice 1.5.3 Montrer quen dimension d < +, on peut toujours separer au sens
large deux convexes disjoints non vides par un hyperplan ferme.
Preuve. On propose le schema de preuve suivant (pas de reference).
si lun des convexes est dinterieur non vide, par exemple A, alors on peut separer B
et linterieur de A (toujours convexe) au sens large par un hyperplan ferme H. Par
passage aux adherences, H separe A et B au sens large, donc a fortiori A et B. (On
note que pour A convexe, on a la relation A =

A.)
si les deux convexes sont dinterieur vide, cela signie quils sont inclus dans des sous-
espaces anes de dimension strictement inferieure ` a d. Lidee est donc depaissir A
de fa con ` a obtenir un convexe

A dinterieur non vide, et tel que

A soit disjoint de B.
On applique ensuite le 1er cas.
Corollaire 1.5.3 En dimension nie d, le seul convexe dense est R
d
.
Preuve. Soit C un convexe dense dans R
d
. Supposons quil existe x R
d
C. Alors
on peut separer C et x au sens large par un hyperplan ferme. Ceci contredit la densite
de C.
Linteret de ce resultat vient du fait quen dimension innie, on sait quil existe des
convexes denses non triviaux, par exemple des hyperplans denses (noyaux de formes
lineaires non continues).
Lemme 1.5.4 Soit E un evn et l une forme lineaire non continue sur E. Alors son noyau
est un hyperplan dense.
Preuve. Soit r > 0 et notons D = l(B(0, r)). Alors D est un convexe equilibre de
R (i.e. D D). De plus, l netant pas continue, D est non borne. Donc D = R. Ainsi,
x E, r > 0, y B(0, r), l(y) = l(x).
On a donc pour tout r > 0 lexistence dun element x + y Ker(l) B(x, r).
Le fait que cette situation pathologique nexiste pas en dimension nie peut aussi se
demontrer plus simplement en remarquant quen dimension d, tout point a un voisinage
qui est combinaison convexe de d + 1 points. Sil existait un convexe dense C de R
d
, et
x R
d
C, alors on pourrait construire un voisinage de x sous la forme
co(x
0
, x
d
).
Chaque point x
i
pourrait etre approche par un point y
i
de C. Si [x
i
y
i
[ est susamment
petit, on aurait
x co(y
0
, y
d
) C,
ce qui contredit lhypoth`ese.
32
1.5.5 Des applications*
Le corollaire ci-dessous est une consequence directe des theor`emes de separation. Il
permet dintroduire la notion dhyperplan dappui qui sera vue dans la section suivante.
Corollaire 1.5.5 Soit C un convexe non vide et non dense de E. Alors

C est linter-
section des demi-espaces fermes contenant C.
Preuve. Linclusion directe est evidente. Pour la reciproque, on consid`ere x ,

C.
Alors on peut separer au sens strict x et

C par un hyperplan ferme. Ainsi, le demi-espace
ferme de fronti`ere cet hyperplan, contenant C, ne contient pas le point x.
Remarque 1.5.2 On verra que ce corollaire a un pendant analytique : toute fonction
convexe f semi-continue inferieurement (i.e. depigraphe ferme) est egale au supremum
des fonctions anes qui la minorent :
f = supg anes, g f.
Corollaire 1.5.6 Soit F E un sous-espace vectoriel. Si F nest pas dense, alors
f E

, f ,= 0, telle que x F, f, x) = 0.
Preuve. Soit x
0
,

F. On utilise le theor`eme de separation stricte pour x
0
et

F.
Il existe donc f E

et R tels que
x F, f, x) < < f, x
0
).
Or F est un sous-espace vectoriel donc son image par f est soit R (exclu dapr`es le resultat
ci-dessus) soit 0.
Remarque : On utilise en general la contraposee de ce corollaire pour montrer quun
sous-espace est dense.
Le theor`eme de separation dans le cas hilbertien permet notamment de demontrer
le lemme de Farkas-Minkowski, qui est ` a la base des resultats en optimisation avec
contraintes dinegalite. Les coecients
i
issus du theor`eme sont alors appeles multi-
plicateurs de Lagrange.
Theor`eme 1.5.7 Soit H un espace de Hilbert, a
1
, a
k
H, xes. On note
K = x H, (a
i
, x) 0, 1 i k.
Soit p H veriant : x K, (p, x) 0. Aors

1
,
k
0, tels que p =
k

i=1

i
a
i
.
33
Demonstration :
Premi`ere etape
Notons C =
_

k
i=1

i
a
i
,
i
0, 1 i k
_
. On va montrer que C est un c one convexe
ferme.
Il est clair que C est un c one : x C, t 0, tx C.
On verie aisement que C est convexe.
Montrons que C est ferme. Si les a
i
sont lineairement independants, cest clair. En
eet, dans ce cas, soit (x
n
) une suite delements de C, qui converge dans H vers x.

Ecrivons
x
n
=
k

i=1

i
n
a
i
.
Par lindependance lineaire des a
i
, les
n
i
sont uniquement determines. Necessairement,
x appartient ` a lespace vectoriel engendre par les a
i
, 1 i n, qui est ferme : ainsi,
il existe un unique (
1
,
k
) R
k
tel que
x =
k

i=1

i
a
i
,
et on a, pour tout i,
i
= lim
n+

i
n
0. Donc x C.
Supposons maintenant que les a
i
soient lies ; on a donc une relation
k

i=1

i
a
i
= 0, (
1
,
k
) ,= (0, 0).
En particulier, on na plus unicite de la decomposition

k
i=1

i
a
i
. Ainsi, il nest plus
du tout clair que C soit ferme. On va montrer que C est une reunion nie de c ones
engendres par des vecteurs lineairement independants. Verions dabord que
C =
1jk
C
j
, o` u C
j
=
_

i=j

i
a
i
,
i
0, i = 1 k
_
. (1.4)
Il est clair que chacun des c ones C
j
est inclus dans C. Reciproquement, soit
x =

k
i=1

i
a
i
C. Quitte ` a remplacer (
1
,
k
) par son oppose, on peut sup-
poser quun des
i
au moins est strictement negatif. Notons alors
t = min
i/
i
<0
_

i
_
.
34
Ainsi, il existe j 1, k tel que t =
j
/
j
. On a alors
x =
k

i=1

i
a
i
=
k

i=1
(
i
+ t
i
)a
i
=

i=j
(
i
+ t
i
)a
i
.
Donc x C
j
. On a montre legalite (1.4). On reit`ere le procede sur chaque C
j
jusqu` a
obtenir des vecteurs lineairement independants, ce qui permet decrire C comme une
reunion nie de c ones fermes. C est donc ferme.
Deuxi`eme etape :
Supposons maintenant que p , C. On a : C est un convexe ferme, p est un
convexe compact disjoint de C, on peut donc les separer au sens strict par un hyperplan
ferme, i.e.
u H, R, v C, (v, u) < < (p, u). (1.5)
C est un c one qui contient 0 donc on en deduit que > 0. Dautre part, la propriete de
c one donne aussi :
R
+
, v C, v C, donc (v, u) < .
En divisant par et en faisant tendre vers +, on obtient
v C, (v, u) 0.
En particulier, il vient : u K. Cependant, on a, dapr`es la relation (1.5) : (p, u) < < 0.
Ceci contredit lhypoth`ese sur p. Donc on a montre que p C, ce qui donne bien le
resultat cherche.
35
1.6 Points extremaux et hyperplans dappui
1.6.1 Hyperplans dappui
Denition 1.6.1 Soit C un convexe de E, et H un hyperplan ane de E. On dit que
H est un hyperplan dappui ` a C si C est inclus dans un demi-espace de fronti`ere H et si
H C ,= .
Si x
0
H C, on dit que H est un hyperplan dappui ` a C en x
0
.
Proposition 1.6.1 Soit C un convexe non vide de R
d
, C ,= R
d
. Alors pour tout x C,
il existe un hyperplan dappui en x ` a C.
Preuve. Soit x C, et soient x
n
, n N des points de R
d

C qui tendent vers x


lorsque n tend vers linni. On a vu que

C est un convexe ferme non vide. On peut donc
separer au sens strict

C et x
n
par un hyperplan ferme H
n
, avec
H
n
= y R
d
, y, N
n
) =
n
et y

C, y, N
n
) <
n
.
On peut supposer que les vecteurs normaux N
n
sont de norme 1. Considerons
n
=
x
n
, N
n
), alors H
n
separe toujours x
n
et N
n
, au sens large cette fois. De plus, la suite
n
ainsi denie est bornee.
Quitte ` a extraire des sous-suites, on peut donc supposer que N
n
et
n
convergent vers
des limites N et . On montre alors aisement que
y

C, N, y) = N, x).
Ainsi, lhyperplan dequation
= N, y)
est un hyperplan dappui ` a C en x.
Remarque : ce resultat reste vrai en dimension innie, si E est un Banach separable, et
avec lhypoth`ese supplementaire : C non dense dans E. La demonstration est analogue ` a
celle donnee ci-dessus, mais utilise la compacite faible etoile des boules du dual (theor`eme
de Banach-Alaoglu). Attention toutefois ` a la redaction precise, il faut utiliser le fait que la
boule unite de E

est metrisable pour la topologie faible-etoile, an dutiliser la denition


sequentielle de la compacite...
1.6.2 Points extremaux
Denition 1.6.2 Soit C un convexe dun e.v. E. Un point x C est dit extremal si
,y
1
, y
2
C, y
1
,= y
2
, ,t ]0, 1[, x = ty
1
+ (1 t)y
2
.
De fa con equivalente, un point x C est extremal si Cx est convexe.
36
Notation : on notera Ext(C) lensemble des points extremaux de C.
Exemple : les points extremaux dun poly`edre convexe de R
d
sont ses sommets.
Le theor`eme suivant, d u ` a Minkowski, est le resultat fondamental sur les points extre-
maux dun convexe en dimension nie.
Theor`eme 1.6.2 (Minkowski) Un convexe compact de R
d
est lenveloppe convexe de
ses points extremaux.
Attention! Ce resultat est faux en dimension innie.(En particulier, on a vu que len-
veloppe convexe dun compact nest pas toujours fermee...) Par contre, on a le resultat
suivant :
Theor`eme 1.6.3 (Krein-Milman, 1940) Soit E un espace vectoriel topologique locale-
ment convexe. Alors tout convexe compact est lenveloppe convexe fermee de ses points
extremaux.
La preuve du theor`eme de Krein-Milman est beaucoup plus dicile que celle de Min-
kowski (voir par exemple Rudin, analyse fonctionnelle). Nous ne la presenterons pas ici.
Preuve du theor`eme de Minkowski. (voir par exemple HUL, Berger).
Soit C un convexe compact non vide de R
d
. Quitte ` a se placer dans un sous-espace
ane de dimension convenable, on suppose que C est dinterieur non vide. On raisonne
par recurrence sur la dimension d.
Cas d = 0. Alors C est un singleton, et le resultat est trivial.
Soit d 1, xe. Supposons le resultat vrai pour les dimensions strictement inferieures.
On consid`ere donc un convexe compact C et on va montrer que tout point x de C est
combinaison convexe de points extremaux. Pour cela, on distingue deux cas, selon
que x est un point interieur ou sur le bord.
Soit x sur le bord de C. Alors il existe H, hyperplan dappui ` a C en x. On va se
ramener ` a la dimension d 1 en considerant le convexe C H.
On a : C H est convexe, compact, non vide (il contient x) et de dimension au
plus d1. Par recurrence, x est donc combinaison convexe de points extremaux de
HC. Attention, pour conclure il faut justier que les points extremaux de HC
sont aussi des points extremaux de C. En fait, on montre le resultat suivant :
Ext(H C) = Ext(C) H.
(Seule linclusion est importante ici.)
37
Preuve de linclusion . Soit u Ext(C) H, alors on a :
y
1
, y
2
C, y
1
,= y
2
, t ]0, 1[, ty
1
+ (1 t)y
2
,= u.
Cest donc vrai a fortiori si on consid`ere y
1
, y
2
C H.
Preuve de linclusion . Soit u Ext(C H), et supposons quon ait :
y
1
, y
2
C, y
1
,= y
2
, t ]0, 1[, ty
1
+ (1 t)y
2
= u.
Plusieurs cas sont ` a envisager selon la position de y
1
et y
2
par rapport ` a H. Soit
D le demi-espace ouvert de fronti`ere H, contenant intC. Si y
1
, y
2
D, alors par
convexite, u D, ce qui contredit u H. Si y
1
D, y
2
H, alors on a aussi
u D, ce qui contredit u H. Enn, si y
1
, y
2
H, alors on contredit le fait que
u Ext(C H).
Soit maintenant x un point interieur. Alors il existe x

C, x

,= x. On remarque
que la droite (xx

) coupe C en deux points exactement (en eet, (xx

) C est
un convexe compact, donc cest un segment [y, z]). Dapr`es le point precedent, y
et z sont combinaisons convexes de points extremaux de C. Or x est combinaison
convexe de y et z. Do` u le resultat.
1.6.3 Exemples et Applications
1. Premier enseignement du theor`eme de Minkowski : en dimension nie, tout convexe
ferme borne admet un point extremal.
En dimension innie, ce resultat est vrai si on remplace ferme borne par compact
(dapr`es le theor`eme de Krein-Milman). Par contre, le resultat est faux en dimension
innie sous lhypoth`ese ferme borne.
Contre-exemple :
Soit E = u R
N
, u
n
0, muni de la norme innie. Soit C la boule unite fermee
de E. Alors C na pas de point extremal. En eet, soit u C, alors il existe N N
tel que
n N, [u
n
[ < 1/2.
Construisons les suites v et w par
v
n
=
_
u
n
, si n < N,
u
n
+
1
2n
, sinon
w
n
=
_
u
n
, si n < N,
u
n

1
2n
, sinon
Alors on a :
v, w C, v ,= w, u = (v + w)/2.
38
2. Pour minimiser une fonction concave (par exemple ane) sur un poly`edre convexe,
il sut de comparer les valeurs aux points extremaux, cest-` a-dire aux sommets.
Cette remarque est ` a lorigine des algorithmes du type simplexe en programmation
lineaire.
3. Le theor`eme de Krein-Milman a de nombreuses applications en analyse fonctionnelle.
En voici quelques exemples.
Il permet par exemple de montrer un theor`eme de Stone-Weierstrass generalise
(voir Rudin).
Il peut aussi etre utilise pour montrer que lespace C([0, 1], R) nest pas le dual
dun espace de Banach (voir Brezis).
theor`eme de representation integrale de Choquet
existence dune fonction de Green pour le laplacien
etc.
1.6.4 Vrai ou faux ?
1. Soit C un convexe compact non vide de E evn. Soit l E

. Alors il existe un hyper-


plan dappui ` a C parall`ele ` a Ker(l).
VRAI. En eet, l est continue sur C compact, donc elle y est bornee et atteint ses
bornes. Donc
x
1
, x
2
C, y C, l(x
1
) l(y) l(x
2
).
Ainsi, les hyperplans dequation l(x) = l(x
1
) et l(x) = l(x
2
) sont des hyperplans
dappui ` a C parall`eles ` a Ker(l).
2. Soit C un convexe ferme borne non vide de E evn. Soit l E

. Alors il existe un
hyperplan dappui ` a C parall`ele ` a Ker(l).
Cest bien-s ur vrai en dimension nie (cf ci-dessus). Cest FAUX en dimension innie.
On propose le contre-exemple suivant.
Soit E = u R
N
, u
n
0, muni de la norme innie. Soit C la boule unite fermee,
et soit l la forme lineaire denie par
u E, l(u) =

nN
2
n
u
n
.
Alors l est bien lineaire continue, et on a
u E, [l(u)[ |u|

nN
2
n
= 2|u|

.
On a donc : u C, 2 l(u) 2.
39
Clairement, il nexiste pas u C telle que [l(u)[ = 2. En eet,
[l(u)[ = 2 n N, [u
n
[ = 1 u , E.
Dautre part, on peut construire une suite minimisante
(u
p
)
pN
E
N
avec l(u
p
) 2.
Il sut de prendre
u
p
n
=
_
1 si n p,
0, sinon.
Ainsi les hyperplans parall`eles ` a Ker(l), i.e. les
H

= x E, l(x) = , R
sont de deux types :
si 2 < < 2, alors C est des deux c otes de lhyperplan H

,
si [[ 2, alors C est dans un demi-espace de fronti`ere H

, mais C H

= .
3. Soit H hyperplan dappui ` a C convexe ferme borne de E evn. Alors H contient
toujours un point extremal de C.
FAUX. Contre-exemple : E et C comme ci-dessus. H = u E, u
0
= 1. Alors H
est un hyperplan dappui ` a C. Or C na pas de point extremal.
40
Chapitre 2
Fonctions convexes
CADRE : Les fonctions f considerees ici sont denies sur une partie convexe C dun
espace vectoriel norme (en abrege evn) E (le plus souvent R
N
, N 1, mais la dimension
innie sera parfois evoquee) et ` a valeurs reelles.
2.1 Denitions, premi`eres proprietes
2.1.1 Convexite
Denition 2.1.1 (Convexite, convexite stricte, convexite forte)
Soit C un convexe non vide de E et f : C R.
f est dite convexe sur C si
]0, 1[, x, y C, f(x + (1 )y) f(x) + (1 )f(y).
f est dite strictement convexe sur C si
]0, 1[, x, y C, x ,= y, f(x + (1 )y) < f(x) + (1 )f(y).
f est dite fortement convexe sur C sil existe > 0 tel que
]0, 1[, x, y C, x ,= y, f(x+(1)y) f(x)+(1)f(y)
1
2
(1)|xy|
2
.
On dit aussi que f est -convexe.
Remarque 2.1.1 1. -convexe = strictement convexe = convexe.
2. f est -convexe sur C si et seulement si f 1/2| |
2
est convexe sur C.
41
Remarque 2.1.2 La forte convexite est le cadre agreable pour de nombreux probl`emes
doptimisation, car elle donne facilement lexistence, lunicite, et des algorihmes de calcul
performants ; cest une hypoth`ese forte, mais elle inclut le cas des fonctions quadratiques,
tr`es important en pratique (cf ex.3 section 2.2).
On montre aisement, ` a partir de la denition, les proprietes suivantes :
Proposition 2.1.1 (Crit`ere de lepigraphe)
f est convexe si et seulement si son epigraphe est convexe, o` u
epi(f) = (x, r) C R, f(x) r.
La preuve est laissee au lecteur. Remarquons que, de meme quen geometrie, la bonne
notion (pour les resultats de projection, de separation, etc) est souvent celle de convexe
ferme, de meme en analyse convexe, on peut developper une theorie tr`es riche sur les
fonctions convexes semi-continues inferieurement (sci), avec la denition suivante.
Denition 2.1.2 Soit X un espace vectoriel topologique. Une fonction f est dite semi-
continue inferieurement si son epigraphe est ferme. Dans le cas dune topologie metrique,
on a les denitions equivalentes suivantes :
la fonction f est semi-continue inferieurement au point x si et seulement si, pour
toute suite (x
n
) tendant vers x, on a
f(x) liminf
n+
f(x
n
).
la fonction f est semi-continue inferieurement sur X si et seulement si elle est semi-
continue inferieurement en tout point.
Nous ne detaillerons pas ici la theorie des fonctions convexes sci.
Proposition 2.1.2 Une somme de fonctions convexes est convexe. Un supremum de
fonctions convexes est convexe.
En passant aux epigraphes, cette proposition decoule directement du resultat qui dit
quune somme, respectivement une intersection de convexes, est convexe.
Proposition 2.1.3 Soit f une fonction continue sur un convexe C. Alors
1. f est convexe sur C si et seulement si x, y C, f
_
x + y
2
_

f(x) + f(y)
2
;
2. f est -convexe sur C si et seulement si
x, y C, f
_
x + y
2
_

f(x) + f(y)
2


8
|x y|
2
.
42
Preuve. Il sut de demontrer le deuxi`eme point ; on obtiendra 1. en prenant = 0.
Supposons donc que f verie la condition, et prenons ]0, 1[, x, y C. En utilisant la
decomposition diadique, on sait quil existe une suite (
n
)
nN
, avec
n
= p
n
/2
n
, p
n
N,
qui converge vers quand n tend vers +. On montre par recurrence sur n que
f (
n
x + (1
n
)y)
n
f(x) + (1
n
)f(y)

2

n
(1
n
)|x y|
2
.
Il reste ` a faire tendre n vers linni et utiliser la continuite de f.
Remarque 2.1.3 Lhypoth`ese supplementaire de continuite peut sembler restrictive.
En realite, on montrera que toute fonction convexe est continue dans linterieur de son
domaine. Voir section 2.3.
2.1.2 Premiers exemples
1. Toute fonction ane est trivialement convexe.
2. Si f est convexe, et convexe croissante, alors f est convexe. (La preuve est
immediate ` a partir de la denition.)
3. Soit : [a, b] R une fonction croissante, alors la fonction denie sur [a, b] par
(x) =
_
x
a
(u)du
est convexe.
Remarque : si est continue, alors est derivable sur [a, b], et sa convexite est une
consequence immediate des resultats de la section 2. Cependant une preuve directe
est possible, qui setend au cas o` u nest pas continue.
Preuve. Soient x, y [a, b], ]0, 1[, et supposons par exemple que x < y.
Calculons la dierence
= (x + (1 )y) (x) (1 )(y).
La relation de Chasles sur les integrales donne
= (1 )
_
y
x
(u)du +
_
x+(1)(yx)
x
(u)du
= (1 )
_
yx
0
(x + u)du + (1 )
_
yx
0
(x + (1 )v)dv
= (1 )
_
yx
0
((x + (1 )u) (x + u)) du 0,
en utilisant lhypoth`ese croissante.
43
4. Une norme sur un evn quelconque E est toujours convexe :
x, y E, [0, 1], |x + (1 )y| |x| + (1 )|y|.
mais nest jamais strictement convexe, puisquelle est positivement homog`ene :
x E, [0, 1], > 0, |x + (1 )x| = |x| + (1 )|x|.
5. En utilisant les points 2 et 4, on obtient que lapplication
| |
2
et toujours convexe ; par contre, elle nest pas
necessairement strictement convexe.
Contre-exemple : R
2
, muni de la norme | |

, cf dessin de
la boule unite ; on a
_
_
_
_
(1, 1) + (1, 1)
2
_
_
_
_
2
= 1 =
1
2
_
|(1, 1)|
2
+|(1, 1)|
2
_
.
x
1
x
2
6. Par contre, si | | est une norme derivant dun produit sca-
laire (meme en dimension innie), lapplication | |
2
est
strictement, et meme fortement convexe ; en eet, elle est
continue et verie :
x, y,
_
_
_
_
x + y
2
_
_
_
_
2
=
1
2
_
|x|
2
+|y|
2
_

1
4
|x y|
2
.
x
1
x
2
(Cette propriete implique lexistence et lunicite dun projete sur une partie convexe
fermee non vide dans un Hilbert, propriete qui nexiste plus en general dans le cas
dun Banach.)
Dautres exemples importants seront listes en section 2.2, en utilisant la caracterisation
des fonctions convexes dans le cas dierentiable/
2.1.3 Caracterisations et proprietes
Les caracterisations suivantes se demontrent facilement ` a partir de la denition.
Proposition 2.1.4 (Crit`ere des pentes croissantes)
Considerons X = R; C est donc un intervalle de R. Alors, f est convexe sur C si et
seulement si, pour tout x
0
C, la fonction
x
f(x) f(x
0
)
x x
0
44
est croissante sur Cx
0
.
x
r
epi(f)
x
0
Preuve. Supposons dabord f convexe. Soient x
0
C, x, y Cx
0
. Supposons
x < y. Montrons linegalite :
f(x) f(x
0
)
x x
0

f(y) f(x
0
)
y x
0
.
Si x
0
< x, alors il existe ]0, 1[ tel que x = x
0
+ (1 )y. On a alors :
f(x) f(x
0
) + (1 )f(y).
On obtient le resultat voulu en soustrayant f(x
0
) ` a chgaque membre, et en divisant
par x x
0
, qui est positif.
Le cas x
0
> y se traite de fa con analogue.
Si par contre x < x
0
< y, alors il existe ]0, 1[ tel que x
0
= x + (1 )y. On a
alors :
f(x
0
) f(x) + (1 )f(y).
On soustrait f(x
0
) aux deux membres, et on divisse par x x
0
qui est negatif. Le
resultat en decoule alors, en remarquant que
y x
0
= (y x) =

1
(x x
0
).
Pour la reciproque, soient x, y C, ]0, 1[. Supposons x < y. On note x

= x +
(1 )y. Alors, lhypoth`ese assure que
f(x

) f(x)
x

x

f(y) f(x)
y x
.
Apr`es quelques calculs elementaires, on en deduit que
f(x

) f(x) + (1 )f(y).

45
Remarque : ces proprietes sont de nature geometrique. Dans le cas dune fonction de
la variable reelle, la premi`ere caracterisation traduit simplement le fait que le graphe de f
est toujours situe sous les cordes, tandis que la deuxi`eme signie que la pente des cordes
reliant les points dabscisse x
0
et dabscisse x crot avec x.
Comme corollaire de la proposition 2, nous pouvons enoncer le resultat suivant, parfois
utile, et pas si facile ` a demontrer directement :
Corollaire 2.1.5 Soit f :]0, +[R, on pose, pour x > 0, g(x) = xf
_
1
x
_
. Alors g est
convexe si et seulement si f est convexe.
Preuve. Remarquons dabord que xg
_
1
x
_
= f(x), donc il sut de demontrer une
des implications.
Supposons donc f convexe. Soit x
0
> 0, alors la fonction
x s
f
(1/x) =
f(1/x) f(1/x
0
)
1/x 1/x
0
=
xx
0
x x
0
(f(1/x) f(1/x
0
))
est decroissante. Considerons la fonction pente de g denie sur ]0, +[x
0
par :
s
g
(x) =
g(x) g(x
0
)
x x
0
=
xf(1/x) x
0
f(1/x
0
)
x x
0
=
x x
0
x x
0
f(1/x
0
) +
x
x x
0
(f(1/x) f(1/x
0
))
= f(1/x
0
)
1
x
0
s
f
(1/x).
Il apparat ainsi que s
g
est croissante, donc g est convexe.
Exemple : x ln(x) est convexe sur ]0, +[, donc x xln x aussi.
2.2 Caracterisations dans le cas dierentiable
Dans cette section, on se place dans le cadre de fonctions denies au voisinage dune
partie convexe de R
N
, mais les resultats restent valables dans un Banach E, en rempla cant
les gradients par des dierentielles. Soit donc C R
N
, convexe, et un ouvert contenant
C. On suppose ici que f est dierentiable sur .
On va etablir des resultats qui generalisent les crit`eres bien connus en dimension 1 :
une fonction derivable est convexe si et seulement si sa derivee est croissante ;
une fonction derivable est convexe si et seulement si son graphe est situe au-dessus
des tangentes.
46
2.2.1 Encore une caracterisation geometrique
Theor`eme 2.2.1 Soit un ouvert de R
N
, C , convexe, et f : R, dierentiable.
On a les equivalences suivantes :
1. f est convexe sur C si et seulement si
x, x
0
C, f(x) f(x
0
) +f(x
0
), x x
0
).
2. f est strictement convexe sur C si et seulement si
x, x
0
C, x ,= x
0
, f(x) > f(x
0
) +f(x
0
), x x
0
).
3. f est -convexe sur C si et seulement si
x, x
0
C, f(x) f(x
0
) +f(x
0
), x x
0
) +

2
|x x
0
|
2
.
Remarque 2.2.1 Le membre de droite des inegalites 1 et 2 donne lequation de lhy-
perplan tangent au graphe en x
0
, tandis que celui de linegalite 3 donne lequation dun
parabolode tangent au graphe en x
0
.
Preuve.
1. Montrons dabord la premi`ere equivalence. Supposons donc f convexe.
Soient x, x
0
C, on a donc, pour tout ]0, 1[,
f(x + (1 )x
0
) f(x) + (1 )f(x
0
),
soit :
f(x + (1 )x
0
) f(x
0
)

f(x) f(x
0
).
En passant ` a la limite quand tend vers 0, on obtient le resultat voulu.
Reciproquement, supposons les inegalites veriees et montrons que f est convexe.
Soient donc x, y C, ]0, 1[. Posons x
0
= x + (1 )y. On a donc :
f(x) f(x
0
) +f(x
0
), x x
0
)
f(y) f(x
0
) +f(x
0
), y x
0
)
En multipliant la premi`ere inegalite par , la seconde par 1 , et en les ajoutant,
on obtient exactement :
f(x) + (1 )f(y) f(x
0
) = f(x + (1 )y).
47
2. Pour le point 2, la reciproque se montre comme ci-dessus en rempla cant les inegalites
larges par des inegalites strictes. Par contre, on ne peut pas calquer la preuve du
sens direct, car les inegalites strictes deviendraient larges ` a la limite 0. On peut
cependant appliquer le resultat du point 1. Soit donc f supposee strictement convexe,
et deux points x, x
0
C, x ,= x
0
. On a alors, pour tout ]0, 1[,
f(x

) < f(x) + (1 )f(x


0
), o` u x

= x + (1 )x
0
.
Mais on a aussi, dapr`es le resultat 1. quon vient de montrer,
f(x

) f(x
0
) +f(x
0
), x

x
0
).
En comparant ces deux inegalites, et en simpliant f(x
0
), on obtient :
f(x
0
), x x
0
) < (f(x) f(x
0
)).
Il reste ` a diviser par pour obtenir le resultat recherche.
3. Pour le troisi`eme point, on utilise la remarque 1.1 :
f convexe f

2
| |
2
convexe
x, x
0
C,
f(x)

2
|x|
2
f(x
0
)

2
|x
0
|
2
+f(x
0
) x
0
, x x
0
).
Apr`es simplication, on arrive ` a lequivalence voulue.

2.2.2 Fonctions monotones


Denition 2.2.1 Soient C R
n
, convexe, 0 et soit une fonction F : C R
n
.
F est dite monotone sur C si
x, y C, F(x) F(y), x y) 0.
F est dite strictement monotone sur C si
x, y C, x ,= y, F(x) F(y), x y) > 0.
F est dite -monotone sur C si
x, y C, F(x) F(y), x y) |x y|
2
.
Remarque 2.2.2 Attention, en dimension 1, une fonction est dite monotone au sens
ci-dessus si et seulement si elle est croissante !
48
Theor`eme 2.2.2 Si f est dierentiable sur , on a les equivalences suivantes :
1. f est convexe sur C f est monotone sur C.
2. f est strictement convexe sur C f est strictement monotone sur C.
3. f est -convexe sur C f est -monotone sur C.
Preuve. Montrons le troisi`eme point. Le premier sen deduira en prenant = 0,
et le deuxi`eme se montre de mani`ere analogue en rempla cant les inegalites larges par des
inegalites strictes.
Supposons dabord f -convexe. Soient x, y C. Alors on a, dapr`es le theor`eme 1,
f(y) f(x) +f(x), y x) +

2
|y x|
2
.
f(x) f(y) +f(y), x y) +

2
|y x|
2
.
En sommant ces deux inegalites, on obtient :
0 f(x) f(y), y x) + |y x|
2
,
i.e. f est -monotone.
Supposons maintenant que f est -monotone. Posons (t) = f(x+t(yx)), t [0, 1].
Alors est derivable sur [0, 1] et pour tout t,

(t) = f(x
t
), y x), o` u x
t
= x + t(y x).
Remarquons quen general, on ne peut pas ecrire
(1) (0) =
_
1
0

(t)dt,
car

na pas de raison detre integrable. Par contre, on va appliquer ` a linegalite des


accroissements nis.
Soit t [0, 1], alors

(t)

(0) =
1
t
f(x
t
) f(x), x
t
x)

t
|x
t
x|
2
= t|y x|
2
.
En appliquant linegalite des accroissements nis sur [0, 1], on obtient :
(1) (0)

(0) +
_
1
0
t|y x|
2
dt =

(0) +

2
|y x|
2
,
ce qui se reecrit :
f(y) f(x) f(x), y x) +

2
|y x|
2
.
Le theor`eme 1 permet de conclure que f est -convexe.
49
Corollaire 2.2.3 Soit maintenant f deux fois dierentiable sur C ouvert convexe. Alors
f est convexe sur C si et seulement si, pour tout x C, D
2
f(x) denit une forme
quadratique positive, i.e.
x C, v R
N
, D
2
f(x)v, v) 0.
Preuve. Commen cons par le sens direct. Soit donc f deux fois dierentiable et
convexe sur C. Dapr`es le theor`eme precedent, f est monotone sur C. Soient x C,
v R
N
, alors pour t assez petit, x + tv C et
D
2
f(x)v, v) = lim
t0
+
1
t
f(x + tv) f(x), v) 0.
Pour la reciproque, on remarque que si D
2
f(x) est positive, alors la formule de Taylor-
Lagrange ` a lordre 2 donne, pour tous x C, v R
N
, t > 0 assez petit,
f(x + tv) = f(x) + tf(x), v) +D
2
f(x + v)v, v) f(x) + tf(x), v)
avec un [0, t]. On en deduit la convexite de f par lintermediaire du theor`eme 2.2.1.
2.2.3 Encore des exemples
1. sur R, les fonctions x [x[

, > 1, x e
x
, R, sont convexes. (On le verie
gr ace aux caracterisations utilisant la derivee.)
2. sur ]0, +[, les fonctions x x

, > 0, x ln x, sont convexes. Dapr`es le


corollaire 1.4, x xln x est convexe.
3. Exemple important pour les applications :
Soient A une matrice symetrique reelle de taille N, b R
N
, et f une fonction denie
sur R
N
par :
f(x) =
1
2
Ax, x) +b, x).
Alors
f est convexe A est positive : Ax, x) 0, x R
N
,
toutes les valeurs propres de A sont positives ou nulles.
f est strictement convexe A est denie positive : Ax, x) > 0, x ,= 0,
toutes les valeurs propres de A sont stricte-
ment positives.
Dans ce cas, f est meme fortement convexe, avec une constante egale ` a la plus
petite valeur propre.
50
Preuve. f est dierentiable, et f(x) = Axb. A est symetrique, donc ses valeurs
propres sont reelles, notons les
1

N
(avec multiplicite). Sil existe une valeur
propre strictement negative, il est clair que f nest pas monotone. Supposons donc
le contraire. En diagonalisant A (qui est symetrique) dans une base orthonormee, on
montre facilement que
x, y R
n
, Ax Ay, x y)
N
|x y|
2
,
et que legalite est atteinte lorsque x y est vecteur propre associe ` a
N
. Ainsi,
dapr`es le theor`eme 2.2, si
N
= 0, f est convexe mais non strictement convexe ; si

N
> 0, f est
N
-convexe.
Remarque 2.2.3 Cet exemple est important car il fournit des algorithmes de
resolution de syst`emes lineaires. En eet, dans le cas o` u f est convexe et dierentiable,
on verra que son gradient sannule uniquement lorsque f atteint un minimum (voir
theor`eme 3.3). On peut donc appliquer des algorithmes de minimisation de f pour
resoudre le syst`eme Ax = b (en particulier, methodes de gradient, gradient conjugue,
etc.).
4. Une fonction de deux variables (x, y) qui est convexe par rapport ` a x pour tout y et
convexe par rapport ` a y pour tout x nest pas necessairement convexe par rapport
au couple (x, y).
Contre-exemple : la fonction f denie sur (R
+
)
2
par : f(x, y) = xy. On a, par exemple,
f(1, 1) = 1 >
1
2
(f(0, 2) + f(2, 0)).
5. Somme des plus grandes valeurs propres dune matrice symetrique
Soit E = S
n
(R) lespace des matrices symetriques reelles de taille n 1, muni du
produit scalaire
A, B)) = tr(AB) =
n

i,j=1
A
ij
B
ij
.
On associe ` a une matrice A E ses valeurs propres, rangees par ordre decroissant :

1
(A)
n
(A),
et une base orthonormee de vecteurs propres (v
1
, v
n
). Pour tout entier m, 1
m n, on note
f
m
(A) =
m

j=1

j
(A).
51
On va montrer que f
m
est convexe, en veriant legalite :
A E, f
m
(A) = supQ
t
Q, A)), Q
m
, (2.1)
o` u
m
= Q M
n,m
(R),
t
Q.Q = I
m
.
Approche algebrique
Remarquons que les matrices Q
m
sont exactement les matrices de projection
sur des sous-espaces vectoriels F R
n
de dimension m. Par ailleurs, si q designe
la forme quadratique canoniquement associee ` a A sur R
n
, on a, pour une matrice
Q
m
, representant la projection sur un sous-espace F R
n
,
Q
t
Q, A)) = tr(Q
t
QA) = tr(
t
QAQ)
est la trace de la restriction ` a F de la forme quadratique. La formule (2.1) signie
donc que la somme des m plus gandes valeurs caracteristiques de q ne peut que
diminuer par restriction ` a un sous-espace de dimension m. (Attention : les sous-
espaces consideres netant a priori pas stables par A, les valeurs caracteristiques de q
restreintes ` a F ne forment pas un sous-ensemble de celles de q.) On obtient toutefois
le resultat (2.1) par iterations successives du resultat suivant :
Lemme 2.2.4 Soit q une forme quadratique sur R
n
, de valeurs caracteristiques

1
...
n
(i.e. il existe une base orthonormee, dans laquelle q(x) =

n
i=1

i
x
2
i
).
Si H est un hyperplan de R
n
et
1
...
n1
sont les valeurs caracteristiques de
la restriction de q ` a H, on a les inegalites

1

1

2
...
n1

n
.

Approche analytique
Pour qui ne connait pas ce lemme, une preuve directe de (2.1) est possible mais, du
fait de la non-stabilite des sous-espaces, elle nest pas immediate. On peut utiliser le
theor`eme des extrema lies pour se ramener au cas o` u les sous-espaces sont stables.
1`ere etape : Notons, pour Q
m
,
A
(Q) = Q
t
Q, A)). Remarquons que :
Q
m
,
A
(Q) = tr(Q
t
QA) = tr(
t
QAQ) =
m

j=1
AC
j
, C
j
), (2.2)
o` u (C
1
, C
m
) sont les vecteurs colonnes de la matrice Q, et , ) designe le produit
scalaire usuel de R
n
. (En particulier, legalite (2.1) est claire pour m = 1 et pour
m = n.) De plus, la fonction
A
est dierentiable sur
m
, de dierentielle
D
A
(

Q) Q = 2
m

j=1
A

C
j
, C
j
)
52
o` u (C
1
, C
m
) sont les vecteurs colonnes de la matrice Q, (

C
1
,

C
m
) sont les vec-
teurs colonnes de la matrice

Q.
Par ailleurs,

m
= Q M
n,m
(R), i, j = 1 m, C
i
, C
j
) =
ij
.
En particulier,
m
est ferme et borne donc compact. Ainsi, le sup de
A
sur
m
est
bien deni et est atteint.
2`eme etape : Notons encore, pour 1 i, j m :
Q M
n,m
(R), h
i,j
(Q) = C
i
, C
j
)
ij
R.
Chaque fonction h
ij
est dierentiable, de dierentielle denie par :
Dh
i,j
(

Q) Q = 2

C
i
, C
j
).
En particulier, on voit quen tout point

Q
m
, ces dierentielles sont lineairement
independantes. En eet, si (
i,j
)
1i,jm
sont tels que
Q M
n,m
(R),
m

i,j=1

i,j
Dh
i,j
(

Q) Q = 0,
alors en choisissant une matrice Q dont les vecteurs colonnes sont nuls sauf le vecteur
C
i
qui est egal ` a

C
j
, on montre que
i,j
est nul.
On peut donc appliquer le theor`eme des extrema lies qui donne une condition necessaire
sur les points o` u le maximum est atteint. Ainsi, si le maximum de
A
sur
m
est
atteint en

Q, il existe des reels (
i,j
)
1i,jm
tels que
Q M
n,m
(R), D
A
(

Q) Q =
m

i,j=1

i,j
Dh
i,j
(

Q) Q.
Il en decoule que
C
1
, C
m
R
n
,
m

j=1
A

C
j
, C
j
) =
m

i,j=1

i,j

C
i
, C
j
),
donc
A

C
j
=
m

i=1

i,j

C
i
, 1 j m.
Ainsi, lendomorphisme canoniquement associe ` a la matrice A laisse stable le sous-
espace de R
n
engendre par les vecteurs

C
1
,

C
m
, et la matrice = (
i,j
)
1i,jm
nest
autre que la matrice de la restriction de cet endomorphisme dans la base (

C
1
,

C
m
).
53
On a alors :
A
(

Q) =

m
j=1
A

C
j
,

C
j
) = tr(). Or les valeurs propres de sont m
valeurs propres de A, on a donc :
A
(

Q) = tr() f
m
(A), et donc :
Q
m
,
A
(Q)
A
(

Q) f
m
(A).
3`eme etape : Il est facile de verier que la valeur f
m
(A) est eectivement atteinte
par
A
sur
m
. Il sut pour cela de choisir une matrice

Q dont les colonnes sont les
vecteurs propres (v
1
, v
m
) associes aux valeurs propres
1
(A),
m
(A), et dappli-
quer la formule (2.2). On a donc demontre legalite (2.1). La convexite de f
m
decoule
directement de cette egalite car on a vu quun sup de fonctions convexes est toujours
convexe (proposition 1.1).
En prenant m = 1, on obtient en particulier la convexite de la premi`ere valeur
propre
1
. En prenant m = n 1, on obtient que f
n1
= tr
n
est convexe. Or la
trace est lineaire, donc concave ; on en deduit donc que la plus petite valeur propre

n
= tr f
n1
est concave comme somme de fonctions concaves.
Ces deux cas particuliers pouvaient aussi se deduire du theor`eme de Rayleigh-Ritz :

1
(A) = max
x=1
Ax, x),
n
(A) = min
x=1
Ax, x).
2.3 Quelques resultats importants sur les fonctions convexes
2.3.1 Inegalites de convexite
Ce resultat est parfois designe sous le nom de theor`eme de Jensen discret. Le vrai
theor`eme de Jensen (dicile) est enonce dans la section suivante.
Theor`eme 2.3.1 Soit f : C R, convexe. Alors, pour tout entier k 2,
x
1
, x
k
C, = (
1
,
k
) [0, 1]
k
,
k

i=1

i
= 1,
f
_
k

i=1

i
x
i
_

i=1

i
f(x
i
).
54
Preuve. Pour k = 2, cest la denition; on passe ` a des entiers k 3 par une
recurrence facile. Voir par exemple [2].
Applications : voir par exemple [2]
ln convexe
k

i=1
x

i
i

k

i=1

i
x
i
. (2.3)
x xln x convexe
_
k

i=1

i
x
i
_
P
k
i=1

i
x
i

i=1
x

i
x
i
i
. (2.4)
x
1
1 + e
x
convexe
k

i=1

i
1 + x
i

_
1 +
k

i=1
x

i
i
_
1
(2.5)
La premi`ere inegalite est connue sous le nom dinegalite arithmetico-geometrique. Elle
permet par exemple dobtenir linegalite de H older :
f, g : X C, mesurables, p, p

]1, +[, avec


1
p
+
1
p

= 1,
_
X
[fg[d
__
X
[f[
p
d
_
1/p
__
X
[g[
p

d
_
1/p

,
do` u on deduit egalement linegalite de Minkowski,
f, g : X C, mesurables, p ]1, +[,
__
X
[f + g
p
[d
_
1/p

__
X
[f[
p
d
_
1/p
+
__
X
[g[
p
d
_
1/p
.
2.3.2 Inegalite de Jensen
Theor`eme 2.3.2 Soient (X, /, ) un espace de probabilite, I un intervalle non vide,
et f : X I une fonction integrable. Alors, pour toute fonction convexe : I R, telle
que f soit integrable, on a :

__
X
fd
_

_
X
( f)d.
Remarque : on retrouve le theor`eme 2.3.1 dans le cas particulier o` u
X = R, / = T(R), =
1
n
n

i=1

x
i
.
55
En dehors de ce cas particulier, les applications de linegalite de Jensen concernent
notamment la physique statistique et la theorie de linformation. Citons lexemple suivant,
tr`es utile en physique statistique :
Corollaire 2.3.3 Soit X une variable aleatoire sur un espace de probabilite. Alors on
a :
e
E(X)
E(e
X
).
2.3.3 Continuite des fonctions convexes
Les proprietes de continuite dune fonction convexe sont importantes mais moins
simples quil ny parat. Voir les commentaires qui suivent lenonce du theor`eme 2.3.5.
On commence par un resultat facile dans le cas o` u la fonction est bornee.
Theor`eme 2.3.4 Soient ouvert convexe de R
N
, et f convexe bornee sur . Alors
pour toute partie C incluse dans , telle quil existe > 0 avec C + B

, f est
lipschitzienne sur C.
Preuve.
La gure 2.3.3 permet de comprendre et memoriser lidee de cette preuve. Soit M > 0
tel que : x , [f(x)[ M. On va montrer qualors f est 2M/-lipschitzienne sur C,
i.e.
x, y C, [f(x) f(y)[
2M

|x y|.

C
x
y
z
2
z
1
Fig. 2.1 Preuve du theor`eme 3.2.
Prenons donc x, y C, x ,= y. On peut alors tracer la droite (xy). Notons z
1
et z
2
les
points de cette droite obtenus en translatant y, respectivement x, dune distance vers
lexterieur du segment :
z
1
= y +
y x
|y x|
, z
2
= x +
x y
|y x|
.
56
Alors z
1
et z
2
sont dans . De plus, y appartient ` a linterieur du segment [x, z
1
], cest-` a-
dire quil existe ]0, 1[ tel que y = x + (1 )z
1
. On peut calculer en rempla cant z
1
par sa denition, et on obtient
=

|x y| +
.
Alors, par convexite de f, on a :
f(y) f(x) + (1 )f(z
1
)
f(y) f(x) (1 )(f(z
1
) f(x)) 2M(1 ) = 2M
|y x|
|y x| +

2M

|y x|.
Le meme raisonnement, applique cette fois au point z
2
, donne
f(x) f(y)
2M

|y x|.
Do` u le resultat.
Remarque : voir par exemple [2] pour la preuve dans R
N
, ou [3] pour le cas N = 1 (cest
exactement la meme preuve). Le theor`eme et sa preuve sont encore valables en dimension
innie, mais dans ce cas, lhypoth`ese fonction bornee est particuli`erement forte.
Theor`eme 2.3.5 Soit f une fonction convexe denie sur un ouvert convexe de R
N
.
Alors f est continue sur , et lipschitzienne sur tout compact de .
La preuve consiste naturellement ` a montrer que la fonction est bornee au voisinage
de chacun de ses points, et ` a appliquer le resultat precedent. Notons au passage que ce
corollaire ne se generalise pas ` a la dimension innie (contre-exemple simple : il existe des
fonctions lineaires non continues). Cela tient au fait quen dimension innie, les fonctions
convexes ne sont pas necessairement localement bornees.
Comment montrer quune fonction est bornee au voisinage dun point ? On voit quen
dehors du cadre classique des fonctions continues, on est souvent bien demuni. Lidee va
etre, dans un premier temps, de minorer f en la comparant ` a une fonction ane (voir le
lemme ci-dessous), et dans un deuxi`eme temps, de la majorer ` a laide des inegalites de
convexite.
Lemme 2.3.6 Soit un ouvert convexe non vide de R
N
, et f : R une fonction
convexe. Alors il existe une fonction ane g qui minore f sur . De plus, pour tout
x
0
, on peut choisir g telle que g(x
0
) = f(x
0
).
57
(On peut montrer que ce lemme se generalise ` a un Banach, fournissant une application
lineaire continue g, ` a condition que lepigraphe de f ne soit pas dense dans E R. Cette
hypoth`ese supplementaire exclut en particulier le cas o` u f est lineaire non continue. Le
lemme se demontre alors de la meme fa con, lexistence dun hyperplan dappui etant dans
ce cas une consequence du theor`eme de Hahn-Banach.)
Preuve. Soit C lepigraphe de f, alors C est convexe, non vide, et pour x
0
xe,
on a (x
0
, f(x
0
)) C. On sait alors quil existe un hyperplan dappui ` a C en (x
0
, f(x
0
)),
i.e. il existe une application lineaire l et un reel tels que
(l, ) ,= (0, 0), et = l(x
0
) + f(x
0
) l(x) + r, (x, r) C. (2.6)
On va montrer que est strictement positif. En eet, supposons dabord < 0. En
considerant les points (x, f(x) + n), o` u x C est xe, et n N tend vers +, on
contredit la relation (2.6). Supposons maintenant que = 0. La relation (2.6) signie
que lapplication lineaire l, restreinte ` a , atteint en x
0
un minimum. Or est ouvert,
et l lineaire, donc si elle atteint un minimum, cest quelle est identiquement nulle. Cela
contredit lhypoth`ese (l, ) ,= (0, 0). Do` u > 0. En prenant r = f(x) et en divisant par
dans linegalite (2.6), on obtient alors
f(x) g(x) =
1

(l(x) ).
On verie aisement que g est ane, et que g(x
0
) = f(x
0
).
Il reste ` a prouver le theor`eme. Soit donc un ouvert convexe de R
N
et f une fonction
convexe sur . Soit x
0
R
N
, on veut montrer que f est bornee sur un voisinage de x
0
.
Lidee est de choisir comme voisinage particulier un simplexe
= co(s
0
, s
N
) tel que x
0

et > 0, +

B

.
(Par exemple, tout simplexe regulier inscrit dans une sph`ere euclidienne centree en x
0
et
incluse dans convient. Notons que des voisinages de ce type ne peuvent etre exhibes
quen dimension nie.) Dapr`es le lemme, il existe g ane qui minore f ; g est continue sur
le compact donc y est bornee, do` u f est minoree sur . Par ailleurs, tous les elements
de sont combinaisons convexes des sommets s
0
, s
N
. Ainsi,
x =
N

i=0

i
s
i
, f(x)
N

i=0

i
f(s
i
)
N

i=0
f(s
i
)
donc f est majoree sur . Par application du theor`eme 2.3.4, on obtient la continuite de
f sur .
Par ailleurs, si K est un compact inclus dans , alors il existe > 0 tel que K+

B
2
.
Dapr`es ce qui prec`ede, f est contine sur le convexe compact K +

B

, donc y est bornee.


Il reste ` a appliquer le theor`eme 2.3.4 pour obtenir que f est lipschitzienne sur K.
58
De cette propriete, on peut deduire le resultat suivant :
Proposition 2.3.7 Soit (f
n
) une suite de fonctions convexes sur R
N
, qui converge sim-
plement vers une limite f. Alors f est convexe, et la convergence est uniforme sur tout
compact.
Preuve. (voir HUL). La convexite de f est immediate par passage ` a la limite.
Montrons maintenant que la convergence de la suite est uniforme sur tout compact.Il
sut de le verier pour des compacts de la forme S =

B(0, r), r > 0 . La preuve se fait
en trois etapes :
1. On montre que la suite (f
n
) est bornee independamment de n sur S. Pour cela, on
introduit la fonction g = sup
k
f
k
. Alors g est convexe et verie :
x S, g(x) = sup f
k
(x) < +.
Dapr`es le theor`eme precedent, on en deduit que g est continue sur S, do` u
M > 0, x S, k, f
k
(x) g(x) M.
Cherchons maintenant ` a minorer uniformement les fonctions f
k
sur S. Dautre part,
la suite (f
k
(0)) est convergente donc minoree, i.e.
R, k, f
k
(0) .
Par convexite de f
k
, on a aussi, pour tout x S,
f
k
(x) 2f
k
(0) f
k
(x) 2 M,
donc les fonctions f
k
sont bien minorees uniformement sur S.
2. On en deduit que les f
n
, et donc egalement la fonction f, sont lipschitziennes sur S,
de constante de Lipschitz K independante de n.
3. Pour > 0, on recouvre S par un nombre ni de boules de rayon , centrees en des
points x
i
, i = 1..m. Pour x S, il existe donc i tel que x B(x
i
, ). On decompose
[f
n
(x) f(x)[ [f
n
(x) f
n
(x
i
)[ +[f
n
(x
i
) f(x
i
)[ +[f(x
i
) f(x)[
et on majore chaque terme independamment de x, pour n assez grand, en utilisant
la propriete de Lipschitz pour le 1er et le 3`eme terme, et la convergence ponctuelle
au point x
i
pour le deuxi`eme terme. Il vient :
k
0
(independant de x) tel que k > k
0
, sup
xS
[f
k
(x) f(x)[
ce qui donne bien la convergence uniforme sur S.

59
Notons au passage que, meme en dimension nie, les fonctions convexes ne sont pas
necessairement continues au bord de leur domaine. On sen convainct aisement en consi-
derant la fonction f denie sur [0, 1] par
f(x) =
_
1 si x = 0,
x sinon.
2.3.4 Derivabilite
Remarque 2.3.1 De la propriete de Lipschitz decoule, en utilisant le theor`eme de
Rademacher (dur) que toute fonction convexe est dierentiable presque partout sur son
domaine (presque partout au sens de la mesure de Lebesgue). Voir par exemple [1] pour
une preuve du theor`eme de Rademacher. Ce resultat permet, par exemple, dautoriser
dans des calculs dintegrale des changements de variable convexes.
Pour simplier, nous allons nous limiter au cas de la dimension N = 1, et montrer que
toute fonction convexe est derivable sauf en un nombre au plus denombrable de points.
Lemme 2.3.8 Soit f une fonction convexe sur un intervalle ouvert I de R. Alors f
admet une derivee ` a gauche et ` a droite en tout point, i.e. pour tout x
0
I, le taux
daccroissement
f(x
0
+ t) f(x
0
)
t
admet une limite nie f

d
(x
0
) quand t tend vers 0
+
et une limite nie f

g
(x
0
) quand t
tend vers 0

. De plus, on a, pour tout x


0
I, f

d
(x
0
) f

g
(x
0
).
Preuve. Ce resultat decoule directement du crit`ere des pentes croissantes, voir
proposition 2.1.4. Soit en eet x
0
I. La fonction
t
f(x
0
+ t) f(x
0
)
t
est croissante sur un intervalle ouvert contenant 0. Elle admet donc une limite nie quand
t tend vers 0
+
et une limite nie quand t tend vers 0

, et on a bien linegalite voulue.


Remarque 2.3.2 Si la fonction est denie jusquaux bornes de lintervalle, on peut encore
denir une derivee ` a gauche ou ` a droite comme limite du taux daccroissement, mais dans
ce cas cette derivee sera eventuellement innie.
Theor`eme 2.3.9 Soit f une fonction convexe sur un intervalle I de R. Alors f est
derivable sauf en un nombre au plus denombrable de points.
60
Preuve. Remarquons dabord que pour x
1
, x
2
I, x
1
< x
2
, on a, toujours dapr`es
le crit`ere des pentes croissantes :
f

d
(x
1
)
f(x
1
) f(x
2
)
x
1
x
2
f

g
(x
2
). (2.7)
Soit x un point o` u f nest pas derivable, trois cas peuvent se produire :
on a : f

g
(x) = . Il existe au maximum un point x I satisfaisant cette condition.
En eet, si deux points x et y la satisfont, avec x < y, on a dapr`es le lemme,
f

g
(y) = , et dapr`es la remarque ci-dessus,
f(y) f(x)
y x
= ,
ce qui est absurde.
on a : f

d
(x) = +. De la meme fa con, il existe au maximum un point x I
satisfaisant cette condition.
les derivees ` a gauche et ` a droite sont nies mais dierentes, i.e.
x = x I, < f

g
(x) < f

d
(x) < +.
Considerons la famille
]f

g
(x), f

d
(x)[, x .
Cest une famille dintervalles non vides, et disjoints dapr`es (2.7). Elle est donc au plus
denombrable. En eet, on peut construire une injection
N
x minn N, q
n
]f

g
(x), f

d
(x)[
o` u q
n
, n N = Q. On en deduit que , et donc lensemble des points de non-derivabilite
de f, sont au plus denombrables.
2.4 Probl`emes dextrema
On sextrait dans cette section du cadre des fonctions convexes (mais on y reviendra
comme un cas particulier important) pour etudier des probl`emes plus generaux de mini-
misation. X designe un espace de Banach. K est une partie fermee non vide de X. On
consid`ere une fonction J : K R, que lon appelle crit`ere ou fonction-co ut.
Les questions que lon se pose sont :
J admet-elle un point de minimum sur K, i.e. existe-t-il
u K, t.q.J(u) = inf
vK
J(v)
si oui, ce point est-il unique ? comment le caracteriser ?
61
2.4.1 Existence du minimum, sans hypoth`ese de convexite
Denition 2.4.1 La fonction J est dite coercive sur K si
lim
xK,x+
J(x) = +,
i.e. lune des conditions equivalentes ci-dessous est veriee :
1. A > 0, r > 0, x K, |x| > r J(x) > A.
2. (x
n
) K
N
, |x
n
| + J(x
n
) +.
On a alors le resultat suivant, en dimension nie :
Theor`eme 2.4.1 Soit K un ferme non vide de R
N
. Soit J une fonction coercive et
semi-continue inferieurement sur K. Alors inf
K
J existe et est atteint.
Preuve. On montre dabord que J est minoree. Soit x
0
K, dapr`es la coercivite
de J, il existe r > 0 tel que
|x| r J(x) J(x
0
).
Il sut donc de montrer que J est minoree sur le compact K

B(0, r). Supposons le
contraire : alors il existe une suite (x
m
) delements de K

B(0, r), telle que J(x
m
) .
Par compacite, on peut en extraire une sous-suite convergeant vers x K

B(0, r). La
semi-continuite inferieure de J permet de conclure
J( x) liminf J(x
n
k
) = ,
ce qui est absurde. On a donc montre que J est minore sur K.
Montrons maintenant que linf est atteint. Pour cela, on consid`ere ` a nouveau une suite
minimisante (x
m
)
mN
. J etant coercive, on en deduit que la suite est bornee. Elle admet
donc une sous-suite convergente et, comme ci-dessus, sa limite x est un point de minimum
pour J.
Remarque 2.4.1 Ce theor`eme est utilise le plus souvent dans le cas dune fonction J
continue, ce qui est plus fort que sci. Cependant, lhypoth`ese sci peut etre utile dans la
mesure o` u un sup de fonctions continues nest pas necessairement continue, mais reste
sci.
Remarque 2.4.2 Ce resultat est faux en dimension innie ! On peut citer le contre-
exemple suivant (voir [8]). Soit X = H
1
(]0, 1[), muni de la norme
|v| =
__
1
0
v
2
(x) + v

2
(x)dx
_
1/2
.
62
On denit sur X lapplication J par
v X, J(v) =
_
1
0
_
([v

(x)[ 1)
2
+ v(x)
2
_
dx.
On montre que J est continue (donc semi-continue inferieurement), coercive, et satisfait
v X, J(v) > 0, inf
vX
J(v) = 0.
2.4.2 Existence du minimum - Cas convexe
Remarquons que la convexite ne sut pas ` a garantir lexistence dun minimum. En
particulier,
convexe , minoree (ex : fonction lineaire)
convexe minoree , existence du min (ex : exp sur R)
convexe minoree , unicite du min (ex : fonction constante)
Lemme 2.4.2
1. Soit X = R
d
, K convexe ferme non vide de X. Soit > 0. Soit J : K R,
-convexe. Alors
R, v K, J(v)

8
|v|
2
+ .
2. Le meme resultat reste vrai dans un espace de Banach, si la fonction J est supposee
semi-continue inferieurement.
Preuve. (voir [8]). On consid`ere dabord le cas de la dimension nie. Fixons v
0
K.
Alors,
v K, J
_
v
0
+ v
2
_

J(v) + J(v
0
)
2


8
|v v
0
|
2
ce qui se reecrit sous la forme
J(v) J(v
0
) +

4
|v v
0
|
2
+ 2J
_
v + v
0
2
_
. (2.8)
On va utiliser le lemme 2.3.6 : il existe une fonction ane qui minore J. Lidee est que
cette fonction ane sera plus petite que le terme quadratique plus une constante. Ainsi,
L X

, R, v K, J(v) L(v) + .
Reprenant linegalite (2.8), on obtient alors
v K, J(v) J(v
0
) +

4
|v v
0
|
2
+ L(v + v
0
) + 2.
63
Dautre part, on a
|v v
0
|
2
[ |v| |v
0
| [
2
= |v|
2
+|v
0
|
2
2|v||v
0
|
et
L(v + v
0
) = L(v) + L(v
0
) c
1
|v| + L(v
0
),
o` u c
1
= |L|. Finalement, il vient
v K, J(v) J(v
0
) +

4
|v|
2
c
2
|v| + c
3
o` u
c
2
= c
1
+

2
|v
0
|, c
3
=

4
|v
0
|
2
+ 2 J(v
0
) + L(v
0
).
Pour faire disparatre le terme c
2
|v|, il reste ` a remarquer que
c
2
|v|

8
|v
0
|
2
+
2c
2
2

.
Le resultat en decoule directement.
En dimension innie, la preuve est identique, mais lexistence dune fonction ane
qui minore J nest pas toujours valable (il faut que lepigraphe de J soit non dense).
Le resultat reste vrai sous lhypoth`ese supplementaire : J semi-continue inferieurement,
auquel cas son epigraphe est ferme donc non dense.
On peut enn enoncer le theor`eme
Theor`eme 2.4.3 Soit X un Banach, K un ferme convexe non vide de X et J : K R.
1. Si J est strictement convexe sur K, alors elle a au plus un point de minimum sur
K ;
2. si J est fortement convexe et semi-continue inferieurement, alors J a exactement un
point de minimum u K, et on a
v K, |v u|
2

(J(v) J(u)).
Preuve.
1. Soient u et v deux points de minimum. Sils sont distincts alors par stricte convexite
de J, on a
J
_
u + v
2
_
< J(u) = J(v) = inf
wK
J(w),
ce qui est absurde.
64
2. Dans le cas fortement convexe, lunicite provient du 1). Il reste ` a montrer lexistence.
Dapr`es le lemme 2.4.2, J est minoree. Soient donc
m = inf
vK
J(v)
et soit (u
m
) une suite minimisante. On montre que cette suite est de Cauchy. Pour
cela, considerons p, q N. On a :
J
_
u
p
+ u
q
2
_

J(u
p
) + J(u
q
)
2


8
|u
p
u
q
|
2
.
Ainsi,
|u
p
u
q
|
2

_
J(u
p
) + J(u
q
) 2J
_
u
p
+ u
q
2
__

(J(u
p
) + J(u
q
) 2m)
Le membre de droite de cette inegalite tend vers 0 quand p, q tendent vers +. X
etant complet et K ferme, on en deduit lexistence dune limite u K. Enn, J etant
semi-continue inferieurement, on a bien
J(u) lim
p+
J(u
p
) = inf
K
J.
Il reste ` a verier lestimation derreur. Soit donc v K, on a :
J(u) J
_
u + v
2
_

J(u) + J(v)
2


8
|u v|
2
,
do` u il vient bien le resultat enonce.

Remarque 2.4.3 Le lecteur attentif aura remarque la similitude entre cette preuve et
celle du theor`eme de projection sur un convexe ferme non vide dans le cas hilbertien. En
fait, le theor`eme de projection nest autre quun cas particulier de ce theor`eme, pour la
fonction J denie par
J(v) = |x v|
2
, v K.
Dans le cas hilbertien, la norme est fortement convexe, donc ce theor`eme permet de re-
trouver lexistence et lunicite du projete. Dans le cas dun Banach, la norme est convexe,
mais pas necessairement fortement convexe. On perd donc le theor`eme de projection.
2.4.3 Applications
1. Methodes de gradient
Le theor`eme precedent et lestimation derreur associee sont ` a la base de nombreux
algorithmes doptimisation, en particulier des methodes de gradient. Lidee est la
65
suivante : pour approcher numeriquement le minimum dune fonction J supposee
dierentiable et fortement convexe, on initialise lalgorithme avec une valeur u
0
quel-
conque, et on denit la suite u
n
par
u
n+1
= u
n

n
J(u
n
),
o` u
n
est le pas de la descente, qui peut soit etre constant pour tout n (gradient ` a
pas constant) soit etre optimise ` a chaque etape pour accelerer la descente (gradient
` a pas optimal). On obtient la convergence de lalgorithme de gradient ` a pas optimal
dans le cas fortement convexe. Cette methode est en particulier tr`es employee pour
resoudre des syst`emes lineaires ` a matrice symetrique denie positive.
2. Le probl`eme des ellipsodes de John-Loewner
Soit / un compact dinterieur non vide de R
d
. On cherche sil existe un ellipsode de
volume minimal contenant /.
A un changement dorigine pr`es, un ellipsode est de la forme
E
A
= x R
d
, (Ax, x) 1, A o
++
d
. (2.9)
En diagonalisant A dans une base orthonormee, on montre que le volume de E
A
est
V (E
A
) = c
d
(det A)
1/2
,
o` u c
d
est une constante ne dependant que de la dimension d. Le volume etant positif,
il est equivalent de minimiser son carre. On peut (mais cest long... !) montrer le
theor`eme
Theor`eme 2.4.4 Il existe un unique ellipsode E
A
de volume minimal contenant
/ parmi les ellipsodes de la forme (2.9).
Lexistence repose ici sur des arguments de continuite et compacite (on ne les detaille
pas ici). En fait, le probl`eme se reformule ainsi : minimiser la fonction
J : K R
A (det A)
1
,
o` u K est deni par
K = A o
++
d
(R), t.q./ E
A
= A o
++
d
(R), t.q.x /, (Ax, x) 1.
Lunicite provient de la stricte convexite de lapplication J. Il en decoule quil y a au
plus un point de minimum sur K.
Proposition 2.4.5 Lapplication A (det A)
1
est strictement convexe sur o
++
d
.
La preuve repose sur le lemme suivant :
Lemme 2.4.6 Soit P polyn ome ` a coecients reels, et scinde sur R, veriant :
P > 0 sur [0, 1]. Alors 1/P est fortement convexe sur [0, 1].
66
Preuve. On note P(X) = a

n
i=1
(X x
i
)

i
, avec
i
> 0, x
i
R[0, 1]. Alors
P

P
=
n

i=1

i
X x
i
donc
_
P

P
_

=
n

i=1

i
(X x
i
)
2
< 0.
Or
_
1
P
_

=
_
P

P
2
_

=
1
P
_
P

P
_

+
P
2
P
3
> 0.
Notons = min
t[0,1]
_
1
P
_

(t), alors 1/P est -convexe sur [0, 1].


Montrons maintenant la proposition.
Soient M, N o
++
d
, M ,= N ; on pose
P(t) = det(tM + (1 t)N), t [0, 1].
Il est clair que P est un polyn ome ` a coecients reels et que P(t) > 0, t [0, 1].
Verions que P est ` a racines reelles.
Soit t C une racine de P, alors
det
_
I +
1 t
t
M
1
N
_
= 0,
donc =
t
1 t
est une valeur propre de M
1
N. Soit X ,= 0 un vecteur propre
associe :
M
1
NX = X
Alors
(M
1
NX, NX) = (X, NX),
les produits scalaires etant positifs strictement. Donc > 0. On a aussi ,= 1 donc
t =

1
R.
Dapr`es le lemme, 1/P est fortement convexe sur [0, 1], donc 1/ det est strictement
convexe (mais pas fortement, la constante dependant de M et N).
2.4.4 Caracterisation du minimum - Cas sans contrainte
On parle de minimisation sans contrainte lorsquon minimise une fonction sur lespace
entier. (Si on minimise sur une partie C stricte de X, on impose sur le minimiseur une
certaine contrainte, qui est dappartenir ` a C.)
67
Une condition necessaire bien connue, dans le cas o` u J est dierentiable, est que le
point de minimum est un point critique, i.e. annule la dierentielle. On montre que dans
le cas convexe, cette condition est susante.
Theor`eme 2.4.7 On suppose ici que C = X. Soit J convexe sur X, et x
0
X. Alors
1.
x
0
minimum local de J x
0
minimum global de J
v X, J

(x; v) [0, +].


2. lensemble des points de minimum est un convexe (eventuellement vide) ;
3. si de plus, J est dierentiable en x
0
, alors x
0
minimum local de J DJ(x
0
) = 0.
Preuve.
1. Il est clair que x
0
minimum global de J x
0
minimum local de J v X, J

(x; v)
[0, +]. Supposons maintenant que v X, J

(x; v) [0, +]. Soit x X, alors en


posant v = x x
0
, on a
0 J

(x
0
; v) = inf
t>0
J(x
0
+ tv) J(x
0
)
t
J(x
0
+ v) J(x
0
).
On en deduit J(x) J(x
0
), pour tout x X, donc x
0
est un point de minimum
global.
2. Le point 2 est immediat.
3. Supposons J dierentiable en x
0
, point de minimum local ; alors pour tout v X,
J

(x
0
; v) = DJ(x
0
)v 0. En changeant v en v on a bien le resultat voulu. La
reciproque est immediate.

Le fait de pouvoir caracteriser le point de minimum par lannulation de la derivee a des


applications importantes. On peut citer par exemple, dans le domaine des equations aux
derivees partielles, lequivalence entre lequation et la minimisation dune energie. Ainsi,
pour lequation de Laplace avec conditions au bord de Dirichlet sur un ouvert borne et
regulier,
u(x) = 0, x , u(x) = 0, x , (2.10)
u H
1
0
() = X est solution de (2.10) au sens des distributions si et seulement si elle
minimise la fonction
J : H
1
0
() R, J(v) =
_

[v(x)[
2
dx.
En eet, on verie que J est dierentiable, de dierentielle
DJ(v).h = 2
_

v(x), h(x))dx.
68
On a de plus, pour tout v, h X,
J(v + h) J(v) + DJ(v).h,
donc J est convexe. Ainsi, u X est un point de minimum de J si et seulement si
DJ(u) = 0.
DJ(u) = 0 h X,
_

v(x), h(x))dx = 0.
En integrant par parties, on obtient
DJ(u) = 0 h X,
_

u(x)h(x)dx = 0 u(x) = 0 pp sur .


2.4.5 Minimisation sous contraintes dinegalite/egalite
On consid`ere maintenant le cas tr`es frequent o` u on doit minimiser une fonction J sur
un sous-ensemble strict K de X = R
N
. On se limitera au cas o` u K est de la forme
K = x R
N
, g
i
(x) 0, h
j
(x) = 0, 1 i m, 1 j p.
et o` u J, g
i
, 1 i m, h
j
, 1 j, p sont de classe C
1
. On parle alors de minimisation sous
contraintes degalite/inegalite. Remarquons aussi que toute contrainte degalite h
j
(x) = 0
peut etre remplacee par les deux contraintes dinegalite h
j
(x) 0, h
j
(x) 0.
Lorsquon ne suppose pas dhypoth`ese de convexite sur les fonctions, on a une condition
necessaire dextremum local, appelee condition de Fritz John.
Theor`eme 2.4.8 (Condition necessaire de Fritz John, 1948).
Soit x K un minimum local de J sur K. Alors on a

0
= 0 ou 1,
i
0, 1 i m,
j
R, 1 j p, tels que

0
J +

i
g
i
+

j
h
j
_
( x) = 0, (2.11)
(
0
, , ) ,= 0, (2.12)

i
g
i
( x) = 0. (2.13)
Remarques :
1. Dans le cas o` u les gradients des contraintes au point x sont lies, on peut prendre

0
= 0 : cest le cas dit anormal ou singulier. A linverse, si les gradients
des contraintes sont tous lineairement independants au point x (cas normal ou
regulier), alors necessairement
0
,= 0, et on retrouve (dans le cas des contraintes
degalite) le theor`eme des extrema lies. Les coecients
j
,
i
sont alors appeles mul-
tiplicateurs de Lagrange.
69
2. La condition

i
g
i
( x) = 0 est appelee condition decart. Notons que, les
i
etant
des multiplicateurs positifs ou nuls, et les g
i
( x) etant negatifs ou nuls, cette condition
est equivalente ` a
i = 1, ...,
i
g
i
( x) = 0.
Autrement dit, on na pas besoin de prendre un multiplicateur de Lagrange lorsque
la contrainte g
i
nest pas ` a legalite. (On dit alors que la contrainte nest pas active
ou pas saturee.)
3. Le resultat admet des generalisations lorsque X est un Hilbert, voir par exemple
[8]. On lenonce en general sous une hypoth`ese supplementaire, dite de contraintes
qualiees en x , qui permet decarter le cas anormal. La preuve repose alors sur le
lemme de Farkas-Minkowski (voir theor`eme 1.5.7 page 33).
Preuve. La preuve proposee ici est valable seulement en dimension nie (X = R
N
),
mais a lavantage detre elementaire.
Pour simplier, on suppose que m = p = 1. La preuve repose sur une penalisation de
la fonction co ut J. Soit x un minimum local de J sur K. On a donc :
> 0, x K

B( x, ), J(x) J( x).
On va denir des fonctionnelles penalisees
k
, k N

sur

B( x, ) par

k
(x) = J(x) +|x x|
2
+ kg
+
2
(x) + k|h(x)|
2
,
o` u g
+
(x) = max(g(x), 0). Par compacite de la boule et continuite de
k
, il existe x
k

B( x, ) point de minimum global de


k
. Quitte ` a extraire une sous-suite, on peut supposer
que la suite (x
k
) converge vers une limite x



B( x, ). La preuve consiste en trois etapes :
1. montrer que x

= x;
2. ecrire la condition necessaire doptimalite pour x
k
,
3. passer ` a la limite k +.
Verions donc ces trois points.
1. Pour la premi`ere etape, on va montrer que x

K et que J(x

)+|x

x|
2
J( x).
Cette inegalite sobtient en ecrivant :
k 1, J(x
k
) +|x
k
x|
2

k
(x
k
)
k
( x) = J( x)
(la deuxi`eme inegalite vient du fait que x
k
est un minimiseur de
k
sur la boule, et
legalite est vraie car x K) et en passant ` a la limite quand x +. Il reste ` a
verier que x

K, i.e. h(x

) = 0 et g
+
(x

) = 0. Pour cela, rappelons

k
(x
k
)
k
( x) = J( x)
J(x
k
) +|x
k
x|
2
+ kg
+
2
(x
k
) + k|h(x
k
)|
2
J( x)
k
_
g
+
2
(x
k
) +|h(x
k
)|
2
_
J( x) min
x

B( x,)
J(x) = M
70
o` u M est une constante independante de k. En faisant tendre k vers +, il vient
g
+
2
(x

) +|h(x

)|
2
= 0, i.e. x

K.
Maintenant, si x ,= x

, on en deduit
J(x

) < inf
xK
J(x),
ce qui est absurde car x

K. Donc x = x

.
2. On vient de montrer que x
k
tend vers x quand k +, donc pour k assez grand,
x
k
est dans la boule ouverte B( x, ). Alors, on peut appliquer la condition necessaire
usuelle de minimalite et on a :
k
(x
k
) = 0, qui se reecrit
J(x
k
) + 2(x
k
x) + 2kg
+
(x
k
)g(x
k
) + 2kh(x
k
)h(x
k
) = 0. (2.14)
Posons

k
= 2kg
+
(x
k
) 0,
k
= 2kh(x
k
).
3. On veut maintenant passer ` a la limite k +. Deux cas se presentent :
(a) si les suites (
k
) et (
k
) sont bornees : alors on peut extraire des sous-suites
convergentes, de limites respectives 0, R. A la limite, on verie bien la
condition doptimalite (2.11) avec
0
= 1. On est dans le cas normal et (2.12)
est bien veriee. De plus, si g( x) < 0, alors g(x
k
) < 0 pour k assez grand, et
donc = 0. Ainsi, la condition (2.13) est satisfaite.
(b) si lune des suites (
k
) et (
k
) est non bornee : ` a une sous-suite pr`es, on a
[
k
[ +[
k
[ +.
Divisons legalite (2.14) par [
k
[ +[
k
[, et faisons tendre k vers +; on obtient
` a la limite :
0 = g( x) + h( x),
o` u
(, ) = lim
k+
_

k
[
k
[ +[
k
[
,

k
[
k
[ +[
k
[
_
satisfait :
[[ +[[ = 1, 0.
Ainsi, (2.11) et (2.12) sont bien veriees avec
0
= 0 (cas anormal). On verie
(2.13) de la meme fa con que dans le cas normal.

71
2.4.6 Condition doptimalite - cas de contraintes convexes
Comme pour la minimisation sans contrainte, o` u la condition necessaire devient neces-
saire et susante lorsque la fonction co ut est convexe, les conditions de Fritz John sont
egalement susantes dans le cas o` u la fonction co ut et les contraintes sont convexes. Cest
le theor`eme de Karush, Kuhn et Tucker, publie par Tucker et son thesard Kuhn en 1951,
mais montre independamment en 1948 par W. Karush dans un memoire de maitrise qui
navait pas ete publie...
Lenonce habituel du theor`eme est le suivant (voir par exemple [8]).
Theor`eme 2.4.9 (Karush, Kuhn, Tucker)
Soient J, g
1
, g
m
des fonctions convexes continues sur un Hilbert X, derivables sur
K = v X, g
i
(v) 0, 1 i m.
Soit u K tel que les contraintes sont qualiees en u. Alors u est un minimum global de
J sur K si et seulement si il existe = (
1
,
m
) (R
+
)
m
tel que
J(u) +
m

i=1

i
g
i
(u) = 0,
m

i=1

i
g
i
(u) = 0.
Nayant pas deni la notion de contraintes qualiees, nous allons enoncer le theor`eme
sous une forme un peu dierente, en nous restreignant ` a la dimension nie.
Theor`eme 2.4.10 (Karush, Kuhn, Tucker)
Soient J, g
1
, g
m
des fonctions convexes sur R
N
. On note
K = v X, g
i
(v) 0, 1 i m.
On denit une fonction L, appelee lagrangien, sur R
N
R
m
R par
L(x, ,
0
) =
0
J(x) +
m

i=1

i
g
i
(x).
Soit u K. On a les proprietes suivantes :
1. Si u est un minimum global de J sur K, alors il existe des multiplicateurs (
0
, ) tels
que
(a) u est point de minimum global de la fonction L(, ,
0
) sur X,
(b)
i
0, 1 i m,
0
= 0 ou 1 ;
(c)
i
g
i
(u) = 0, 1 i m.
2. Si
0
,= 0, les trois conditions ci-dessus sont susantes pour que u soit point de
minimum global de J sur K ;
3. sil existe x X satisfaisant : g
i
(x) < 0, 1 i m, alors on peut prendre
0
= 1.
72
QUELQUES GRANDS NOMS DE LANALYSE CONVEXE
J. Jensen 1859-1925 danois, expert dans une compagnie telephonique,
connu principalement pour linegalite integrale qui
porte son nom;
Minkowski 1864-1909 allemand, auteur de resultats sur la convexite en
dimension nie, notamment le theor`eme sur len-
veloppe convexe des points extremaux.
W. Fenchel 1905-1988 danois dorigine allemande, privilegie une ap-
proche geometrique ; auteur avec JJ. Moreau de
la notion de fonction conjuguee (conjuguee de
Fenchel-Moreau)
JJ Moreau 1923- mecanicien et mathematicien fran cais, voir Fenchel
L. Kantorovitch 1912-1986 mathematicien russe, laureat en 1975 (avec T.
Koopmans) du Prix Nobel deconomie, il est
considere comme un des fondateurs de la program-
mation lineaire en optimisation.
Fritz John en sinteressant au probl`eme de maximisation du
volume dun ellipsode contenu dans un convexe
donne (probl`eme des ellipsodes de John), il enonce
des conditions necessaires pour la minimisation
sous contrainte, connues sous le nom de conditions
de Fritz John.
A.W. Tucker
et son el`eve K.
Kuhn
connus pour le theor`eme dit de Kuhn-Tucker
(1951) qui enonce des conditions necessaires de
minimum pour loptimisation sous contrainte.
En fait, ce theor`eme avait dej` a ete demontre
independamment par W. Karush, russe, ` a locca-
sion de son memoire de maitrise en 1948 !
R.T. Rockafellar 1935- mathematicien americain, inventeur de la notion
de probl`eme dual en optimisation convexe.
73

Vous aimerez peut-être aussi