Vous êtes sur la page 1sur 23

Chapitre 1.

Éléments d’analyse convexe: rappels et compléments


Ensembles convexes
Definition (Ensemble convexe)
Soit X ⊆ Rn . L’ensemble X est dit convexe si :

∀(x1 , x2 ) ∈ X × X , ∀α ∈ [0, 1], αx1 + (1 − α)x2 ∈ X .

2 / 23
Ensembles convexes
Propriétés (à démontrer à titre d’exercice pour manipuler la définition d’un ensemble convexe)

1 Soit X un ensemble convexe et β ∈ R. Alors l’ensemble

βX = {βx ; x ∈ X }

est convexe.

2 L’intersection d’une collection d’ensembles convexes est un convexe.

3 / 23
Quelques ensembles remarquables

Definition (Combinaison convexe)


Soient x1 , .., xm , m éléments de Rn . On dit que x est combinaison convexe de ces points
s’il existe des réels positifs (α1 , ..., αm ) tels que:
m
X m
X
x= αi xi avec: αi = 1.
i=1 i=1

Definition (Enveloppe convexe)


Soit X ⊆ Rn un ensemble. On appelle enveloppe convexe de X et on note conv (X )
l’ensemble convexe le plus petit contenant X . En dimension finie, c’est aussi l’ensemble
des combinaisons convexes d’éléments de X :
p p
X X
conv (X ) = {x ∈ Rn | x = αi xi où xi ∈ X , p ∈ N et αi = 1, αi ≥ 0}.
i=1 i=1

4 / 23
Quelques ensembles remarquables
Illustrations

5 / 23
Cône convexe et cône dual
On verra plus tard dans ce cours des applications à l’optimisation conique i.e. à des
problèmes d’optimisation de la forme:

minhc, xi sous Ax = b
x∈K

où K est un cône de Rn .

Definition (Cône)
L’ensemble K ⊆ Rn est un cône si:

∀x ∈ K , ∀λ ≥ 0, λx ∈ K .

De plus:
1 K est appelé cône convexe si K est un cône et si K est convexe.
2 K est appelé cône pointé si K est un cône et si K ne contient pas de droite
vectorielle i.e. K ∩ (−K ) ⊂ {0}.
3 K est appelé cône solide si K est un cône et si K est d’intérieur non vide.
4 K est appelé cône propre si K est un cône convexe fermé solide et pointé.

6 / 23
Cône convexe
Illustrations

7 / 23
Inégalités généralisées - Inégalités sur un cône convexe
Soit K un cône propre. K induit un ordre partiel sur Rn :
a K b ⇔ a − b ∈ K .
Quelques exemples.
K = Rn+

Cône de Lorentz: Ln = {(x, z) ∈ Rn × R | ||x||2 ≤ z}.

Cône SDP: S+
n = {M ∈ R
n×n
| M > = M, v > Mv ≥ 0, ∀v ∈ Rn }.

8 / 23
Cône SDP
Illustrations

Montrer que le cône SDP en dimension 2 peut être défini à l’aide d’inégalités
fonctionnelles "classiques".

9 / 23
Cône dual

Definition (Cône dual)


Soit X un sous-ensemble quelconque de Rn . L’ensemble:

X ∗ = {y ∈ Rn | hx, y i ≥ 0, ∀x ∈ X }

est appelé cône dual de l’ensemble X .

10 / 23
Cône dual
Application

1 Les cônes Rn+ et Sn+ sont auto-adjoints:


∗ ∗
(Rn+ ) = Rn+ , Sn+ = Sn+ .

2 Calculer (Ln )∗ .

11 / 23
Propriétés du cône dual (1/2)
1 Soit X ⊂ Rn quelconque. Alors X ∗ est un cône convexe.

2 Soit K un cône.

1 K est un cône convexe fermé. .

2 K ⊂ K ∗∗ et K ∗∗ est la fermeture du plus petit cône convexe contenant K .

12 / 23
Propriétés du cône dual (2/2)

3 Si K est un cône convexe fermé non vide alors: K ∗∗ = K .

4 Soient K1 et K2 deux cônes dans Rn tels que: K1 ⊂ K2 . Alors:

K2∗ ⊂ K1∗ .

13 / 23
Inégalités généralisées duales

Definition
Soit K ⊆ Rn un cône propre. Alors:

x K y ⇔ ∀λ K ∗ 0, hλ, xi ≤ hλ, y i.

Cas où K = Rn+ .

14 / 23
Fonctions convexes (rappels)

On considère des fonctions f : Rn → R ∪ {+∞}. Autoriser les fonctions à valoir +∞


présente l’intérêt de pouvoir représenter les problèmes contraints sous une forme non
contrainte: par exemple
inf f (x) = infn f˜(x)
x∈X x∈R
n
avec X sous-ensemble non vide de R et

f (x) si x ∈ X ,
f¯(x) =
+∞ sinon.

On définit alors la notion de domaine d’une fonction f : Rn → R ∪ {+∞}:

Definition (Domaine d’une fonction)


dom(f ) = {x ∈ Rn , f (x) < +∞}.

15 / 23
Fonctions convexes
Definition (Fonction convexe)
• f : Rn → R ∪ {+∞} est dite convexe si :

∀(x, y ) ∈ dom(f )2 , ∀λ ∈ [0, 1], f ((1 − λ)x + λy ) ≤ (1 − λ)f (x) + λf (y ).

• f est dite strictement convexe si :

∀(x, y ) ∈ dom(f )2 , x 6= y , ∀λ ∈ [0, 1], f ((1 − λ)x + λy )<(1 − λ)f (x) + λf (y ).

16 / 23
Caractérisation différentielle de la convexité (1/2)

Soit f : Rn → R une fonction différentiable. Les propositions suivantes sont équivalentes:

(a) f est convexe.


(b)
∀(x, y ) ∈ Rn × Rn , f (y ) ≥ f (x) + h∇f (x), y − xi.
(c) Le gradient de f est un opérateur monotone:

∀(x, y ) ∈ Rn × Rn , h∇f (y ) − ∇f (x), y − xi ≥ 0.

17 / 23
Caractérisation différentielle de la convexité (2/2)

Soit f : Rn → R une fonction de classe C 2 .


• f est convexe ssi:
∀x ∈ Rn , H[f ](x)  0
(i.e. la hessienne de f est semi-définie positive en tout point).
• f est strictement convexe ssi:

∀x ∈ Rn , H[f ](x)  0

(i.e. la hessienne de f est définie positive en tout point).

18 / 23
Eléments d’analyse pour l’algorithmie

Les algorithmes que nous allons étudier dans ce cours vont générer des suites de points
(xk )k∈N qui vont converger suivant les propriétés géométriques de f vers un point
stationnaire/un point de minimum de f .

On s’intéressera dans ce cours à la convergence et à la vitesse de convergence de nos


algorithmes en fonction des propriétés géométriques de f :
Différentiabilité de f
Fonctions à gradient Lipschitz:

∃L > 0, ∀(x, y ) ∈ Rn × Rn , k∇f (x) − ∇f (y )k ≤ Lkx − y k.

Fonctions fortement convexes:


µ
∃µ > 0, ∀(x, y ) ∈ Rn × Rn , f (y ) ≥ f (x) + h∇f (x), y − xi + ky − xk2 .
2

19 / 23
Eléments d’analyse pour l’algorithmie
Propriété clé des fonctions à gradient Lipschitz

Lemma
Soit f : Rn → R une fonction différentiable à gradient L-Lipschitz. Alors:
L
f (y ) ≤ f (x) + h∇f (x), y − xi + ky − xk2
| {z } 2
Approximation linéaire

20 / 23
Eléments d’analyse pour l’algorithmie
Propriété clé des fonctions à gradient Lipschitz

Démonstration:

21 / 23
Eléments d’analyse pour l’algorithmie
Caractérisation par la hessienne

f : Rn → R est une fonction C 2 , convexe à gradient L Lipschitz si et seulement si :

∀x ∈ Rn , λmin (Hf (x)) ≥ 0 convexité


n
∀x ∈ R , λmax (Hf (x)) ≤ L gradient Lipschitz.

1 Montrer que f (x) = 12 kAx − bk2 est convexe à gradient Lipschitz et calculer sa
constante L.
2 Montrer que f (x) = − log(x) est convexe sur R∗+ , mais que son gradient n’est pas
Lipschitz.
3 Montrer que f (x) = exp(x) est convexe sur R, mais que son gradient n’est pas
Lipschitz.
De même : f : Rn → R est une fonction C 2 µ-fortement convexe si et seulement si :

∀x ∈ Rn , λmin (Hf (x))  µ

22 / 23
Eléments d’analyse pour l’algorithmie

23 / 23

Vous aimerez peut-être aussi