Vous êtes sur la page 1sur 11

Sous-différentiel

En mathématiques, et plus précisément en analyse 1.1 Définition


convexe, le sous-différentiel est un concept permettant
de décrire la variation locale d'une fonction convexe (à va-
leurs réelles donc) non nécessairement différentiable dans
un sens classique, celui auquel on attache aujourd'hui le
nom de Fréchet. Au lieu d'être la pente de l'application
linéaire tangente (c'est-à-dire, la dérivée) au point consi-
déré, qui n'existe pas nécessairement, le sous-différentiel
d'une fonction convexe est l'ensemble des pentes de toutes
les minorantes affines de la fonction, qui sont exactes en
ce point, c'est-à-dire qui ont en ce point la même valeur
que la fonction convexe qu'elles minorent. Dans cette des-
cription le mot pente peut être entendu comme un élément
de l'espace dual. La convexité de la fonction assure qu'on
peut lui trouver des minorantes affines exactes en presque
tout point de son domaine ; on met donc à profit cette pro-
priété pour définir le sous-différentiel. Si l'on peut trouver
une minorante affine exacte en un point donné, on dit que
la fonction convexe est sous-différentiable en ce point. Une fonction convexe non différentiable (en bleu) et deux de ses
On sait que la notion de dérivée est fondamentale en minorantes affines exactes en x0 (rouge). Le sous-différentiel de
analyse car elle permet d'approcher localement des fonc- cette fonction en x0 est l'ensemble des pentes de ces minorantes
affines exactes en x0 .
tions par des modèles linéaires, plus simples à étudier.
Ces modèles fournissent des renseignements sur les fonc-
De manière rigoureuse, une sous-dérivée d'une fonction
tions qu'ils approchent, si bien que de nombreuses ques-
convexe f : I → R en un point x0 de l'intervalle ouvert
tions d'analyse passent par l'étude des fonctions linéa-
I est un nombre réel s tel que
risées (stabilité, inversibilité locale, etc). On rencontre
beaucoup de fonctions convexes qui ne sont pas diffé-
f (x) ⩾ f (x0 ) + s(x − x0 ),
rentiables au sens classique, en particulier lorsque celles-
ci résultent de constructions qui n'ont rien pour assurer pour tout x dans I . On peut montrer que si x est dans
0
la différentiabilité des fonctions qu'elles produisent. Il l'intérieur de I , l'ensemble des sous-dérivées en x est un
0
en est ainsi de la fonction duale associée à un problème intervalle fermé non vide, donc de la forme [a, b] , avec
d'optimisation sous contraintes, pour en citer un exemple des bornes a et b données par
emblématique. Pour ces fonctions convexes non lisses, le
sous-différentiel joue donc un rôle similaire à celui de la f (x) − f (x0 )
dérivée des fonctions plus régulières. a = lim ,
x↑x0 x − x0
La notion de sous-différentiel connaît diverses extensions f (x) − f (x0 )
b = lim ,
aux fonctions non nécessairement convexes, par exemple x↓x 0 x − x0
aux fonctions localement lipschitziennes[1] .
qui sont finies et qui vérifient a ⩽ b .
Connaissances supposées : l'algèbre linéaire, le calcul
L'ensemble [a, b] de toutes les sous-dérivées est appelé le
différentiel (notamment les propriétés de la dérivée di-
sous-différentiel de la fonction f en x0 .
rectionnelle au sens de Dini pour les fonctions convexes
prenant des valeurs infinies), les bases de l'analyse
convexe (notamment les principales notions attachées aux 1.2 Exemples
ensembles et aux fonctions convexes, mais surtout la no-
tion de fonction conjuguée). Considérons la fonction f(x)=|x| qui est convexe. Alors,
le sous-différentiel à l'origine est l'intervalle [−1, 1].
Le sous-différentiel en n'importe quel point x0 <0 est le
1 Fonction d'une seule variable singleton {−1} et le sous-différentiel en n'importe quel
point x0 >0 est le singleton {1}.

1
2 2 FONCTION DÉFINIE SUR UN ESPACE EUCLIDIEN

1.3 Propriétés de f en x ∈ dom f si l'une des propriétés équivalentes


suivantes est vérifiée :
• Une fonction convexe f :I→R est différentiable en
x0 si et seulement si le sous-différentiel ne contient
1. ∀ d ∈ E, f ′ (x; d) ⩾ ⟨s, d⟩ ,
qu'un seul point, qui est alors la dérivée de f en x0 .
2. ∀ y ∈ E, f (y) ⩾ f (x) + ⟨s, y − x⟩ ,
• Un point x0 est un minimum local de f si et seule-
ment si zéro est contenu dans le sous-différentiel, 3. x minimise y ∈ E 7→ f (y) − ⟨s, y⟩ ,
c'est-à-dire, dans la figure ci-dessus, on peut tracer
4. f ∗ (s) + f (x) ⩽ ⟨s, x⟩ ,
une droite horizontale “sous-tangente” au graphe de
f en (x0 , f(x0 )). La dernière propriété est une géné- 5. f ∗ (s) + f (x) = ⟨s, x⟩ .
ralisation du fait que la dérivée d'une fonction déri-
vable en un minimum local est nulle.
La lettre s renvoie à slope (pente) ou sous-gradient (si l'on
préfère). La propriété 1 exprime le fait que la fonction
d ∈ E 7→ ⟨s, d⟩ est une minorante linéaire de la fonction
2 Fonction définie sur un espace dérivée directionnelle f ′ (x; ·) : d ∈ E 7→ f ′ (x; d) ∈
euclidien R ∪ {±∞} (que l'on sait toujours exister lorsque f est
convexe), exacte en 0 . La propriété 2 exprime le fait que
la fonction y ∈ E 7→ f (x) + ⟨s, y − x⟩ est une minorante
On suppose dans cette section que E est un espace eucli-
affine de f exacte en x . Les propriétés 4 et 5 expriment
dien (de dimension finie donc) dont le produit scalaire est
la même chose que la propriété 2 en utilisant la fonction
noté ⟨·, ·⟩ et la norme associée ∥ · ∥ . On note par ailleurs
conjuguée f ∗ de f .
• R̄ := R ∪ {−∞, +∞} la droite réelle achevée, Sous-différentiel — L'ensemble des sous-gradients de f
en x est appelé le sous-différentiel de f en x . Il est noté
• dom f := {x ∈ E : f (x) < +∞} le domaine
d'une fonction f : E → R̄ , qui peut donc prendre
∂f (x).
la valeur −∞ sur son domaine,
• Conv(E) l'ensemble des fonctions f : E → R̄ On dit que f est sous-différentiable en x si ∂f (x) ̸= ∅
qui sont convexes (c'est-à-dire, leur épigraphe est . Par convention, ∂f (x) = ∅ si x ∈
/ dom f .
convexe) et propres (c'est-à-dire, elles ne prennent
pas la valeur −∞ et ne sont pas identiquement
égales à +∞ ), 2.2 Propriétés
• Conv(E) la partie de Conv(E) formée des fonctions
2.2.1 Optimalité
qui sont aussi fermées (c'est-à-dire, leur épigraphe
est fermé),
La propriété 2 de la définition du sous-différentiel per-

• int P = P l'intérieur d'une partie P ⊂ E et intr P met d'obtenir immédiatement une expression simple de
son intérieur relatif. l'optimalité d'un point.
Condition d'optimalité — Soit f ∈ Conv(E) . Un point
x̄ ∈ E minimise f sur E si, et seulement si, 0 ∈ ∂f (x̄) .
2.1 Définition
Cette condition nécessaire et suffisante d'optimalité du
La notion de sous-différentiel peut être généralisée à une premier ordre (ainsi qualifiée parce qu'elle ne fait inter-
fonction convexe de plusieurs variables réelles, pouvant venir que les « dérivées » premières de la fonction) est
également prendre la valeur +∞ . Cette dernière ex- typique des problèmes d'optimisation convexes (voir la
tension trouve son utilité, par exemple en optimisation, section Conditions du premier ordre sans contrainte de
lorsque la fonction résulte d'une construction qui n'assure l'article Conditions d'optimalité).
pas a priori la finitude des valeurs qu'elle prend. Comme Trouver les minimiseurs d'une fonction convexe propre
pour la notion de gradient, on a besoin que l'espace sur le-
revient donc à trouver les « zéros » de son sous-
quel est définie la fonction soit muni d'un produit scalaire
différentiel. Ce résultat est à rapprocher de celui selon
si l'on veut construire des objets dans cet espace et nonlequel les minimiseurs d'une fonction convexe différen-
dans son dual. Les concepts seront mieux révélés en tra- tiable sont les points qui annulent son gradient. Ce résul-
vaillant sur un espace euclidien abstrait, qui pourra, si on
tat est plus riche qu'il ne paraît à première vue. En ef-
le souhaite, être vu comme Rn muni du produit scalaire fet, du fait que la fonction peut prendre la valeur +∞
euclidien. , il traite également de la minimisation d'une fonction
Sous-gradient — Soit f : E → R ∪ {+∞} , une fonction convexe sous contraintes convexes (l'ensemble admissible
convexe et propre. On dit que s ∈ E est un sous-gradient étant le domaine de la fonction).
2.2 Propriétés 3

Lorsque f est polyédrique on a les caractérisations sup- ∀ d ∈ E, f ′ (x; d) ⩾ ⟨s, d⟩,


[2]
plémentaires suivantes , liées au concept de minimum
saillant. On a noté " ri C " l'intérieur relatif d'un convexe montre clairement que f ne peut être sous-différentiable
C et " int C " son intérieur. en x si la dérivée directionnelle f ′ (x; ·) prend en une di-
Caractérisations de l'intériorité relative et de l'unicité rection la valeur −∞ puisque le membre de droite de
d'un minimiseur de fonction polyédrique — Soit f ∈ l'inégalité ci-dessus est toujours fini. La réciproque de
Conv(E) une fonction polyédrique. Alors cette observation est le sujet de la proposition qui suit.
Une telle situation se présente pour la fonction convexe
( ) ( ) définie par
x̄ ∈ ri arg min f ⇐⇒ 0 ∈ ri (∂f (x̄) ),
arg min f = {x̄} ⇐⇒ 0 ∈ int ∂f (x̄) . { √
− x si x ⩾ 0
f (x) =
La polyédricité de la fonction joue un rôle majeur dans +∞ sinon.
les caractérisations précédentes. Ainsi chacune des im-
plications de la première équivalence peut être fausse Cette fonction n'est pas sous-différentiable en zéro, parce
pour une fonction non polyédrique : l'implication " ⇒ que f ′ (0; 1) = −∞ . Évidemment, si f ′ (x; d) = −∞ ,
" est fausse pour la fonction x ∈ R → max(x2 , x) en alors f ′ (x; −d) = +∞ , mais ce n'est pas la valeur +∞
x̄ = 0 et l'implication " ⇐ " est fausse pour la fonction de la dérivée directionnelle qui empêche f d'être sous-
x ∈ R → max(0, x)2 en x̄ = 0 . Pour la seconde équi- différentiable en x . C'est ce que montre la fonction indi-
valence, l'implication " ⇒ " est fausse pour la fonction catrice de l'intervalle [0, +∞[ , dont le sous-différentiel
x ∈ R → x2 en x̄ = 0 , mais l'implication " ⇐ " reste en zéro est l'intevalle ] − ∞, 0] .
vraie même si f n'est pas polyédrique.
Sous-différentiabilité — Si f ∈ Conv(E) et x ∈ E , les
propriétés suivantes sont équivalentes :
2.2.2 Règle de bascule
1. f est sous-différentiable en x ,
Les sous-différentiels de f et de sa conjuguée f ∗ jouissent
d'une belle règle de réciprocité, parfois appelée règle de 2. il existe y ∈ intr (dom f ) tel que f ′ (x; y − x) >
bascule[3] . −∞ ,
Règle de bascule —
3. f ′ (x; ·) ne prend pas la valeur −∞ .
1. Si f ∈ Conv(E) , alors s ∈ ∂f (x) =⇒ x ∈
∂f ∗ (s) . Ces propriétés sont vérifiées si x ∈ intr (dom f ) .

2. Si f ∈ Conv(E) , alors s ∈ ∂f (x) ⇐⇒ x ∈


∂f ∗ (s) . 2.2.4 Propriétés géométriques et topologiques

La réciproque n'a pas lieu au point 1, pour la fonction On note ci-dessous aff P l'enveloppe affine d'une partie
f ∈ Conv(R) ci-dessous P ⊂E.

 Propriétés géométriques et topologiques du sous-


 0 si x < 0 différentiel — Soient f ∈ Conv(E) , E0 le sous-espace
f (x) = 1 si x = 0 donc f ∗ (s) = vectoriel parallèle à aff (dom f ) , PE0 le projecteur

+∞{ si x > 0 orthogonal sur E0 et x ∈ dom f . On note f |x+E0 la
+∞ si s < 0 restriction de f à x + E0 = aff (dom f ) . Alors
0 si s ≥ 0,
1. ∂f (x) = ∂f |x+E0 (x) + E⊥ 0 , en particulier

puisque l'on a 0 ∈
/ ∂f (0) = ∅ , alors que 0 ∈ ∂f (0) = PE0 ∂f (x) = ∂f |x+E0 (x) ,
] − ∞, 0] .
2. ∂f (x) est convexe et fermé (éventuellement vide),

2.2.3 Sous-différentiabilité 3. x ∈ intr (dom f ) ⇐⇒ PE0 ∂f (x) est non vide et


borné,
Rappelons que l'on dit que f ∈ Conv(E) est sous-
différentiable en x ∈ dom f si ∂f (x) ̸= ∅ . Affirmer 4. x ∈ int (dom f ) ⇐⇒ ∂f (x) est non vide et borné.
qu'un ensemble est non vide est une propriété forte qui,
dans certains cas, revient à montrer qu'un certain pro- Si f ne prend que des valeurs réelles, alors dom f = E
blème a une solution. et son sous-différentiel est un ensemble non vide, convexe
La propriété 1 définissant un sous-gradient s , à savoir et compact (par les points 2 et 4).
4 2 FONCTION DÉFINIE SUR UN ESPACE EUCLIDIEN

2.2.5 Formule du max φ−1 (u) = {x ∈ E : u ∈ φ(x)}.

Le sous-différentiel peut être défini en utilisant la dérivée Lorsque E est un espace euclidien dont le produit scalaire
directionnelle (propriété 1 de la définition). La proposi- est noté ⟨·, ·⟩ et que F = E , on dit que φ est monotone
tion suivante montre que l'on peut retrouver les dérivées si
directionnelles à partir du sous-différentiel : f ′ (x; ·) est
la fonction d'appui de ∂f (x) .
∀ (x, u) ∈ G(φ), ∀ (y, v) ∈ G(φ) :
Formule du max — Si f ∈ Conv(E) et x ∈ intr (dom f ) ⟨v − u, y − x⟩ ⩾ 0.
, alors
On dit que φ est monotone maximale si φ est mono-
∀d ∈ E : f ′ (x; d) = sups∈∂f (x) ⟨s, d⟩. tone et si son graphe n'est pas strictement contenu dans
le graphe d'un opérateur monotone. On vérifie facilement
Le supremum est atteint si f ′ (x; d) < +∞ . que cette dernière propriété s’écrit aussi
Le résultat précédent ne tient plus si x est sur la frontière [ ]
relative du domaine de f . Voici un contre-exemple : f ⟨v − u, y − x⟩ ⩾ 0, ∀ (x, u) ∈ G(φ) =⇒
est l'indicatrice de la boule-unité fermée de R2 , pour la (y, v) ∈ G(φ).
norme euclidienne, et x = (−1, 0) . Alors f ′ (x; 0) = 0
et si d ̸= 0 :
Dans le résultat ci-dessous, on note f ∗ la conjuguée de f
{ .
0 si d1 > 0
f ′ (x; d) =
+∞ si d1 ⩽ 0. La multifonction sous-différentiel — Si f ∈ Conv(E) ,
alors
Dès lors, la fonction δx : d 7→ f ′ (x; d) n'est pas fermée
et ne peut donc être la fonction d'appui d'un ensemble, 1. intr (dom f ) ⊂ dom ∂f ⊂ dom f ;
en particulier elle n'est pas la fonction d'appui du sous-
différentiel. D'ailleurs, ce dernier s’écrit ∂f (x) = {s ∈ 2. R(∂f ) ⊂ dom f ∗ ;
R2 : s1 ⩽ 0, s2 = 0} et
3. G(∂f ) est fermé ;
{
0 si d1 ⩾ 0 4. la multifonction ∂f est monotone.
σ∂f (x) (d) =
+∞ si d1 < 0
Si f ∈ Conv(E) , alors
est l'enveloppe convexe fermée de δx . Cette propriété est
tout à fait générale pour les fonctions de Conv(E) . 1. intr (dom f ∗ ) ⊂ R(∂f ) ;
2. (∂f )−1 = ∂f ∗ ;
2.2.6 La multifonction sous-différentiel
3. la multifonction ∂f est monotone maximale.
On peut voir ∂f comme une multifonction ou fonction
multivoque, qui à un élément de E fait correspondre une On rappelle que f : E → R ∪ {+∞} est fortement
partie de E , c'est-à-dire un élément de l'ensemble P(E) convexe, de module α > 0 , si pour tout x et x ∈
0 1
des parties de E . On note dom f et pour tout t ∈ [0, 1] ⊂ R , on a

∂f : E ⊸ E : x 7→ ∂f (x)
f ((1 − t)x0 + tx1 ) ≤
(1 − t)f (x0 ) + tf (x1 ) − α2 t(1 − t)∥x0 − x1 ∥2 .
cette correspondance.
Rappelons quelques notions d'analyse multifonctionnelle. Rappelons aussi qu'une multifonction φ : E ⊸ F est dit
Soit φ : E ⊸ F une multifonction. On définit le do- fortement monotone, de module α > 0 , si
maine, l'image et le graphe de φ respectivement par
∀ (x, y) ∈ G(φ), ∀ (x′ , y ′ ) ∈ G(φ) :
dom φ := {x ∈ E : φ(x) ̸= ∅}, ⟨y − y ′ , x − x′ ⟩ ⩾ α∥x − x′ ∥2 .
R(φ) := ∪{φ(x) : x ∈ dom φ},
G(φ) := {(x, u) ∈ E × F : u ∈ φ(x)}.
La forte convexité de f peut s’exprimer par la forte mo-
[4]
On notera bien que l'on a choisi de définir le graphe notonie de ∂f .
comme une partie de E × F et pas de E × P(F) . La Sous-différentiel fortement monotone — Pour une fonc-
multifonction réciproque φ−1 : F ⊸ E de la multi- tion f : E → R ∪ {+∞} et un réel α > 0 , les propriétés
fonction φ : E ⊸ F est définie en u ∈ F par suivantes sont équivalentes :
2.3 Calcul sous-différentiel 5

1. f est fortement convexe de module α , Le résultat suivant[6] établit un lien entre la différentia-
bilité et la sous-différentiabilité : en bref, une fonction
2. ∂f est fortement monotone de module α , est différentiable en un point si, et seulement si, elle est
sous-différentiable en ce point et son sous-différentiel est
3. ∀ (x, s) ∈ G(∂f ) et ∀ y ∈ E , on a un singleton.
Différentiabilité et sous-différentiabilité — Soient f ∈
f (y) ⩾ f (x) + ⟨s, y − x⟩ + α2 ∥y − x∥2 . Conv(E) et x ∈ (dom f )◦ .

1. Si f est différentiable en x , alors ∂f (x) =


2.2.7 Lien avec la différentiabilité
{∇f (x)} .
Rappelons les trois notions de différentiabilité d'une fonc- 2. Si ∂f (x) est le singleton {D} , alors f est différen-
tion f : E → R̄ dont il est question dans cette section. tiable en x et ∇f (x) = D .
On suppose que f est finie au point x où sont prises ces
dérivées.
2.2.8 Limites des gradients convergents

• On dit que f a une dérivée partielle en x suivant un 2.3 Calcul sous-différentiel


vecteur d ∈ E si la fonction t ∈ R 7→ f (x + td) est
différentiable en t = 0 . 2.3.1 Combinaison conique
• On dit que f est Gâteaux-différentiable en x si la Voici une conséquence immédiate de la définition du
dérivée directionnelle f ′ (x; d) existe pour tout d ∈ sous-différentiel.
E et si d ∈ E 7→ f ′ (x; d) est linéaire.
Multiplication par un scalaire positif — Soit α ⩾ 0 , f ∈
• On dit que f est Fréchet-différentiable en x s’il Conv(E) et x ∈ E . Alors
existe un vecteur D ∈ E tel que
∂(αf )(x) = α ∂f (x).

lim h→0 f (x+h)−f (x)−⟨D,h⟩


= 0. On remarquera bien que le scalaire multiplie une fonction
∥h∥
h̸=0
dans le membre de gauche de l'identité ci-dessus et un
ensemble dans son membre de droite.
Dans ce cas, le vecteur D est appelé le gradient de
f en x . On le note À l'inverse, comme le montrera un exemple ci-dessous,
l'égalité entre le sous-différentiel de la somme de fonc-
tions convexes et la somme des sous-différentiels n'est pas
nécessairement assurée. On aura certainement l'égalité si
∇f (x). toutes les fonctions ne prennent que des valeurs finies.
On notera également que la somme se fait sur des fonc-
D'après la définition, si f est Fréchet-différentiable tions dans le membre de gauche de l'identité et sur des
en x , f prend des valeurs finies dans un voisinage ensembles dans celui de droite.
de x .
Sous-différentiel d'une somme — Soient f1 , . . . , fp ∈
Conv(E) et x ∈ E . Alors
Ces trois propriétés sont de plus en plus fortes (la Fréchet-
différentiabilité implique la Gâteaux-différentiabilité, ∂(f1 + · · · + fp )(x) ⊃ ∂f1 (x) + · · · + ∂fp (x),
qui implique elle-même la différentiabilité partielle).
Pour une fonction convexe, les trois notions sont avec égalité si
équivalentes[5] , si bien qu'il n'y a alors pas lieu de faire
de distinction entre celles-ci. ∩
1⩽i⩽p intr (dom fi ) ̸= ∅.
Gâteaux et Fréchet différentiabilité — Soient f ∈
Conv(E) et x ∈ (dom f )◦ . On note n la dimension de Dans cette dernière condition, on peut remplacer
E . Alors les propriétés suivantes sont équivalentes : intr (dom fi ) par dom fi si fi est polyédrique.
Voici un exemple où l'égalité n'est pas assurée dans la
1. f a des dérivées partielles en x suivant n directions formule de la somme ( f2 est la fonction indicatrice de
linéairement indépendantes, ] − ∞, 0] ) :
{ √
2. f est Gâteaux-différentiable en x , − x si x ⩾ 0
f1 : x ∈ R 7→ et f2 =
+∞ sinon
3. f est Fréchet-différentiable en x . I]−∞,0] .
6 2 FONCTION DÉFINIE SUR UN ESPACE EUCLIDIEN

Comme la somme f = f1 + f2 est l'indicatrice de {0} 1. Il faut bien noter que, si la borne inférieure
, on a ∂f (0) = R , alors que ∂f1 (0) + ∂f2 (0) = ∅ , inf{φ(x, y) : y ∈ F} est atteinte en plusieurs
parce que ∂f1 (0) = ∅ . y , {s : (s, 0) ∈ ∂φ(x, y)} ne dépend pas du
minimiseur y choisi.
On a un autre éclairage sur cette indépendance par
2.3.2 Pré-composition par une fonction affine rapport à y en observant que φ est constante sur
l'ensemble M (x) := {(x, y) : y minimise φ(x, ·)}
Le cadre est le suivant. On dispose d'une fonction affine , si bien que ∂φ est aussi constant sur l'intérieur
a : E → F entre deux espaces euclidiens E et F . Celle-ci relatif de M (x) . Cependant ∂φ(x, y) peut varier
est supposée être définie en x ∈ E par lorsque (x, y) passe de l'intérieur relatif de M (x)
à son bord. C'est le cas de la fonction définie par
a(x) = Ax + b, φ(x, y) = max(0, |y| − 1) , dont la fonction
marginale est nulle :
où A : E → F est linéaire et b ∈ F . On note R(a) :=
a(E) l'Image directe de E par a et A∗ l'application li-
néaire adjointe de A pour les produits scalaires que l'on { = {x} × [−1, 1] et ∂φ(0, y) =
M (x)
{(0, 0)} si − 1 < y < 1
s’est donné sur E et F , défini donc par la relation
{0} × [0, 1] si y = 1.

∀ x ∈ E, ∀y ∈ F : ⟨A∗ y, x⟩ = ⟨y, Ax⟩. 2. D'autre part, si φ est différentiable en (x, y) ,


où y est un minimiseur quelconque de φ(x, ·) ,
L'application affine a est composée avec une application alors f est également différentiable en x (car son
g : F → R̄ . sous-différentiel est un singleton) et on a
Sous-différentiel d'une pré-composition par une fonction
affine — Dans le cadre défini ci-dessus, si g ∈ Conv(F) , ∇f (x) = ∇x φ(x, y).
alors pour tout x ∈ E :
( ) C'est comme s’il y avait un minimiseur unique y(x)
∂(g ◦ a)(x) ⊃ A∗ ∂g(a(x)) , , fonction différentiable de x , que l'on écrivait
f (x) = φ(x, y(x)) et que l'on calculait ∇f (x) par
une dérivation en chaîne :
avec égalité si l'une des conditions suivantes est vérifiée :

• R(a) ∩ intr (dom g) ̸= ∅ , ∇f (x) = ∇x φ(x, y) + y ′ (x)∗ ∇y φ(x, y).

• R(a) ∩ dom g ̸= ∅ et g est convexe polyédrique. On retrouverait le résultat ci-dessus en observant que
∇y φ(x, y) = 0 car y minimise φ(x, ·) .
2.3.3 Fonction marginale 3. Le fait que φ(x, ·) ait un minimum unique
n'implique nullement la différentiabilité de la fonc-
Soient E et F deux espaces euclidiens et φ : E × F → tion marginale en x . Par exemple, f est la fonction
R̄ une fonction. On associe à cette dernière la fonction marginale de φ définie par φ(x, y) = f (x) + y 2 .
marginale f : E → R̄ définie par : Cette dernière a un minimum y = 0 unique en y
quel que soit x , alors que f peut ne pas être diffé-
f (x) = infy∈F φ(x, y). rentiable.

Le sous-différentiel de f dépend de celui de φ qui est 2.3.4 Enveloppe supérieure


supposé calculé pour le produit scalaire de E × F suivant :
⟨(x, y), (x′ , y ′ )⟩ = ⟨x, x′ ⟩ + ⟨y, y ′ ⟩ . 2.4 Fonctions concave et convexe-concave
Sous-différentiel d'une fonction marginale — Dans le
cadre défini ci-dessus, supposons que φ ∈ Conv(E × F) Certaines constructions conduisent naturellement à des
et que f ∈ Conv(E) . Si x ∈ E et f (x) = φ(x, y) fonctions concaves plutôt que convexes. Il en est ainsi, par
(l'infimum est atteint en y ∈ F ), alors exemple, lorsque l'on prend l'enveloppe inférieure d'une
famille de fonctions linéaires (la fonction duale d'un pro-
blème d'optimisation est construite de cette manière). On
∂f (x) = {s : (s, 0) ∈ ∂φ(x, y)}. peut alors prendre le sous-différentiel de la fonction op-
posée, qui est convexe, mais il est parfois plus naturel
Ce résultat appelle quelques remarques. de se passer de la multiplication par moins un. Si f est
2.5 Exemples 7

concave, on définit donc le sous-différentiel concave de Dans cette définition, on a noté ∂x f (x, y) le sous-
cette fonction en un point x où elle est finie, comme différentiel ordinaire

en x de la fonction convexe x′ 7→
l'ensemble noté et défini par ′
f (x , y) et ∂ y f (x, y) le sous-différentiel concave en y
de la fonction concave y ′ 7→ f (x, y ′ ) . Certains auteurs

∂ f (x) := −∂(−f )(x). ne mettent pas le signe ∽ au-dessus de ∂ ; il faut alors se
rappeler que f est convexe-concave.
Certains auteurs ne mettent pas le signe ⌢ au-dessus de
∂ ; il faut alors se rappeler que f est concave. Si f est 2.5 Exemples
concave différentiable, son sous-différentiel concave se
réduit bien au gradient de f . Les propriétés suivantes sont Voici quelques exemples de sous-différentiels de fonc-
équivalentes : tions convexes classiques.

• s ∈ ∂ f (x) , 2.5.1 Fonction indicatrice

• ∀ d ∈ E, f (x; d) ⩽ ⟨s, d⟩ ,
On suppose ici que E est un espace euclidien et que C est
• ∀ y ∈ E, f (y) ⩽ f (x) + ⟨s, y − x⟩ , un convexe de E .
• x maximise y ∈ E 7→ f (y) − ⟨s, y⟩ . Le sous-différentiel de la fonction indicatrice IC est le
cône normal NC de C :
Il est aussi intéressant de définir le sous-différentiel d'une
fonction convexe-concave. Si E et F sont deux espaces
vectoriels, on dit que f : E×F → R̄ est convexe-concave
si 2.5.2 Norme

• pour tout y ∈ F , x 7→ f (x, y) est convexe et Soit ∥ · ∥ une norme sur un espace euclidien E , non né-
cessairement dérivée du produit scalaire ⟨·, ·⟩ de E . On
• pour tout x ∈ E , y 7→ f (x, y) est concave.
introduit la norme duale

Le lagrangien d'un problème d'optimisation convexe avec ∥s∥D := sup∥x∥⩽1 ⟨s, x⟩


contraintes a cette propriété. La situation est plus com-
plexe que dans le cas d'une fonction concave, car il ne et la boule-unité duale fermée
suffit pas de multiplier (une partie de) la fonction par −1
pour retrouver une fonction convexe et lui appliquer la B̄D := {s ∈ E : ∥s∥D ⩽ 1}.
notion de sous-différentiel convexe que l'on connait.
Sous-gradient d'une fonction convexe-concave — Soient Une norme est évidemment une fonction convexe (par
E et F deux espaces vectoriels et f : E×F → R̄ une fonc- l'inégalité triangulaire), partout sous-différentiable (elle
tion convexe-concave. On dit que (u, v) ∈ E est un sous- ne prend que des valeurs finies). Son sous-différentiel est
gradient (convexe-concave) de f en un point (x, y) où f donné par les formules
prend une valeur finie si (u, v) vérifie l'une des propriétés
équivalentes suivantes :


1. u ∈ ∂x f (x, y) et v ∈ ∂ y f (x, y) , En particulier :

2. ∀ x′ ∈ E : f (x′ , y) ⩾ f (x, y) + ⟨u, x′ − x⟩ , • si x ̸= 0 , les sous-gradients s ∈ ∂(∥ · ∥)(x) sont sur


∀ y ′ ∈ F : f (x, y ′ ) ⩽ f (x, y) + ⟨v, y ′ − y⟩ , la frontière de B̄D : ∥s∥D = 1 ;
3. (x, y) est un point-selle de (x′ , y ′ ) ∈ E × F 7→ • ∂(∥ · ∥)(0) = B̄D .
f (x′ , y ′ ) − ⟨u, x′ ⟩ − ⟨v, y ′ ⟩ .
La puissance p > 1 d'une norme

On note ∂f (x, y) l'ensemble des sous-gradients et on le
f : E → R : x 7→ f (x) := p1 ∥x∥p
nomme le sous-différentiel (convexe-concave) de f .
Par convention, ce sous-différentiel est vide si f (x) n'est
pas fini. est aussi une fonction convexe (composition de fonctions
convexes dont la seconde est croissante) propre (elle ne
De manière synthétique : prend que des valeurs finies) fermée (elle est continue) et
partout sous-différentiable (elle ne prend que des valeurs
finies). Son sous-différentiel est donné par les formules
8 2 FONCTION DÉFINIE SUR UN ESPACE EUCLIDIEN

2.5.4 Valeur propre maximale

On note S n l'ensemble des matrices réelles d'ordre n


où p′ := p/(p − 1) ∈ ]0, 1[ est le nombre conjugué de p :
symétriques, que l'on munit du produit scalaire canonique
1
+ 1
= 1. (A, B) ∈ S n × S n 7→ ⟨A, B⟩ := tr AB ( tr A désigne
p p′
la trace de la matrice A ). On note aussi S+
n
le cône de S n
La dernière expression du sous-différentiel ∂f (x) rap- formé des matrices semi-définies positives. On note enfin
pelle la dérivation en chaîne de la composition de x ∈
E 7→ ∥x∥ et de t ∈ R 7→ tp /p . λ1 : S n → R : A 7→ λ1 (A)

l'application valeur propre maximale, qui à une matrice


2.5.3 Distance à un convexe symétrique A associe sa plus grande valeur propre (on
rappelle qu'une matrice symétrique d'ordre n a n valeurs
Soit ∥ · ∥ une norme sur un espace euclidien E , non né-
propres réelles). C'est une fonction propre, convexe et
cessairement dérivée du produit scalaire ⟨·, ·⟩ de E . On
continue (donc fermée). Son sous-différentiel en A ∈ S n
introduit la norme duale
est donné par la formule
∥s∥D := sup∥x∥⩽1 ⟨s, x⟩

et la boule-unité duale fermée


où co P désigne l'enveloppe convexe d'un ensemble
P . L'enveloppe convexe ci-dessus est compacte (par
B̄D := {s ∈ E : ∥s∥D ⩽ 1}.
exemple, parce que le sous-différentiel d'une fonction
convexe ne prenant que des valeurs finies, comme λ1 ,
Soit C un ensemble convexe fermé non vide de E . On
l'est).
considère la fonction distC : E → R , la distance à C ,
définie par On en déduit que :

distC (x) = infy∈C ∥x − y∥. • si λ1 (A) est simple, λ1 (·) est différentiable en A et
son gradient s’écrit alors
C'est une fonction convexe propre et fermée (elle ne prend
que des valeurs finies). On note x̄ une projection d'un point ∇λ1 (A) = vv ⊤,
x sur C : c'est une solution du problème inf{∥x−y∥ : y ∈
C} . Cette dernière n'est pas nécessairement unique car où ±v sont les uniques vecteurs propres unitaires as-
la norme n'est pas nécessairement associée à un produit sociés à la valeur propre maximale ;
scalaire. • ∂λ1 (0) = {S ∈ S+
n
: tr S = 1} ;
Le sous-différentiel en x ∈ E de la distance à C est donné
par la formule • la dérivée directionnelle de λ1 en A ∈ S n dans la
direction D ∈ S n s’écrit

λ′1 (A; D) = λ1 (V ⊤DV ),


où NC (x) := {d ∈ E : ⟨d, y − x⟩ ⩽ 0 pour tout y ∈ C} où V est une matrice dont les colonnes forment
est le cône normal à C en x . une base orthonormale de l'espace propre associé à
Lorsque la norme ∥·∥ est celle associée au produit scalaire λ1 (A) .
⟨·, ·⟩ , les boules-unités primale et duale coïncident (c'est-
à-dire, B̄D = B̄ ) et on a les propriétés suivantes :
2.5.5 Fonction spectrale
• si x ∈ / C , alors distC est différentiable en x et La présentation ci-dessous synthétise celles de Lewis
∇ distC (x) = (x − x̄)/∥x − x̄∥ ; (1996), Hiriart-Urruty (1998), Borwein et Lewis (2000).
• si x ∈ int C , l'intérieur de C , alors distC est diffé- On note S n l'ensemble des matrices réelles d'ordre n
rentiable en x et ∇ distC (x) = 0 ; symétriques, que l'on munit du produit scalaire canonique
• si x ∈ C \ (int C) , la frontière de C , alors (A, B) ∈ S × S 7→ ⟨A, B⟩ := tr ABn , la trace
n n

∂ distC (x) = B̄ ∩ NC (x) . de la matrice AB . Par ailleurs, pour x ∈ R , on note


[x] ∈ Rn le vecteur formé des composantes de x en ordre
En l'absence de convexité d'un ensemble P ⊂ E , la dis- décroissant.
tance distP n'est pas nécessairement différentiable sur le On se donne une fonction f : Rn → R̄ symétrique,
complémentaire de P . c'est-à-dire qui vérifie
9

∀ x ∈ Rn : f (x) = f ([x]), 3 Fonction définie sur un espace lo-


ce qui revient à dire que l'on ne modifie pas la valeur de calement convexe
f (x) en permutant les composantes de x . On note
La présentation ci-dessous synthétise celle de Bonnans et
λ : S n → Rn : A 7→ λ(A) := (λ1 (A), . . . , λn (A)), Shapiro (2000).

la fonction donnant les valeurs propres de A en ordre dé-


croissant : 3.1 Cadre
λ1 (A) ⩾ λ2 (A) ⩾ · · · ⩾ λn (A). On suppose donnés deux espaces espaces vectoriels topo-
logiques localement convexes E et E∗ sur R couplés, dans
On appelle fonction spectrale une fonction de la forme le sens où il existe une application bilinéaire continue
f ◦ λ , avec f et λ comme ci-dessus. Ce sont donc des
fonctions définies sur S n , mais dont les valeurs ne dé-
⟨·, ·⟩ : E × E∗ → R
pendent que du spectre des matrices.
On peut alors caractériser la convexité-fermeture de (f ◦ telle que
λ) à partir de celle de f [7] .
Convexité-fermeture d'une fonction spectrale — Dans le • le dual topologique de E coïncide avec {⟨·, x∗ ⟩ :
cadre défini ci-dessus, si f est symétrique, alors x∗ ∈ E∗ } ,
• le dual topologique de E∗ coïncide avec {⟨x, ·⟩ :
(f ◦ λ) ∈ Conv(S n ) ⇐⇒ f ∈ Conv(Rn ).
x ∈ E} .
On peut aussi calculer le sous-différentiel de (f ◦ λ) à
partir de celui de f . Comme exemples de tels couples d'espaces vectoriels to-
pologiques localement convexes, citons
Sous-différentiel d'une fonction spectrale — Dans le
cadre défini ci-dessus, si f ∈ Conv(Rn ) est symétrique,
• un espace de Banach et son dual topologique muni
alors les trois propriétés suivantes, reliant A et S ∈ S n ,
de la topologie faible,
sont équivalentes :
• un espace de Banach réflexif et son dual topologique
1. S ∈ ∂(f ◦ λ)(A) , muni de la topologie forte.
2. λ(S) ∈ ∂f (λ(A)) et ⟨S, A⟩ = λ(S)⊤λ(A) ,
3. il existe une matrice orthogonale V et des vecteurs 3.2 Définitions
a , s ∈ Rn tels que
Les définitions de sous-gradient, de sous-différentiel et de
V ⊤AV = Diag(a), V ⊤SV = sous-différentiabilité sont essentiellement les mêmes que
Diag(s) et s ∈ ∂f (a). celles introduites en dimension finie.
On peut enfin caractériser la différentiabilité de (f ◦ λ) à Sous-gradient, sous-différentiel, sous-différentiabilité —
partir de celle de f . Soit f : E → R∪{+∞} , une fonction convexe et propre.
On dit que x∗ ∈ E∗ est un sous-gradient de f en x ∈
Différentiabilité d'une fonction spectrale — Dans le cadre dom f si l'une des propriétés équivalentes suivantes est
défini ci-dessus, si f ∈ Conv(Rn ) est symétrique, (f ◦ λ) vérifiée :
est différentiable en A si, et seulement si, f est différen-
tiable en λ(A) . Dans ce cas, si V est une matrice ortho-
1. ∀ y ∈ E, f (y) ⩾ f (x) + ⟨x∗ , y − x⟩ ,
gonale telle que A = V Diag(λ(A)) V ⊤ , on a
2. x minimise y ∈ E 7→ f (y) − ⟨x∗ , y⟩ ,
∇(f ◦ λ)(A) = V Diag(∇f (λ(A))) V ⊤.
3. f ∗ (x∗ ) + f (x) ⩽ ⟨x∗ , x⟩ ,
Les fonctions spectrales sont fréquemment rencontrées.
4. f ∗ (x∗ ) + f (x) = ⟨x∗ , x⟩ .
En voici quelques-unes, construites à partir de fonctions
f ∈ Conv(Rn ) , donnant donc lieu à des fonctions (f ◦
λ) ∈ Conv(S n ) . Dans le tableau ci-dessous, les entiers p L'ensemble des sous-gradients de f en x est appelé le
et q peuvent être choisis arbitrairement dans {0, . . . , n} sous-différentiel de f en x ; il est noté
, un vecteur de x ∈ Rn dont toutes les composantes sont
strictement positives est signalé par x > 0 , une matrice ∂f (x).
A définie positive est signalée par A ≻ 0 .
On dit que f est sous-différentiable en x si ∂f (x) ̸= ∅
. Par convention, ∂f (x) = ∅ si x ∈
/ dom f .
10 4 ANNEXES

4 Annexes • (en) J.-B. Hiriart-Urruty, Cl. Lemaréchal (2001).


Fundamentals of Convex Analysis. Springer. ISBN
978-3-540-42205-1.
4.1 Notes
• (en) A.S. Lewis (1996). Convex analysis on the Her-
[1] Voir Clarke (1983).
mitian matrices. SIAM Journal on Optimization, 6,
[2] La caractérisation de l'intériorité relative est peut-être due 164-177.
à Gilbert (2015). La caractérisation de l'unicité peut s’ob-
tenir à partir de résultats plus généraux de Burke et Ferris • (en) R.T. Rockafellar (1970). Convex Analysis. Prin-
(1993). ceton Mathematics Ser. 28. Princeton University
Press, Princeton, New Jersey.
[3] J.-B. Hiriart-Urruty (2013). Bases, outils et principes pour
l’analyse variationnelle. Mathématiques et Applications • (en) R.T. Rockafellar (1976). Monotone operators
70. Springer Verlag. and the proximal point algorithm. SIAM Journal on
Control and Optimization, 14, 877–898.
[4] Proposition 6 chez Rockafellar (1976).

[5] Proposition IV.4.2.1 chez Hiriart-Urruty et Lemaréchal • (en) R.E. Showalter (1997). Monotone Operators
(2001). in Banach Space and Nonlinear Partial Differential
Equations. American Mathematical Society. ISBN
[6] Théorème 25.1 chez Rockafellar (1970). 978-0-8218-0500-8.
[7] Voir Davis (1957) et la section 5.2 chez Borwein et Lewis
(2000).
• Portail de l’analyse

4.2 Bibliographie
• (en) A. Auslender, M. Teboulle (2003). Asymptotic
Cones and Functions in Optimization and Variational
Inequalitites. Springer Monographs in Mathematics.
Springer, New York.
• (en) J. F. Bonnans, A. Shapiro (2000). Perturbation
Analysis of Optimization Problems. Springer Verlag,
New York.
• (en) J.M. Borwein, A.S. Lewis (2000). Convex Ana-
lysis and Nonlinear Optimization. Springer, New
York.
• (fr) H. Brézis (1973). Opérateurs Maximaux Mo-
notones et Semi-groupes de Contractions Dans les
Espaces de Hilbert. Mathematics Studies 5. North-
Holland, Amsterdam. ISBN 978-0-7204-2705-9.
• (en) J.V. Burke, M.C. Ferris (1993). Weak sharp
minima in mathematical programming. SIAM Jour-
nal on Control and Optimization, 31, 1340–1359.
DOI
• (en) C. Davis (1957). All convex invariant functions
of Hermitian matrices. Archiv der Mathematik, 8,
26-278.
• (en) F.H. Clarke (1983). Optimization and Nons-
mooth Analysis. John Wiley & Sons, New York.
• (en) J.Ch. Gilbert (2015). On the solution unique-
ness characterization in the ℓ1 norm and polyhedral
gauge recovery. Rapport INRIA.
• (fr) J.-B. Hiriart-Urruty (1998). Optimisation et
Analyse Convexe. Presses Universitaires de France,
Paris.
11

5 Sources, contributeurs et licences du texte et de l’image


5.1 Texte
• Sous-différentiel Source : https://fr.wikipedia.org/wiki/Sous-diff%C3%A9rentiel?oldid=118369341 Contributeurs : Touriste, Poulos,
Mit-Mit, Stéphane33, Stanlekub, Ico, MMBot, Crouchineki, Ji-Elle, Kyle the bot, Zawer, Zorrobot, TXiKiBoT, Adrien.delaye, Alleborgo-
Bot, Jeanpisstoute, Gjacquenot, ZetudBot, WikiDreamer Bot, Elfix, LaaknorBot, Luckas-bot, Micbot, Zandr4, Mabifixem, Tatery, Cantons-
de-l'Est, Nouill, ZéroBot, Jean-Charles.Gilbert, LinedBot, Roll-Morton, Addbot et Anonyme : 4

5.2 Images
• Fichier:Nuvola_apps_kmplot.svg Source : https://upload.wikimedia.org/wikipedia/commons/e/e8/Nuvola_apps_kmplot.svg Licence :
LGPL Contributeurs : ? Artiste d’origine : ?
• Fichier:Subderivative_illustration.png Source : https://upload.wikimedia.org/wikipedia/commons/4/4e/Subderivative_illustration.png
Licence : Public domain Contributeurs : ? Artiste d’origine : ?

5.3 Licence du contenu


• Creative Commons Attribution-Share Alike 3.0

Vous aimerez peut-être aussi