Vous êtes sur la page 1sur 134

LICENCE DE MATHÉMATIQUES

FONDAMENTALES

Calcul Différentiel et Équations Différentielles

D. Azé

Université Paul Sabatier Toulouse

2008
Table des matières

1 Généralités sur les espaces normés 3


1.1 Espaces vectoriels normés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2 Espaces de Banach . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.3 Applications linéaires continues . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.4 Normes équivalentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.5 Applications multilinéaires continues . . . . . . . . . . . . . . . . . . . . . . . . 15
1.6 Espaces de Hilbert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

2 Applications différentiables dans les espaces normés 29


2.1 Définition d’une application différentiable . . . . . . . . . . . . . . . . . . . . . 29
2.2 Opérations sur les applications différentiables . . . . . . . . . . . . . . . . . . . 35
2.3 Applications à valeurs dans un produit d’espaces . . . . . . . . . . . . . . . . . 38
2.4 Applications définies sur un produit d’espaces . . . . . . . . . . . . . . . . . . . 39

3 Théorème des Accroissements Finis et Applications 47


3.1 Théorème des Accroissements Finis . . . . . . . . . . . . . . . . . . . . . . . . 47
3.2 Applications du Théorème des Accroissements Finis . . . . . . . . . . . . . . . 51
3.3 Applications Strictement Différentiables . . . . . . . . . . . . . . . . . . . . . . 55
3.4 Opérateurs de Nemicki . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.5 Primitives et Intégrales des Fonctions Réglées . . . . . . . . . . . . . . . . . . . 60

4 Différentielles d’Ordre Supérieur 67


4.1 Définition des Différentielles d’Ordre Supérieur . . . . . . . . . . . . . . . . . . 67
4.2 Propriétés de Symétrie des Différentielles d’Ordre Supérieur . . . . . . . . . . . 71
4.3 Formules de Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
4.4 Conditions d’Optimalité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85

5 Théorèmes d’Inversion et Applications 90


5.1 Théorèmes d’inversion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
5.2 Théorème des Fonctions Implicites . . . . . . . . . . . . . . . . . . . . . . . . 94
5.3 Application : Multiplicateurs de Lagrange . . . . . . . . . . . . . . . . . . . . . 96
5.4 Introductions aux sous-variétés . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
5.4.1 Immersion et submersion locale . . . . . . . . . . . . . . . . . . . . . . 98
5.4.2 Définitions équivalentes des sous-variétés . . . . . . . . . . . . . . . . . 99

1
5.4.3 Sous-espace tangent . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102

6 Équations Différentielles : Existence et Unicité des Solutions du Problème de Cauchy 105


6.1 Rappels et Compléments d’Analyse . . . . . . . . . . . . . . . . . . . . . . . . 105
6.1.1 Applications Lipschitziennes . . . . . . . . . . . . . . . . . . . . . . . . 105
6.1.2 Théorème des Applications Contractantes . . . . . . . . . . . . . . . . . 106
6.2 Equations Différentielles : Généralités . . . . . . . . . . . . . . . . . . . . . . . 108
6.3 Résolution Locale du Problème de Cauchy . . . . . . . . . . . . . . . . . . . . . 111
6.4 Solution Globale du Problème de Cauchy . . . . . . . . . . . . . . . . . . . . . 115

7 Flot d’une Équation Différentielle 119


7.1 Lemme de Gronwall . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
7.2 Tube de solutions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
7.3 Propriétés du flot d’une équation différentielle . . . . . . . . . . . . . . . . . . . 123

2
Chapitre 1

Généralités sur les espaces normés

1.1 Espaces vectoriels normés


Définition 1.1.1 Étant donné un espace vectoriel réel E, une norme est une fonction

k · k : E → R+ ,

vérifiant
i) kxk = 0 =⇒ x = 0,
ii) kλxk = |λ|kxk, pour tout λ ∈ R et x ∈ E,
iii) kx + yk ≤ kxk + kyk, pour tout x, y ∈ E.

A toute norme est associée une distance d(x, y) = kx − yk. Un espace normé est un espace
métrique et donc un espace topologique. Une partie U ⊂ E est ouverte si, pour tout a ∈ U , il
existe r > 0 tel que B̄(a, r) ⊂ U où B̄(a, r) = {x ∈ E : kx − ak ≤ r}. Les boules ouvertes
B(a, r) = {x ∈ E : kx − ak < r} sont des ouverts et tout ouvert est réunion d’une famille
de boules ouvertes. Une partie F de E est fermée si son complémentaire est ouvert (les boules
fermées sont des fermés). Une suite (xn ) d’éléments de E est dite converger vers x ∈ E si la suite
réelle (kxn − xk) converge vers 0. On écrit alors x = lim xn ou xn → x. La limite, quand elle
n→∞
existe, est unique ; elle est caractérisée par la propriété :

pour tout ε > 0, il existe n0 ∈ N tel que, pour tout n ≥ n0 , kxn − xk ≤ ε.

Les ensembles fermés F sont alors caractérisés par le fait que tout x ∈ E tel que pour tout r > 0,
F ∩ B(x, r) 6= ∅ appartient à F , ce qui équivaut à dire qu’ils contiennent toute limite d’une suite
à valeurs dans F (le démontrer en exercice).

Remarque 1.1.1
a) Pour tout x, y ∈ X on déduit des inégalités

kxk ≤ kx − yk + kyk

3
et
kyk ≤ ky − xk + kxk
que l’on a
|kxk − kyk| ≤ kx − yk.
b) Les applications (λ, x) 7−→ λx et (x, y) 7−→ x + y sont continues respectivement de R × E
dans E et de E × E dans E. En effet si les suites (xn ), (yn ) et (λn ) convergent respectivement
vers x ∈ E, y ∈ E et λ ∈ R, on a
k(xn + yn ) − (x + y)k ≤ kxn − xk + kyn − yk,
kλn xn − λxk = k(λn − λ)xn + λ(xn − x)k
≤ |λn − λ|kxn k + |λ|kxn − xk
≤ |λn − λ|M + |λ|kxn − xk
où M = supkxn k < +∞ car une suite convergente est bornée. Il en résulte bien que x + y =
n∈N
lim (xn + yn ) et que λx = lim λn xn .
n→∞ n→∞
c) Dans le cas où E = Rn , on identifiera u ∈ Rn à une matrice n × 1. Cela donne un sens
au produit matriciel AX ∈ Rn d’une matrice A ∈ M(m, n) par un vecteur X ∈ Rn . Avec ces
notations, le produit scalaire euclidien s’écrit, pour X, Y ∈ Rn ,
n
X
hX, Y i = Y T X = Xi Yi ,
i=1

où Y T ∈ M(1, n) est la matrice uniligne transposée de Y ∈ M(n, 1).

Etant donnée une famille finie d’espaces normés E1 , · · · , Ed dont les normes sont indifférem-
ment dénotées par k · k. Nous utiliserons sur le produit cartésien E = E1 × · · · × Ed les normes
suivantes (démontrer en exercice que ce sont bien des normes).
Définition 1.1.2 On pose
d
X
k(x1 , · · · , xd )k1 = kxi k,
i=1
d
X 1/2
k(x1 , · · · , xd )k2 = kxi k2 ,
i=1
et plus généralement pour p ≥ 1
d
X  p1
k(x1 , · · · , xd )kp = kxi kp ,
i=1

on pose aussi
k(x1 , · · · , xd )k∞ = sup kxi k.
1≤i≤d
n
C’est un exercice facile de montrer qu’une suite (x )n∈N dans E1 × · · · × Ed converge pour ces
normes vers x si et seulement si les d suites (xn i )n∈N convergent vers xi pour tout i ∈ [1, d].

4
1.2 Espaces de Banach
Rappellons que dans un espace métrique (E, d), une suite (xn ) est dite de Cauchy si

lim d(xn , xm ) = 0,
(m,n)→∞

ce qui équivaut à

pour tout ε > 0, il existe n0 tel que pour tout m, n ≥ n0 , d(xn , xm ) ≤ ε.

L’espace métrique (E, d) est dit complet si toute suite de Cauchy est convergente.
Définition 1.2.1 Un espace de Banach est un espace normé (E, k · k) complet pour la distance
associée à la norme k · k.

Exemple 1.2.1
a) Considérons Rd muni de l’une des normes k · k1 , k · k2 , k · k∞ de la définition 1.1.2. On a,
pour tout x ∈ Rd ,
kxk2 ≤ kxk1 ≤ nkxk∞ et kxk∞ ≤ kxk2 .
Ces inégalités montrent que les suites convergentes sont les mêmes pour ces trois normes et qu’une
suite converge si et seulement si les d suites de ses composantes convergent au sens usuel de R
vers des limites qui sont alors les composantes de la limite. L’espace Rd est alors de Banach pour
ces trois normes (il est en fait complet pour toute norme comme on le verra dans la suite de ce
chapitre).
b) Plus généralement un produit fini d’espaces de Banach est de Banach pour les normes de la
définition 1.1.2.
c) Soit p un élément de R tel que 1 ≤ p ≤ ∞, on définit

`p = {(xn )n∈N∗ ⊂ R : kxkp < +∞}

où ∞
X 1/p
p
kxkp = |xn | si 1 ≤ p < +∞,
n=1

kxk∞ = sup |xn | si p = +∞.


n≥1

Pour montrer que k · kp est une norme sur `p pour 1 ≤ p < +∞, il faut faire appel aux inégalités
de Hölder et de Minkowski, le cas p = +∞ étant plus simple (voir T.D.). Montrons que `p est
complet pour la norme k · kp . Remarquons que si (xn )n∈N∗ est une suite dans `p , chaque terme xn
est une suite de nombres réels dont les termes sont notés (xni )i∈N∗ . On a donc un tableau infini à
double entrée,
x11 , · · · , x1i , · · ·
..
.
xn1 , · · · , xni , · · ·
..
.

5
Traitons le cas où 1 ≤ p < +∞. Soit (xn )n∈N∗ une suite de Cauchy. Pour tout ε > 0, il existe
n0 ∈ N∗ tel que, pour tout m, n ≥ n0 , on ait

X
|xni − xm p p
i | ≤ ε .
i=1

Pour tout i ∈ N∗ on obtient donc que la suite (xni )n∈N∗ est de Cauchy dans R et converge donc
vers un réel xi . Pour tout N ∈ N∗ , on a
N
X ∞
X
|xni − xm
i |
p
≤ |xni − xm p p
i | ≤ ε .
i=1 i=1

En faisant tendre m vers +∞, il vient


N
X
|xni − xi |p ≤ εp (1.1)
i=1

ce qui implique que xn − x ∈ `p d’où x = xn − (xn − x) ∈ `p car `p est un espace vectoriel. Enfin,
passant à la limite sur N dans l’inégalité 1.1, on obtient que pour tout n ≥ n0 ,
kxn − xkp ≤ ε,
d’où le résultat. Dans le cas p = +∞, la démonstration est analogue.
d) On se donne un espace métrique (X, d), un espace normé (Y, k · k) et on considère l’en-
semble Cb (X, Y ) des applications de X dans Y qui sont continues et bornées (i.e. supx∈X kf (x)k <
+∞). On munit Cb (X, Y ) de la norme
kf k∞ = sup kf (x)k.
x∈X

Quand Y = R, on notera simplement Cb (X, R) = Cb (X). C’est un exercice facile de montrer que
(Cb (X, Y ), k·k∞ ) est un espace de Banach quand c’est le cas pour (Y, k·k). Dans le cas particulier
où X = N et Y = R, on retrouve l’exemple c) en remarquant que Cb (N) = `∞ car toute fonction
définie sur N est continue !
e) L’ensemble C 1 ([0, 1]) des fonctions continuement dérivables sur [0, 1] est un espace de Ba-
nach muni de la norme
kf kC 1 = kf k∞ + kf 0 k∞
est un espace de Banach (le démontrer en exercice). Plus généralement il en est de même de
l’ensemble C m ([0, 1]) des fonctions m fois continuement dérivables sur [0, 1] avec m ∈ N∗ muni
de la norme
kf kC m = kf k∞ + kf 0 k∞ + · · · + kf (m) k∞ .

f) L’espace C([0, 1]) des fonctions continues sur [0,1] à valeurs réelles muni de la norme
Z 1
kf k1 = |f (t)| dt
0

n’est pas un espace de Banach (le démontrer).

6
PnSoit (E, k · k) un espace normé et (xn ) une suite dans E. On pose, pour tout
Définition 1.2.2
n ∈ N, Sn = i=0 xi . On dit que la série de terme général (xn ) converge s’il en est de même de
la suite (Sn ) et on pose
X∞
xi = lim Sn .
n→∞
i=0

On dit que la série de terme général (xn ) est normalement convergente si la série de terme général
(kxn k) est convergente.

Théorème 1.2.1 Dans un espace de Banach (E, k · k), toute série normalement convergente est
convergente et
X∞ X ∞
xn ≤ kxn k.


n=0 n=0

Démonstration. Soit n > m, on a

kSn − Sm k = kxm+1 + · · · + xn k ≤ Tn − Tm ,

où Tn = ni=0 kxi k. La suite (Tn ) étant convergente est de Cauchy. Il en est donc de même de
P
(Sn ) qui est donc convergente. Par ailleurs passant à la limite quand n → +∞ dans l’inégalité
kSn k ≤ Tn on obtient que kSk ≤ kT k, d’où le résultat.

1.3 Applications linéaires continues


Théorème 1.3.1 Soient (E, k · k) et (F, k · k) deux espaces normés et f : E → F une application
linéaire. Les propriétés suivantes sont équivalentes
i) f continue sur E,
ii) f continue en 0,
iii) il existe M ≥ 0 tel que pour tout x ∈ E, kf (x)k ≤ M kxk.

Démonstration. Il est clair que i) ⇒ ii) et que iii) ⇒ i) car, pour tout x, y ∈ X,

kf (x) − f (y)k = kf (x − y)k ≤ M kx − yk.

Il reste à montrer que ii) ⇒ iii). De part la continuité de f en 0, il existe η > 0 tel que, pour tout
z ∈ B(0, η),
kf (z)k = kf (z) − f (0)k ≤ 1.
η
Soit alors x ∈ E\{0}. Remarquant que z := x ∈ B(0, η), on obtient
kxk
η
kf (x)k = kf (z)k ≤ 1,
kxk

7
d’où
kf (x)k ≤ (1/η)kxk.

On notera L(E, F ) l’ensemble des applications linéaires continues de E dans F . Si F = R,


on note E ∗ = L(E, R) et on dit que E ∗ est le dual topologique de E.

Remarque 1.3.1 On peut montrer, en utilisant le Théorème de Hahn-Banach, que pour tout es-
pace normé (E, k · k), E ∗ = L(E, R) 6= {0}. On peut aussi montrer qu’il existe des applications
linéaires non continues.

Définition 1.3.1 Pour tout f ∈ L(E, F ), on pose :

kf k = inf{M ≥ 0 : pour tout x ∈ E, kf (x)k ≤ M kxk}.

Cette définition a bien un sens car l’ensemble de réels dont on considère la borne inférieure est
non vide (Théorème 1.3.1) et minoré par 0.

Proposition 1.3.1 La fonction k.k définie ci-dessus est une norme sur L(E, F ) et l’on a,

kf (x)k
kf k = sup = sup kf (x)k = sup kf (x)k.
x6=0 kxk kxk≤1 kxk=1

Démonstration. Soit M ≥ 0 tel que kf (x)k ≤ M kxk pour tout x ∈ E. On a donc pour tout
x 6= 0,
kf (x)k
≤ M,
kxk
d’où
kf (x)k
sup ≤ M.
x6=0 kxk
Passant à la borne inférieure sur M , il vient
kf (x)k
sup ≤ kf k.
x6=0 kxk

Soit alors ε tel que 0 < ε < kf k, on a

kf k − ε 6∈ {M ≥ 0 : pour tout x ∈ E, kf (x)k ≤ M kxk}.

Il existe donc z 6= 0 tel que


kf (z)k > (kf k − ε)kzk.
Il vient alors
kf (x)k kf (z)k
sup ≥ > kf k − ε,
x6=0 kxk kzk

8
d’où
kf (x)k
sup ≥ kf k
x6=0 kxk
en faisant tendre ε vers 0. On a donc bien
kf (x)k
kf k = sup ,
x6=0 kxk
kf (x)k x
on a alors, notant que = f( )
kxk kxk
kf (x)k
kf k = sup ≤ sup kf (z)k.
x6=0 kxk kzk=1

Par ailleurs
sup kf (x)k ≤ kf k
kxk≤1

car kf (x)k ≤ kf kkxk pour tout x ∈ X. En résumé on a


sup kf (x)k ≤ sup kf (x)k ≤ kf k ≤ sup kf (x)k,
kxk=1 kxk≤1 kxk=1

d’où le résultat. Nous laissons alors au lecteur le soin de vérifier que la fonction k · k ainsi définie
sur L(E, F ) est une norme.

Remarque 1.3.2
a) Pour montrer qu’une application linéaire est continue, il suffit donc de montrer qu’elle est
bornée sur la boule unité de l’espace de départ.
b) Ce qu’il faut retenir c’est que si une application linéaire de E dans F est telle qu’il existe
M ≥ 0 telle que, pour tout x ∈ E,
kf (x)k ≤ M kxk,
alors f est continue et kf k ≤ M . Notons également que pour tout f ∈ L(E, F ) et pour tout
x ∈ E, on a
kf (x)k ≤ kf kkxk,
on en déduit aisément que, pour tout f ∈ L(E, F ), g ∈ L(F, G), on a
kg ◦ f k ≤ kgkkf k. (1.2)
En effet, pour tout x ∈ E avec kxk ≤ 1
kg(f (x))k ≤ kgkkf (x)k ≤ kgkkf k,
d’où
kg ◦ f k = sup kg(f (x))k ≤ kgkkf k.
kxk≤1

L’inégalité 1.2 ne peut pas être remplacée par une égalité. En effet si f et g sont les projections
orthogonales sur deux sous-espaces orthogonaux non réduits à {0} de Rd , on a g ◦ f = 0 et
kf k = kgk = 1.

9
Exemple 1.3.1
a) Soit E = C([0, 1]) l’ensemble des fonctions continues définies sur [0, 1) muni de la norme
kf k∞ = supt∈[0,1] |f (t)|. L’application L : E −→ R définie par
Z 1
L(f ) = f (t) dt
0

est linéaire continue et kLk ≤ 1. En effet, pour tout f ∈ E


Z 1 Z 1 Z 1
|L(f )| ≤ f (t) dt ≤ |f (t)| dt ≤ kf k∞ dt ≤ kf k∞ .

0 0 0

b) Soit 1 < p < +∞ et soit `p défini dans l’exemple 1.2.1 b). Soit 1 < q < +∞ tel que
1 1
+ = 1. Soit y ∈ `q et L : `p −→ R définie pour tout x ∈ `p par
p q

X
L(x) = xn yn .
n=1

La série définissant L(x) est convergente, L est linéaire et

|L(x)| ≤ kykq kxkp

ce qui montre que L est linéaire et kLk ≤ kykq (voir T.D.).


c) Soient E, F , G des espaces normés et soient f ∈ L(E, F ), g ∈ L(F, G). Pour tout x ∈ E
on a
kg(f (x))k ≤ kgkkf (x)k ≤ kf kkgkkxk.
il en résulte que g ◦ f ∈ L(E, G) et

kg ◦ f k ≤ kgkkf k. (1.3)

De plus les applications

L : L(E, F ) −→ L(E, G)
f 7−→ f ◦ g

et

M : L(F, G) −→ L(E, G)
g 7−→ f ◦ g

sont linéaires. Elles sont aussi continues car pour tout f ∈ L(E, F ), g ∈ L(F, G) il découle de
(1.3) que
kL(f )k ≤ kgkkf k
et
kM (g)k ≤ kf kkgk.

10
Théorème 1.3.2 Soient (E, k · k) un espace normé et (F, k · k) un espace de Banach. Alors
L(E, F ) est un espace de Banach muni de la norme de la Définition 1.3.1.

Démonstration. Soit (fn ) une suite de Cauchy dans L(E, F ). Pour tout ε > 0, il existe n0 ∈ N
tel que, pour tout m, n ≥ n0 ,

kfn − fm k = sup kfn (x) − fm (x)k ≤ ε, (1.4)


kxk≤1

Pour tout x ∈ B = B(0, 1), la suite (fn (x)) est de Cauchy, elle converge donc vers un élément
noté ϕ(x). Il existe donc une application

ϕ:B→F

telle que la restriction fn |B converge uniformément vers ϕ. Posons, pour tout x ∈ X\{0}

f (x) = kxkϕ(x/kxk) et f (0) = 0.

Pour tout x 6= 0, il vient


fn (x) = kxkfn (x/kxk),
d’où
lim fn (x) = kxkϕ(x/kxk) = f (x).
n→∞

Il est alors aisé de vérifier, en passant à la limite dans les égalités fn (λx) = λfn (x) et fn (x + y) =
fn (x) + fn (y), que f est linéaire. Montrons que f est continue. En effet en prennant n = n0 et en
faisant tendre m vers l’infini dans (1.4) il vient

sup kfn0 (x) − f (x)k ≤ ε,


kxk≤1

d’où
sup kf (x)k ≤ kfn0 k + ε,
kxk≤1

ce qui, compte tenu de la Remarque 1.3.2 a) montre la continuité de f . Enfin, revenant à 1.4, on a
faisant tendre m vers l’infini,

kfn − f k = sup kfn (x) − f (x)k ≤ ε


kxk≤1

et ce, pour tout n ≥ n0 , ce qui achève la démonstration.

Définition 1.3.2 Soient E et F des espaces normés. On dit que f ∈ L(E, F ) est un isomorphisme
si f est bijective et si f −1 ∈ L(F, E). On note alors Isom (E, F ) l’ensemble éventuellement vide
des isomorphismes de E dans F .

11
Remarque 1.3.3
a) Si E est un espace de Banach et si F est isomorphe à E, alors F est un espace de Banach.
En effet, il existe D > 0 telles que, pour tout y, y 0 ∈ F ,

kf −1 (y) − f −1 (y 0 )k ≤ Dky − y 0 k.

Il en résulte que si (yn ) est de Cauchy dans F alors (f −1 (yn )) est de Cauchy dans E et converge
donc vers un élément x ∈ E, ce qui implique la convergence de (yn ) vers y = f (x).
b) Il est clair que la composée de deux isomorphismes est un isomorphisme.
c) Il existe des applications linéaires continues et bijectives qui ne sont pas des isomorphismes.
Cependant on a le résultat positif suivant que nous démontrerons dans le chapitre 4.

Théorème 1.3.3 Soient E et F des espaces de Banach et soit f ∈ L(E, F ) telle que f est bijec-
tive. Alors f est un isomorphisme.

Définition 1.3.3 On dit que f ∈ L(E, F ) est une isométrie si pour tout x ∈ E

kf (x)k = kxk.

Exemple 1.3.2 Soit E un espace normé. Pour tout h ∈ E on définit l’application

ϕh : R −→ E
t 7−→ th

On a ϕh ∈ L(R, E) et l’application ϕ qui à h associe ϕh est un isomorphisme et une isométrie de


E dans L(R, E). En effet

kϕh k = max(kϕh (1)k, kϕh (−1)k) = kϕh (1)k = khk.

L’isométrie réciproque ψ : L(R, E) → E est définie par

ψ(f ) = f (1) pour tout f ∈ L(R, E).

Dans la suite, on identifiera L(R, E) et E par cette isométrie.

Le résultat suivant a d’importantes applications.

Théorème 1.3.4 Soient E, F des espaces de Banach, alors Isom (E, F ) est ouvert (éventuellement
vide) dans L(E, F ) et l’application u 7−→ u−1 est continue sur Isom (E, F ).

Démonstration. Soit v ∈ L(E) tel que kvk < 1. LaP série de terme général (v n ) est alors norma-
lement convergente car kv n k ≤ kvkn . Posons Sn = nk=0 v k , on a

v ◦ Sn = Sn ◦ v = Sn+1 − I

12
où I désigne l’application identique de E dans E. Il résulte alors
Pde la continuité des applications

u 7−→ u ◦ v et u 7−→ v ◦ u (voir Exemple (1.3.1), c)) que S = k=0 v k vérifie
(I − v) ◦ S = S ◦ (I − v) = I,
donc que I − v est bijective, c’est donc un isomorphisme d’après le Théorème 1.3.3. Soit alors
u ∈ Isom (E, F ) et v ∈ L(E, F ). On a,
v ∈ Isom(E, F ) → u−1 ◦ v ∈ Isom(E).
Or u−1 ◦ v = I − w avec w = I − (u−1 ◦ v) = u−1 ◦ (u − v). On a,
kwk = ku−1 ◦ (u − v)k ≤ ku−1 kk(u − v)k.
donc B(u, 1/ku−1 k) ⊂ Isom (E, F ). Par ailleurs on a
v −1 = (u ◦ (I − w))−1 = (I − w)−1 ◦ u−1 ,
d’où ∞
X
−1 −1 −1 −1
v −u = ((I − w) − I) ◦ u = wk ◦ u−1 .
k=1
On obtient alors
∞ ∞
−1 −1
X
−1
X kwk
kv −u k≤ k
w ku k ≤ kwk kku−1 k ≤ kuk−1 .

k=1 k=1
1 − kwk

Comme w tend vers 0 quand v tend vers u on a bien le résultat.

1.4 Normes équivalentes


Définition 1.4.1 Soit E un espace vectoriel muni de deux normes k · k1 et k · k2 . On dit que ces
deux normes sont équivalentes si elles définissent la même topologie (i.e. si les suites convergentes
et leurs limites sont les mêmes). Ceci équivaut à la continuité des applications linéaires :
I : (E, k · k1 ) → (E, k · k2 )
I : (E, k · k2 ) → (E, k · k1 ).

Il en résulte immédiatement le
Théorème 1.4.1 Soient k · k1 et k · k2 deux normes sur un espace vectoriel E. Les propriétés
suivantes sont équivalentes,
i) k · k1 et k · k2 sont des normes équivalentes,
ii) il existe a, b > 0 telles que, pour tout x ∈ E,
kxk1 ≤ akxk2 et kxk2 ≤ bkxk1 .

13
Démonstration. Elle résulte de la Définition 1.4.1 et du Théorème 1.3.2, remarquant que ii)
équivaut à la continuité des applications linéaires

I : (E, k · k2 ) → (E, k · k2 ) et I : (E, k · k1 ) → (E, k · k2 ).

Dans le cas des espaces de dimension finie, on a

Théorème 1.4.2 Toutes les normes sont équivalentes dans Rd .

Démonstration. Posons, pour tout x ∈ Rd , kxk = di=1 |xi | et considérons une norme ρ(.) sur
P
Rd . Pour tout i = 1, · · · , d définissons le vecteur ei = (0, · · · , 1, · · · , 0), dont toutes les compo-
santes sont nulles sauf celle de rang i. Pour tout x, y ∈ Rd on a
d
X 
ρ(x − y) = ρ (xi − yi )ei
i=1
d
X
≤ |xi − yi |ρ(ei )
i=1
≤ M kx − yk,

où M = sup1≤i≤d ρ(ei ). La fonction ρ(.) est donc continue, elle atteint alors sa borne inférieure
sur le compact S = {x ∈ Rd : kxk = 1}. Il existe donc m > 0 tels que, pour tout x 6= 0, on a

m ≤ ρ(x/kxk),

d’où mkxk ≤ ρ(x) ≤ M kxk, ce qui montre que les normes k · k et ρ(.) sont équivalentes. Soient
alors ρ1 et ρ2 deux normes sur Rd . Comme ρ1 est équivalente à k · k et que k · k est équivalente à
ρ2 , on obtient que ρ1 est équivalente à ρ2 (le vérifier).

Corollaire 1.4.1
i) Rd est un espace de Banach pour toute norme.
ii) Toute application linéaire de Rd dans un espace normé (F, k · k) est continue.

Démonstration. i) Résulte du fait qu’un espace de Banach l’est encore quand on remplace sa
norme par une norme équivalente, du Théorème 1.4.2 et du fait que Rd est complet muni de l’une
de ses normes usuelles (voir Exemple 1.2.1 a)).
ii) Exercice facile.

14
Remarque 1.4.1
a) Soit (E, k · k) un espace vectoriel de dimension d rapporté à une base (u1 , · · · , ud ). L’ap-
plication
d
X
ϕ(x1 , · · · , xd ) = x i ui
i=1

est bijective linéaire et continue (le démontrer) de Rd dans E. La bijection réciproque ϕ−1 est aussi
continue. En effet la fonction kϕ(.)k qui est une norme sur Rd est équivalente à la norme k · k∞ .
Il existe donc c > 0 tel que k · k∞ ≤ ckϕ(.)k, ce qui implique bien la continuité de ϕ−1 . Ainsi E
est isomorphe à Rd et le Théorème 1.4.2 ainsi que le Corollaire 1.4.1 sont vrais en remplaçant Rd
par un espace vectoriel E de dimension finie d.
b) On peut montrer que la boule unité d’un espace normé de dimension infinie n’est jamais
compacte (Théorème de F. Riesz).

1.5 Applications multilinéaires continues


Définition 1.5.1 Soient E1 , · · · , En , F des espaces vectoriels, on dit qu’une application

f : E1 × · · · × En −→ F

est multilinéaire si, pour tout i ∈ [1, n], et pour tout a = (a1 , · · · , an ) ∈ E1 × · · · × En , les
applications fi : Ei → F définies par

fi (x) = f (a1 , · · · , ai−1 , x, ai+1 , · · · , an )

sont linéaires.

Théorème 1.5.1 Soient E1 , · · · En , F des espaces normés et soit une application multilinéaire
f : E1 × · · · × En −→ F . On munit l’espace vectoriel E1 × · · · × En d’une norme définissant
la topologie produit (par exemple l’une des normes équivalentes de la Définition 1.1.2). Alors, les
deux propriétés suivantes sont équivalentes.
i) f est continue sur E1 × · · · × En ,
ii) il existe M ≥ 0 telle que, pour tout x ∈ E1 × · · · × En , on a

kf (x)k ≤ M kx1 k · · · kxn k.

Démonstration. i) ⇒ ii). Comme f est continue en 0 et f (0) = 0, Il existe η > 0 tel que,

kxk = sup kxi k ≤ η ⇒ kf (x)k ≤ 1.


1≤i≤n

Soit alors x ∈ (E1 \{0}) × · · · × (En \{0}). Posons y = η(x1 /kx1 k, · · · ., xn /kxn k), on a kyk ≤ η.
Il en résulte kf (y)k ≤ 1, et donc

kf (x)k ≤ (1/η n )kx1 k · · · .kxn k.

15
Enfin, si l’un des xi est nul l’inégalité ci-dessus est vérifiée avec 0 des deux côtés de l’inégalité.
ii) ⇒ i). On procède par récurrence sur n. Soient x, h ∈ E1 × · · · × En . On a

kf (x + h) − f (x)k ≤ kf (x + h) − f (x + k)k + kf (x + k) − f (x)k

où k = (0, h2 , · · · , hn ). On a alors

kf (x + h) − f (x + k)k ≤ M kh1 k(kx2 k + kh2 k) · · · (kxn k + khn k)


≤ Ckh1 k

pourvu que khk ≤ 1. Par ailleurs l’application g : E2 × · · · × En −→ F définie par

g(z2 , · · · , zn ) = f (x1 , z2 , · · · , zn )

est telle que g ∈ L(E2 × · · · × En , F ) et vérifie

kg(z2 , · · · , zn )k ≤ M 0 kz2 k · · · kzn k avec M 0 = M kx1 k.

De plus
kf (x + k) − f (x)k = kg(x2 + h2 , · · · , xn + hn ) − g(x2 , · · · , xn )k.
On applique alors l’hypothèse de récurrence et on obtient l’existence de η > 0 tel que

kg(x2 + h2 , · · · , xn + hn ) − g(x2 , · · · , xn )k ≤ ε/2

pourvu que sup2≤i≤n khi k ≤ η. Il en résulte que pour sup1≤i≤n khi k ≤ max(η, ε/2C), on a

kf (x + h) − f (x)k ≤ Ckh1 k + ε/2 ≤ ε,

ce qui démontre i).

On note L(E1 , · · · , En ; F ) l’ensemble des applications multilinéaires continues de


E1 × · · · × En dans F . Si E1 = · · · = En = E, on note L(E1 , · · · , En ; F ) = Ln (E; F ). Nous
laissons au lecteur le soin de démontrer que pour tout choix d’une norme sur E1 × · · · × En

kf k = sup kf (x)k
kxk≤1

est une norme sur L(E1 , · · · , En , F ), que

kf k = inf{M ∈ R+ : pour tout x ∈ E2 × · · · × En , kf (x)k ≤ M kx1 k · · · kxn k},

et que si F est de Banach, l’espace L(E1 , · · · , En ; F ) est un espace de Banach muni de cette norme
(s’inspirer de la démonstration du Théorème 1.3.2). Enfin le lecteur démontrera que si E1 , · · · , En
sont de dimension finie toute application multilinéaire définie sur E1 × · · · × En est continue.
Le résultat suivant est fondamental pour l’étude des différentielles d’ordre supérieur.

16
Théorème 1.5.2 L’application
Φ : Lm (E; Ln (E; F )) → Ln+m (E; F )
définie pour g ∈ Lm (E; Ln (E; F )) et (x1 , · · · , xn+m ) ∈ E n+m par
Φ(g)(x1 , · · · , xn+1 ) = g(x1 , · · · , xm )(x2 , · · · , xn+1 )
est une isométrie de Lm (E; Ln (E; F )) dans Ln+m (E; F ) et l’isométrie réciproque
Ψ : Ln+m (E; F ) → Lm (E; Ln (E; F ))
est définie, pour tout f ∈ Ln+m (E; F ), (z1 , · · · , zm ) ∈ E m et (x1 , · · · , xn ) ∈ E n par
(Ψ(f )(z1 , · · · , zm ))(x1 , · · · , xn ) = f (z1 , · · · , zm , x1 , · · · , xn ).

Démonstration. On a
kΦ(g)(x1 , · · · , xn+m )k ≤ kg(x1 , · · · , xm )kLn (E;F ) k(xm+1 k · · · kxn+1 k
≤ kgkLm (E;Ln (E;F )) kx1 k · · · kxm k · kx2 k · · · kxn+1 k
ce qui montre que Φ(g) ∈ Ln+m (E; F ) et
kΦ(g)kLn+m (E;F ) ≤ kgkLm (E;Ln (E;F )) . (1.5)
Par ailleurs, pour tout (z1 , · · · , zm ) ∈ E m ,
kΨ(f )(z1 · · · , zm )(x1 , · · · , xn )k ≤ kf kLn+m (E;F ) kz1 k · · · kzm k · kx1 k · · · kxn k
ce qui montre que Ψ(f ) ∈ Lm (E; Ln (E; F )) et
kΨ(f )(z1 , · · · , zm )kLn (E;F ) ≤ kf kLn+1 (E;F ) kz1 k · · · kzm k
d’où
kΨ(f )kLm (E;Ln (E;F )) ≤ kf kLn+m (E;F ) . (1.6)
Les applications Φ et Ψ sont donc linéaires continues. Il est clair qu’elles sont aussi réciproque
l’une de l’autre. On a alors pour tout f ∈ Ln+m (E; F ), g ∈ Lm (E; Ln (E; F ))
kf kLn+m (E;F ) = k(Φ ◦ Ψ)(f )kLn+m (E;F ) = kΦ(Ψ(f ))kLn+m (E;F ) ≤ kΨ(f )kLm (E;Ln (E;F ))
et
kgkLm (E;Ln (E;F )) = k(Ψ ◦ Φ)(g)kLm (E;Ln (E;F )) = kΨ(Φ(g))kLm (E;Ln (E;F )) ≤ kΦ(g)kLn+m (E;F ) ,
ce qui combiné à (1.5) et (1.6) montre que
kΦ(g)kLn+m (E;F ) = kgkLm (E;Ln (E;F ))
et
kΨ(f )kLm (E;Ln (E;F )) = kf kLn+m (E;F ) .
On a donc bien le résultat.

17
1.6 Espaces de Hilbert
Définition 1.6.1 Un produit scalaire h., .i sur un espace vectoriel E est une fonction de E × E
dans R qui est bilinéaire symétrique (hx, yi = hy, xi pour tout x, y ∈ E) non dégénérée positive
(hx, xi ≥ 0 pour tout x ∈ E et hx, xi = 0 implique x = 0), E muni du produit scalaire h., .i est
dit alors préhilbertien.

Exemple 1.6.1
a) Pour tout x, y ∈ Rd on pose

hx, yi = x1 y1 + · · · + xd yd .

On définit ainsi un produit scalaire.


b) Soit `2 défini dans l’exemple 1.2.1, c). Pour x, y ∈ `2 , on a, pour tout N ∈ N,
N
X N
X N
 12  X 1/2
|xn yn | ≤ |xn |2 |yn2
n=1 n=1 n=1

X ∞
 21  X 1/2
≤ |xn |2 |yn |2 .
n=1 n=1
P∞
Il en résulte que n=1 |xn yn | < ∞. On pose alors

X
hx, yi = xn yn .
n=1

On définit ainsi un produit scalaire.


c) Soit E = C([0, 1]) l’ensemble des fonctions continues définies sur l’intervalle [0, 1]. Pour
tout f , g ∈ E posons Z 1
hf, gi = f (t)g(t) dt.
0
On définit ainsi un produit scalaire.

Théorème 1.6.1 I N ÉGALIT É DE C AUCHY-S CHWARZ


Soit (E, h., .i) un espace préhilbertien. Alors pour tout x, y ∈ E,

|hx, yi|2 ≤ hx, xihy, yi

avec égalité si et seulement si x et y sont colinéaires.

Démonstration. On peut supposer que hy, yi > 0. Soit λ ∈ R, on a

hx + λy, x + λyi ≥ 0

d’où
λ2 hy, yi + 2λhx, yi + hx, xi ≥ 0.

18
Le discriminant du trinôme du second degré est donc négatif ou nul, ce qui donne l’inégalité
annoncée. Par ailleurs il est clair que l’inégalité est une égalité si y = µx. Réciproquement si x
et y sont non colinéaires alors x + λy 6= 0 pour tout λ ∈ R ce qui montre que le trinôme n’a
pas de racine réelle. Il en résulte que son discriminant est strictement négatif, d’où |hx, yi|2 <
hx, xihy, yi.

Proposition 1.6.1 Soit (E, h., .i) un espace préhilbertien. On définit alors une norme sur E en
posant pour tout x ∈ E
kxk = hx, xi1/2 .

Démonstration. La seule vérification non évidente est celle de l’inégalité triangulaire. Soient
x, y ∈ E, on a, utilisant l’inégalité de Cauchy-Schwarz

kx + yk2 = kxk2 + kyk2 + 2hx, yi


≤ kxk2 + kyk2 + 2kxkkyk
≤ (kxk + kyk)2 .

On a donc bien kx + yk ≤ kxk + kyk.

Remarque 1.6.1
a) Théorème de Pyhagore. Soit (E, h., .i) un espace préhilbertien et soient x, y ∈ E tels que
hx, yi = 0. Alors
kx + yk2 = kxk2 + kyk2 .
En effet

kx + yk2 = hx + y, x + yi
= hx, xi + hx, yi + hy, yi
= hx, xihy, yi
= kxk2 + kyk2 .

b) Soit (E, h., .i) un espace préhilbertien et soit a ∈ E. Définissons La : E −→ R par

La (x) = ha, xi

pour tout x ∈ E. Utilisant l’inégalité de Cauchy-Schwarz, on a

|La (x)| ≤ kakkxk

ce qui montre que l’application linéaire La est continue et que kLa k ≤ kak. De plus |La (a)| =
kak2 donc kLa k ≥ kak ce qui montre que kLa k = kak.

Définition 1.6.2 Un espace de Hilbert est un espace préhilbertien (H, h., .i) qui est complet pour
la norme définie dans la Proposition 1.6.1.

19
Exemple 1.6.2
a) L’espace Euclidien Rd muni du produit scalaire usuel (exemple 1.6.1, a)) est un espace de
Hilbert.
b) Soit `2 défini dans l’exemple 1.2.1, c) muni du produit scalaire

X
hx, yi = xn yn .
n=1

(exemple 1.6.1, b)). Alors `2 est un espace de Hilbert pour ce produit scalaire.
c) L’espace E = C([0, 1]) muni du produit scalaire
Z 1
hf, gi = f (t)g(t) dt.
0

n’est pas un espace de Hilbert.

Définition 1.6.3 Soit (E, d) un espace métrique, a ∈ E et soit B une partie non vide de E). La
distance de a à la partie B est

d(a, B) = inf{d(a, b) : b ∈ B}.

On dit que b ∈ B est une projection de a sur B si

d(a, b) = d(a, B).

En général la projection n’existe pas et, s’il en existe, il peut en exister plusieurs.

Définition 1.6.4 Une partie C d’un espace vectoriel E est dite convexe si, pour tout x, y ∈ C et
pour tout λ ∈ [0, 1]
λx + (1 − λ)y ∈ C.

Dans le cas d’un espace préhilbertien il y a existence et unicité de la projection sur une partie
convexe complète comme le montre le résultat fondamental suivant.

Théorème 1.6.2 PROJECTION SUR UN CONVEXE COMPLET


Soit C une partie convexe et complète d’un espace préhilbertien (E, h., .i). Alors, pour tout
x ∈ E, il existe y ∈ C unique tel que

kx − yk = d(x, C).

Le vecteur pC (x) = y ∈ C est alors caractérisé par

hx − pC (x), z − pC (x)i ≤ 0

pour tout z ∈ C.

20
Démonstration. Remarquons que d(x, C) = d(0, C − x). Comme C − x est aussi convexe com-
plet, on peut supposer que x = 0. Soit yn ∈ C tel que
1
kyn k ≤ d(0, C) + .
n
Pour tout x, z ∈ E, on a

kx − zk2 + kx + zk2 = 2kxk2 + 2kzk2 ,

d’où x + z 2
2 2 2
kx − zk = 2kx k + 2kzk − 4 .

2
On obtient alors y + y 2
2 2 2 m n
kym − yn k = 2kym k + 2kyn k − 4 .
2
ym + yn
Comme C est convexe, on a ∈ C donc
2
y + y
m n
d(0, C) ≤ .
2
Il en résulte que

kym − yn k2 ≤ 2kym
2
k + 2kyn k2 − 4d2 (0, C)
≤ 4d(0, C)(1/m + 1/n) + 2/m2 + 2/n2 .

La suite (yn ) est donc de Cauchy dans C qui est complet, elle converge donc vers un certain y ∈ C
(C est fermé car C est complet). Passant à la limite dans l’inégalité kyn k ≤ d(0, C) + 1/n, il vient
kyk ≤ d(0, C) et donc kyk = d(0, C) car kyk ≥ d(0, C). Montrons l’unicité de y. Si y1 et y2 sont
solutions, on a
ky1 − y2 k2 ≤ 2ky1 k2 + 2ky2 k2 − 4d2 (0, C) = 0
donc y1 = y2 . Enfin, revenant au cas général, pC (x) est caractérisé par

kx − pC (x)k2 ≤ kx − zk2 pour tout z ∈ C.

Soit y ∈ C et t ∈ [0, 1], on a z = pC (x) + t(y − pC (x)) ∈ C par convexité, d’où

kx − pC (x)k2 ≤ kx − pC (x) − t(y − pC (x))k2

soit
0 ≤ −2thx − pC (x), y − pC (x)i + t2 ky − pC (x)k2 .
Divisant par t et faisant tendre t vers 0 on a bien

hx − pC (x), y − pC (x)i ≤ 0

pour tout y ∈ C. Réciproquement, supposant que z ∈ C est tel que hx − z, y − zi ≤ 0 pour tout
y ∈ C, il vient
kx − yk2 = kx − zk2 + kz − yk2 − hx − z, y − zi

21
d’où
kx − yk2 ≥ kx − zk2
pour tout y ∈ C, et donc z = pC (x).

Proposition 1.6.2 Soit C une partie convexe et complète d’un espace préhilbertien (E, h., .i).
Alors, pour tout x1 , x2 ∈ E

kpC (x1 ) − pC (x1 )k ≤ kx1 − x2 k.

Démonstration. Posons y1 = pC (x1 ) et y2 = pC (x2 ). On a

hx1 − y1 , y2 − y1 i ≤ 0 (1.7)

et
hx2 − y2 , y1 − y2 i ≤ 0. (1.8)
On a alors

hx1 − x2 , y1 − y2 i = hx1 − y1 , y1 − y2 i + hy1 − y2 , y1 − y2 i + hy2 − x2 , y1 − y2 i.

D’après (1.7) et (1.8), le premier et le troisième terme de l’inégalité précédente sont positifs ou
nuls. Il en résulte que

hx1 − x2 , y1 − y2 i ≥ hy1 − y2 , y1 − y2 i = ky1 − y2 k2 .

On a alors
kx1 − x2 kky1 − y2 k ≥ hx1 − x2 , y1 − y2 i ≥ ky1 − y2 k2
d’où
ky1 − y2 k ≤ kx1 − x2 k
ce achève la démonstration.

Définition 1.6.5 Soit (E, h., .i) un espace préhilbertien et soient x, y ∈ E. On dit que x est
orthogonal à y et on note x ⊥ y si hx, yi = 0. Étant donné F ⊂ E, on note

F ⊥ = {y ∈ E : hx, yi = 0, pour tout x ∈ F }.

Remarque 1.6.2 Remarquons que

F ⊥ = ∩x∈F Ker hx, .i

et que hx, .i est linéaire continue (voir Remarque (1.6.1), b)). On obtient alors que F ⊥ est fermé
comme intersection de fermés.

Dans le cas où C est un sous-espace vectoriel le Théorème 1.6.2 prend la forme suivante

22
Théorème 1.6.3 PROJECTION SUR UN SOUS - ESPACE VECTORIEL COMPLET
Soit F un sous-espace vectoriel complet d’un espace préhilbertien (E, h., .i). Alors

E = F ⊕ F⊥

et
pF ∈ L(E).
Pour tout x ∈ E, pF (x) est l’unique vecteur de F tel que

hx − pF (x), yi = 0 pour tout y ∈ F.

De plus,
kpF (x)k ≤ kxk
pour tout x ∈ E.

Démonstration. D’après le Théorème 1.6.2 pF (x) est l’unique vecteur de F tel que

hx − pF (x), y − pF (x)i ≤ 0 pour tout y ∈ F.

Pour tout z ∈ F on a pF (x) + z ∈ F d’où

hx − pF (x), zi ≤ 0 pour tout z ∈ F

ce qui implique, changeant z en −z que

hx − pF (x), zi = 0 pour tout z ∈ F

donc x − pF (x) ∈ F ⊥ . Tout vecteur x ∈ E s’écrit alors

x = pF (x) + x − pF (x)

où
pF (x) ∈ F et x − pF (x) ∈ F ⊥ .
Comme F ∩ F ⊥ = {0}, on a bien E = F ⊕ F ⊥ . De plus pF (.) est la projection algébrique
sur F parallèlement à F ⊥ , c’est donc une application linéaire. Remarquons alors que, d’après le
Théorème de Pythagore

kxk2 = kx − pF (x)k2 + kpF (x)k2 ≥ kpF (x)k2 ,

ce qui montre que kpF (x)k ≤ kxk pour tout x ∈ E et que pF est continue.

Voici un résultat très utile dans la pratique.


Corollaire 1.6.1
Soit F un sous-espace vectoriel fermé d’un espace de Hilbert (H, h., .i). Alors
a) F ⊥⊥ = F .
b) F = H ⇐⇒ F ⊥ = {0}.

23
Démonstration. a) Observons que F ⊂ F ⊥⊥ et que F ⊥ est un sous-espace vectoriel fermé de
E (F ⊥ = x∈F ker hx, .i et ker hx, .i est fermé comme noyau d’une forme linéaire continue
T
(Remarque 1.6.1, b))). Les sous-espaces vectoriels F et F ⊥ sont donc complets ce qui permet
d’appliquer le Théorème 1.6.3. On a alors

F ⊂ F ⊥⊥
E = F ⊕ F⊥
E = F ⊥⊥ ⊕ F ⊥

donc F = F ⊥⊥ .
b) Si F = H il est clair que F ⊥ = {0}. Réciproquement si F ⊥ = {0} on a H = F ⊕ {0}
donc F = E.

Définition 1.6.6 On dit qu’une famille de vecteurs (ei )i∈I est orthogonale si

hei , ej i = 0 pour tout i, j ∈ I, i 6= j.

On dit que la famille orthogonale (ei )i∈I est orthonormée si

kei k = 1 pour tout i ∈ I.

Le résultat suivant dont la démonstration élémentaire est laissée au lecteur est d’une grande im-
portance pratique.
Proposition 1.6.3 Soit (e1 , · · · , en ) une famille
P orthononormée d’un espace préhilbertien (E, h., .i,
soit n ∈ N∗ et λ1 , · · · , λn ∈ R. Posons x = ni=1 λi ei , alors

λi = hx, ei i pour tout i ∈ [1, n],

et n
X
2
kxk = |λi |2 .
i=1

Théorème 1.6.4 Soit (E, h., .i) un espace préhilbertien et soit (e1 , · · · , en ) une famille ortho-
normée. On pose
En = [e1 , · · · , en ]
(sous-espace vectoriel engendré par e1 , · · · , en ). Alors pour tout x ∈ E,
a) pEn (x) = ni=1 hx, ei iei ,
P

b) kxk2 − d2 (x, En ) = ni=1 |hx, ei i|2 .


P

Démonstration. Remarquons qu’un sous-espace vectoriel de dimension finie est complet (voir
Remarque 1.4.1). On peut donc appliquer le Théorème 1.6.3. On sait que pEn (x) est caractérisé
par
hx − pEn (x), ei i = 0 pour tout i ∈ [1, n].

24
Il en résulte que
n
X n
X
pEn (x) = hpEn (x), ei iei = hx, ei iei .
i=1 i=1
De plus, on a
x = x − pEn (x) + pEn (x)
et
(x − pEn (x)) ⊥ pEn (x).
D’après le Théorème de Pythagore, il vient
kxk2 − kx − pEn (x)k2 = kpEn (x)k2 ,
ce qui montre bien que
n
X
kxk2 − d2 (x, En ) = |hx, ei i|2 .
i=1

Théorème 1.6.5 IN ÉGALIT É DE PARSEVAL -B ESSEL


Soit (E, h., .i) un espace préhilbertien et (ei )i∈N∗ une famille orthonormée. Alors pour tout
x ∈ E, la série de terme général (|hx, ei i|2 ) converge et

X
|hx, ei i|2 ≤ kxk2 .
i=1

Démonstration. Pour tout n ∈ N∗ , on a kpEn (x)k2 ≤ kxk2 et, d’après le Théorème 1.6.4 et la
Proposition 1.6.3 on a
Xn
kpEn (x)k2 = |hx, ei i|2 ,
i=1
d’où le résultat.

Définition 1.6.7 Soit (en )n∈N ∗ une famille de vecteurs d’un espace normé (E, k · k). On dit que
cette famille est totale si

[
E= Fn ,
n=1

où Fn = [e1 , · · · , en ]. Autrement dit, si pour tout x ∈ X et pour tout ε > 0, il existe n ≥ 1 et
xn ∈ Fn tel que kx − xn k ≤ ε. De façon équivalente la famille (en )n∈N ∗ est totale si et seulement
si pour tout x ∈ E, on a limn→∞ d(x, En ) = 0 (le démontrer).

Proposition 1.6.4 Soit (H, h., .i) un espace de Hilbert. Alors la famille (en )n∈N ∗ est totale si et
seulement si
{en : n ∈ N∗ }⊥ = 0.

25
Démonstration. On a

[ ⊥
{en : n ∈ N∗ }⊥ = Fn .
n=1
En effet il est clair que

[ ⊥
∗ ⊥
{en : n ∈ N } = Fn ,
n=1
et l’orthogonal d’un sous espace vectoriel est égal à celui de son adhérence (le vérifier). On a donc

[
Fn = H
n=1

si et seulement si

[ ⊥
Fn = {0},
n=1
d’où le résultat.

On a alors une caractérisation simple des familles totales.


Proposition 1.6.5 Soit (H, h., .i) un espace de Hilbert et (ei )i∈N∗ une famille orthonormée. Alors
les propriétés suivantes sont équivalentes,
i) la famille (ei )i∈N∗ est totale,
ii) pour tout x ∈ H, kxk2 = ∞ 2
P
i=1 |hx, ei i| ,

iii) pour tout x ∈ H, x = ∞


P
i=1 hx, ei iei .

Démonstration. i) ⇒ ii). Étant donné ε > 0, il existe n ∈ N∗ et des réels λ1 , · · · , λn tels que
n
X
x − λi ei ≤ ε.

i=1

On a alors n n
X X 2
2 2 2
kxk − |hx, ei i| = kx − pEn (x)k ≤ x − λi ei ≤ ε2 ,

i=1 i=1
2
P∞ 2 2
d’où kxk ≤ i=1 |hx, ei i| + ε ce qui implique bien ii) en faisant tendre ε vers 0.
ii) ⇒ iii). On a x = (x − pEn (x)) + pEn (x) et x − pEn (x) et x − pEn (x) sont orthogonaux.
On obtient donc
kxk2 − kpEn (x)k2 = kx − pEn (x)k2 = d2 (x, En )
soit utilisant le Théorème (1.6.4)
n
X
2
kxk − |hx, ei i|2 = kx − pEn (x)k2 ,
i=1

26
Pn
il en résulte que limn→∞ pEn (x) = x d’où le résultat car pEn (x) = i=1 hx, ei iei .

iii) ⇒ i). Évident.

Exemple 1.6.3 Soit dans `2 la famille (ei )i∈N ∗ définie par ein = δi,n . Pour x ∈ `2 , on a hx, ei i = xi ,
la famille (ei )i∈N∗ est donc totale dans `2 d’après le Théorème 1.6.4, ii).

Soit alors (H, h., .i) un espace de Hilbert et a ∈ H. L’application la : H → R définie par
la = ha, .i est linéaire et on a
|ha, xi| ≤ kakkxk
Il en résulte que la est continue : la ∈ H ∗ . Le résultat suivant montre que tous les éléments de H ∗
sont représentables de cette manière.

Théorème 1.6.6 Soit (H, h., .i un espace de Hilbert. Alors l’application

l : H −→ H ∗
x 7−→ lx

est une isométrie surjective de H dans H ∗ .

Démonstration. Il est clair que l est linéaire. Soit ϕ ∈ H ∗ , si ϕ = 0 on a ϕ = l0 . On peut donc


supposer que ϕ 6= 0. Le noyau F = ker ϕ est donc un hyperplan fermé de H. Il existe alors
b ∈ F ⊥ tel que b 6∈ F car dans le cas contraire on aurait F ⊥ ⊂ F et donc H = F ⊕ F ⊥ ⊂ F
ce qui impliquerait la contradiction F = H. Remarquons alors que F ⊥ = [b] car H = F ⊕ [b],
H = F ⊕ F ⊥ et [b] ⊂ F ⊥ . Comme ker lb = ker ϕ, il existe un réel λ tel que ϕ = λlb = la avec
a = λb. L’application l est alors linéaire et bijective de H dans H ∗ . De plus kla (x)k ≤ kakkxk
pour tout x ∈ H et kla (a)k = kakkak, d’où kla k = kak.

On identifiera le plus souvent H avec H ∗ par l’isométrie définie ci-dessus.

27
28
Chapitre 2

Applications différentiables dans les espaces


normés

2.1 Définition d’une application différentiable


Dans toute la suite, E et F sont des espaces normés, U est un ouvert de E, f est une applica-
tion de U dans F et a est un élément de U .

Définition 2.1.1 On dit que l’application f : U −→ F est différentiable au point a ∈ U s’il existe
ϕ ∈ L(E, F ) telle que pour tout ε > 0, il existe η > 0 tel que pour tout x ∈ B(a, η)

kf (x) − f (a) − ϕ(x − a)k ≤ εkx − ak.

On note alors Df (a) = ϕ.

Remarque 2.1.1
a) Pour simplifier l’écriture, on écrira souvent, h étant un vecteur de E, Df (a)h au lieu de
Df (a)(h).
b) La définition s’écrit de façon équivalente, posant R(x) = f (x) − f (a) − ϕ(x − a),

f (x) = f (a) + ϕ(x − a) + R(x),


R(x)
où limx→a kx−ak
= 0. Cela s’écrit aussi

f (x) = f (a) + ϕ(x − a) + kx − akε(x),

où
lim ε(x) = 0.
x→a

Cela équivaut bien sûr à


f (a + h) = f (a) + ϕ(h) + khkδ(h)
où
lim δ(h) = 0.
h→0

29
On note parfois o(khk) une fonction α(h) définie au voisinage de 0 et à valeurs réelles telles que
limh→0 khk−1 α(h) = 0. La différentibilité en a s’écrit alors

f (a + h) = f (a) + ϕ(h) + o(khk).

c) Si f est différentiable en a, alors f est continue en a. En effet

f (x) − f (a) = ϕ(x − a) + R(x),

d’où utilisant la continuité en a de ϕ et le fait que limx→a R(x) = 0,

lim (f (x) − f (a)) = 0.


x→a

d) Si f est différentiable en a, alors pour tout h ∈ E,


f (a + th) − f (a)
Df (a)(h) = lim . (2.1)
t→0 t
En effet, f (a + th) − f (a) = tDf (a)(h) + kthkε(th). Il en résulte que
f (a + th) − f (a)
= Df (a)(h) + khkε(th),
t
d’où le résultat. On remarque que cette propriété montre que la différentielle Df (a), quand elle
existe, est unique.
e) On note également que l’application f est différentiable en a si et seulement si il existe
ϕ ∈ L(E, F ) telle que
(f (x) − f (a) − ϕ(x − a))
lim = 0,
6=
x→a
kx − ak
6=
où x → a signifie x tend vers a et x 6= a.
f) Si f est différentiable en a et si une application g coincide avec f sur un voisinage de a,
alors g est différentiable en a et Dg(a) = Df (a) (immédiat en utilisant (2.1)).
g) La différentiabilité de f ne change pas quand on remplace les normes de E et F par des
normes équivalentes (exercice facile).
h) Si f : U −→ F est constante alors Df (x) = 0 pour tout x ∈ U , c’est immédiat.

Définition 2.1.2 Soit f : I −→ E une fonction vectorielle définie sur un intervalle ouvert I de R.
On dit que f est dérivable en t0 ∈ I si la limite
f (t) − f (t0 )
lim
t→t0 t − t0
existe. On pose alors
df f (t) − f (t0 )
f 0 (t0 ) = (t0 ) = lim .
dt t→t0 t − t0

30
Théorème 2.1.1 Soit f : I −→ E une fonction vectorielle définie sur un intervalle ouvert I de
R. Alors les deux propriétés suivantes sont équivalentes
i) f est dérivable en t0 ∈ I,
ii) f est différentiable en t0 ∈ I.
De plus pour tout h ∈ R, on a
df
Df (t0 )(h) = h (t0 ),
dt
df
(t0 ) = Df (t0 )(1).
dt

Démonstration. On sait (voir chap. 1, Exemple 1.3.2 que L(R, E) s’identifie à E quand on iden-
tifie ϕ ∈ L(R, E) avec le vecteur ϕ(1) et x ∈ E avec ϕ ∈ L(R, E) définie par ϕ(t) = tx.
Remarquons que
f (t) − f (t0 )
lim =x
t→t0 t − t0
équivaut à
f (t) − f (t0 ) − (t − t0 )x = (t − t0 )ε(t − t0 )
avec lim ε(h) = 0, ce qui démontre le théorème.
h→0

Exemple 2.1.1
a) Soit (E, k.k) un espace normé, alors la norme n’est pas différentiable en 0. Dans le cas
contraire, on aurait (remarque 2.1.1, d)) pour tout h ∈ E

D(k.k)(0)h = lim kthk/t


t→0

ce qui est absurde car le rapport kthk/t a une limite à droite égale à khk et une limite à gauche
égale à −khk quand t tend vers 0.
b) Soient E, F des espaces normés et soit f ∈ L(E, F ). Il découle de l’égalité,

f (x) − f (a) − f (x − a) = 0 pour tout x, a ∈ E

que, pour tout a ∈ E, f est différentiable en a ∈ E et que sa différentielle en a est Df (a) = f .


c) Soit E, F , G des espaces normés, soit f ∈ L2 (E, F ; G) une application bilinéaire continue
et soient a, x ∈ E, b, y ∈ F . On a

f (x, y) = f (a + (x − a), b + (y − b))


= f (a, b) + f (a, y − b) + f (x − a, b) + f (x − a, y − b).

Notons que l’application linéaire L : E × F −→ G définie par

L(u, v) = f (a, v) + f (u, b) pour tout (u, v) ∈ E × F

31
est continue car

kL(u, v)k ≤ kf kkakkvk + kf kkbkkuk ≤ (kf kkak + kf kkbk)k(u, v)k

où k(u, v)k = sup(kuk, kvk). Enfin

kf (x − a, y − b)k ≤ kf kkx − akky − bk ≤ kf kk(x − a, y − b)k2 ,

ce qui montre que


f (x − a, y − b)
lim = 0.
(x,y)→(a,b) k(x − a, y − b)k

Il en résulte que toute application bilinéaire continue f ∈ L2 (E, F ; G) est différentiable sur E ×F
et que pour tout (a, b) ∈ E × F , (u, v) ∈ E × F

Df (a, b)(u, v) = f (a, v) + f (u, b).

Plus généralement si E1 , · · · , Em , G sont des espaces normés et si f ∈ L(E1 , · · · , Em ; G) est


une application multilinéaire continue, alors f est différentiable sur E1 × · · · × Em et pour tout
(a1 , · · · , am ), (u1 , · · · , um ) ∈ E1 × · · · × Em on a

Df (a1 , · · · , am )(u1 , · · · , um ) = f (u1 , a2 , · · · , am ) + · · · + f (a1 , · · · , am−1 , um ),

(exercice facile et fastidieux ou voir Corollaire 2.4.3).


d) Soit U un ouvert de Rn , f : U −→ R une application et soit a ∈ U . On rappelle que la
dérivée partielle
∂f
(a)
∂xi
est égale quand elle existe au nombre dérivé ϕ0 (ai ) où ϕi est la fonction de la variable réelle définie
au voisinage de ai par ϕi (z) = f (a1 , · · · , z, · · · , an ). En d’autre termes

∂f f (a1 , · · · , z, · · · , an ) − f (a1 , · · · , an )
(a) = lim ,
∂xi z→ai z − ai
soit
∂f f (a1 , · · · , ai + t, · · · , an ) − f (a1 , · · · , an )
(a) = lim .
∂xi t→0 t
Autrement dit
∂f f (a + tei ) − f (a)
(a) = lim ,
∂xi t→0 t

6 i
0 si j = ∂f
où (ei )j = . Il résulte donc de (2.1) que si f est différentiable en a alors (a)
1 si j = i ∂xi
existe. On a de plus
n n n
X  X X ∂f
Df (a)(h) = Df (a) hi ei = Df (a)(ei )hi = (a)hi .
i=1 i=1 i=1
∂x i

32
Autrement dit
Df (a)(h) = h∇f (a), hi pour tout h ∈ Rn
 ∂f 
(a)
 ∂x1 
où h., .i désigne le produit scalaire usuel sur Rn et ∇f (a) = 
 ..  est appelé le vecteur

 ∂f . 
(a)
∂xn
∂f
gradient de f en a. On montrera dans la suite que si pour tout i = 1, · · · , n la fonction (.) est
∂xi
définie au voisinage de a et continue en a alors f est différentiable en a et que sa différentiellle en
a est définie par
Df (a)(h) = h∇f (a), hi.

e) Plus généralement, si U ⊂ Rn est un ouvert et si l’application


f = (f1 , · · · , fm ) : U −→ Rm
est différentiable en a. On montrera un peu plus loin que f1 , · · · , fm sont alors différentiables en
a. On a alors d’après (2.1), pour tout h ∈ Rn ,
f (a + th) − f (a)  f1 (a + th) − f (a) fm (a + th) − f (a) 
Df (a)(h) = lim = lim , · · · , lim ,
t→0 t t→0 t t→0 t
donc
Df (a)(h) = (h∇f1 (a), hi, · · · , h∇fm (a), hi),
autrement dit
Df (a)(h) = Jf (a)h
∇f1 (a)T
 

où Jf (a) est la matrice à m lignes et n colonnes dont les lignes sont  .. , autrement dit
.
∇fm (a)T
∂fi
[Jf (a)]ij = (a) pour tout (i, j) ∈ [1, m] × [1, n].
∂xj
On dit que Jf (a) est la matrice Jacobienne de f en a. On montrera que si les dérivées partielles
 ∂f 
i
(.) existent au voisinage de a et sont continues en a on montrera que f est
∂xj (i,j)∈[1,m]×[1,n]
différentiable en a et que Df (a) est donné, pour tout vecteur h ∈ Rm par
Df (a)(h) = Jf (a)h.

La notion de vecteur gradient s’étend au cadre des espaces de Hilbert


Définition 2.1.3 Soit U un ouvert d’un espace de Hilbert E et soit f : E −→ R une application
différentiable en a. On a Df (a) ∈ E ∗ , on désigne alors par ∇f (a) ∈ E l’unique vecteur fourni
par le Théorème de Riesz, tel que
Df (a)(h) = h∇f (a), hi pour tout h ∈ E.

33
Définition 2.1.4 Soit f : U ⊂ E −→ F une application. On dit que f est de classe C 1 sur U si f
est différentiable sur U et si l’application, x 7−→ Df (x) est continue de U dans L(E, F ).

Théorème 2.1.2 Soient E, F des espaces normés. Alors l’application

I : Isom (E, F ) −→ Isom (F, E),

définie par I(u) = u−1 est de classe C 1 et pour tout h ∈ L(E, F ),

DI(u)(h) = −u−1 ◦ h ◦ u−1 .

Démonstration. On sait que Isom (E, F ) est ouvert dans L(E, F ) (Chapitre 1, Théorème 1.3.4).
On remarque que L(.) définie par L(h) = −u−1 ◦ h ◦ u−1 est linéaire ; L(.) est aussi continue car

kL(h)k ≤ ku−1 kku−1 kkhk.

Soit u ∈ Isom (E, F ), on peut supposer que h est assez petit pour que u + h ∈ Isom (E, F ). On a
alors

I(u + h) − I(u) = (u + h)−1 − u−1


= (u + h)−1 ◦ u ◦ u−1 − (u + h)−1 ◦ (u + h) ◦ u−1
= (u + h)−1 ◦ (u − (u + h)) ◦ u−1
= −(u + h)−1 ◦ h ◦ u−1 .

Posons
R(h) = I(u + h) − I(u) − L(h).
On a donc

R(h) = −(u + h)−1 ◦ h ◦ u−1 + u−1 ◦ h ◦ u−1


= (u−1 − (u + h)−1 ) ◦ h ◦ u−1

Montrons alors que lim khk−1 R(h) = 0. On a


h→0

kR(h)k ≤ k(u−1 − (u + h)−1 )kkhkku−1 k.

Or d’après le Théorème 1.3.4 du chapitre 1, on sait que

k(u−1 − (u + h)−1 )k ≤ ε/ku−1 k,

pour h assez petit, ce qui prouve la différentiabilité de I(.) en u ∈ Isom (E, F ).


Il reste à prouver que DI(.) est continue de Isom (E, F ) dans L(L(E, F ), L(F, E)). Posons
pour tout v, w ∈ L(F, E) et h ∈ L(E, F )

Ψ(v, w)(h) = −v ◦ h ◦ w

34
Il est clair que Ψ(v, w)(.) est linéaire de L(E, F ) dans L(F, E). Elle est aussi continue car

kΨ(v, w)(h)k ≤ kvkkwkkhk.

Observons que l’application

Ψ : L(F, E) × L(F, E) −→ L(L(E, F ), L(F, E))

ainsi définie est bilinéaire (évident) et continue car

kΨ(v, w)k ≤ kvkkwk.

On a alors
DI = Ψ ◦ (I, I)
ce qui montre que DI est continue comme composée d’applications continues.

2.2 Opérations sur les applications différentiables


Le résultat suivant découle de la continuité des opérations

(λ, x) 7→ λx et (x, y) 7→ x + y
(voir chapitre 1, Remarque 1.2).

Proposition 2.2.1 Soient f, g : U −→ F deux applications différentiables en a ∈ U et soit


λ ∈ R. Alors les applications λf et f + g sont différentiables en a et l’on a

D(λf )(a) = λDf (a),

D(f + g)(a) = Df (a) + Dg(a).

Le résultat suivant est très important en calcul différentiel et il est impératif de savoir l’appliquer
sans hésitation.

Théorème 2.2.1 Soient E, F , G des espaces normés U ⊂ E, V ⊂ F des ouverts et soient


f : U −→ V différentiable en a ∈ U , g : V −→ G différentiable en b = f (a) ∈ V . Alors
l’application g ◦ f est différentiable en a et

D(g ◦ f )(a) = Dg(f (a)) ◦ Df (a).

Démonstration. On a,
f (x) = f (a) + Df (a)(x − a) + r1 (x),
g(y) = g(b) + Dg(b)(y − b) + r2 (y),

35
avec
r1 (x)
lim =0
x→a kx − ak

et
r2 (y)
lim = 0.
y→b ky − bk

On donc
g(f (x)) = g(b) + Dg(b)(Df (a)(x − a) + r1 (x)) + r2 (f (x)).
Il en résulte que
g(f (x)) = g(b) + (Dg(b) ◦ Df (a))(x − a) + R(x),
où
R(x) = Dg(b)(r1 (x)) + r2 (y).
Il reste à montrer que
R(x)
lim = 0.
x→a kx − ak

Observons que
kDg(b)(r1 (x))k ≤ kDg(b)kkr1 (x)k,
ce qui montre que
Dg(b)(r1 (x))
lim = 0.
x→a kx − ak
r1 (x)
Par ailleurs utilisant le fait que lim = 0, il existe α > 0 tel que
x→a kx − ak
kr1 (x)k ≤ kx − ak
pour tout x tel que kx − ak ≤ α. Il vient, pour tout x ∈ B(a, α),
kf (x) − bk = kDf (a)(x − a) + r1 (x)k

≤ kDf (a)(x − a)k + kr1 (x)k

≤ kDf (a)kk(x − a)k + kr1 (x)k,


donc
kf (x) − bk ≤ (kDf (a)k + 1)kx − ak. (2.2)
Soit alors ε > 0, il existe η > 0 tel que
ε
kr2 (y)k ≤ ky − bk (2.3)
kDf (a)k + 1
 η 
pour tout y tel que ky − bk ≤ η. Pour tout x tel que kx − ak ≤ min α, il vient,
kDf (a)k + 1)
utilisant (2.2),
kf (x) − bk ≤ η,

36
et donc, utilisant (2.3),
ε
kr2 (f (x))k ≤ kf (x) − bk
kDf (a)k + 1
ε
≤ (kDf (a)k + 1)kx − ak
kDf (a)k + 1
≤ εkx − ak,
ce qui achève la démonstration.

Corollaire 2.2.1
a) Soit I ⊂ R un intervalle ouvert de R, soient E, F des espaces normés et soit x : I −→ E
et f : U −→ F une application définie sur un ouvert U de E. On suppose que x(I) ⊂ U , que x(.)
est dérivable en t ∈ I et que f est différentiable en x(t). Alors f ◦ x est dérivable en t et
(f ◦ x)0 (t) = Df (x(t))(x0 (t)).

b) Soit I ⊂ R un intervalle ouvert de R, soient E, F , G des espaces normés, soient x : I −→ E


et y : I −→ F . Soit f ∈ L2 (E, F ; G) une application bilinéaire continue. On suppose que x(.) et
y(.) sont dérivables en t ∈ I. Posons z(t) = f (x(t), y(t)), alors z(.) est dérivable en t et
z 0 (t) = f (x0 (t), y(t)) + f (x(t), y 0 (t)).

Démonstration. a) D’après le Théorème 2.2.1, f ◦ x est différentiable en t donc dérivable en t et


(f ◦ x)0 (t) = D(f ◦ x)(t)(1) = (Df (x(t)) ◦ Dx(t))(1) = Df (x(t)(x0 (t)).

b) On a z = f ◦ g où g(.) = (x(.), y(.)). D’après le Théorème 2.2.1 il résulte que


Dz(t) = Df (x(t), y(t)) ◦ Dg(t).
Appliquant le Théorème 2.3.1 de la section 2.3 on a
Dg(t) = (Dx(t), Dy(t)).
Il vient alors
z 0 (t) = Dz(t)(1)
= Df (x(t), y(t))(Dx(t)(1), Dy(t)(1))
= Df (x(t), y(t))(x0 (t), y 0 (t)).
Utilisant l’Exemple 2.1.1, c), on obtient bien le résultat.

Exemple 2.2.1 Si (E, h·, ·i) est un espace de Hilbert et x, y : I −→ E sont dérivables en t ∈ I,
on déduit du corollaire précédent que
(hx(t), y(t)i)0 = hx0 (t), y(t)i + hx(t), y 0 (t)i.

37
2.3 Applications à valeurs dans un produit d’espaces
Soient F1 , · · · , Fm des espaces normés et F = F1 × · · · × Fm leur produit cartésien. On définit,
pour tout i = 1, · · · , m
pi : F −→ Fi par pi (x1 , · · · , xm ) = xi
et
ui : Fi −→ F par ui (y) = (0, · · · , y, · · · , 0),
où toutes les composantes sont nulles sauf celle de rang i qui est égale à y. On a pi ∈ L(F, Fi ),
ui ∈ L(Fi , F ) (le démontrer) et, pi ◦ ui = IFi .

Théorème 2.3.1 Soit f : U −→ F = F1 × · · · × Fm une application définie sur un ouvert U d’un


espace normé E à valeurs dans un produit d’espaces normé. Alors les propriétés suivantes sont
équivalentes,
i) f est différentiable en a ∈ U ,
ii) f1 , · · · , fm sont différentiables en a où f = (f1 , · · · , fm ).
De plus pour tout h ∈ E,
m
X
Df (a)(h) = (ui ◦ Dfi (a))(h) = (Df1 (a)(h), · · · , Dfm (a)(h)). (2.4)
i=1

Démonstration. Comme f est différentiable en a, l’application fi = pi ◦ f est aussi différentiable


en a pour tout i = 1, · · · m, d’après le Théorème 2.2.1.
Réciproquement, supposons que f1 , · · · , fm sont différentiables en a. Alors, pour tout i =
1, · · · , m, ui ◦ fi est différentiable en a comme composée d’une application différentiable en
a et d’une application différentiable sur Fi . Il en résulte que f qui est égal à m
P
u
i=1 i ◦ f i est
différentiable en a et que, utilisant de nouveau le Théorème 2.2.1 pour tout h ∈ E
m 
X 
Df (a)(h) = Dui (fi (a)) ◦ Dfi (a) (h)
i=1
m 
X 
= ui ◦ Dfi (a) (h),
i=1

ce qui achève la démonstration.

Corollaire 2.3.1 Soit U un ouvert de Rn et soit f : U −→ Rm . Alors f est différentiable en a ∈ U


si et seulement si f1 , · · · , fm sont différentiables en a et on a, pour tout h ∈ Rn ,

Df (a)(h) = Jf (a)h, (2.5)

38
∇f1 (a)T
 

oú Jf (a) =  ..
.  est la matrice m × n définie par [Jf (a)]ij = ∂fi (a), soit
∂xj
∇fm (a)T
 ∂f ∂f1 
1
(a) · · · (a)
 ∂x1 ∂xn 
Jf (a) = 
 .
.. .
.. .

 ∂f · · ·
m ∂fm

(a) · · · (a)
∂x1 ∂xn
Démonstration. La première partie de la conclusion découle du Théorème 2.3.1. Utilisant ce
même Théorème, il vient

Df (a)(h) = (Df1 (a)(h), · · · , Dfm (a)(h)).


∂fi
Par ailleurs, pour i ∈ [1, m], on a (a) = Dfi (a)(ej ) où ej est le j eme vecteur de la base
∂xj
canonique de Rn de telle sorte que
n n
X X ∂fi
Dfi (a)(h) = hj Dfi (a)(ej ) = hj (a) = h∇fi (a), hi.
j=1 j=1
∂xj

On a donc bien
h∇f1 (a), hi
 

Df (a)(h) =  ..  = Jf (a)h.
.
h∇fm (a), hi

2.4 Applications définies sur un produit d’espaces


Nous aurons besoin dans cette section de la Proposition 2.4.2 que nous démontrerons au cha-
pitre suivant. Nous en donnons ici une autre démonstration basée sur la proposition suivante dont
la démonstration fait appel au Théorème de Hahn-Banach.
Proposition 2.4.1 Soit (E, k.k) un espace normé. Alors pour tout x ∈ X on a

kxk = sup{|l(x)| : l ∈ E ∗ , klk ≤ 1}.

Proposition 2.4.2 Soit f : U ⊂ E −→ F une application différentiable définie sur un ouvert


convexe d’un espace normé à valeurs dans un espace normé. On suppose qu’il existe M ∈ R+ tel
que
sup kDf (x)k ≤ M.
x∈U

Alors pour tout x, z ∈ U


kf (z) − f (x)k ≤ M kz − xk.

39
Démonstration. Soient x, z ∈ U et t ∈ [0, 1]. De part la convexité de U on a tx + (1 − t)z ∈ U .
En fait il existe η > 0 tel que tx + (1 − t)z ∈ U pour tout t ∈ [−η, 1 + η] (choisir η > 0 tel que
B(x, ηkx − zk) ⊂ U et B(z, ηkx − zk) ⊂ U ). Soit l ∈ F ∗ telle que klk ≤ 1. Posons pour tout
t ∈ [−η, 1 + η]
ϕ(t) = l(f (tx + (1 − t)z)) = l(f (α(t))).
Utilisant la règle de différentiation des applications composées on obtient que ϕ est dérivable sur
] − η, 1 + η[ et

ϕ0 (t) = Dl(f (α(t)))(Df (α(t))(α0 (t))) = l(Df (tx + (1 − t)z))(z − x).

On a alors

|ϕ0 (t)| ≤ klkk(Df (tx + (1 − t)z)kkz − xk


≤ k(Df (tx + (1 − t)z)kkz − xk
≤ M kz − xk.

Utilisant le théorème des accroissements finis pour les fonctions d’une variable réelle il vient

|ϕ(t) − ϕ(s)k ≤ M kz − xk|t − s|

pout tout s, t ∈] − η, 1 + η[. On obtient alors

|l(f (z) − f (x))| = |ϕ(1) − ϕ(0)| ≤ M kz − xk.

On applique alors la Proposition 2.4.1 et il vient

kf (z) − f (x)k = sup{|l(f (z) − f (x))| : l ∈ F ∗ , klk ≤ 1} ≤ M kz − xk.

Soient E1 , · · · , En , F des espaces normés, U un ouvert du produit cartésien

E = E1 × · · · × En ,

et f : U −→ F une application. Étant donné a ∈ U , on introduit, pour tout i = 1, · · · , n,


l’application ϕi définie par
ϕi (z) = f (a1 , · · · , z, · · · , an ),
(dans (a1 , · · · , z, · · · , an ), les composantes de rang j 6= i sont égales à aj , celle de rang i est égale
à z). L’application ϕi est définie sur un voisinage Ui de ai et à valeurs dans F .
Définition 2.4.1 Soient E1 , · · · , En , F des espaces normés, U un ouvert du produit cartésien
E = E1 × · · · × En et f : U −→ F une application. On dit que f admet une différentielle
partielle en a ∈ U par rapport à la ième variable si ϕi est différentiable en ai . On pose alors

Di f (a) = Dϕi (a).

On remarque que Di f (a) ∈ L(Ei , F ).

40
Proposition 2.4.3 Soit f : U ⊂ E −→ F où U est un ouvert de E = E1 × · · · × En . Supposons
que f est différentiable en a. Alors pour tout i = 1, · · · , n, Di f (a) existe et pour tout h ∈ Ei

Di f (a)(h) = Df (a)(ui (h)),

où ui (h) = (0, · · · , h, · · · , 0).

Démonstration. Posons, pour z ∈ Ei ,

vi (z) = (a1 , · · · , z, · · · , an ),

vi (.) est définie dans un voisinage de ai et

vi (z) − vi (ai ) = ui (z − ai ),

ce qui montre que vi est différentiable en ai et que Dvi (ai ) = ui . D’après le Théorème 2.2.1,
ϕi = f ◦ vi est différentiable en ai et que, pour tout h ∈ Ei
 
Dϕi (ai )(h) = Df (vi (ai )) ◦ Dvi (ai ) (h) = Df (a)(ui (h)),

d’où le résultat.
Le résultat suivant découle immédiatement de la Proposition 2.4.3

Proposition 2.4.4 Soit f : U −→ R où U est un ouvert de Rn . Alors il est équivalent de dire que
f admet une différentielle partielle en a par rapport à la ième variable et que la dérivée partielle
∂f
(a) existe. De plus on a
∂xi
∂f
(a) = Df (a)(ei ),
∂xi
∂f
Di f (a)(h) = h (a),
∂xi
et
∂f
(a) = Di f (a)(1).
∂xi

Il est faux en général que l’existence de différentielles partielles Di f (a), 1 ≤ i ≤ n, implique la


différentiabilité de f en a. On a cependant le résultat suivant qui est très important.

Théorème 2.4.1 Soit f : U ⊂ E1 × · · · × En −→ F et a ∈ U . On suppose que pour i = 1, · · · , n


les différentielles partielles Di f (.) existent sur U et que les applications Di f : U −→ L(Ei , F )
sont continues en a ∈ U . Alors f est différentiable en a et,
n
X
Df (a)(h) = Di f (a)(hi ) pour tout h = (h1 , · · · , hn ) ∈ E1 × · · · × En
i=1

41
Démonstration. On remarque que l’application

L : E1 × · · · × En −→ F
Pn
définie par L(h) = i=1 Di f (a)(hi ) est linéaire et continue. Posons
n
X
R(x) = f (x) − f (a) − Di f (a)(xi − ai ).
i=1

On a

R(x) = f (x1 , · · · , xn ) − f (a1 , x2 , · · · , xn ) − D1 f (a)(x1 − a1 )


+ f (a1 , x2 , · · · xn ) − f (a1 , a2 , · · · , xn ) − D2 f (a)(x2 − a2 )
..
.
+ f (a1 , · · · , an−1 , xn ) − f (a1 , · · · , an ) − Dn f (a)(xn − an ).

Ce que l’on peut écrire

R(x) = g1 (x1 ) − g1 (a1 ) + · · · + gn (xn ) − gn (an ),

où

g1 (z1 ) = f (z1 , x2 , · · · , xn ) − D1 f (a)(z1 − a1 ),


g2 (z2 ) = f (a1 , z2 , x3 , · · · , xn ) − D2 f (a)(z2 − a2 ),
..
.
gn (zn ) = f (a1 , · · · , an−1 , zn ) − Dn f (a)(zn − an ).

Les applications gi sont définies et différentiables dans un voisinage de ai pour tout x voisin de a.
Par définition de la différentielle partielle, on a

Dg1 (z1 ) = D1 f (z1 , x2 , · · · , xn ) − D1 f (a1 , · · · , an ),


Dg2 (z2 ) = D2 f (a1 , z2 , x3 , · · · , xn ) − D2 f (a1 , · · · , an ),
..
.
Dgn (zn ) = Dn f (a1 , · · · , an−1 , zn ) − Dn f (a1 , · · · , an ).

Munissons alors E de la norme

k(u1 , · · · , un )k = sup kui k.


1≤i≤n

Utilisant la continuité de l’application D1 f , étant donné ε > 0, il existe η > 0 tel que, pour tout
y ∈ B(a, η) et pour tout i ∈ [1, n], on ait

kDi f (y) − Di f (a)k ≤ ε.

42
On obtient donc pour tout x ∈ B(a, η) et pour tout i ∈ [1, n],

kDi g(zi )k ≤ ε pour tout zi ∈ B(ai , η).

Appliquant alors la Proposition 2.4.2, il vient pour tout x ∈ B(a, η) et pour tout i ∈ [1, n],

kgi (xi ) − gi (ai )k ≤ εkxi − ai k,

d’où n
X
kR(x)k ≤ ε kxi − ai k = εkx − ak1 ,
i=1

ce qui achève la démonstration.

Corollaire 2.4.1 Soit f : U ⊂ E1 ×· · ·×En −→ F . Alors f est de classe C 1 sur U si et seulement


si les différentielles partielles Di f (.) existent, i = 1, · · · , n et sont continues sur U .

Démonstration. Supposons f de classe C 1 . Alors Di f (x) existe pour tout i = 1, · · · , n et pour


tout x ∈ U . Pour tout i ∈ [1, n], x, z ∈ U et pour tout v ∈ Ei , on a

k(Di f (z) − Di f (x))(v)k = k(Df (z) − Di f (x))(0, · · · , v, · · · , 0)k

≤ kDf (z) − Df (x)kL(E1 ×···×En ,F ) kvk,

ce qui montre que

kDi f (z) − Di f (x)kL(Ei ,F ) ≤ kDf (z) − Df (x)kL(E1 ×···×En ,F ) ,

d’où la continuité de Di f en tout x ∈ U . Réciproquement, d’après le Théorème 2.4.1 l’application


f est différentiable sur U et pour tout x, z ∈ U , h ∈ E1 × · · · × En on a
n
X
k(Df (z) − Df (x))(h)k ≤ k(Di f (z) − Di f (x))(hi )k
i=1
n
X 
≤ k(Di f (z) − Di f (x))k khk.
i=1

On obtient donc
n
X
k(Df (z) − Df (x))kL(E1 ×···×En ,F ) ≤ k(Di f (z) − Di f (x))kL(Ei ,F )
i=1

ce qui montre bien la continuité de Df .

43
Corollaire 2.4.2 Soit U un ouvert de Rn et f : U −→ Rm , f = (f1 , · · · , fm ).
∂fi
a) On suppose que les dérivées partielles , (i, j) ∈ [1, m] × [1, n] existent au voisinage
∂xj
d’un point a ∈ U et sont continues en a. Alors f est différentiable en a et pour tout h ∈ Rn

Df (a)(h) = Jf (a)h,

où Jf (a) est la matrice (m, n) définie par


∂fi
(Jf (a))i,j = (a).
∂xj

∂fi
b) De plus si les dérivées partielles , (i, j) ∈ [1, m] × [1, n] sont continues sur U alors f
∂xj
est de classe C 1 sur U .

Démonstration. a) Utilisant la Proposition 2.4.4, on a, pour tout i ∈ [1, m], j ∈ [1, n], x ∈ U et
h ∈ R,
 ∂f ∂fi 
i
|(Dj fi (x) − Dj fi (a))(h)| = (x) − (a) h

∂xj ∂xj
∂f ∂fi
i
= (x) − (a) |h|,
∂xj ∂xj
ce qui montre que
∂f ∂fi
i
kDj fi (x) − Dj fi (a)kL(R,R) = (x) − (a) .
∂xj ∂xj
Il en résulte que les applications Di fj sont continues en a. Utilisant les Théorèmes 2.3.1 et 2.4.1,
on obtient bien que f est différentiable en a. Le calcul de Df (a)(h) découle alors du Corollaire
2.3.1.
b) Montrons que les différentielles partielles Di f , 1 ≤ i ≤ n sont continues. Pour tout u ∈ R
et pour tout x ∈ U , on a, utilisant la Proposition 2.4.4

Di f (x)(u) = Df (x)(uei )
= (Df1 (x)(uei ), · · · , Dfm (x)(uei ))
 
∂f1 ∂fm
= u (x), · · · , (x) .
∂xi ∂xi
Il en résulte que
 
∂f1 ∂f1 ∂fm ∂fm
kDi f (z) − Di f (x)kL(R,Rm ) =
(z) − (x), · · · , (z) − (x)
.
∂xi ∂xi ∂xi ∂xi
Il suffit alors d’appliquer le Corollaire 2.4.1.

44
Remarque 2.4.1 Dans le cas où m = 1 on peut aussi écrire

Df (a)(h) = h∇f (a), hi

où  ∂f ∂f 
∇f (a) = (a), · · · , (a) .
∂x1 ∂xn
Corollaire 2.4.3 Soient E1 , · · · , En , F des espaces normés et soit

f ∈ Ln (E1 , · · · , En ; F )

une application multilinéaire continue. Alors f est de classe C 1 sur E1 × · · · × En et pour tout
x, h ∈ E1 × · · · × En

Df (a)(h) = f (h1 , x2 , · · · , xn ) + · · · + f (x1 , · · · , xn−1 , hn ).

Démonstration. Soit a ∈ E1 × · · · × En et i ∈ [1, n]. L’application partielle

ϕi (z) = f (a1 , · · · , z, · · · , an ),

est alors linéaire et continue de Ei dans F . Elle est donc différentiable d’après l’Exemple 2.1.1,
b) et
Di f (a) = ϕi .
Montrons alors que, pour tout 1 ≤ i ≤ n, l’application Di f est continue sur E1 × · · · × En ce
qui démontrera le résultat grâce au Corollaire 2.4.1. Il suffit de faire la démonstration pour i = 1.
Pour tout x ∈ E1 × · · · × En on a

D1 f (x) = Ψ(x2 , · · · , xn )

où
Ψ : E2 × · · · × En −→ L(E1 , F )
est définie pour tout z ∈ E2 × · · · × En par

Ψ(z) = f (., z2 , · · · , zn ).

Remarquons que Ψ est multilinéaire et que pour tout u ∈ E1

kψ(z)(u)k ≤ kf kkz2 k · · · kzn kkuk.

Il en résulte que
kψ(z)kL(E1 ,F ) ≤ kf kkz2 k · · · kzn k,
donc d’après le Théorème 1.5.1 du Chapitre 1, Ψ est continue sur E2 × · · · × En ce qui implique
que D1 f est continue sur E1 × · · · × En .

On a aussi le

45
Corollaire 2.4.4 Soient f : U ⊂ E −→ R et g : U ⊂ E −→ R∗ différentiables en a ∈ U . Alors
f
l’application est différentiable en a, et, pour tout u ∈ E,
g
f  g(a)Df (a)(u) − f (a)Dg(a)(u)
D (a)(u) = .
g g(a)2

f s
Démonstration. On a = ϕ ◦ (f, g) avec ϕ : R × R∗ −→ R définie par ϕ(s, t) = . On a
g t
∂ϕ 1 ∂ϕ s
(s, t) = et (s, t) = − 2 . Ces dérivées partielles étant continues sur R × R∗ , on déduit du
∂s t ∂t t
f
Corollaire 2.4.2 que ϕ est différentiable sur R × R∗ . Il en résulte que est différentiable en a, et
g
que, pour tout u ∈ E,
f  1 f (a)
D (a)(u) = Dϕ(f (a), g(a))(Df (a)(u), Dg(a)(u)) = Df (a)(u) − Dg(a)(u),
g g(a) g(a)2

d’où le résultat.

Remarquons que si, dans le corollaire précédent, E est un espace de H ILBERT, on a alors
f  g(a)∇f (a) − f (a)∇g(a)
∇ (a) = .
g g(a)2

46
Chapitre 3

Théorème des Accroissements Finis et


Applications

3.1 Théorème des Accroissements Finis


Définition 3.1.1 Soit f : I −→ E une fonction définie sur un intervalle I de R à valeurs dans
un espace normé E, on dit que f est dérivable à droite (resp. à gauche) en t0 ∈ I si le vecteur
f (t) − f (t0 )
a une limite à droite (resp. à gauche) en t0 . On note fd0 (t0 ) (resp. fg0 (t0 )) cette limite
t − t0
à droite (resp. à gauche) quand elle existe.

Le résultat suivant est connu sous le nom de Théorème des accroissements finis.
Théorème 3.1.1 Soit E un espace normé et soient f : [a, b] −→ E, g : [a, b] −→ R des fonctions
continues sur [a, b] et dérivables sur ]a, b[. On suppose que, pour tout t ∈]a, b[

kf 0 (t)k ≤ g 0 (t).

Alors
kf (b) − f (a)k ≤ g(b) − g(a).
Démonstration. Montrons que l’on a

kf (v) − f (u)k ≤ g(v) − g(u) pour tout a < u < v < b,

ce qui donnera bien la conclusion du théorème en faisant tendre u vers a et v vers b, utilisant la
continuité de f et g en a et b. Supposons le contraire, il existe donc a < u < v < b tels que

kf (v) − f (u)k − (g(v) − g(u)) = η > 0.

Définissons a0 = u et b0 = v. Comme
u+v  u+v 
kf (v) − f (u)k − (g(v) − g(u)) ≤ f (v) − f ( ) − g(v) − g( ) +

u2+ v  u2+ v 
f ( ) − f (u) − g( ) − g(u)

2 2

47
on a u+v  u+v  η
f (v) − f ( ) − g(v) − g( ) ≥ ,

2 2 2

ou bien u+v  u+v  η
f ( ) − f (u) − g( ) − g(u) ≥ .

2 2 2

Choisissons alors a1 , b1 ∈ {a0 , b0 } tels que


η
kf (b1 ) − f (a1 )k − (g(b1 ) − g(a1 )) ≥ .
2
On construit alors par récurrence, une suite décroissantes d’intervalles [an , bn ] tels que bn − an =
b0 − a0
et
2n
η
kf (bn ) − f (an )k − (g(bn ) − g(an )) ≥ n . (3.1)
2
Les suites (an )n∈N et (bn )n∈N convergent alors vers une limite commune c ∈ [a0 , b0 ] ⊂]a, b[.
Utilisant la dérivabilité de f et g en c, on a

f (an ) = f (c) + (an − c)f 0 (c) + (an − c)ε(an − c)

f (bn ) = f (c) + (bn − c)f 0 (c) + (bn − c)ε(bn − c)


(3.2)
0
g(an ) = g(c) + (an − c)g (c) + (an − c)η(an − c)

g(bn ) = g(c) + (bn − c)g 0 (c) + (bn − c)η(bn − c),

avec limh→0 ε(h) = 0 et limh→0 η(h) = 0. Revenant à (3.1), et utilisant l’inégalité triangulaire, il
vient
η
kf (bn ) − f (c)k + kf (c) − f (an )k − (g(bn ) − g(c)) − (g(c) − g(an )) ≥ n .
2
On obtient donc, utilisant (3.2) et le fait que an ≤ c ≤ bn ,
η
≤ kf 0 (c)k(bn − c + c − an ) − g 0 (c)(bn − an ) + rn
2n
avec

rn = (bn − c)(kε(bn − c)k + |η(bn − c)|) + (c − an )(kε(an − c)k + |η(an − c)|).

Divisant par bn − an , il vient


η
≤ kf 0 (c)k − g 0 (c) + (bn − an )−1 rn .
b 0 − a0
Il existe δ > 0 tel que, pour tout |h| ≤ δ, on a kε(h)k ≤ ε et kη(h)k ≤ ε. Pour tout n assez grand
pour que bn − an ≤ δ, on a alors bn − c ≤ bn − an et c − an ≤ bn − an , de telle sorte que

rn ≤ 4(bn − an )ε,

48
donc limn→∞ (bn − an )−1 rn = 0. On arrive donc à la contradiction

kf 0 (c)k > g 0 (c).

On peut en fait démontrer le résultat plus général suivant

Théorème 3.1.2 Soient f : [a, b] −→ E, g : [a, b] −→ R des fonctions continues sur [a, b] et
dérivables à droite sur ]a, b[ sauf éventuellement sur une partie au plus dénombrable D de ]a, b[.
On suppose que, pour tout t ∈]a, b[\D,

kfd0 (t)k ≤ gd0 (t).

Alors
kf (b) − f (a)k ≤ g(b) − g(a).

Démonstration. Soit n 7−→ ρn une surjection de N sur D. Soit ε > 0, on va montrer que, pour
tout t ∈ [a, b]
kf (t) − f (a)k ≤ g(t) − g(a) + ε(t − a + 2),
ce qui démontrera bien le résultat en faisant t = b et en faisant tendre ε vers 0. Posons

A = {a} ∪ {t ∈]a, b] : ψ(s) ≤ 0, ∀s ∈ [a, t[},

où X
ψ(s) = kf (s) − f (a)k − (g(s) − g(a)) − ε(s − a) − ε 2−n ,
ρn <s
P
avec la convention ∅ = 0. On a a ∈ A et ]a, t[⊂ A si t ∈ A. Il en résulte que A est un intervalle.
Soit c la borne supérieure de A ; on a A = [a, c] car c ∈ A. En effet si t ∈ [a, c[, il existe t0 ∈ A
tel que t < t0 , ce qui implique ψ(t) ≤ 0, d’où ψ(t) ≤ 0 sur [a, c[ donc c ∈ A. Observons que
ψ(c) ≤ 0. En effet, si (si ) ∈ A est une suite qui tend en croissant vers c, on a ψ(si ) ≤ 0, d’où
X
kf (si ) − f (a)k − (g(si ) − g(a)) ≤ ε(si − a) + ε 2−n
ρn <si
X
≤ ε(c − a) + ε 2−n ,
ρn <c

car si < c et ρn <si 2−n ≤ −n


P P
ρn <c 2 . Par continuité de f et g, il en résulte que ψ(c) ≤ 0.
On se propose de démontrer que c = b, ce qui achèvera la démonstration. Supposons c < b. Si
c 6∈ D la dérivabilité à droite de f (.) et g(.) en c implique l’existence de η > 0 tel que, pour tout
s ∈ [c, c + η]
kf (s) − f (c) − fd0 (c)(s − c)k ≤ (s − c)ε/2,
|g(s) − g(c) − gd0 (c)(s − c)| ≤ (s − c)ε/2.

49
On a donc

kf (s) − f (c)k ≤ kfd0 (c)k(s − c) + (s − c)ε/2,


≤ gd0 (c)(s − c) + (s − c)ε/2
≤ g(s) − g(c) + ε(s − c).

Comme ψ(c) ≤ 0, on a
X
kf (c) − f (a)k ≤ (g(c) − g(a)) + ε(c − a) + ε 2−n . (3.3)
ρn <c

On
P obtient donc,
P ajoutant membre à membre les deux précédentes inégalités, et observant que
−n −n
ρn <c 2 ≤ ρn <s 2
X
kf (s) − f (a)k ≤ g(s) − g(a) + ε(s − a) + ε 2−n ,
ρn <s

d’où ψ(s) ≤ 0 sur [c, c + η] comme ψ(s) ≤ 0 sur [a, c], on a ψ(s) ≤ 0 sur [a, c + η], ce qui
implique la contradiction c + η ∈ A.
Si c ∈ D, il existe m ∈ N tel que c = ρm . Par continuité de f et g en c, il existe η > 0 tel que,
pour tout s ∈]c, c + η]
ε
kf (s) − f (c)k ≤ 2−m ,
2
ε −m
|g(s) − g(c)| ≤ 2 .
2
Pour tout s ∈]c, c + η] on a utilisant 3.3
ε
kf (s) − f (a)k ≤ kf (c) − f (a)k + 2−m
2 X ε
≤ g(c) − g(a) + ε(c − a) + ε 2−n + 2−m
ρn <c
2
X
≤ g(s) − g(a) + ε(c − a) + ε 2−n + ε2−m
ρn <c
X
≤ g(s) − g(a) + ε(s − a) + ε 2−n + ε2−m ,
ρn <s

car ρm = c < s. On obtient alors la contradiction c + η ∈ A. On a donc bien c = b. Ainsi, pour


tout t ∈ [a, b]
X
kf (t) − f (a)k ≤ g(t) − g(a) + ε(t − a) + ε 2−n
ρn <t
≤ g(t) − g(a) + ε(t − a + 2)

2−n ≤ 2, ce qui achève la démonstration.


P
car ρn <t

50
Corollaire 3.1.1 Soit f : [a, b] −→ E une fonction continue sur [a, b] et dérivable à droite sur
]a, b[ sauf éventuellement sur une partie au plus dénombrable D de ]a, b[. On suppose qu’il existe
M ≥ 0 telle que, pour tout t ∈]a, b[\D,
kfd0 (t)k ≤ M.
Alors
kf (b) − f (a)k ≤ M (b − a).
Démonstration. Il suffit d’appliquer le Théorème 3.1.2 avec g(t) = M t.

Remarque 3.1.1
a) Le Théorème 3.1.2 et le Corollaire 3.1.1 sont vrais en remplaçant la dérivée à droite par la
dérivée à gauche.
b) Quand E 6= R, il n’existe pas en général d’élément c ∈ [a, b] tel que f (b) − f (a) =
0
f (c)(b − a) (voir T.D.).

3.2 Applications du Théorème des Accroissements Finis


Le résultat très utile suivant montre qu’une fonction différentiable dont la différentielle est
majorée en norme par une constante M sur un convexe est M -Lipschitzienne sur ce convexe.
Corollaire 3.2.1 Soit U ⊂ E un ouvert d’un espace normé et soit f : U −→ F une application
différentiable et soit C ⊂ U un convexe tel que supy∈C kDf (y)k ≤ M . Alors, pour tout x, z ∈ C
kf (z) − f (x)k ≤ M kx − zk.
Démonstration. Soient x, z ∈ C. Définissons pour tout t ∈ [0, 1]
u(t) = tx + (1 − t)z ∈ U
et
ϕ(t) = f (u(t)).
La fonction ϕ est continue sur [0, 1], à valeurs dans C, dérivable sur ]0, 1[ et sa dérivée est donnée,
utilisant le Corollaire 2.2.1 du Chapitre 2
ϕ0 (t) = Df (u(t))u0 (t) = Df (tx + (1 − t)z)(x − z).
Il en résulte que pour tout t ∈]0, 1[
kϕ0 (t)k ≤ M kx − zk = g 0 (t)
en posant g(t) = M kx − zkt. Le Théorème 3.1.1 implique que
kf (x) − f (z)k = kϕ(1) − ϕ(0)k ≤ g(1) − g(0) = M kx − zk.

Le résultat suivant est aussi utile

51
Proposition 3.2.1 Foit U ⊂ E un ouvert d’un espace normé E et soit f : U −→ F une applica-
tion différentiable que l’on suppose M -lipschitzienne sur U . Alors,
kDf (x)k ≤ M pour tout x ∈ U.
Démonstration. Pour tout x ∈ U et u ∈ E, on sait que
f (x + tu) − f (x)
Df (x)(u) = lim ,
t→0 t
donc f (x + tu) − f (x)
kDf (x)(u)k = lim .

t→0 t
Pour tout t assez petit, on a x + tu ∈ U de telle sorte que
kf (x + tu) − f (x)k ≤ M |t|kuk,
d’où f (x + tu) − f (x)
kDf (x)(u)k = lim ≤ M kuk,

t→0 t
ce qui montre bien que kDf (x)k ≤ M pour tout x ∈ U .

Le résultat suivant est important.


Corollaire 3.2.2 Soit U ⊂ E un ouvert connexe d’un espace normé, soit f : U −→ F une
application différentiable telle que Df (x) = 0 pour tout x ∈ U . Alors f est constante sur U.
Démonstration. Pour tout a ∈ U il existe un ouvert convexe, à savoir une boule ouverte B(a, r)
sur laquelle Df est nulle et donc sur laquelle f est constante (Corollaire 3.2.1). Considérons
a0 ∈ U et posons b0 = f (a0 ) et U0 = f −1 (b0 ). L’ensemble U0 est fermé car f est continue. Soit
a ∈ U0 , il existe une boule ouverte B(a, r) telle que f (x) = f (a) = b0 sur B(a, r). Il en résulte
que U0 est ouvert dans U . Comme U0 est aussi fermé dans U et que U est connexe, on a U = U0
ce qui achève la démonstration.

Une application utile du Théorème des accroissements finis est de donner une condition suffisante
pour passer à la limite sur la différentielle d’une suite de fonctions différentiables.

Théorème 3.2.1 Soit U ⊂ E un ouvert connexe d’un espace normé et soit fp : U −→ F , p ∈ N


une suite d’applications différentiables à valeurs dans un espace de Banach F . On suppose que
i) il existe x0 ∈ U tel que la suite (fp (x0 )) converge ;
ii) il existe une fonction g : U −→ L(E, F ) telle que, pour tout a ∈ U il existe une boule
ouverte B(a) contenant a telle que la suite de fonctions (Dfp ) converge uniformément sur B(a)
vers g, ce qui signifie  
lim sup kDfp (y) − g(y)kL(E,F ) = 0.
p→∞ y∈B(a)

Alors il existe une application différentiable f : U −→ F telle que pour tout a ∈ U , la suite
(fp ) converge uniformément vers f sur B(a) et l’on a Df = g sur U .

52
Démonstration. Soient p, q ∈ N et a ∈ U . On définit
h(x) = fp (x) − fp (a) − (fq (x) − fq (a)).
On a Dh(x) = Dfp (x) − Dfq (x) et h(a) = 0. Appliquant le Corollaire 3.2.1 à l’application h et
à l’ouvert convexe B(a), on a pour tout x ∈ B(a) et pour tout p, q ∈ N,
kfp (x) − fp (a) − (fq (x) − fq (a))k ≤ kDfp − Dfq kC(B(a),F ) kx − ak. (3.4)
avec kDfp − Dfq kC(B(a),F ) = supy∈B(a) kDfp (y) − Dfq (y)k. La suite (fp (x) − fp (a)) est donc
de Cauchy dans F . Il en résulte que les suites (fp (x)) et (fp (a)) convergent ou divergent simul-
tanément. Ceci implique que l’ensemble A des x ∈ U tels que (fp (x)) converge est à la fois ouvert
et fermé dans U . En effet, d’après ce qui précéde on a B(a) ⊂ A ou B(a) ⊂ U \ A suivant que
a ∈ A ou a ∈ U \ A. L’ensemble A qui est non vide par hypothèse est donc égal à U car U est
connexe. Notons que pour tout x ∈ U , f (x) = limp→∞ fp (x). Soit r(a) > 0 le rayon de la boule
B(a). D’après 3.4 on a, pour tout x ∈ B(a) et pour tout p, q ∈ N,
kfp (x) − fp (a) − (fq (x) − fq (a))k ≤ kDfp − Dfq kC(B(a),F ) r(a),
d’où, faisant tendre q vers l’infini, et passant à la borne supérieure sur x ∈ B(a),
sup kfp (x) − fp (a) − (f (x) − f (a))k ≤ kDfp − DgkC(B(a),F ) r(a).
x∈B(a)

Il en résulte que la suite d’applications (fp − fp (a)) converge uniformément vers f − f (a) sur
B(a), donc (fp ) converge uniformément vers f sur B(a).
Il reste à démontrer que f est différentiable et que Df = g. Soit a ∈ U . Posons pour tout x ∈ U
R(x) = f (x) − f (a) − g(a)(x − a) = R1 (x) + R2 (x) + R3 (x),
où
R1 (x) = f (x) − f (a) − (fp (x) − fp (a)),
R2 (x) = fp (x) − fp (a) − Dfp (a)(x − a),
R3 (x) = (Dfp (a) − g(a))(x − a).
On sait que pour tout x ∈ B(a) et pour tout p ∈ N
kR1 (x)k = kfp (x) − fp (a) − (f (x) − f (a))k ≤ sup kDfp (y) − g(y)kkx − ak.
y∈B(a)

Étant donné ε > 0 il existe p0 ∈ N tel que pour tout p ≥ p0


sup kDfp (y) − g(y)k ≤ ε/3,
y∈B(a)

ce qui implique que, pour tout x ∈ B(a) et pour tout p ≥ p0


kR1 (x)k ≤ kx − akε/3,
kR3 (x)k ≤ sup kDfp (y) − g(y)kkx − ak
y∈B(a)

≤ kx − akε/3.

53
Fixons alors p0 (qui ne dépend que de ε). Utilisant la différentiabilité de fp0 en a, il existe η > 0
tel que, pour tout x ∈ B(a, η) ⊂ B(a)

kfp0 (x) − fp0 (a) − Dfp0 (a)(x − a)k ≤ kx − akε/3.

On obtient donc, pour tout x ∈ B(a, η),

kR(x)k ≤ kR1 (x)k + kR2 (x)k + kR3 (x)k ≤ εkx − ak,

ce qui achève la démonstration.

On peut écrire ce résultat pour des séries d’applications.

Corollaire 3.2.3 Soit U ⊂ E un ouvert connexe d’un espace normé et soit up : U −→ F une
suite d’applications différentiables à valeurs dans un espace de Banach F . On suppose
i) Il existe a ∈ U tel que la série de terme général (up (a)) converge dans F .
ii) La série de fonctions de terme général (Dup (.)) converge uniformément vers une applica-
tion g : U −→ L(E, F ), ce qui signifie que
 Xp 
lim sup Duk (y) − g(y) = 0.

p→∞ y∈U L(E,F )
k=0

Alors la série d’applications de terme général (up (.)) converge uniformément sur U et on a

X  X∞
D uk (x) = Duk x.
k=0 k=0

Dans le cas des fonctions on obtient :

Théorème 3.2.2 Soit I ⊂ R un intervalle ouvert, soient fp : I −→ F , p ∈ N une suite de


fonctions dérivables à valeurs dans un espace de Banach F . On suppose que
i) Il existe t0 ∈ I tel que la suite (fp (t0 )) converge.
ii) Il existe une fonction g : I −→ F telle que, pour tout a ∈ I, il existe un intervalle
ouvert I(a) contenant a tel que la suite de fonctions (fp0 ) converge uniformément vers une fonction
g : I −→ F sur I(a).
Alors il existe une fonction f : I −→ F telle que pour tout a ∈ I la suite de fonctions (fp )
converge uniformément vers f sur I(a) et l’on a

f 0 (t) = g(t) pour tout t ∈ I.

54
3.3 Applications Strictement Différentiables
Définition 3.3.1 Soit f : U −→ F une application définie sur un ouvert d’un espace normé E et
à valeurs dans un espace normé F . On dit que f est strictement différentiable en a ∈ U s’il existe
une application linéaire continue ϕ ∈ L(E, F ) telle que, pour tout ε > 0, il existe η > 0 tel que
f − ϕ soit ε-Lipschitzienne sur B(a, η), ce qui signifie

pour tout x, z ∈ B(a, η), kf (z) − f (x) − ϕ(z − x)k ≤ εkz − xk.

Une application strictement différentiable en a est différentiable en a et Df (a) = ϕ. Il suffit de


remplacer x par a dans l’inégalité ci-dessus.

Théorème 3.3.1 Soit f : U −→ F une application définie sur un ouvert d’un espace normé E et
à valeurs dans un espace normé F . On suppose que f est différentiable sur U et que l’application
Df est continue en a. Alors f est strictement différentiable en a.

Démonstration. Posons g(x) = f (x) − f (a) − Df (a)(x − a). On a Dg(x) = Df (x) − Df (a).
Utilisant la continuité de Df en a et pour tout ε > 0, il existe donc η > 0 tel que, pour tout
y ∈ B(a, η)
kDg(y)k ≤ ε.
D’après le Corollaire 3.2.1 pour tout x, z ∈ B(a, η), on a

kf (z) − f (x) − Df (a)(z − x)k = kg(z) − g(x)k


≤ sup kDg(y)k × kz − xk
y∈B(a,η)

≤ εkz − xk

d’où le résultat.

Il existe des applications strictement différentiable en un point sans que la différentielle soit
continue en 0.

Exemple 3.3.1 Introduisons la fonction paire h :] − 1, 1[−→ R définie par



 0 si x = 0
h(x) =
(n + 1)−1 si x ∈ [(n + 1)−1 , n−1 [

et posons pour x ∈] − 1, 1[ Z x
f (x) = h(t) dt.
0

Soit ε > 0 et n ∈ N∗ tel que n + 1−1 ≤ εn−1 . Comme |h(t)| ≤ ε sur ]−ε, ε[, f est ε-Lipschitzienne
sur ] − ε, ε[ ce qui montre que f est strictement différentiable en 0 avec f 0 (0) = 0 alors que f
n’est pas dérivable aux points x = n−1 .

55
On a cependant la

Proposition 3.3.1 Soit f : U −→ F une application définie sur un ouvert d’un espace normé E
et à valeurs dans un espace normé F . On suppose que f est différentiable sur U et strictement
différentiable en a ∈ U . Alors Df est continue en a.

Démonstration. Soit ε > 0 et η > 0 tel que h = f − Df (a) soit ε-Lipschitzienne sur B(a, η). Il
résulte de la Proposition 3.2.1 que kDh(x)k = kDf (x) − Df (a)k ≤ ε pour tout x ∈ B(a, η).

3.4 Opérateurs de Nemicki


Soit U un ouvert d’un espace normé E, f : U −→ F une application continue à valeurs dans
un espace normé F et I un intervalle compact de R. On note C(I, E) l’ensemble des fonctions
continues de I dans E et l’on munit cet ensemble de la norme k.k∞ de la convergence uniforme.
On définit
Ω = {x ∈ C(I, E) : x(I) ⊂ U } (3.5)
et on introduit
Nf : Ω −→ C(I, F )
définie pour tout x ∈ Ω par
Nf (x) = f ◦ x.

Théorème 3.4.1 L’ensemble Ω défini en 3.5 est ouvert dans C(I, E) et l’application Nf est conti-
nue.

Démonstration. a) Ω est ouvert. Soit x ∈ Ω. Pour tout z ∈ x(I), il existe ηz > 0 tel que
B(z, 2ηz ) ⊂ U . Du fait de la compacité de x(I), il existe n ∈ N∗ et z1 , . . . , zn ∈ x(I) tels que
n
[
x(I) ⊂ B(zi , ηzi ).
i=1

Posons η = min1≤i≤n ηzi . On a


B(x, η) ⊂ Ω.
En effet, soit z ∈ B(x, η) et t ∈ I. Il existe alors i ∈ [1, n] tel que x(t) ∈ B(zi , ηzi ). On a

kz(t) − zi k ≤ kz(t) − x(t)k + kx(t) − zi k ≤ 2ηzi ,

ce qui montre que z(t) ∈ B(zi , 2ηzi ) ⊂ U . On a donc bien z ⊂ Ω.


b) Nf est continue. Soit x ∈ Ω et ε > 0. Pour tout z ∈ x(I), il existe ηz > 0 tel que pour tout
y ∈ B(z, 2ηz ) on ait kf (y) − f (z)k ≤ ε/2. Du fait de la compacité de x(I), il existe n ∈ N∗ et
z1 , . . . , zn ∈ x(I) tels que
[n
x(I) ⊂ B(zi , ηzi ).
i=1

56
Soit alors 0 < η ≤ min1≤i≤n ηzi assez petit pour que B(x, η) ⊂ Ω. Pour tout y ∈ B(x, η) et pour
tout t ∈ I, il existe i ∈ [1, n] tel que x(t) ∈ B(zi , ηzi ). On a

ky(t) − zi k ≤ ky(t) − x(t)k + kx(t) − zi k ≤ 2ηzi ,


kx(t) − zi k ≤ 2ηzi ,

d’où
kf (y(t) − f (x(t))k ≤ kf (y(t) − f (zi )k + kf (zi ) − f (x(t))k ≤ ε.
On a alors

kNf (y) − Nf (x)k∞ = kf (y) − f (x)k∞ = sup kf (y(t)) − f (x(t))k ≤ ε


t∈I

d’où le résultat.

L’opérateur Nf est alors appelé opérateur de Nemicki associé à f . On considère alors un ouvert
U ⊂ R × E et f : U −→ F une application continue. On pose

A = {x ∈ C(I, E) : (t, x(t)) ∈ U pour tout t ∈ I}.

L’ensemble A est ouvert, (éventuellement vide). En effet on a A = L−1 (Ω) où

Ω = {u ∈ C(I, R × E) : u(I)) ∈ U }

et
L : C(I, E) −→ C(I, R × E)
est définie par
L(x) = (IdR , x).
Comme L est continue et Ω ouvert, il en est donc bien de même de A. Introduisons

Nf : A −→ C(I, F )

définie par
Nf (x) = (Nf ◦ L)(x),
à savoir Nf (x) = f (·, x(·)). L’application Nf est alors continue comme composée de deux appli-
cations continues. Etudions alors la différentiabilité de Nf .

Théorème 3.4.2 Soit f : U −→ F continue telle que D2 f existe et est continue sur U . Alors
l’application Nf est de classe C 1 sur A et pour tout x ∈ A, h ∈ C(I, E), t ∈ I,

(DNf (x)(h) (t) = D2 f (t, x(t))(h(t)).

57
Démonstration. D’après le Théorème 3.4.1, l’application

ND2 f : A −→ C(I, L(E, F ))

définie par
ND2 f = ND2 f ◦ L
est continue. Soit x ∈ A. Pour tout ε > 0, il existe donc η > 0 tel que ky − xk∞ ≤ η implique
y ∈ A et

kND2 f (y) − ND2 f (x)k∞ = sup kD2 f (t, y(t)) − D2 f (t, x(t))kL(E,F ) ≤ ε.
t∈I

Soit h ∈ C(I, E) tel que khk∞ < η, soit t ∈ I. Posons

ϕt (ξ) = f (t, x(t) + ξ) − f (t, x(t)) − D2 f (t, x(t))(ξ).

Remarquons que ϕt (ξ) est défini et différentiable sur B(0, η) avec

Dϕt (ξ) = D2 f (t, x(t) + ξ) − D2 f (t, x(t)).

D’où
sup kDϕt (ξ)k ≤ sup kD2 f (t, x(t) + ξ) − D2 f (t, x(t))k ≤ ε.
kξk<η kξk<η

Appliquant le Corollaire 3.2.1 il vient, pour tout t ∈ I, notant que ϕt (0) = 0,

kf (t, x(t) + h(t)) − f (t, x(t)) − D2 f (t, x(t))(h(t))k = kϕt (h(t)) − ϕt (0)k
≤ sup kDϕt (ξ)k kh(t)k
kξk<η

≤ εkhk∞ .

Il en résulte que pour tout h ∈ B(x, η) on a

sup kf (t, x(t) + h(t)) − f (t, x(t)) − D2 f (t, x(t))h(t)k ≤ εkhk∞ ,


t∈I

d’où
kNf (x + h) − Nf (x) − L(h)k∞ ≤ εkhk∞
avec L(h) ∈ C(I, F ) défini par

L(h)(t) = D2 f (t, x(t))(h(t)) pour tout t ∈ I.

Remarquons que L est linéaire et que

kL(h)(t)k ≤ kD2 f (t, x(t))kL(E,F ) kh(t)k ≤ M khk

où
M = sup kD2 f (t, x(t)k
t∈I

58
(M est fini comme borne supérieure d’une fonction continue sur un compact). Il en résulte que

kL(h)k ≤ M khk,

ce qui montre que L ∈ L(C(I, E), C(I, F )) et donc que Nf est différentiable en x. Reste à montrer
que DNf est continue. Pour tout x, y, pour tout h ∈ C(I, E) et pout tout t ∈ I, on a

k((DNf (y) − DNf (x))(h))(t)k ≤ kD2 f (t, y(t)) − D2 f (t, x(t))kL(E,F ) kh(t)k,

de telle sorte que

k(DNf (y) − DNf (x))(h)k∞ ≤ sup kD2 f (t, y(t)) − D2 f (t, x(t))kL(E,F ) khk∞
t∈I

donc

kDNf (y) − DNf (x)kL(C(I,E),C(I,F )) ≤ sup kD2 f (t, y(t)) − D2 f (t, x(t))kL(E,F ) ,
t∈I

ce qui montre que

kDNf (y) − DNf (x)kL(C(I,E),C(I,F )) ≤ kND2 f (y) − ND2 f (x)k∞ ,

ce qui achève la démonstration car ND2 f est continue.

Le Théorème 3.4.2 a de nombreuses applications. Citons le

Théorème 3.4.3 Soit I = [a, b] un intervalle compact. Soit E un espace normé, U ⊂ R × E un


ouvert et f : U −→ Rn une application continue. On pose

A = {x ∈ C(I, E) : (t, x(t)) ∈ U pour tout t ∈ I}

et on définit une application If : A −→ Rn par


Z b
If (x) = f (t, x(t)) dt.
a

Alors,
a) If est continue sur A.
b) Si de plus D2 f existe et est continue sur U , l’application If est de classe C 1 sur A et, pour
x ∈ A et h ∈ C(I, E)
Z b
(DIf (x))(h) = D2 f (t, x(t))h(t) dt.
a

59
Démonstration. a) Définissons
I : C(I, Rn ) −→ Rn
par Z b
I(z) = z(t) dt.
a
Il est clair que I est linéaire continue et que If = I ◦ Nf . On obtient donc bien que If est continue
comme composée de deux applications continues.
b) D’après le Théorème 3.4.2 l’application Nf est continuement différentiable. Il en est donc
de même de If . Pour x ∈ A et h ∈ C(I, E), on a
Z b
(DIf (x)h) = (I ◦ DNf (x))(h) = D2 f (t, x(t))(h(t)) dt.
a

Remarque 3.4.1 Dans le cas où U ⊃ I × V où V est un ouvert de E, le Théorème 3.4.1 montre
que l’ensemble Ω = {x ∈ C(I, E) : x(I) ⊂ V } est ouvert dans C(I, E). Comme A ⊃ Ω , il en
résulte que A est non vide.

3.5 Primitives et Intégrales des Fonctions Réglées


Définition 3.5.1
a) Soit I un intervalle d’extrémités éventuellement infinies a et b et f : I −→ E une fonction
à valeurs dans un espace de Banach E. On dit que f est une fonction en escalier sur I s’il existe
une suite finie a = t0 < · · · < tn = b telle que f soit constante sur chacun des intervalles ]ti , ti+1 [
pour tout 0 ≤ i ≤ n − 1.
b) On dit que f : I −→ E est une fonction réglée si elle admet une limite à droite et une limite
à gauche en tout t ∈ I. (Une fonction en escalier est réglée, une fonction continue est réglée ainsi
qu’une fonction monotone à valeurs dans R).

Le résultat suivant caractérise l’ensemble des fonctions réglées sur un intervalle compact
comme étant l’adhérence pour la topologie de la convergence uniforme de l’ensemble des fonc-
tions en escalier

Théorème 3.5.1 Soit I un intervalle compact et f : I −→ E une fonction à valeurs dans un


espace de Banach E. Alors les deux propriétés suivantes sont équivalentes,
i) f est une fonction réglée,
ii) f est limite uniforme sur I d’une suite de fonctions en escalier.

60
Démonstration
i) =⇒ ii). Pour tout n ∈ N∗ et pour tout t ∈ I il existe, par application du critère de Cauchy à
droite et à gauche en t, un intervalle ouvert I(t) =]a(t), b(t)[ contenant t tel que

kf (s) − f (s0 )k ≤ 1/n

pour tout s, s0S∈ I∩]t, b(t)[ ou s, s0 ∈ I∩]a(t), t)[. Par compacité il existe m ∈ N∗ et t1 , . . . , tm ∈ I
tels que I ⊂ m i=1 I(ti ). Soit alors c0 < c1 < · · · < ck la suite telle que

{c0 , . . . , ck } = {a, b, ti , a(ti ), b(ti ) : 1 ≤ i ≤ m} ∩ I.

Chaque cj appartient à un intervalle I(ti ). Si cj ∈]a(ti ), ti [ alors cj < cj+1 ≤ ti . Si cj ∈ [ti , b(ti )[,
alors cj < cj+1 ≤ b(ti ). Dans tous les cas on a |f (s) − f (s0 )| ≤ 1/n sur ]cj , cj+1 [∩I. Soit alors la
fonction fn définie par

fn (cj ) = f (cj ) si cj ∈ I,
fn (t) = f (τj ) si t ∈]cj , cj+1 [∩I où τj ∈]cj , cj+1 [∩I.

On a alors kfn − f k∞ ≤ 1/n, d’où le résultat.


ii) =⇒ i). Soit t ∈ I. Pour tout  > 0 il existe n ∈ N tel que kfn − f k∞ ≤ /3. La fonction fn
étant en escalier, il existe η > 0 tel que fn prend des valeurs constantes sur chacun des intervalles
]t, t + η[∩I et ]t − η, t[∩I. Pour tout s, s0 ∈]t, t + η[∩I ou s, s0 ∈]t − η, t[∩I, on a

kf (s0 ) − f (s)k ≤ kf (s0 ) − fn (s0 )k + kfn (s0 ) − fn (s)k + kfn (s0 ) − f (s)k ≤ .

Le critère de Cauchy est alors vérifié à droite et à gauche en t. Il en résulte bien l’existence de
limites à droite et à gauche en t, l’espace E étant supposé complet. 

Définition 3.5.2 Soit I ⊂ R un intervalle et f : I −→ E une fonction à valeurs dans un espace


de Banach E. On dit que la fonction continue Φ : I −→ E est une primitive de f dans I s’il existe
une partie au plus dénombrable D ⊂ I telle que Φ soit dérivable sur I \ D et telle que Φ0 = f
sur I \ D.

Proposition 3.5.1 Soit I ⊂ R un intervalle et f : I −→ E une fonction à valeurs dans un espace


de Banach E. Alors si Φ1 et Φ2 sont deux primitives de f sur I, Φ1 − Φ2 est constante sur I.

Démonstration
D’après la définition des primitives, il existe deux parties au plus dénombrables D1 et D2 de
I telles que (Φ1 − Φ2 )0 = 0 sur I \ (D1 ∪ D2 ). Écrivons I comme réunion d’une suite croissante
d’intervalles compacts In . D’après le Corollaire 3.1.1 la fonction Φ1 − Φ2 est constante sur chaque
In donc sur I, (détaillez le raisonnement en exercice). 

Lemme 3.5.1 Soit I un intervalle compact de R et soit f : I −→ E une fonction en escalier,


alors f admet une primitive sur I.

61
Démonstration
Soient a < b les extrémités de I et soit t−1 = 0 et a = t0 < · · · < tn = b telle que pour tout
0 ≤ i ≤ n − 1 f (t) = ci sur l’intervalle ]ti , ti+1 [. Posons F (t) = c0 (t − t0 ) pour t ∈ [t0 , t1 ] et pour
1 ≤ i ≤ n − 1 et t ∈ [ti , ti+1 ]
i−1
X
F (t) = ci (t − xi ) + ck (tk+1 − tk )
k=0

Nous laissons au lecteur le soin de vérifier que F est continue et vérifie F 0 (t) = f (t) pour tout
t ∈ I \ {t0 , . . . , tn }. 

Théorème 3.5.2 Soit I ⊂ R un intervalle et f : I −→ E une fonction réglée à valeurs dans un


espace de Banach E. Alors f admet une primitive Φ dans I.

Démonstration
Remarquons que I s’écrit comme réunion croissante d’une suite (In ) d’intervalles compacts.
Soit t0 ∈ int (I). Supposons démontré que f possède
une primitive Φn dans In telle que Φn (t0 ) =
0. On observe alors que si m ≥ n, on a Φm | = Φn . En effet ces deux primitives d’une même

n
fonction différent d’une constante d’après la Proposition 3.5.1. Comme elles sont égales en t0
elles coı̈ncident sur In . On définit alors sans ambiguı̈té une primitive Φ de f par Φ(t) = Φn (t) si
t ∈ In .
On peut donc supposer I compact. D’après le Théorème 3.5.1 f est limite uniforme dans I
d’une suite de fonctions en escalier (fn ). Soit Φn une primitive de fn et Dn ⊂ I telle que Φ0n = fn
sur I \ Dn . Choisissons Φn telle que Φn (t0 ) = 0 où t0 ∈ I. On peut alors appliquer le Théorème
3.2.2 qui nous permet de conclure que la suite (Φ Sn ) converge uniformément vers une fonction Φ
0
telle que Φ = f sur l’ensemble I \ D où D = n≥0 Dn est au plus dénombrable, ce qui achève
la démonstration. 
On peut alors définir l’intégrale d’une fonction réglée définie sur un intervalle I et à valeurs
dans un espace de Banach. Pour cette intégrale une primitive de fonction réglée est l’intégrale de
sa dérivée.

Théorème 3.5.3 TH ÉOR ÈME ET D ÉFINITION

Soit I ⊂ R un intervalle et f : I −→ E une fonction réglée à valeurs dans un espace de


Banach E. On pose, pour tout a, b ∈ I (on ne suppose pas a ≤ b)
Z b
f (t)dt = Φ(b) − Φ(a)
a

où Φ est une primitive de f dont l’existence est garantie par le Théorème 3.5.2. On a alors
Z b Z b
f (t)dt ≤ kf (t)kdt .


a a

62
Démonstration Rb
La définition de a f (t)dt ne dépend pas de la primitive Φ car d’après la Proposition 3.5.1,
deux primitives d’une même fonction différent d’une constante. Pour démontrer l’inégalité
Z b Z b
f (t)dt ≤ kf (t)kdt


a a

on suppose a ≤ b. Soit Φ la primitive de f telle que φ(a) = 0. On a, pour tout t ∈ [a, b]


Z t
Φ(t) = f (s)ds.
a

Il existe alors une partie au plus dénombrable D ⊂ [a, b] telle que sur [a, b] \ D,

Φ0 (t) = f (t),

d’où kΦ0 (t)k = kf (t)k. Remarquons que la fonction kf (.)k est réglée car la norme est
R t continue.
0
Il existe donc ∆ ⊂ [a, b] au plus dénombrable telle que G (t) = kf (t)k où G(t) = a kg(s)kds.
Pour t ∈ [a, b] \ (D ∪ ∆) on a donc

kΦ0 (t)k ≤ G0 (t).

D’après le Théorème 3.1.1 on obtient

kF (b) − F (a)k ≤ G(b) − G(a),

d’où
Z b Z b
f (t)dt ≤ kf (t)kdt. 


a a

Remarque 3.5.1
a) Soit I = [a, b], f : I −→ E une fonction en escalier à valeurs dans un espace de Banach
E et soient a = t0 < · · · < tn = b telle que f (t) = ci sur ]ti , ti+1 [. On sait que la fonction
Φ : I −→ E définie par Φ(t) = c0 (t − t0 ) si t ∈ [t0 , t1 ] et
i−1
X
Φ(t) = ci (t − ti ) + ck (tk+1 − tk )
k=0

si t ∈ [ti , ti+1 ] est une primitive de f sur [a, b]. On a donc


Z b n−2
X
f (t)dt = Φ(b) − Φ(a) = cn−1 (tn − tn−1 ) + ck (tk+1 − tk )
a k=0

d’où
Z b n−1
X
f (t)dt = ck (tk+1 − tk ).
a k=0

63
b) Il est important d’observer que si f : [a, b] −→ E est une fonction réglée, la fonction
Φ : [a, b] → E définie par Z t
Φ(t) = f (s)ds
a

est une primitive de f sur [a, b].


c) Si f : I −→ E est continue on a, pour toute primitive Φ de f

Φ0 (t) = f (t) pour tout t ∈ I.


Rt
En effet on peut supposer que Φ(t) = t0 f (s)ds pour un certain t0 ∈ I. Il en résulte donc que
Z t+h
kΦ(t + h) − Φ(t) − hf (t)k = (f (s) − f (t))ds

t
Z t+h
≤ kf (s) − f (t)kds .

t

Etant donné  > 0 il existe η > 0 tel que |s − t| ≤ η implique kf (s) − f (t)k ≤ . On a donc, pour
|s − t| ≤ η
Z t+h
kΦ(t + h) − Φ(t) − hf (t)k ≤ ds = |h|,

t
d’où le résultat.

Théorème 3.5.4 Soit I ⊂ R un intervalle et g : I −→ E une fonction à valeurs dans un espace


de Banach E qui est primitive d’une fonction réglée. (Cela signifie que g est continue, qu’il existe
une fonction réglée g 0 telle que la dérivée de g en t soit égale à g 0 (t) pour tout t ∈ I \ D où D ⊂ I
est au plus dénombrable). Alors, pour tout t0 , t ∈ I
Z t
g(t) = g(t0 ) + g 0 (s)ds.
t0

Démonstration
Comme g 0 est réglée, la fonction
Z t
γ(t) = g(t0 ) + g 0 (s)ds
t0

est une primitive de g 0 sur [a, b]. Comme g est aussi une primitive de g 0 et que g(t0 ) = γ(t0 ) on a
g(.) = γ(.) sur I, ce qui achève la démonstration. 
Nous laissons au lecteur le soin d’établir les règles de calcul pour cette intégrale. Nous donnons
cependant le résultat utile suivant qui permet d’établir un lien entre l’intégrale de la limite et la
limite des intégrales.

64
Théorème 3.5.5 Soit I = [a, b] un intervalle compact et soit fn : I −→ F une suite de fonctions
réglées à valeurs dans un espace de Banach F . On suppose que (fn ) converge uniformément vers
f dans I. Alors f est réglée dans I et
Z b Z b
lim fn (t)dt = f (t)dt.
n→∞ a a

Démonstration
La fonction f est réglée. En effet, d’après le Théorème 3.5.1 pour tout n ∈ N, il existe une
fonction ϕn en escalier dans I telle que

kϕn − fn k ≤ 1/n.

La suite (ϕn ) converge donc uniformément vers f dans I, ce qui montre, utilisant de nouveau le
Théorème 3.5.1 que f est réglée dans I. On a alors
Z b Z b Z b
fn (s)ds − f (s)ds ≤ kfn (s) − f (s)kds ≤ (b − a)kfn − f k∞


a a a

d’où le résultat. 

Théorème 3.5.6 Soient F , G des espaces de Banach, soit I = [a, b] un intervalle compact, soit
f : I −→ F une fonction réglée et soit u ∈ L(F, G). Alors u ◦ f est réglée et
Z b  Z b
u f (t)dt) = u(f (t))dt.
a a

Démonstration
Le fait que u ◦ f soit réglée découle de la continuité de u. Supposons que f est en escalier, il
en est alors de même de u ◦ f . On a alors
Z b n−1
X
f (t)dt = ck (tk+1 − tk ),
a k=0
Z b  n−1
X
u f (t)dt = u(ck )(tk+1 − tk )
a k=0
Z b
= u(f (t))dt.
a

Revenons au cas général. Il existe une suite (fn ) de fonctions en escalier qui converge uni-
formément vers f sur I. Comme, pour tout n ∈ N et pour tout t ∈ I, on a

ku(fn (t)) − u(f (t))k ≤ kukkfn (t)) − (f (t)k,

65
la suite de fonctions en escalier (u ◦ fn ) converge uniformément vers u ◦ f sur I. Utilisant le
Théorème 3.5.5, il vient
Z b Z b 
u(f (t))dt = lim u(fn (t))dt
a n→∞ a
Z b 
= lim u (fn (t))dt car fn est en escalier,
n→∞ a
 Z b 
= u lim (fn (t))dt car u est continue,
n→∞ a
Z b 
= u f (t)dt
a

d’après le Théorème 3.5.5, d’où le résultat. 

Exemple 3.5.1
a) Dans le cas où F = Rn , G = R, i ∈ [1, n], u(x1 , . . . , xn ) = xi et f (t) = (f1 (t), . . . , fn (t)),
on a
Z b  Z b
f (t)dt = fi (t)dt, et donc
a i a
Z b Z b Z b 
f (t)dt = f1 (t)dt, . . . , fn (t)dt .
a a a

b) Dans le cas où u : L(E, F ) → F est définie par u(A) = A(h), h étant un élément fixé de
E (vérifiez que u ∈ L(L(E, F ), F )) et si A : I → L(E, F ) est réglée, le Théorème 3.5.6 conduit
à Z b Z b 
A(t)(h)dt = A(t)dt (h).
a a

66
Chapitre 4

Différentielles d’Ordre Supérieur

4.1 Définition des Différentielles d’Ordre Supérieur


Soit f : U −→ F différentiable sur U et a ∈ U . Il est naturel de s’intéresser à la différentiabilité
en a de l’application
Df : U −→ L(E, F ).
Rappellons qu’étant donnés des espaces normés E et F et un entier p ∈ N, on désigne par
Lp (E; F ) l’ensemble des applications de E p dans F qui sont multilinéaires (i.e. linéaires par
rapport à chaque variable) et continues. On définit alors par récurrence la différentielle d’ordre p
d’une application f : U −→ F .
Définition 4.1.1 Soit f : U −→ F et p ≥ 2 un entier. On dit que f est p fois différentiable en
a ∈ U si Dp−1 f (x) ∈ Lp−1 (E; F ) existe dans un voisinage V ⊂ U de a et si l’application
Dp−1 f : V −→ Lp−1 (E; F )
est différentiable en a. Pour tout u = (u1 , · · · , up ) ∈ E p on pose alors
Dp f (a)(u1 , · · · , up ) = (D(Dp−1 f )(a)(u1 ))(u2 , · · · , up ).
On a alors Dp f (a) ∈ Lp (E; F ).
On vérifie que cette définition est bien cohérente : on a D(Dp−1 f )(a) ∈ L(E, Lp−1 (E; F )), donc
D(Dp−1 f )(a)(u1 ) ∈ Lp−1 (E; F ) et (D(Dp−1 f )(a)(u1 ))(u2 , · · · , up ) ∈ F . Il est clair que Dp f (a)
est multilinéaire. Le fait que Dp f (a) soit continue découle des inégalités suivantes
kDp f (a)(u1 , · · · , up )k ≤ kD(Dp−1 f )(a)(u1 )kLp−1 (E;F ) ku2 k · · · kup k
≤ kD(Dp−1 f )(a)kL(E,Lp−1 (E;F ) ku1 kku2 k · · · kup k.
Remarque 4.1.1 On a vu au Théorème 1.5.2 que l’application
Φ : L(E, Lp−1 (E; F )) −→ Lp (E; F )
définie pour g ∈ L(E, Lp−1 (E; F )) et (x1 , · · · , xp ) ∈ E p par
Φ(g)(x1 , · · · , xp ) = g(x1 )(x2 , · · · , xp )

67
est une isométrie linéaire de L(E, Lp−1 (E; F )) dans Lp (E; F ) et l’isométrie réciproque

Ψ : Lp (E; F ) → L(E, Lp−1 (E; F ))

est définie, pour tout f ∈ Lp (E; F ), x ∈ E et (x1 , · · · , xp−1 ) ∈ E p−1 par

Ψ(f )(x)(x1 , · · · , xp−1 ) = f (x, x1 , · · · , xp−1 ).

Avec ces notations, on a, si f est p fois différentiable en a,

Ψ(Dp f (a)) = D(Dp−1 f )(a), (4.1)

et
Φ(D(Dp−1 f )(a)) = Dp f (a). (4.2)
Si de plus f est p fois différentiable dans un voisinage V de a, alors

D(Dp−1 f ) = Ψ ◦ Dp f sur V,

et
Dp f = Φ ◦ D(Dp−1 f ) sur V.

Dans le cas où f est définie sur un intervalle ouvert de R, il est utile de faire le lien entre
différentielle d’ordre p et dérivée d’ordre p.

Définition 4.1.2 Soit f : I −→ E une fonction définie sur un intervalle ouvert I de R et p ∈ N∗ .


On dit que f est p fois dérivable en a ∈ I si f (p−1) existe au voisinage de a et est dérivable en a.
On pose alors f (p) = (f (p−1) )0 .

Proposition 4.1.1 Soit f : I −→ E une fonction définie sur un intervalle ouvert I de R. Alors
f est p fois dérivable en a si et seulement si f est p fois différentiable en a. De plus pour tout
(u1 , · · · , up ) ∈ Rp on a
Dp f (a)(u1 , · · · , up ) = u1 · · · up f (p) (a) (4.3)
et
f (p) (a) = Dp f (a)(1, · · · , 1). (4.4)

Démonstration. Par récurrence sur p. Pour p = 1, c’est le Théorème 2.1.1 du Chapitre 2. Suppo-
sons le résultat à l’ordre p. Les relations (4.3) et (4.4) peuvent s’ecrire

Dp f = α ◦ f (p) et f (p) = e ◦ Dp f,

où α : E −→ Lp (R; E) et e : Lp (R; E) −→ E sont les applications linéaires continues définies


pour tout x ∈ E, t1 , · · · , tp ∈ Rp , A ∈ Lp (R; E) par α(x)(t1 , · · · , tp ) = t1 · · · tp x et e(A) =
A(1, · · · , 1). Le résultat découle alors des Théorèmes 2.1.1 et 2.2.1 du chapitre 2. On obtient que
Dp f est différentiable en a et que

D(Dp f )(a) = α ◦ Df (p) (a),

68
d’où

Dp+1 f (a)(u1 , · · · , up+1 ) = ((D(Dp f )(a))(u1 ))(u2 , · · · , up+1 )

= α(u1 f (p+1) (u2 , · · · , up+1 )

= u1 · · · up+1 f (p+1) (a),

et que f (p) est dérivable en a avec

f (p+1) (a) = e((Dp f )0 (a))

= e(D(Dp f )(a)(1))

= (D(Dp f )(a)(1))(1, · · · , 1)

= Dp+1 f (a)(1, · · · , 1).

Définition 4.1.3 On dit que f est de classe C p sur U si Dp f existe sur U et si l’application
Dp f : U −→ Lp (E; F ) est continue. On dit que f est de classe C ∞ si f est de classe C p pour tout
p ∈ N∗ .

Un exemple simple de fonction de classe C ∞ est fourni par la :

Proposition 4.1.2 Soit f ∈ L2 (E, F ; G) une application bilinéaire continue, alors f est de classe
C ∞ et Dp f = 0 pour tout p > 2.

Démonstration. On sait (voir chapitre 2, exemple 2.1.1, c)) que f est différentiable sur E × F et
que pour tout (x1 , x2 ) ∈ E 2 , (u, v) ∈ E 2

Df (x1 , x2 )(u, v) = f (x1 , v) + f (u, x2 ).

Il en résulte aisément que Df : E × E −→ L(E × E, F ) est linéaire continue (le vérifier). On


en déduit que D(Df )(x1 , x2 ) = Df pour tout (x1 , x2 ) ∈ E × F donc l’application D2 f (.) est
constante ce qui implique bien Dp f = 0 pour p > 2.

Proposition 4.1.3 Soient U ⊂ E, V ⊂ F des ouverts, soient f : U −→ V 2 fois différentiable en


a ∈ U et g : V −→ G et g 2 fois différentiable en b = f (a). Alors g ◦ f est 2 fois différentiable en
a.

69
Démonstration. Définissons Φ : L(F, G) × L(E, F ) −→ L(E, G) par Φ(A, B) = A ◦ B.
L’application Φ est bilinéaire et comme kΦ(A, B)k ≤ kAkkBk, elle est continue. Utilisant le
Théorème 2.2.1 du chapitre 2, on a, pour tout x voisin de a

D(g ◦ f )(x) = Dg(f (x)) ◦ Df (x),

ce que l’on peut écrire


D(g ◦ f ) = Φ ◦ Θ
avec Θ = (Dg ◦ f, Df ). On remarque que Θ est différentiable en a car ses deux composantes le
sont, et que Φ est de classe C ∞ (voir Proposition 4.1.2). On obtient donc bien que D(g ◦ f ) est
différentiable en a donc g ◦ f est deux fois différentiable en a.

Les propositions suivante sont utiles pour le calcul des différentielles d’ordre supérieur.

Proposition 4.1.4 Soit f : U −→ F une application p fois différentiable en a ∈ U . Posons, pour


x dans un voisinage de a et pour tout u2 , · · · , up ∈ E p−1 ,

g(x) = Dp−1 f (x)(u2 , · · · , up ).

Alors g est différentiable en a et, pour tout u1 ∈ E, on a

Dp f (a)(u1 , · · · , up ) = Dg(a)(u1 ).

Démonstration. On a g = e ◦ Dp−1 f où e : Lp−1 (E; F ) −→ F est définie par e(A) =


A(u2 , · · · , up ). L’application e est linéaire. De plus ke(A)k ≤ kAkku2 k · · · kup k donc A est conti-
nue. Il en résulte que g est différentiable en a et que pour tout u1 ∈ E

Dg(a)(u1 ) = e(D(Dp−1 f )(a)(u1 ))


= (D(Dp−1 )f (a)(u1 ))(u2 , · · · , up )
= Dp f (a)(u1 , · · · , up ).

Proposition 4.1.5 a) Si f : U −→ F est p fois différentiable en a ∈ U , on a pour tout u ∈ E,


v ∈ E p−1 ,
Dp f (a)(u, v) = ϕ0 (0),
où ϕ(t) = Dp−1 f (a + tu)(v).
b) Si f est p fois différentiable en a + tu ∈ U avec u ∈ E et t ∈ R, alors

Dp f (a + tu)(u, · · · , u) = ψ (p) (t),

où ψ(t) = f (a + tu).

70
Démonstration. a) On a ϕ = (e ◦ g)(a + tu) avec e(A) = A(v) pour A ∈ Lp−1 (E; F ) est linéaire
et continue et g(x) = Dp−1 f (x) donc g est différentiable an a et

Dg(a)(u) = Dp f (a)(u, ·).

On obtient donc que e ◦ g est différentiable en a, donc ϕ est dérivable en 0 et

ϕ0 (0) = D(e ◦ g)(a)(u) = e(Dg(a)(u)) = Dp f (a)(u, v).

b) Remarquons que ψ est définie dans un intervalle ouvert contenant t. Pour p = 1, ψ est
dérivable en t car f est différentiable en a + tu et t 7−→ a + tu est dérivable sur R, et, d’après la
règle de la différentielle d’une composée, on a

ψ 0 (t) = Df (a + tu)(u).

Supposons le résultat vrai pour p et considérons f supposée p + 1 fois différentiable en a + tu. Il


en résulte que f est p fois différentiable dans un voisinage de a + tu. Par hypothèse de récurrence,
on obtient donc que la fonction ψ est p fois dérivable au voisinage de t et que

ψ (p) (s) = Dp f (a + su)(u, · · · , u),

pour tout s voisin de t. Posant g(x) = Dp f (x)(u, · · · , u), on a donc

ψ (p) (s) = g(a + su),

et g est différentiable en a + tu d’après la Proposition 4.1.4. On obtient alors, utilisant de nouveau


la Proposition 4.1.4, que

ψ (p+1) (t) = Dg(a + su)(u) = Dp+1 f (a + tu)(u, · · · , u).

ce qui donne le résultat au rang p + 1.

4.2 Propriétés de Symétrie des Différentielles d’Ordre Supé-


rieur
Le résultat suivant (Théorème de S CHWARZ) est fondamental.

Théorème 4.2.1 Soit f : U −→ F une application deux fois différentiable en a ∈ U . Alors pour
tout u, v ∈ E
D2 f (a)(u, v) = D2 f (a)(v, u).

Démonstration. Soit ε > 0, utilisant la définition de la différentiabilité de Df en a, il existe δ > 0


tel que
kDf (a + w) − Df (a) − D(Df )(a)(w)kL(E,F ) ≤ εkwk,

71
pour tout w tel que kwk ≤ δ. Posons, pour tout kuk ≤ δ/2 et kvk ≤ δ/2,

Gu (v) = f (a + u + v) − f (a + v) − f (a + u) + f (a) − (D(Df )(a)(u))(v).

On a DGu (v) = Df (a + u + v) − Df (a + v) − D(Df )(a)(u) donc

DGu (v) = Df (a + u + v) − Df (a) − D(Df )(a)(u + v) − (Df (a + v) − Df (a) − D(Df )(a)(v)).

On a donc
kDGu (v)kL(E,F ) ≤ ε(kuk + kvk) + εkvk ≤ 2ε(kuk + kvk).
Utilisant le corollaire 3.2.1 avec C = B̄(0, kvk), il en résulte que, pour tout kuk ≤ δ/2 et kvk ≤
δ/2,

kGu (v)k = kGu (v) − Gu (0)k ≤ kvk sup kDGu (w)kL(E,F ) ≤


kwk≤kvk

2kvkε(kuk + kvk) ≤ 2ε(kuk + kvk)2 .

On a alors

f (a + u + v) − f (a + v) − f (a + u) + f (a) − (D(Df )(a)(u))(v) = o(kuk + kvk)2

Soient alors u, v ∈ E, pour tout t assez petit, on a donc

f (a + tu + tv) − f (a + tv) − f (a + tu) + f (a) − t2 (D(Df )(a)(u))(v) = o(t2 ),

d’où
f (a + tu + tv) − f (a + tv) − f (a + tu) + f (a)
(D(Df )(a)(u))(v) = lim .
t→0 t2
Comme le membre de droite ne change pas quand on permute u et v, il en est de même du membre
de gauche donc (D(Df )(a)(u))(v) = (D(Df )(a)(v))(u), soit D2 f (a)(u, v) = D2 f (a)(v, u).

Les propriétés de symétrie de la différentielle seconde s’étendent aux différentiellles d’ordre p.


Théorème 4.2.2 Soit f : U −→ F une application p fois différentiable en a ∈ U . Alors, pour
tout (u1 , · · · , up ) ∈ E p et pour toute permutation σ de [1, · · · , p], on a

Dp f (a)(uσ(1) , · · · , uσ(p) ) = Dp f (a)(u1 , · · · , up ).

Démonstration. Il suffit de démontrer le résultat pour une transposition σi,j



 k si k 6∈ {i, j}
σi,j (k) = i si k = j,
j si k = i

car toute permutation de [1, p] est produit d’un nombre fini de telles transpositions. Procédons par
récurrence sur p. Pour p = 2 le résultat est démontré (Théorème 4.2.1). Supposons alors le résultat
vrai pour tout 2 ≤ k ≤ p − 1 avec p ≥ 3.

72
Si {i, j} = {1, 2}. Soient (u3 , · · · , up ) ∈ E p−2 et soit g(x) = Dp−2 f (x)(u3 , · · · , up ). L’ap-
plication g définie au voisinage de a est 2 fois différentiable au voisinage de a grâce à la Pro-
position 4.1.3 car g = e ◦ Dp−2 f avec e : Lp−2 (E; F ) −→ F linéaire continue définie par
e(A) = A(u3 , · · · , up ). D’après la Proposition 4.1.4, on a pour tout u2 ∈ E,

Dg(x)(u2 ) = Dp−1 f (x)(u2 , · · · , up ),

et, appliquant de nouveau la Proposition 4.1.4,

D2 g(a)(u2 , u1 ) = Dp f (a)(u1 , u2 , · · · , up ).

D’après le Theorème 4.2.1, on obtient donc que D2 g(a)(u2 , u1 ) = D2 g(a)(u1 , u2 ), soit

Dp f (a)(u1 , u2 , · · · , up ) = Dp f (a)(u2 , u1 , · · · , up ). (4.5)

Si i, j ∈ {3, · · · , n}, on utilise de nouveau l’application

g(x) = Dp−2 f (x)(u3 , · · · , up ).

Par hypothèse de récurrence, on a

g(x) = Dp−2 f (x)(uσ(3) , · · · , uσ(p) ),

où σ = σi,j . On obtient bien alors

Dp f (a)(u1 , u2 , u3 , · · · , up ) = Dp f (a)(uσ(1) , uσ(2) , uσ(3) , · · · , uσ(p) ).

Si i = 1, j ∈ {3, · · · , n}, on pose g(x) = Dp−1 f (x)(u2 , · · · , uj , · · · , up ) et on a g(x) =


p−1
D f (x)(uj , u2 , · · · , up ) par hypothèse de récurrence. On calcule alors Dg(a)(u1 ) à l’aide des
deux expressions de g et on obtient que l’on peut échanger j et 2. Ensuite on échange j et 1 comme
dans (4.5) puis 1 et 2. Enfin si i = 2, j ∈ {3, · · · , n}, on peut échanger 1 et 2 comme dans (4.5) et
on est ramené au cas précédent.

La proposition suivante est importante. Si sa conclusion coule de source, il n’en est pas de même
de sa démonstration.

Proposition 4.2.1 Soient p, q ∈ N∗ des entiers et soit f : U −→ F une application q + p fois


différentiable en a ∈ U . Alors Dp f est q fois différentiable en a, et pour tout (u1 , · · · , uq ) ∈ E q et
(v1 , · · · , vp ) ∈ E p , on a

(Dq (Dp f )(a)(u1 , · · · , uq ))(v1 , · · · , vp ) = Dq+p f (a)(u1 , · · · , uq , v1 , · · · , vp ).

Démonstration. Par récurrence sur q. Pour q = 1, c’est la définition de Dp+1 f . Supposons la


propriété vraie à l’ordre q et considérons f supposée q + 1 + p fois différentiable en a. Comme f
est q + p fois différentiable au voisinage de a, l’ hypothèse de récurrence nous dit que

(Dq (Dp f )(x)(u1 , · · · , uq ))(v1 , · · · , vp ) = Dq+p f (x)(u1 , · · · , uq , v1 , · · · , vp ),

73
pour tout x voisin de a. Cela s’écrit

Dq (Dp f ) = Ψ ◦ Dq+p f,

avec Ψ : Lp+q (E; F ) −→ Lq (E; Lp (E; F )) linéaire continue (le vérifier) définie par

(Ψ(A)(u1 , · · · , uq ))(v1 , · · · , vp ) = A(u1 , · · · , uq , v1 , · · · , vp )

pour tout A ∈ Lp+q (E; F ), (u1 , · · · , uq ) ∈ E q et (v1 , · · · , vp ) ∈ E p . Comme Ψ et Dq+p f sont


différentiables en a, on obtient que Dq (Dp f ) est différentiable en a donc Dp f est q + 1 fois
différentiable en a.
Posant alors g(x) = Dq+p f (x)(u1 , · · · , uq , v1 , · · · , vp ), on a, utilisant la Proposition 4.1.4 et la
symétrie de Dq+p+1 f (a)

Dg(a)(uq+1 ) = Dq+p+1 f (a)(u1 , · · · , uq , uq+1 , v1 , · · · , vp ), (4.6)

pour tout uq+1 ∈ E. Par ailleurs, on a g = e ◦ Φ avec e : Lp (E; F ) −→ F linéaire continue définie
par e(A) = A(v1 , · · · , vp ) et Φ : U −→ Lp (E; F ) définie par Φ(x) = (Dq (Dp f )(x))(u1 , · · · , uq ).
On a alors, appliquant la Proposition 4.1.4 à Dp f , et utilisant la symétrie des différentielles d’ordre
supérieur,
DΦ(a)(uq+1 ) = Dq+1 (Dp f )(a)(u1 , · · · , uq , uq+1 )
et
Dg(a)(uq+1 ) = e(DΦ(a)(uq+1 )) = (Dq+1 (Dp f )(a)(u1 , · · · , uq , uq+1 ))(v1 , · · · , vp ),
ce qui joint à (4.6) montre la propriété au rang q + 1.

Nous aurons besoin du résultat suivant.

Proposition 4.2.2 Soit f : U −→ F1 × · · · × Fm avec f = (f1 , · · · , fm ).


a) On suppose que f1 , · · · , fm sont p fois différentiables en a ∈ U . Alors f est p fois différen-
tiable en a, et on a, pour tout (u1 , · · · , up ) ∈ E p ,

Dp f (a)(u1 , · · · , up ) = (Dp f1 (a)(u1 , · · · , up ), · · · , Dp fm (a)(u1 , · · · , up )).

b) Si f1 , · · · , fm sont de classe C p sur U , alors f est de classe C p sur U .

Démonstration. a) par récurrence sur p. Pour p = 1, le résultat découle du Théorème 2.3.1.


Supposons la propriété vraie à l’ordre p. On a Dp f = (Dp f1 , · · · , Dp fm ) au voisinage de a, et
Dp f1 , · · · , Dp fm sont différentiables en a. Appliquant de nouveau le Théorème 2.3.1 on obtient
que f est p + 1 fois différentiable en a avec Dp+1 f (a) = (Dp+1 f1 (a), · · · , Dp+1 fm (a))
b) Démonstration analogue.

74
Théorème 4.2.3 Soit f : U −→ V et g : V −→ G deux applications telles que f (U ) ⊂ V où U
et V sont des ouverts d’espaces normés E, F et G est un espace normé.
a) Si f est p fois différentiable en a ∈ U et si g est p fois différentiable en b = f (a) ∈ V , alors
g ◦ f est p fois différentiable en a.
b) Si f est de classe C p sur U et si g est de classe C p sur V , alors g ◦ f est de classe C p sur U .

Démonstration. a) Procédons par récurrence sur p. Pour p = 1 le résultat est vrai. Supposons le
résultat vrai à l’ordre p − 1. On a, dans un voisinage W de a

D(g ◦ f )(x) = Dg(f (x) ◦ Df (x) = Φ(A(x), B(x))

où A : U −→ L(F, G) et B : U −→ L(E, F ) sont définis par A(x) = (Dg ◦ f )(x), B(x) =
Df (x) et
Φ : L(F, G) × L(E, F ) −→ L(E, G)
est définie par Φ(A, B) = A ◦ B. Or Dg et f sont p − 1 fois différentiables en a (utiliser la
Proposition 4.2.1), donc il en est de même de A = Dg ◦ f , de B = Df (utiliser les Pro-
priétés 4.2.1 et 4.2.2) et de (A, B) (Proposition 4.2.2). Par ailleurs Φ est bilinéaire et continue
car kΦ(A, B)k ≤ kAkkBk, elle est donc p − 1 fois différentiable d’après la Proposition 4.1.2.
L’hypothèse de récurrence nous permet de conclure que D(g ◦ f ) = Φ ◦ (A, B) est p − 1 fois
différentiable en a donc g ◦ f est bien p fois différentiable en a (utiliser de nouveau les Propriétés
4.2.1 et 4.2.2).
b) Même méthode que dans a).

Théorème 4.2.4 Soient E et F des espaces de BANACH, alors l’application

u 7−→ I(u) = u−1

de Isom(E, F ) dans Isom(F, E) est de classe C ∞ .

Démonstration. On sait que Isom(E, F ) est ouvert dans L(E, F ), que I est de classe C 1 (chapitre
2) et que pour tout h ∈ L(E, F ), on a DL(u)h = −u−1 ◦ h ◦ u−1 . Pour tout (v, w) ∈ L(F, E) ×
L(F, E), et pour tout h ∈ L(E, F ), posons

ψ(v, w)(h) = v ◦ h ◦ w.

L’application Ψ(v, w) est linéaire de L(E, F ) dans L(F, E), de plus

kψ(v, w)(h)k ≤ kvkkhkkwk. (4.7)

On a donc Ψ(v, w) ∈ L(L(E, F ) × L(F, E)). L’application Ψ est alors bilinéaire de L(F, E) ×
L(F, E) dans L(L(E, F ) × L(F, E)), elle est de plus continue car

kψ(v, w)kL(L(E,F )×L(F,E)) ≤ kvkkwk

75
d’après (4.7). Par ailleurs
DI(u) = Ψ(I(u), I(u)).
Supposons que I soit de classe C p , il en est alors de même de l’application (I(.), I(.)) ainsi que
de Ψ qui est bilinéaire continue. Utilisant le Théorème 4.2.3, b) on obtient que DI = Ψ ◦ (I, I)
est de classe C p donc I est de classe C p+1 . Par récurrence, on a donc bien I de classe C ∞ .
Comme application de la différentielle seconde, nous allons maintenant caractériser la conve-
xité des fonctions deux fois différentiables.

Définition 4.2.1 On dit qu’une fonction f : U −→ R définie sur un ouvert convexe U d’un espace
normé E est convexe si, pour tout x, y ∈ x, y ∈ U et pour tout t ∈ [0, 1], on a

f (ty + (1 − t)x) ≤ tf (y) + (1 − t)f (x).

Théorème 4.2.5 Soit f : U −→ R définie sur un ouvert convexe U d’un espace normé E. On
suppose que f est deux fois différentiable sur U . Alors f est convexe si et seulement si

D2 f (x)(u, u) ≥ 0 pour tout x ∈ X, u ∈ E. (4.8)

Démonstration. Supposons f convexe, et soient x, y ∈ x, y ∈ U et t ∈]0, 1]. On a

f (x + t(y − x)) ≤ tf (y) + (1 − t)f (x),

f (x + t(y − x)) − f (x)


donc ≤ f (y) − f (x), ce qui donne, faisant tendre t vers 0
t
Df (x)(y − x) ≤ f (y) − f (x),

ainsi donc
Df (y)(x − y) ≤ f (x) − f (y),
d’où par addition
(Df (y) − Df (x))(y − x) ≥ 0 pour tout x, y ∈ U.
Introduisons alors, pour x ∈ U et u ∈ E, la fonction ϕ(t) = Df (x + tu)(u) définie pour tout t
voisin de 0. Pour 0 ≤ t, on a

(Df (x + tu) − Df (x))(tu) ≥ 0

donc ϕ(t) ≥ ϕ(0). Il en résulte que ϕd (0) ≥ 0 donc D2 f (x)(u, u) ≥ 0. Réciproquement, suppo-
sons (4.8). Pour tout x, y ∈ U et t ∈ [0, 1], posons ψ(t) = f (x + t(y − x)) − Df (x)(x + t(y − x))
de telle sorte que ψ 0 (t) = (Df (x + t(y − x)) − Df (x))(y − x) et

ψ 00 (t) = D2 f (x + t(y − x))(y − x, y − x) ≥ 0.

On a donc ψ 0 (t) ≥ ψ 0 (0) = 0, donc ψ(1) ≥ ψ(0), d’où

f (y) − f (x) ≥ Df (x)(y − x) pour tout x, y ∈ U.

76
Posant xt = x + t(y − x), t ∈ [0, 1], il vient

f (y) ≥ f (xt ) + (1 − t)Df (xt )(y − x),

et
f (x) ≥ f (xt ) + tDf (xt )(y − x).
Multipliant la première inégalité par t, la seconde par 1 − t et ajoutant, on obtient

tf (y) + (1 − t)f (x) ≥ f (xt ),

donc f est bien convexe.

Dans le cas particulier où E = E1 × · · · × En , on rappelle que la différentiabilité de f en a ∈ U


implique l’existence des différentielles partielles Dj f (a) ∈ L(Ej , F ). Si l’application Dj f :
U −→ L(Ej , F ) est différentiable en a ∈ U on a pour tout 1 ≤ i ≤ n

Di Dj f (a) ∈ L(Ei , L(Ej , F )).

Pour tout ui ∈ Ei et vj ∈ Ej on pose alors


 
Di Dj f (a)(ui , vj ) = Di Dj f (a)(ui ) (vj ).

On vérifie immédiatement que Di Dj f (a) ∈ L2 (Ei , Ej ; F ). On a alors

Proposition 4.2.3 Soit f : U ⊂ E1 × · · · × En −→ F une application deux fois différentiable


en a ∈ U . Alors les applications Di f , 1 ≤ i ≤ n sont différentiables en a et pour 1 ≤ i ≤ n,
1 ≤ j ≤ n, et pour tout u, v ∈ E1 × · · · × En , on a
n X
X n
2
D f (a)(u, v) = Di Dj f (a)(ui , vj ).
i=1 j=1

De plus, pour tout (ū, v̄) ∈ Ei × Ej

Dj Di f (a)(v̄, ū) = Di Dj f (a)(ū, v̄).

Démonstration. Pour tout x voisin de a et pour tout h ∈ Ej , on a

Dj f (x)(h) = Df (x)(0, · · · , h, · · · , 0) = (Df (x) ◦ ϕj )(h)

où ϕj est l’injection canonique de Ej dans E1 × · · · × En . On a donc

Dj f = Φj ◦ Df

où Φj ∈ L(L(E1 × · · · × En , F ), L(Ej , F )) est définie par

Φj (A) = A ◦ ϕj .

77
Comme Df et Φj sont différentiables en a il en est de même de Dj f . Il en résulte que les
différentielles partielles
Di Dj f (a) ∈ L(Ei , L(Ej , F ))
existent pour tout i, j ∈ [1, n]. On remarque alors que
n
X
Df = Tj ◦ Dj f
j=1

où
Tj ∈ L(L(Ej , F )), L(E1 × · · · × En , F ))
est définie par
Tj (A) = A ◦ πj
avec πj (x1 , · · · , xn ) = xj . On a alors pour 1 ≤ i ≤ n, 1 ≤ j ≤ n, et u, v ∈ E1 × · · · × En
n
X
D(Df )(a) = Tj ◦ D(Dj f )(a)
j=1

donc
n
X  
D(Df )(a)(u) = Tj D(Dj f )(a)u)
j=1
Xn n
X 
= Tj Di (Dj f )(a)ui
j=1 i=1
n
XX n  
= Di Dj f (a)ui ◦ πj
i=1 j=1

d’où n X
n
X
D2 f (a)(u, v) = Di Dj f (a)(ui , vj ).
i=1 j=1

Posons alors, pour ū ∈ Ek , v̄ ∈ El , u = (0, · · · , ū, · · · , 0), v = (0, · · · , v̄, · · · , 0). On a alors

D2 f (a)(u, v) = Dk Dl f (ū, v̄)

et
D2 f (a)(v, u) = Dl Dk f (v̄, ū).
Comme D2 f (a)(u, v) = D2 f (a)(v, u), on a bien Dk Dl f (ū, v̄) = Dl Dk f (v̄, ū).

Comme cas particulier, on obtient que, pour tout 1 ≤ i ≤ n, Di Di f (a) ∈ L2 (Ei ; F ) est
symétrique.

78
Théorème 4.2.6 Soit f : U ⊂ E1 × · · · × En −→ F une application telle que les différentielles
partielles Di Dj f existent et sont continues en un point a ∈ U . Alors f est deux fois différentiable
en a et, pour tout u, v ∈ E1 × · · · × En
n X
X n
2
D f (a)(u, v) = Dj Di f (a)(uj , vi ).
i=1 j=1
Pn
Démonstration. On a Df = i=1 Ti ◦ Di f (voir la démonstration du Corollaire 4.2.3) et Di f
est différentiable en tout x ∈ U car les différentielles partielles Dj Di f existent et sont continues
en a. Il résulte donc du Théorème 2.4.1 que Df est différentiable en a et donc que f est deux fois
différentiable en a. La formule donnant D2 f (a) a été démontrée dans le Corollaire 4.2.3.

Remarque 4.2.1 Examinons le cas particulier E1 = E2 = · · · = En = R, et F = R. Supposons


que f est deux fois différentiable en a. On a
∂f
(x) = Df (x)(ei ) = ψi (Df (x)),
∂xi
∂f
où ψi : L(Rn , R) −→ R est l’application linéaire définie par ψi (A) = A(ei ). On a donc =
∂xi
∂f
ψi ◦ Df , ce qui montre que est différentiable en a, donc les dérivées partielles secondes
∂xi
∂2f
(a) existent pour tout i, j ∈ [1, n]. Posant alors
∂xj ∂xi
n
X ∂f
g(x) = Df (x)(u) = (a)ui .
i=1
∂xi

On a alors
n X n
X ∂2f
D2 f (a)(u, v) = Dg(a)(v) = (a)ui vj = hHf (a), ui,
i=1 j=1
∂x j ∂x i

où Hf (a) est alors la matrice Hessienne de f en a définie par

∂2f
(Hf (a))ij = (a).
∂xj ∂xi
Remarquons que
∂2f ∂2f
(a) = D2 f (a)(ei , ej ) = D2 f (a)(ej , ei ) = (a).
∂xj ∂xi ∂xi ∂xj
Remarquons aussi que
∂2f
Di Dj f (a)(s, t) = st (a),
∂xj ∂xi

79
donc ∂2f ∂2f
kDi Dj f (b) − Di Dj f (a)kL2 (R;R) = (b) − (a) .

∂xj ∂xi ∂xj ∂xi
∂2f
Il en résulte que si les dérivées partielles secondes existent et sont continues en a alors les
∂xj ∂xi
différentielles partielles secondes existent au voisinage de a et sont continues en a. Le Théorème
4.2.6 nous permet alors d’affirmer que f est deux fois différentiables en a et que l’on a alors en
particulier
∂2f ∂2f
(a) = (a).
∂xj ∂xi ∂xi ∂xj
Dans le cas où l’application f est définie sur un ouvert U de E1 × · · · × En , pour toute suite
finie {i1 , · · · , ip } ⊂ [1, n], on introduit par récurrence les différentielles partielles d’ordre p
Di1 Di2 · · · Dip f (a) ∈ Lp (Ei1 × · · · × Eip , F ).
On montre alors facilement par récurrence que si f est p fois différentiable en a on a pour tout
(u1 , · · · up ) ∈ (E1 × · · · × En )p
X
Dp f (a)(u1 , · · · , up ) = Di1 Di2 · · · Dip f (a)(ui1 , · · · , uip ).
{i1 ,···,ip }⊂[1,n]

4.3 Formules de Taylor


Commençons par démontrer le résultat suivant
Proposition 4.3.1 Soient I un intervalle ouvert, E, F , G des espaces normés, f : I −→ E,
g : I −→ F deux fonctions p + 1 fois dérivables et soit [., .] : E × F −→ G une application
bilinéaire continue. Alors
p
X 0
(p+1) p+1 (p+1)
[f, g ] − (−1) [f , g] = (−1)i [f (i) , g (p−i) ] .
i=0

Démonstration. Par récurrence sur p. Pour p = 0 la formule se réduit à


[f, g 0 ] + [f 0 , g] = ([f, g])0
qui est une conséquence de la formule donnant la différentielle d’une application bilinéaire et la
dérivée d’une composée. Supposons le résultat vrai à l’ordre p − 1. On a
p
X p−1
0  X 0
i (i) (p−i) i (i) (p−1−i) p p
(−1) [f , g ] = (−1) [f , h ] + (−1) [f , g]
i=0 i=0

avec h = g 0 . Appliquant l’hypothèse de récurrence, il vient


p
X 0
(−1)i [f (i) , g (p−i) ] = [f, h(p) ] − (−1)p [f (p) , h]+
i=0

80
(−1)p [f (p+1) , g] + (−1)p [f (p) , h]

d’où p
X 0
(−1)i [f i , g p−i ] = [f, g (p+1) ] − (−1)p+1 [f (p+1) , g]
i=0

On en déduit la formule de Taylor suivante

Théorème 4.3.1
a) F ORMULE DE TAYLOR AVEC RESTE INT ÉGRAL. Soient I un intervalle ouvert de R, f :
I −→ E une fonction à valeurs dans un espace de Banach E qui est p + 1 fois continuement
dérivable sur I. Alors, pour tout a, t ∈ I
p t
(t − a)i (t − s)p (p+1)
X Z
(i)
f (t) = f (a) + f (s)ds.
i=0
i! a p!

b) F ORMULE DE TAYLOR -L AGRANGE. Si l’on suppose seulement que f est p+1 fois dérivable
sur I et que
sup kf (p+1) (s)k ≤ M < +∞
s∈I

alors p
X |t − a|p+1
(t − a)i (i)
f (t) − f (a) ≤ M.

i=0
i! (p + 1)!

(t − s)p
Démonstration. a) On applique la Proposition 4.3.1 avec g(s) = , F = R, G = E et
p!
[x, t] = tx. On remarque que

(t − s)p−i
g (i) (s) = (−1)i pour 0 ≤ i ≤ p,
(p − i)!

g (p+1) (s) ≡ 0,
de telle sorte que

(t − s)i (i) (t − s)i (i)


(−1)i [f (i) , g (p−i) ] = (−1)i (−1)p−i f (s) = (−1)p f (s).
i! i!
Il vient alors, appliquant la Proposition 4.3.1,
p
p+1 (t − s)p (p+1) X (t − s)i (i) 0
−(−1) f (s) = (−1)p f (s)
p! i=0
i!

81
donc p
(t − s)p (p+1) X (t − s)i (i) 0
f (s) = f (s) . (4.9)
p! i=0
i!
Intégrant entre a et t, on obtient
p
Z t
(t − s)p (p+1) X (t − a) i
f (s) = f (t) − f (i) (a)
a p! i=0
i!

d’où le résultat.
Pp (t − s) i (i)
b) Posons ψ(s) = i=0 f (s). D’après (4.9) on a
i!

0 (t − s)p (p+1)
ψ (s) = f (s).
p!
Supposons t ≥ a, le cas t ≤ a se traı̂tant de manière analogue. Pour tout s ∈ I, on a

0 |t − s|p
kψ (s)k ≤ M .
p!

Il en résulte que, pour s ∈ [a, t]

(t − s)p
kψ 0 (s)k ≤ M = g 0 (s)
p!

(t − s)p+1
avec g(s) = −M . On applique alors le Théorème des accroissements finis et on obtient
(p + 1)!

kψ(t) − ψ(a)k ≤ g(t) − g(a),

Pp (t − a) i (i)
d’où le résultat car ψ(t) = f (t) et ψ(a) = i=0 f (a).
i!

Dans le cas d’applications entre espaces normés, on a les formules de Taylor suivantes

Théorème 4.3.2
a) F ORMULE DE TAYLOR AVEC RESTE INT ÉGRAL. Soit f : U −→ F une application p + 1
fois continuement différentiable définie sur un ouvert U d’un espace normé E à valeurs dans un
espace de Banach F . Alors pour tout x ∈ U et h ∈ E tels que le segment [x, x + h] soit contenu
dans U , on a
p Z 1
X 1 i i (1 − s)p p+1
f (x + h) = D f (x)h + D f (x + sh)hp+1 ds
i=0
i! 0 p!

où hi = (h, · · · , h) ∈ E i .

82
b) F ORMULE DE TAYLOR -L AGRANGE. Soit f : U −→ F une application p + 1 fois différen-
tiable définie sur un ouvert U d’un espace normé E à valeurs dans un espace de Banach F . On
suppose qu’il existe M ≥ 0 telle que kDp+1 f (z)k ≤ M pour tout z ∈ U . Alors pour tout x ∈ U
et h ∈ E tels que le segment [x, x + h] soit contenu dans U , on a
p
X 1 i khkp+1
f (x + h) − D f (x)hi ≤ M .

i=0
i! (p + 1)!

Démonstration. a) Remarquons qu’il existe η > 0 tel que x + sh ∈ U pour tout s ∈] − η, 1 + η[.
Posons alors g(s) = f (x + sh), g est alors p + 1 fois continuement dérivable sur ] − η, 1 + η[
et, utilisant la Proposition 4.1.5, b), on a g i (s) = Di f (x + sh)hi . On applique alors le Théorème
4.3.1 avec a = 0 et t = 1 et on a le résultat.
b) Posons g(t) = f (x + th), on a g (i) (t) = Di f (x + th)hi pour 1 ≤ i ≤ p + 1 (Proposition
4.1.5, b)), d’où supt∈[0,1] kg (p+1) (t)k ≤ M khkp+1 . On applique alors le Théorème 4.3.1, b) et on
obtient que
p
X M khkp+1
g (i) (0)
g(1) − ≤

i=0
i! (p + 1)!
soit p
X 1 i M khkp+1
i
f (x + h) − D f (x)h ≤ ,

i=0
i! (p + 1)!
d’où le résultat.

Il est également possible d’obtenir une formule de Taylor sous des hypothèses plus faibles.

Théorème 4.3.3 F ORMULE DE TAYLOR -YOUNG. Soit f : U −→ F une application définie sur
un ouvert U d’un espace normé E à valeurs dans un espace normé F que l’on suppose p fois
différentiable en a ∈ U . Alors
p
X 1 i
f (a + h) = D f (a)hi + khkp ε(h)
i=0
i!

avec limh→0 ε(h) = 0.

Démonstration. On procède par récurrence. Le cas p = 1 est exactement la définition de la


différentiabilité. Supposons la propriété vraie à l’ordre p − 1. Posons alors
p
X 1 i
g(z) = f (a + z) − D f (a)z i .
i=0
i!

Posons
1 i 1
ϕi (z) = D f (a)z i = (Di f (a) ◦ L)(z)
i! i!

83
avec L(z) = (z, · · · , z) ∈ E i . Utilisant le calcul de la différentielle d’une application multilinéaire
continue (voir chapitre 2, exemple 2.1.4, c)), on a pour tout u ∈ E,
i
X 1 i 1
Dϕi (z)(u) = (D f (a)(z, · · · , u, · · · , z) = Di f (a)(z i−1 , u)
k=1
i! (i − 1)!

car Di f (a) est symétrique. On a donc, utilisant la Proposition 4.2.1

(Di−1 (Df )(a)(z i−1 ))(u) = Di f (a)(z i−1 , u)

donc
Dϕi (z) = Di−1 (Df )(a)(z i−1 ).
Il en résulte que
p−1
X 1 j
Dg(z) = Df (a + z) − D (Df )(a)(z j ).
j=0
j!

Par hypothèse de récurrence appliquée à Df , pour tout ε > 0, il existe η > 0 tel que kzk ≤ η
implique
kDg(z)k ≤ εkzkp−1 .
Soit khk ≤ η et soit θ(t) = g(th) pour tout t ∈ [0, 1]. On a θ0 (t) = Dg(th)h donc kθ0 (t)k ≤
εkhkp−1 khk = εkhkp . D’après le Théorème des accroissements finis, on a donc

kg(h)k = kg(h) − g(0)k = kθ(1) − θ(0)k ≤ εkhkp

d’où le résultat.

Remarque 4.3.1 Dans le cas d’une fonction f : U −→ R définie sur un ouvert U de Rn , et deux
fois différentiable en a, on a
n
1 X ∂f
f (a) + Df (a)u + D2 f (a)(u, u) = f (a) + (a)ui +
2 i=1
∂x i
n
1  X ∂2f 2
X ∂2f 
(a)(ui ) + 2 (a)ui uj .
2 i=1 ∂x2i 1≤i<j≤n
∂xi ∂xj

Si f est trois fois différentiable en a, on peut calculer D3 f (a)(u, u, u) par exemple de la manière
suivante. On pose
n X n
X ∂2f
g(x) = D2 f (x)(u, u) = (x)ui uj ,
i=1 j=1
∂x i ∂x j

et on a D3 f (a)(u, u, u) = Dg(a)u, soit


n X
n X
n
X ∂3f
D3 f (a)(u, u, u) = (a)ui uj uk ,
i=1 j=1 k=1
∂xi ∂xj ∂xk

84
que l’on peut écrire
n
3
X ∂3f X ∂3f
D f (a)(u, u, u) = 3
(a)(ui )3 + 3 2 2
(a)(ui )2 uj +
i=1
∂xi 1≤i<j≤n
∂x i ∂x j
X ∂3f
6 (a)ui uj uk .
1≤i<j<k≤n
∂x i ∂xj ∂xk

4.4 Conditions d’Optimalité


Définition 4.4.1 Soit f : U −→ R une fonction définie sur un ouvert U d’un espace topologique
E.
On dit que f admet un minimum (resp. maximum) local en a ∈ U s’il existe un voisinage V
de a tel que
f (x) ≥ f (a) (resp. f (x) ≤ f (a)) pour tout x ∈ V.
Si
f (x) > f (a) (resp. f (x) < f (a)) pour tout x ∈ V \ {a}
on dit que l’extremum est strict. On dit que l’extremum est global si l’inégalité a lieu pour tout
x ∈ U.

Théorème 4.4.1
a) Si f admet un extremum local en a ∈ U et si f est différentiable en a, alors

Df (a) = 0.

Si de plus f est deux fois différentiable en a alors pour tout h ∈ E

D2 f (a)(h, h)

garde un signe constant (≥ 0 pour un minimum, ≤ 0 pour un maximum).


b) On suppose que f est deux fois différentiable en a ∈ U , qu’il existe α > 0 tel que pour tout
h∈E
D2 f (a)(h, h) ≥ αkhk2
et que
Df (a) = 0.
Alors f admet un minimum local strict en a.

Démonstration. a) On suppose que f admet un minimum local en a. Soit h ∈ E. Pour tout


t ∈ R+ assez petit on a donc
f (a + th) − f (a) ≥ 0.
Divisant par t et faisant tendre t vers 0 il vient Df (a)(h) ≥ 0. Changeant h en −h, on en déduit
Df (a)(h) ≤ 0 soit
Df (a)(h) = 0.

85
Si f est deux fois différentiable en a, on a
t2 2
D f (a)(h, h) + t2 ε(t) = f (a + th) − f (a) ≥ 0.
2
Divisant par t2 et faisant tendre t vers 0, il vient
D2 f (a)(h, h) ≥ 0.

b) D’après la formule de Taylor (Théorème 4.3.3), on a


1 1
f (a + h) − f (a) = D2 f (a)(h, h) + khk2 ε(h) ≥ khk2 (α + ε(h))
2 2
avec limh→0 ε(h) = 0. Il existe alors η > 0 tel que |ε(h)| ≤ α/4 pour tout khk ≤ η. On obtient
alors pour tout khk ≤ η
f (a + h) − f (a) ≥ khk2 α/4,
ce qui démontre bien le résultat annoncé.

Dans le cas où f : U −→ R est une fonction convexe définie sur un ouvert convexe, on a une
condition nécessaire et suffisante de minimalité.
Théorème 4.4.2 f : U −→ R est une fonction convexe définie sur un ouvert convexe d’un espace
normé. Alors les propriétés suivantes sont équivalentes pour a ∈ U tel que f soit différentiable en
a:
a) f (a) = minx∈U f (x)
b) Df (a) = 0.
Démonstration. Il suffit de démontrer que b) implique a). Pour tout x ∈ U et t ∈]0, 1], on a
f (a + t(x − a)) ≤ tf (x) + (1 − t)f (a), donc
f (a + t(x − a)) − f (a)
≤ f (x) − f (a).
t
faisant tendre t vers 0, il vient
0 = Df (a)(x − a) ≤ f (x) − f (a),
pour tout x ∈ U , d’où le résultat.

Remarque 4.4.1 Il découle du théorème précédent que si fonction convexe f : U −→ R admet


un minimum local en a ∈ U , alors ce minimum est global.

On peut aussi obtenir des conditions d’optimalité pour des problèmes avec contraintes c’est à
dire pour un extremum local de f non plus sur U mais sur U ∩ M où M est une partie fermée de
E. On donnera un résultat général de ce type dans le chapitre suivant. Dans le cas des fonctions
convexes, on peut dès maintenant donner un résultat.

86
Théorème 4.4.3 Soit U ⊂ X un ouvert d’un espace de Hilbert et soient f , g : U −→ R deux
fonctions convexes. On suppose que
a) f est différentiable sur U et il existe y ∈ U tel que f (y) < 0.
b) x̄ ∈ S := {x ∈ U : f (x) ≤ 0} est tel que g(x̄) = inf x∈S g(x) et f est différentiable en x̄.
Alors il existe λ ≤ 0 tel que 
 ∇g(x̄) = λ∇f (x̄)
(4.10)
λf (x̄) = 0.

Réciproquement, si x̄ ∈ S vérifie (4.10), alors g(x̄) = minx∈S g(x).

Démonstration. On remarque que S est convexe, que son intérieur est non vide et que

{x ∈ U : f (x) < 0} ⊂ int S.

Si f (x̄) < 0, alors g a un minimum local en x̄, donc ∇g(x̄) = 0 = 0∇f (x̄) avec 0f (x̄) = 0.
Supposons alors f (x̄) = 0. Si ∇g(x̄) = 0, on a la conclusion voulue. On peut donc supposer
que ∇g(x̄) 6= 0. Pour tout x ∈ S et t ∈]0, 1], on a x̄ + t(x − x̄) ∈ S donc

g(x̄ + t(x − x̄)) − g(x̄)


≥ 0,
t
ce qui, par passage à la limite pour t ↓ 0 donne

h∇g(x̄), x − x̄i ≥ 0 pour tout x ∈ S.

Cela implique que h∇g(x̄), x − x̄i > 0 pour tout x ∈ int S. Sinon, il existerait x0 ∈ int S tel que
h∇g(x̄), x0 − x̄i ≤ 0, ce qui impliquerait h∇g(x̄), x0 − x̄i = 0 et

h∇g(x̄), x0 i = h∇g(x̄), x̄i ≤ h∇g(x̄), xi pour tout x ∈ int S.

La fonction convexe h∇g(x̄), ·i aurait alors un minimum local, donc global (voir Remarque 4.4.1),
ce qui impliquerait la contradiction ∇g(x̄) = 0. On en déduit que h∇g(x̄), x − x̄i ≤ 0 implique
x∈/ int S donc f (x) ≥ 0 = f (x̄). On obtient donc

f (x) ≥ f (x̄) pour tout x ∈ H ∩ U

où
H = {x ∈ X : h∇g(x̄), x − x̄i ≤ 0}.
Soit alors u ∈ X tel que h∇g(x̄), ui ≤ 0. Comme x̄ + tu ∈ H ∩ U pour tout t > 0 assez
f (x̄ + tu) − f (x̄)
petit, il vient ≥ 0 donc h∇f (x̄), ui ≥ 0. Il en résulte que h∇f (x̄), ui = 0 si
t
h∇g(x̄), ui = 0, ce qui implique l’existence de λ ∈ R∗ tel que ∇g(x̄) = λ∇f (x̄). On remarque
enfin que λ < 0 car h∇f (x̄), ui ≥ 0 si h∇g(x̄), ui ≤ 0 et que λf (x̄) = 0.

87
Réciproquement, supposons que (4.10) est vérifié. Si λ = 0, alors ∇g(x̄) = 0 donc x̄ réalise le
minimum de g sur U donc sur S. Supposons donc λ 6= 0 de telle sorte que f (x̄) = 0. On a alors,
pour tout x ∈ S,
0 ≥ f (x) − f (x̄) ≥ h∇f (x̄), x − x̄i,
donc h∇g(x̄), x − x̄i ≥ 0 car ∇g(x̄) = λ∇f (x̄) avec λ < 0. On a alors, pour tout x ∈ S,

g(x) − g(x̄) ≥ h∇g(x̄), x − x̄i ≥ 0.

88
89
Chapitre 5

Théorèmes d’Inversion et Applications

Nous illustrons dans ce chapitre le principe qu’une application différentiable se comporte locale-
ment comme sa différentielle.

5.1 Théorèmes d’inversion


Commençons par donner quelques définitions

Définition 5.1.1
a) Une application f : E −→ F où E et F sont des espaces topologiques est un homéomor-
phisme si
– f est bijective
– f et f −1 sont continues.
Autrement dit f est donc un homéomorphisme si et seulement
– f est bijective,
– f (U ) est ouvert dans F pour tout ouvert U de E,
– f −1 (V ) est ouvert dans E pour tout ouvert V de F.
b) Soient U ⊂ E et, V ⊂ F des ouverts d’espaces de Banach E et F . On dit qu’une applica-
tion f : U −→ V est un difféomorphisme si
– f est bijective,
– f et f −1 sont différentiables.
c) On dit que f est un C r difféomorphisme si f est un difféomorphisme et si f et f −1 sont de
classe C r .

Remarque 5.1.1
a) Une application bijective et continue n’est pas toujours un homéomorphisme. En effet, soit
(E, d) un espace métrique dont la topologie n’est pas la topologie discrète et δ(x, y) la distance
définie par 
0 si x = y
δ(x, y) =
1 si x 6= y.

90
Considérons f : (E, δ) −→ (E, d) définie par f = IE . C’est une application continue bijective
mais f −1 n’est pas continue car si X ⊂ E qui n’est pas ouvert pour (E, d) on a X est ouvert
pour (E, δ) alors que f (X) = X n’est pas ouvert pour (E, d).
b) On remarque qu’un difféomorphisme est un homéomorphisme. Mais la fonction f (x) =
x3 qui est un homéomorphisme différentiable de R dans R n’est pas un difféomorphisme car
f −1 (y) = y 1/3 n’est pas différentiable en 0.
c) On remarque également que si f : U −→ V est un difféomorphisme alors Df (x) ∈
Isom(E, F ) pour tout x ∈ U . En effet, f et f −1 sont différentiables en x et y = f (x) et on a
f ◦ f −1 = IdV ,
f −1 ◦ f = IdU .
Utilisant le résultat de dérivation d’une composée, on a
Df (x) ◦ Df −1 (y) = IdF
et
Df −1 (y) ◦ Df (x) = IdE ,
ce qui montre que bien que Df (x) est bijective et que Df −1 (y) = (Df (x))−1 .
Le résultat suivant est une étape vers le résultat principal de cette section à savoir le Théorème du
difféomorphisme local 5.1.2.
Théorème 5.1.1 TH ÉOR ÈME D ’ INVERSION LOCALE Soit f : U −→ F une application diffé-
rentiable définie sur un ouvert U d’un espace de Banach et à valeurs dans un espace de Banach
F . On suppose que Df est continue en a ∈ U et que Df (a) ∈ Isom (E, F ). Alors
a) il existe des voisinages ouverts U 0 de a et V 0 de b = f (a) tels que f soit un homéomorphisme
de U 0 dans V 0 .
b) f −1 est Lipschitzienne sur V 0 , différentiable en b et on a Df −1 (b) = (Df (a))−1 .
Démonstration. Posons ψ = (Df (a))−1 ∈ Isom (F, E), et r(x) = f (x) − b − Df (a)(x − a).
Observons que pour y ∈ F et x ∈ U ,
y = f (x) ⇐⇒ y = b + Df (a)(x − a) + r(x)
⇐⇒ x = a + ψ(y − b − r(x))
⇐⇒ x = Fy (x)
où Fy (x) = a + ψ(y − b − r(x)). Choisissons η > 0 tel que
1
kDr(x)k = kDf (x) − Df (a)k ≤
2kψk
1
sur B̄(a, η), de telle sorte que r(.) est 2kψk -Lipschitzien sur B̄(a, η) ; et soit y ∈ B̄(b, δ) où δ =
η
2kψk
. Pour tout x ∈ B̄(a, η) on a, notant que 0 = r(a)
η 1
kFy (x) − ak ≤ kψk(ky − bk + kr(x)k) ≤ kψk( + kx − ak) ≤ η.
2kψk 2kψk

91
On a donc défini une application Fy : B̄(a, η) −→ B̄(a, η). Pour tout x, z ∈ B̄(a, η), on a

1 kx − zk
kFy (x) − Fy (z)k ≤ kψkkr(x) − r(z)k ≤ kψk kx − zk = .
2kψk 2

D’après le Théorème des applications contractantes de Banach, il existe un unique x ∈ B̄(a, η) tel
que f (x) = y noté x = g(y). Ceci montre l’existence d’une application g : B̄(b, δ) −→ B̄(a, η)
telle que f (g(y)) = y pout tout y ∈ B̄(b, δ). Notons que g(b) = a car Fb (a) = a et que, pour tout
y ∈ B̄(b, δ), g(y) est l’unique x ∈ B̄(a, η) tel que f (x) = y. Il en résulte que f est surjective de
B̄(a, η) dans B̄(b, δ). Considérons y, y 0 ∈ B(b, δ), on a

kg(y) − g(y 0 )k = kFy (g(y)) − Fy0 (g(y 0 ))k


≤ kFy (g(y)) − Fy (g(y 0 ))k + kFy (g(y 0 )) − Fy0 (g(y 0 ))k
1
≤ k(g(y) − (g(y 0 )k + kψ(y − y 0 )k
2
ce qui entraine
kg(y) − g(y 0 )k ≤ 2kψkky − y 0 k.
Il en résulte que g est Lipschitzienne donc continue sur B̄(b, δ) et que

kg(y) − ak = kg(y) − g(b)k < 2kψkδ = η

si ky − bk < δ d’où g(B(b, δ)) ⊂ B(a, η) en notant, comme d’habitude, B(x, r) la boule ouverte
de centre x et de rayon r. Posons alors V 0 = B(b, δ) et U 0 = g(B(b, δ)) ⊂ B(a, η). Pour tout
y ∈ B(b, δ), on a g(y) = f −1 (y) ∩ B(a, η), donc U 0 = f −1 (B(b, δ)) ∩ B(a, η), ce qui montre
que U 0 est ouvert. Remarquons que f (U 0 ) ⊂ V 0 et que f : U 0 −→ V 0 est surjective. Elle est
aussi injective car si x, x0 ∈ U 0 vérifient f (x) = f (x0 ) = y, on a x ∈ B(a, η) donc g(y) = x
et g(y) = x0 d’où x = x0 . On a donc montré que f : U 0 −→ V 0 est un homéomorphisme et que
f −1 = g est Lipschitzienne sur V 0 .
Il reste à prouver la différentiabilité de f −1 en b. Soit ε > 0 et 0 < α < η tel que kDr(x)k ≤ 2kψk
ε
2
ε
sur B(a, α), de telle sorte que r(.) est 2kψk2 -Lipschitzienne sur B(a, α). Posons β = α/2kψk.
Pour tout y ∈ B(b, β) on a

kg(y) − ak = kg(y) − g(b)k ≤ 2kψkky − bk ≤ 2kψkβ = α

donc g(B(b, β)) ⊂ B(a, α). Soit y ∈ B(b, β). On a

g(y) = Fy (g(y)) = a + ψ(y − b − r(g(y))),

d’où
g(y) − g(b) − ψ(y − b) = −ψ(r(g(y))) = ψ(r(g(b))) − ψ(r(g(y))).
Il en résulte que
kg(y) − g(b) − ψ(y − b)k ≤ kψkkr(g(y)) − r(g(b))k.

92
Comme r(.) est Lipschitzienne de rapport ε/2kψk2 sur B(a, α), et comme g(y), g(b) ∈ B(a, α),
il vient
ε ε ε
kr(g(y) − r(g(b))k ≤ kg(y) − g(b)k ≤ 2kψkky − bk ≤ ky − bk.
2kψk2 2kψk2 kψk

On a donc pour tout y ∈ B(b, β)


ε
kg(y) − g(b) − ψ(y − b)k ≤ kψk ky − bk = εky − bk,
kψk

ce qui montre bien que g et donc f −1 est différentiable en b avec Df −1 (b) = (Df (a))−1 .

On en déduit le
Théorème 5.1.2 TH ÉOR ÈME DU DIFF ÉOMORPHISME LOCAL
Soit f : U −→ F une application de classe C r , r ≥ 1 définie sur un ouvert U d’un es-
pace de Banach E et à valeurs dans un espace de Banach F . Soit a ∈ U tel que Df (a) ∈
Isom (E, F ). Alors, il existe des voisinages ouverts U 0 de a et V 0 de b = f (a) tels que f soit un C r
difféomorphisme de U 0 dans V 0 .
Démonstration. Comme Df (a) ∈ Isom (E, F ) qui est ouvert dans L(E, F ) et comme Df est
continue en a, on peut supposer en diminuant U au besoin, que Df (x) ∈ Isom (E, F ) pour tout
x ∈ U . Appliquant le Théorème 5.1.1, il existe des voisinages ouverts U 0 de a et V 0 de b = f (a)
tels que f soit un homéomorphisme de U 0 dans V 0 et tel que f −1 soit différentiable en b avec
Df −1 (b) = (Df (a))−1 . On peut alors appliquer de nouveau le Théorème 5.1.1 pour tout x ∈ U 0 . Il
en résulte que, pour tout y ∈ V 0 l’application f −1 est différentiable en y et Df −1 (y) = (Df (x))−1 .
L’application Df −1 est continue sur V 0 car

Df −1 = Φ ◦ Df ◦ f −1

où Φ : Isom (E, F ) −→ Isom (F, E) est définie par φ(u) = u−1 pour tout u ∈ Isom (E, F ).
Notons que f −1 , Df sont continues ainsi que Φ qui est de classe C ∞ (voir chapitre 4, Théorème
4.2.4). Il en résulte que f −1 est de classe C 1 sur V 0 . Supposons démontré que f −1 est de classe C s
sur V 0 pour s ∈ [1, r − 1]. On a f −1 de classe C s ainsi que Df et Φ. D’après le Théorème 4.2.3
du chapitre 2, on obtient donc que Df −1 est de classe C s sur V 0 d’où f −1 est de classe C s+1 . Le
théorème est alors complètement démontré.

Remarque 5.1.2 Si les hypothèses du théorème précédent sont vérifiées dans des espaces de di-
mension finie E = Rn et F = Rp , on a nécessairement n = p et l’hypothèse Df (a) ∈ Isom (E, F )
se traduit par det(Jf (a)) 6= 0 où Jf (a) est la matrice Jacobienne de f en a définie par
∂fi
Jf (a)i,j = (a)
∂xj

avec f = (f1 , . . . , fn ).

93
Le résultat suivant est une version globale du Théorème 5.1.1.
Théorème 5.1.3 Soit f : U −→ F une application définie sur un ouvert U d’un espace de Banach
E et à valeurs dans un espace de Banach F . On suppose que f est de classe C r . Alors, pour que
f soit un C r difféomorphisme de U dans f (U ) qui est alors ouvert, il faut et il suffit que f soit
injective et que Df (x) ∈ Isom (E, F ) pour tout x ∈ U .
Démonstration. Supposons que f est un C r difféomorphisme d’un ouvert U de E dans un en-
semble V = f (U ) de F . Il résulte de la Remarque 5.1.1, b) que Df (x) ∈ Isom (E, F ) pour tout
x ∈ U . Montrons alors que V = f (U ) est ouvert. Soit b = f (a) ∈ V avec a ∈ U . Il existe d’après
le Théorème 5.1.1 des voisinage ouverts U 0 ⊂ U de a et V 0 de b tel que f soit un homéomorphisme
de U 0 dans V 0 . On a alors V 0 ⊂ f (U ) = V .
Réciproquement Soit f : U −→ F une application injective de classe C r telle que Df (x) ∈
Isom (E, F ) pour tout x ∈ U . Observons que f est bijective de U dans f (U ). Par ailleurs f (U )
est ouvert et f −1 est continue sur f (U ). En effet, si on considère y = f (x) ∈ f (U ) avec x ∈ U ,
il existe d’après le Théorème 5.1.1 des voisinages ouverts U 0 de x et V 0 de y tels que f soit un
homéomorphisme de U 0 dans V 0 , ce qui implique que V 0 ⊂ f (U ) et que f −1 est continue en y.
L’application f est donc un homéomorphisme de U dans l’ouvert V = f (U ). De plus, comme
Df (x) ∈ Isom (E, F ), on peut appliquer le Théorème 5.1.2 qui nous assure que f −1 est r fois
continuement différentiable au voisinage de y. Ce qui montre que f est un C r difféomorphisme de
U dans l’ouvert f (U ), d’où le résultat.

Remarque 5.1.3 Il résulte du théorème précedent que si U ⊂ E et V ⊂ F sont des ouverts et si


f : U −→ V est un C r difféomorphisme, alors pour tout ouvert Ũ ⊂ U , on a Ṽ = f (Ũ ) est ouvert
et f est un C r difféomorphisme de Ũ dans Ṽ .

5.2 Théorème des Fonctions Implicites


Théorème 5.2.1 Soient E, F , G des espaces de Banach, U ⊂ E × F un ouvert et f : U −→ G
une application de classe C r . Soit (a, b) ∈ U tel que f (a, b) = 0 et tel que la différentielle partielle
D2 f (a, b) ∈ Isom (F, G). Alors,
a) il existe des voisinages ouverts V de (a, b), A de a, il existe une application
ϕ : A −→ F
telle que, pour tout x ∈ A
f (x, ϕ(x)) = 0.
b) (x, y) ∈ V et f (x, y) = 0 ⇐⇒ x ∈ A et y = ϕ(x), autrement dit
S ∩ V = {(x, ϕ(x)) : x ∈ A},
où S = {(x, y) ∈ U : f (x, y) = 0}.
c) ϕ(.) est de classe C r sur A et
Dϕ(x) = −(D2 f (x, ϕ(x)))−1 ◦ D1 f (x, ϕ(x)).

94
Démonstration. Comme Isom (F, G) est ouvert dans L(F, G) et comme D2 f est continue, on a
(D2 f )−1 (Isom (F, G)) est un ouvert qui contient (a, b). On peut alors supposer que D2 f (x, y) ∈
Isom (F, G) pour tout (x, y) ∈ U . Définissons

h : U −→ E × G

par
h(x, y) = (x, f (x, y)).
pour tout (x, y) ∈ U . L’application h est de classe C r car h = (h1 , h2 ) avec h1 et h2 de classe C r .
On a donc, pour tout (u, v) ∈ E × F

Dh(x, y)(u, v) = (u, D1 f (x, y)u + D2 f (x, y)v).

On observe que L = Dh(a, b) est bijective. En effet si (u, v) ∈ ker L, alors u = 0 et D2 f (a, b)v =
0 d’où v = 0. De plus, si on considère (u, w) ∈ E × G, on a L(u, v) = (u, w) où l’on a posé
v = (D2 f (a, b))−1 (w − D1 f (a, b)u). Observons que l’on a montré que

(Dh(a, b))−1 = (πE , D2 f (a, b) ◦ (πG − D1 f (a, b) ◦ πE )),

ce qui implique que Dh(a, b) est un isomorphisme. On peut donc appliquer le Théorème 5.1.2 qui
garantit l’existence d’un voisinage V 0 de (a, b) tel que h soit un C r difféomorphisme de V 0 dans
l’ouvert W 0 = h(V 0 ) qui est un voisinage de h(a, b) = (a, 0). Il existe alors un voisinage ouvert
A de a et un voisinage ouvert B de 0 dans G tels que A × B ⊂ W ’. Posons W = A × B et
V = h−1 (W ). Il est clair que h est un C r difféomorphisme de V dans W . Pour tout x ∈ A, posons

ϕ(x) = (πF ◦ h−1 )(x, 0).

L’application ϕ est de classe C r comme composée de trois applications de ce type. Pour tout
x ∈ A, on a h−1 (x, 0) = (x, ϕ(x)) donc (x, 0) = h(x, ϕ(x)) = (x, f (x, ϕ(x))) ce qui montre que
f (x, ϕ(x)) = 0. De plus, si (x, y) ∈ V vérifie f (x, y) = 0 on a h(x, y) = (x, 0) = h(x, ϕ(x)) et
(x, ϕ(x)) ∈ V ce qui implique y = ϕ(x) car h est injective sur V . Il reste alors à calculer Dϕ. On
remarque pour ceci que pour tout x ∈ A on a f (x, ϕ(x)) = 0. Remarquons alors que f ◦ Φ = 0
où Φ : A −→ V est définie par Φ(x) = (x, ϕ(x)). Il en résulte que, pour tout x ∈ A et pour tout
u ∈ E, on a D(f ◦ Φ)(x)(u) = 0, d’où D1 f (x, ϕ(x))(u) + D2 (f, ϕ(x))(Dϕ(x)(u)) = 0. Il en
résulte bien que

Dϕ(x)(u) = −((D2 f (x, ϕ(x)))−1 ◦ D1 f (x, ϕ(x)))(u).

Remarque 5.2.1 On vient de démontrer le Théorème des fonctions implicites à l’aide du Théorème
du difféomorphisme local. On peut également faire l’inverse. En effet, étant donné f : U −→ F
une application de classe C r , r ≥ 1 définie sur un ouvert U d’un espace de Banach E et à valeurs
dans un espace de Banach F et a ∈ U tel que Df (a) ∈ Isom (E, F ), on définit g : U × F → F

95
par g(x, y) = f (x) − y. Posant b = f (a) on a D1 g(a, b) = Df (a) ∈ Isom (E, F ). D’après le
Théorème 5.2.1 il existe un voisinage ouvert V de (a, b), un voisinage ouvert B de b et une appli-
cation ψ : B −→ X de classe C r telle que (x, y) ∈ V et g(x, y) = 0 si et seulement si y ∈ B et
x = ψ(y). Posons
A = {x ∈ X : (x, f (x)) ∈ V }.
C’est un ensemble ouvert comme image réciproque d’un ouvert par une application continue et
a ∈ A. On a alors que f est bijective de A dans B et f −1 = ψ sur B. En effet si x1 , x2 ∈ A vérifient
f (x1 ) = f (x2 ) := y on a (x1 , y), (x2 , y) ∈ V et g(x1 , y) = g(x2 , y) = 0 donc x1 = x2 = ψ(y).
Par ailleurs si y ∈ B, posant x = ψ(y) on a (x, y) ∈ V et f (x) = y donc x ∈ A. On a donc bien
montré que f était un C r difféomorphisme de A dans B.

5.3 Application : Multiplicateurs de Lagrange


Théorème 5.3.1 Soient g : U −→ F une application de classe C 1 définie sur un ouvert U d’un
espace de Banach E, à valeurs dans un espace de Banach F et f : U −→ R une fonction. On
pose S = g −1 (0) et on suppose que a ∈ S est un extremum local de f sur S. On suppose aussi
que f est différentiable en a et que :
– Dg(a) ∈ L(E, F ) est surjective ;
– ker Dg(a) admet un supplémentaire topologique (i.e. E = ker Dg(a) ⊕ Y avec projections
continues).
Alors, il existe λ ∈ F ∗ = L(F, R) unique tel que
Df (a) = λ ◦ Dg(a).
Démonstration. On pose X = ker Dg(a) et on considère un sous-espace vectoriel fermé Y ⊂ E
tel que E = X ⊕Y dont l’existence est garantie par l’hypothèse. Soit r > 0 tel que la boule ouverte
B(a, 2r) soit contenue dans U . Posant V = X ∩ B(0, r) et W = Y ∩ B(0, r), on remarque que
V et W sont des ouverts non vides de Y et de Y et que a + V + W ⊂ U , ce qui permet de définir
une application h : V × W −→ F par h(v, w) = g(a + v + w). L’application h est de classe C 1
comme composée d’une application de classe C 1 et d’une application affine continue. On a alors
Dh(v, w) = Dg(a + v + w) ◦ ` avec ` : X × Y −→ E définie par `(h, k) = h + k pour tout
(h, k) ∈ X × Y . Il en résulte que
D1 h(v, w) = Dh(v, w) ◦ `(·, 0) = Dg(a + v + w)|X ,
et
D2 h(v, w) = Dh(v, w) ◦ `(0, ·) = Dg(a + v + w)|Y .
On a h(0, 0) = 0. Comme E = ker Dg(a) ⊕ Y , on a ker Dg(a)|Y = ker Dg(a) ∩ Y = {0} donc
Dg(a)|Y est injective. Par ailleurs, comme Dg(a) est surjective, tout élément w ∈ F s’écrit w =
Dg(a)(u + v) avec (u, v) ∈ ker Dg(a) × Y , donc w = Dg(a)|Y (v), ce qui montre que Dg(a)|Y
est aussi surjective. On obtient donc que D2 h(0, 0) = Dg(a)|Y ∈ Isom (Y, F ) et h(0, 0) = 0.
Utilisant le théorème des fonctions implicites, il existe un voisinage ouvert A de 0 dans X et une
application ϕ : A −→ Y telle que
g(a + v + ϕ(v)) = 0 pour tout v ∈ A,

96
avec
Dϕ(0) = −(D2 h(0, 0))−1 ◦ D1 h(0, 0) = −(Dg(a)|Y )−1 ◦ Dg(a)|X = 0,
car Dg(a)|X = 0. Supposant que a est un minimum local de f sur S, on a, pour tout v dans un
voisinage de 0,
f (a + v + ϕ(v)) ≥ f (a) = f (a + 0 + ϕ(0)),
ce qui implique que la fonction θ(v) = f (a + v + ϕ(v)) a un minimum local en 0, d’où

0 = Dθ(0) = Df (a) ◦ (IX + Dϕ(0)) = Df (a)|X .

Posons alors λ = Df (a) ◦ (Dg(a)|Y )−1 ∈ L(F, R). On a, par définition :

Df (a)|Y = (λ ◦ Dg(a))|Y .

De plus
Df (a)|X = (λ ◦ Dg(a))|X = 0,
donc Df (a) = λ ◦ Dg(a) car E = X ⊕ Y . L’unicité de λ découle du fait que Df (a) = λ ◦ Dg(a)
implique Df (a)|Y = (λ ◦ Dg(a))|Y , d’où λ = Df (a) ◦ (Dg(a)|Y )−1 .

Remarque 5.3.1 a) Le théorème précédent reste vrai sans avoir à supposer que ker Dg(a) admet
un supplémentaire topologique ; mais la démonstration dépasse alors le niveau de ce cours.
b) Dans le cas où E est un espace de Hilbert, il est toujours vrai que ker Dg(a) admet un
supplémentaire topologique (son orthogonal, par exemple).
On en déduit le
Corollaire 5.3.1 Soient U ⊂ Rn un ouvert, g : U −→ Rm une application de classe C 1 et
f : U −→ R une fonction. On pose S = g −1 (0) et on suppose que a ∈ S est un extremum local
de f sur S. On suppose aussi que f est différentiable en a et que :

(∇g1 (a), · · · , ∇gm (a)) sont linéairement indépendant.

Alors, il existe λ ∈ Rm unique tel que


m
X
∇f (a) = λi ∇gi (a).
i=1

Démonstration. On a Dg(a)u = (h∇g1 (a), ui, · · · , h∇gm (a), ui) pour tout u ∈ Rn , de telle
m
sorte que Dg(a)T (v) = i=1 vi ∇gi (a) pour tout v ∈ Rm . Comme (∇g1 (a), · · · , ∇gm (a)) sont
P
linéairement indépendant, il en résulte que Dg(a)T est injective donc Dg(a) est surjective. Par
ailleurs ker Dg(a) admet un supplémentaire topologique (son orthogonal, par exemple). Appli-
quant le Théorème 5.3.1, il existe λ ∈ Rm unique tel que Df (a)u = hλ, Dg(a)ui pour tout
u ∈ Rn , soit
Xm DXm E
h∇f (a), ui = λi h∇gi (a), ui = λi ∇gi (a), u ,
i=1 i=1

97
d’où m
X
∇f (a) = λi ∇gi (a).
i=1

Remarque 5.3.2 La condition nécessaire donnée dans le Théorème 5.3.1 permet parfois de dé-
terminer l’extremum.

5.4 Introductions aux sous-variétés


5.4.1 Immersion et submersion locale
Pour m ≤ n on notera π l’application linéaire surjective π : Rn −→ Rm définie pour tout x ∈ Rn
par π(x1 , · · · , xn ) = (xn−m+1 , · · · , xn ), et pour n ≤ m, on notera par j : Rn −→ Rm l’application
linéaire injective définie pour tout x ∈ Rm par

j(x1 , · · · , xn ) = (x1 , · · · , xn , 0, · · · , 0).

Théorème 5.4.1 I MMERSION. Soit U ⊂ Rn un ouvert, soit g : U −→ Rm une application de


classe C r et soit a ∈ U tel que Dg(a) soit injective. Alors il existe des ouvert U ⊃ U 0 3 a,
Rm ⊃ V 3 g(a) tels que g(U 0 ) ⊂ V et un C r -difféomorphisme f de V sur un ouvert f (V ) de Rm
tel que
f (g(x)) = j(x) = (x1 , · · · , xn , 0, · · · , 0) pour tout x ∈ U 0 ,
de plus, on a
f (V ) ∩ (Rn × {0}) = f (g(U 0 )).
Démonstration. Notons que n ≤ m car Dg(a) est injective et considérons un sous-espace vecto-
riel F de Rm tel que Rm = Dg(a)(Rn ) ⊕ F de sorte que la dimension de F est m − n. Soit ψ un
isomorphisme de Rm−n dans F et soit h : U × Rm−n −→ Rm définie par h(x, y) = g(x) + ψ(y).
L’application h est de classe C r et Dh(x, y)(u, v) = Dg(x)(u) + ψ(v) ce qui montre que Dh(a, 0)
est surjective, donc bijective car Dh(a, 0) ∈ L(Rm , Rm ). Il existe donc des ouverts Rn ⊃ U 0 3 a
et Rm−n ⊃ W 0 3 0 tels que h soit un C r difféomorphisme de U 0 × W 0 dans un ouvert V 3 g(a) de
Rm . Posant f = h−1 , on a g(U 0 ) ⊂ h(U 0 ×W 0 ) = V , et, pour tout x ∈ U 0 , f (g(x)) = f (h(x, 0)) =
(x, 0) = j(x). On a donc montré que f (g(U 0 )) ⊂ f (V )∩(Rn ×{0}). Réciproquement, étant donné
z = (z1 , · · · , zn , 0) ∈ f (V ) ∩ (Rn × {0}), on a donc x = (z1 , · · · , zn ) ∈ U 0 donc f (g(x)) = z
donc z ∈ f (g(U 0 )).

Théorème 5.4.2 S UBMERSION . Soit U ⊂ Rn un ouvert, soit f : U −→ Rm une application de


classe C r et soit a ∈ U tel que Df (a) soit surjective. Alors il existe un ouvert U ⊃ U 0 3 a et un
C r -difféomorphisme g de U 0 sur un ouvert g(U 0 ) de Rn tel que

π(g(x)) = f (x) pour tout x ∈ U 0 .

98
De plus, si f (a) = 0, on a

g(U 0 ∩ S) = g(U 0 ) ∩ (Rn−m × {0}),

où S = {x ∈ U : f (x) = 0}.


Démonstration. Notons que m ≤ n car Df (a) est surjective et que dim(ker(Df (a))) = n−m. Il
existe alors une application linéaire ψ : Rn −→ Rn−m telle que ψ|ker(Df (a)) soit injective (prendre
une base (e1 , · · · , en−m ) de ker(Df (a)) et poser ψ(x) = (y1 , · · · , yn−m ) coordonnées dans cette
base de la projection orthogonale de x sur ker(Df (a))). Introduisons g : U −→ Rn par g = (ψ, f )
de telle sorte que g est de classe C r sur U et Dg(a) = (ψ, Df (a)). Soit u ∈ ker(Dg(a)), on
a u ∈ ker(Df (a)) et ψ(u) = 0 donc u = 0, d’où Dg(a) est injective et alors bijective car
Dg(a) ∈ L(Rn , Rn ). Il existe donc des ouverts U ⊃ U 0 3 a et Rn ⊃ g(U 0 ) 3 g(a) tels que g soit
un C r -difféomorphisme U 0 dans g(U 0 ). Il est alors clair que f = π ◦ g sur U 0 . Pour tout x ∈ S ∩ U 0 ,
on a alors g(x) = (ψ(x), f (x)) = (ψ(x), 0) donc g(U 0 ∩ S) ⊂ g(U 0 ) ∩ (Rn−m × {0}). Par ailleurs,
si z ∈ g(U 0 ) ∩ (Rn−m × {0}), alors z = g(x) avec x ∈ U 0 et z = (y, 0) avec y ∈ Rn−m d’où
(y, 0) = (ψ(x), f (x)), ce qui montre bien que x ∈ S donc z ∈ g(U 0 ∩ S).

5.4.2 Définitions équivalentes des sous-variétés


Définition 5.4.1 Une partie non vide S ⊂ Rn est appelée sous-variété de classe C r et de dimen-
sion d ∈ N si, pour tout a ∈ S, il existe un ouvert V 3 a et un C r -difféomorphisme f de V dans
un ouvert W 3 f (a) tel que

f (V ∩ S) = f (V ) ∩ (Rd × {0}).

Exemple 5.4.1 a) Un ouvert de Rn est une sous-variété de dimension n et de classe C ∞ (prendre


f = IRn ). On pourra démontrer en exercice que, réciproquement, toute sous-variété de dimension
n est un ouvert de Rn .
b) Étant donnée une sous-variété S de dimension 0 et a ∈ S, alors S ∩ V = f (V ) ∩ {0} = {0}
donc S ∩ V = {a}.
c) Un sous-espace affine L ⊂ Rn de dimension d est une sous-variété de dimension d. En effet,
étant donné a ∈ L on considère une base (e1 , · · · , en ) de Rn telle que (e1 , · · · , ed ) soit une base
de L − a, et on considère l’isomorphisme ϕ : Rn −→ Rn qui à x ∈ Rn associe ses cooordonnées
(x1 , · · · , xn ) dans cette base. Posant f (x) = ϕ(x) − ϕ(a), on a f (L) = Rd × {0}.

Théorème 5.4.3 Considérons les propriétés suivantes relatives à une partie non vide S ⊂ Rn .
i) S est une sous-variété de classe C r et de dimension d.
ii) Pour tout a ∈ S, il existe un ouvert Rn ⊃ U 3 a et une application h = (h1 , · · · , hn−d ) : U −→
Rn−d de classe C r avec (∇h1 (a), · · · , ∇hn−d (a)) linéairement indépendants (ce qui équivaut à
dire que Dh(a) est surjective) telles que

S ∩ U = h−1 (0).

99
iii) Pour tout a ∈ S, il existe un ouvert Rn ⊃ V 3 a, un ouvert Rd ⊃ W 3 (a1 , · · · , ad ) et une
application g : W −→ Rn−d de classe C r telle que, à une permutation près des coordonnées, on
ait
S ∩ V = {(z, g(z)) : z ∈ W }.

iv) Pour tout a ∈ S, il existe des ouverts Rn ⊃ V 3 a, Rd ⊃ Ω 3 0 et une application p : Ω −→


Rn de classe C r telle que

p(0) = a, Dp(0) est injective et p est un homéomorphisme de Ω dans S ∩ V.

Alors, ces quatres propriétés sont équivalentes.

Démonstration. Montrons que i) =⇒ ii) =⇒ iii) =⇒ iv) =⇒ i).


i) =⇒ ii). Définissons h = π ◦f : V −→ Rn−d avec π(y1 , · · · , yn ) = (yd+1 , · · · , yn ). L’application
h est de classe C r sur V et Dh(a) = π ◦ Df (a) est surjective car π est surjective et Df (a) est
bijective. Pour x ∈ V , on a h(x) = 0. Réciproquement, si h(x) = 0, on a f (x) ∈ f (V )∩(Rd ×{0})
donc f (x) = f (z) avec z ∈ S donc x = z ∈ S car f est injective sur V . On a donc bien
S ∩ V = h−1 (0).
ii) =⇒ iii). Comme Dh(a) est surjective, il existe {i1 , · · · , in−d } ⊂ [1, n] tels que

(Dh(a)ei1 , · · · , Dh(a)ein−d )

soient linéairement indépendants. Quitte à permuter les coordonnées, on peut supposer que

(Dh(a)ed+1 , · · · , Dh(a)en )

sont linéairement indépendants. Écrivant Rn = Rd × Rn−d , on a, pour tout v ∈ Rn−d ,


n
X
D2 h(a)(v) = Dh(a)(0, v) = vj Dh(a)(ej ),
j=d+1

ce qui montre que D2 h(a) ∈ L(Rn−d , Rn−d ) est injective donc bijective. Appliquant le Théorème
des fonctions implicites, il existe des voisinages ouverts A de (a1 , · · · , ad ) dans Rd et V ⊂ U de a
dans Rn et une application g : A −→ Rn−d de classe C r tels que

h−1 (0) ∩ V = {(z, g(z)) : z ∈ A},

soit
S ∩ V = S ∩ U ∩ V = h−1 (0) ∩ V = {(z, g(z)) : z ∈ A}.

iii) =⇒ iv). Posons Ω = W − â, où â = (a1 , · · · , ad ), de telle sorte que g(â) = (ad+1 , · · · , an ), et,
pour tout t ∈ Ω, p(t) = (â + t, g(â + t)) d’où p(0) = (â, g(â)) = a. L’application p est de classe
C r et Dp(0)(u) = (u, Dg(a)(u)) pour tout u ∈ Rd ce qui montre que Dp(0) est injective. On a

p(Ω) = S ∩ V.

100
De plus, p étant injective est une bijection de Ω dans p(Ω) = S ∩ V . Enfin la bijection inverse est
définie pour tout x ∈ S ∩ V par (x1 − a1 , · · · , xd − ad ) qui est continue, ce qui montre bien que p
est un homéomorphisme de Ω dans S ∩ V .
iv) =⇒ i). D’après le Théorème 5.4.1, il existe un ouvert Ω̂ ⊂ Ω contenant 0, un ouvert Ŵ 3 a tel
que p(Ω̂) ⊂ Ŵ et un C r -difféomorphisme f de Ŵ dans un ouvert f (Ŵ ) tels que

f (p(Ω̂)) = f (Ŵ ) ∩ (Rd × {0}).

Comme Ω̂ est un ouvert et p un homéomorphisme, on obtient que p(Ω̂) est un ouvert de S ∩ V .


Il existe donc un ouvert V̂ 3 a tel que p(Ω̂) = V̂ ∩ S. Comme p(Ω̂) ⊂ Ŵ , on peut supposer que
V̂ ⊂ Ŵ . On a alors

f (V̂ ∩ S) = f (p(Ω̂)) = f (Ŵ ) ∩ (Rd × {0}) ⊃ f (V̂ ) ∩ (Rd × {0}),

et f (V̂ ∩ S) ⊂ f (V̂ ) et f (V̂ ∩ S) = f (p(Ω̂)) ⊂ Rd × {0} donc f (V̂ ∩ S) ⊂ f (V̂ ) ∩ (Rd × {0}),
d’où
f (V̂ ∩ S) = f (V̂ ) ∩ (Rd × {0}).

Remarque 5.4.1 C’est un bon exercice de montrer d’autres implications que celles strictement
nécessaires à la démonstration du théorème précédent.
ii) =⇒ i). D’après le Théorème 5.4.2, il existe un ouvert V ⊃ V 0 3 a et un C r -difféomorphisme g
de V 0 dans un ouvert g(V 0 ) de Rn tel que πd (g(x)) = f (x) pour tout x ∈ V 0 avec πd (y1 , · · · , yn ) =
(yd+1 , · · · , yn ) et tel que g(V 0 ∩ S) = g(V 0 ) ∩ (Rd × {0}).
iii) =⇒ ii). Considérons l’ouvert V̂ = V ∩ (W × Rd ). On vérifie immédiatement que a ∈ V̂ et que
S ∩ V̂ = {(z, g(z)) : z ∈ W }. Introduisons l’application h : V̂ −→ Rn−d par h(z, y) = y − g(z).
On vérifie alors que
h−1 (0) = V̂ ∩ S.
De plus pour tout (w, v) ∈ Rd × Rn−d on a Dh(a)(w, v) = v − Dg(a1 , · · · , ad )(w) donc
v = Dh(a)(0, v) d’où Dh(a) est surjective, ce qui équivaut à ∇h1 (a), · · · , ∇hm (a) linéairement
indépendants.
i) =⇒ iv). On peut supposer sans perte de généralité que f (a) = 0. Définissons

π0 (y1 , · · · , yn ) = (y1 , · · · , yd )

et Ω = π0 (f (V ) ∩ (Rd × {0})). L’ensemble Ω est ouvert (vérification facile) et contient 0. Pour


t ∈ Ω, on a (t, 0) ∈ f (V ), on peut donc poser p(t) = f −1 (t, 0). L’application ainsi définie est
de classe C r et, pour tout w ∈ Rd , on a Dp(0)(w) = Df −1 (0)(w, 0) = (Df (a))−1 (w, 0), ce qui
montre que Dp(0) est injective. Par ailleurs t ∈ Ω si et seulement si (t, 0) ∈ f (V ) ∩ (Rd × {0})
donc p(Ω) = S ∩ V . Enfin pour tout x ∈ S ∩ V , on a p−1 (x) = π0 (f (x)) ce qui montre que p−1
est continue, donc p est bien un homéomorphisme de Ω dans S ∩ V .

101
iv) =⇒ iii). (C’est un peu moins facile). Comme Dp(0) est injective, on a Dp(0)T est surjective,
ce qui implique que le sous-espace vectoriel engendré par ∇p1 (0), · · · , ∇pn (0) est Rd . Il existe
donc i1 , · · · , id ∈ [1, n] tels que (∇pi1 (0), · · · , ∇pid (0)) est une base de Rd . En permutant les co-
ordonnées, on peut supposer que (∇p1 (0), · · · , ∇pd (0)) est une base de Rd , ce qui implique que
l’application q : Ω −→ Rd définie par q(t) = (p1 (t), · · · , pd (t)) vérifie Dq(0) ∈ Isom (Rd ).
Il existe donc un ouvert Ω̂ 3 0 tel que q soit un C r -difféomorphisme de Ω̂ dans un ouvert
Rd ⊃ Ŵ 3 â = (a1 , · · · , ad ). Comme p est un homéomorphisme de Ω dans S ∩ V , il existe
un ouvert Rn ⊃ V̂ 3 a tel que p(Ω̂) = S ∩ V̂ . Introduisons alors g : Ŵ −→ Rn−d par
g(ẑ) = (pd+1 (q −1 (ẑ), · · · , pn (q −1 (ẑ)). L’application g est de classe C r sur Ŵ et

{(ẑ, g(ẑ)) : ẑ ∈ Ŵ } = S ∩ V̂ .

En effet, si x ∈ S ∩ V̂ , alors x = p(t) pour un t ∈ Ω̂ et ẑ = (p1 (t), · · · , pd (t)) ∈ Ŵ de telle sorte


que
x = (p1 (t), · · · , pd (t), pd+1 (t), · · · , pn (t)) = (ẑ, g(ẑ)).
Réciproquement, si x = (ẑ, g(ẑ)) pour ẑ ∈ Ŵ , alors t = q −1 (ẑ) ∈ Ω̂, d’où

x = (p1 (t), · · · , pd (t), pd+1 (t), · · · , pn (t)),

donc x ∈ p(Ω̂) = S ∩ V̂ .
iii) =⇒ i). Soit U l’ouvert de Rn défini par U = W × Rn−d et soit f : U −→ Rn définie
par f (y, z) = (y, g(y) − z). L’application f est de classe C r et, pour tout u = (v, w) ∈ Rn ,
on a Df (a)u = (v, Dg(â)v − w) où â = (a1 , · · · , ad ). Il en résulte que Df (a) est injective
donc bijective car Df (a) ∈ L(Rn , Rn ). D’après le Théorème du difféomorphisme local, il existe
donc un ouvert V̂ 3 a tel que V̂ ⊂ W × Rn−d et tel que f soit un C r difféomorphisme de V̂
dans l’ouvert Ŵ = f (V̂ ). Étant donné x = (y, z) ∈ S ∩ V̂ , on a y ∈ W donc z = g(y) et
f (x) = (y, 0) ∈ f (V̂ ) ∩ Rd × {0}. Réciproquement, si x = (y, 0) ∈ f (V̂ ) ∩ Rd × {0}, alors
y ∈ W et il existe z ∈ Rn−d tel que x = (y, g(y) − z) = (y, 0) d’où z = g(y) donc (y, z) ∈ S et
x ∈ f (S ∩ V̂ ). On a donc bien

f (S ∩ V̂ ) = f (V̂ ) ∩ Rd × {0}.

5.4.3 Sous-espace tangent


Définition 5.4.2 Soit S ⊂ Rn une sous-variété de classe C r et de dimension d. On dit que u ∈ Rn
est tangent à S en a ∈ S s’il existe η > 0 et une fonction ϕ :] − η, +η[−→ S dérivable en 0 telle
que ϕ(0) = a et ϕ0 (0) = u.

Théorème 5.4.4 L’ensemble Ta S des vecteurs tangents en a à une sous-variété S 3 a de classe


C r et de dimension d est un espace vectoriel de dimension d.

Démonstration. Considérons le voisinage ouvert V de a et le C r -difféomorphisme f : V −→


f (V ) tel que f (S ∩ V ) = f (V ) ∩ Rd × {0}. On peut supposer que f (a) = 0. Soit alors v ∈ Ta S
et ϕ :] − η, +η[−→ S dérivable en 0 telle que ϕ(0) = a et ϕ0 (0) = u. On peut supposer, quitte

102
à diminuer η que ϕ(] − η, +η[) ⊂ S ∩ V . Définissant alors α :] − η, +η[−→ Rd × {0} par
α(t) = f (ϕ(t)), on a
α0 (0) = Df (ϕ(0))ϕ0 (0) = Df (a)u,
et α0 (0) ∈ Rd × {0} donc Df (a)u ∈ Rd × {0}. Réciproquement, soit w ∈ Rd × {0}. On a
0 = f (a) ∈ f (V ) ∩ Rd × {0} et f (V ) ∩ Rd × {0} est un ouvert de Rd × {0} car f (V ) est un ouvert
de Rn . Il existe donc η > 0 tel que tw ∈ f (V )∩Rd ×{0} = f (S∩V ) pour tout t ∈]−η, +η[. Posant
ϕ(t) = f −1 (tw), on a ϕ :] − η, +η[−→ S ∩ V , ϕ(0) = a et ϕ0 (0) = Df −1 (0)w = (Df (a))−1 (w)
et u = ϕ0 (0) ∈ Ta S. On a alors w = Df (a)u avec u ∈ Ta S. On a donc montré que

Ta S = (Df (a))−1 (Rd × {0}).

Comme (Df (a))−1 est un isomorphisme et comme Rd × {0} est un espace vectoriel de dimension
d, il en est de même pour Ta S.

on peut aussi calculer l’espace tangent Ta S à l’aide des définitions équivalentes des sous-variétés
données dans le théorème 5.4.4.

Proposition 5.4.1 Dans le cas ii), on a

Ta S = ker Dh(a) = {u ∈ Rn : h∇hi (a), ui = 0, i ∈ [1, n − d]}.

Dans le cas iii), on a, posant â = (a1 , · · · , ad ),

Ta S = {(v, Dg(â)v) : v ∈ Rd }.

Dans le cas iv), on a


Ta S = Dp(0)(Rd ) = {Dp(0)v : v ∈ Rd }.

103
104
Chapitre 6

Équations Différentielles : Existence et


Unicité des Solutions du Problème de
Cauchy

Dans ce chapitre, après avoir défini les notions de base de la théorie des équations différentielles,
nous étudions l’existence et l’unicité de la solution du problème de Cauchy. Les résultats sont
basés sur la méthode des approximations successives pour les contractions dans les espaces mé-
triques complets.

6.1 Rappels et Compléments d’Analyse


6.1.1 Applications Lipschitziennes
Etant donné un espace métrique (E, d), un élément a ∈ E et un réel positif η, on notera
respectivement B̄(a, η) et B(a, η) les boules fermées et ouvertes de centre a et de rayon η.
Définition 6.1.1 Soient (E, d) et (F, δ) deux espaces métriques. On dit qu’une application f :
E −→ F est Lipschitzienne s’il existe k ∈ R+ tel que
pour tout x, z ∈ E, δ(f (x), f (z)) ≤ kd(x, z).
On dit alors que f est k-Lipschitzienne.
On dit que f est localement Lipschitzienne si, pour tout x ∈ E, il existe un voisinage de x
sur lequel f est Lipschitzienne. Remarquons qu’une application Lipschitzienne est uniformément
continue.

Exemple 6.1.1
a) Soit f : U −→ Rn où f = (f1 , . . . , fn ) et U ⊂ Rm est un ouvert convexe. On suppose que
les fonctions f1 , . . . , fn admettent des dérivées partielles sur U par rapport à x1 , . . . , xm et que

∂fi
sup sup
(x) ≤ k
(i,j)∈[1,n]×[1,m] x∈U ∂xj

105
Alors f est k-Lipschitzienne sur U (voir Chapitre 3).
b) Dans a), si on suppose que les dérivées partielles sont continues sur U , alors la fonction f
est localement Lipschitzienne sur U car, pour tout a ∈ U , il existe une boule fermée de centre a
sur laquelle les dérivées partielles sont bornées et il suffit d’appliquer a) sur cette boule.
c) Soit f : U −→ R où U est un ouvert de Rm . Si f est k-Lipschitzienne sur U et si f admet
une dérivée partielle au point a ∈ U par rapport à la variable xj , alors

∂f
sup
(x) ≤ k,
x∈U ∂xj

(exercice facile). √
d) La fonction f : R+ −→ R+ définie par f (x) = x n’est pas Lipschitzienne car le rapport
(f (x) − f (0))/x n’est pas borné au voisinage de 0.
e) Soit A une partie non vide d’un espace métrique (E, d). On pose, pour tout x ∈ E,
d(x, A) = inf a∈A d(x, a). La fonction d(., A) est alors 1-Lipschitzienne (le démontrer).

6.1.2 Théorème des Applications Contractantes


Définition 6.1.2 On dit qu’une application f : (E, d) −→ (E, d) est contractante si elle est
k-Lipschitzienne avec k ∈]0, 1[.
Théorème 6.1.1 Soit f : (E, d) −→ (E, d) une application contractante définie sur un espace
métrique complet (E, d). Alors, f admet un unique point fixe x (i.e. un point x tel que f (x) = x).
De plus, pour tout x0 ∈ E, la suite (xn ) définie par xn = f n (x0 ) converge vers cet unique point
fixe.

Démonstration
Soit x0 ∈ X et soit (xn ) la suite définie par, xn = f n (x0 ). On a, pour tout n ∈ N, xn+1 =
f (xn ). Soient m, n ∈ N∗ avec m > n, on obtient que
d(xm , xn ) = d(f (xm−1 ), f (xn−1 )) ≤ kd(xm−1 , xn−1 ).
De proche en proche, il vient
d(xm , xn ) ≤ k n d(xm−n , x0 )
≤ k n (d(xm−n , xm−n−1 ) + . . . + d(x1 , x0 ))
≤ k n d(x1 , x0 )(k m−n−1 + . . . + k + 1)
≤ k n (1 − k)−1 d(x1 , x0 ).
La suite (xn ) est alors de Cauchy car limn→∞ k n = 0. Elle converge donc vers un élément x ∈ E.
De l’égalité xn+1 = f (xn ) et de la continuité de f , il résulte que x = f (x).
Unicité : Si x, z ∈ E vérifient f (x) = x et f (z) = z, il vient
d(x, z) = d(f (x), f (z)) ≤ kd(x, z),
d’où (1 − k)d(x, z) ≤ 0, ce qui impose d(x, z) = 0 et x = z. 
Ce résultat admet la légère variante suivante

106
Théorème 6.1.2 Soit f : (E, d) −→ (E, d) une application pour laquelle il existe p ∈ N∗ tel
que f p soit une contraction. Alors f admet un point fixe unique vers lequel converge toute suite
xn = f n (x0 ) où x0 ∈ E est arbitraire.

Démonstration. D’après le Théorème 6.1.1, l’application f p admet un point fixe unique a. De


l’égalité f p (a) = a, il vient f p (f (a)) = f p+1 (a) = f (f p (a)) = f (a), ce qui montre que f (a) est
un point fixe pour f p . De part l’unicité de ce dernier, on obtient f (a) = a. De plus si b est un point
fixe pour f , c’en est un pour f p d’où b = a.
Définissons alors la suite (xn ) par xn = f n (x0 ) où x0 ∈ E est arbitraire. Les p suites suivantes :

{(f p )m (x0 )} = {xpm }

{(f p )m (x1 )} = {xpm+1 }


..
.
{(f p )m (xp−1 )} = {xpm+p−1 }
convergent alors vers l’unique point fixe a de f p quand m tend vers l’infini. On obtient donc bien
que (xn ) converge vers a.

Quand l’application f dépend d’un paramètre, il peut être intéressant d’étudier la dépendance du
point fixe par rapport au paramètre. C’est l’objet du

Théorème 6.1.3 Soit une application f : Λ × E → E où (E, d) et (Λ, δ) sont deux espaces
métriques (E, d) étant complet. On suppose que, pour tout λ ∈ Λ, l’application partielle fλ =
f (λ, .) est une contraction de rapport k indépendant de λ. On suppose également que, pour tout
x ∈ X, l’application partielle fx = f (., x) est continue.
Alors le point fixe xλ de fλ dépend continuement du paramètre λ.

Démonstration
Soit λ0 ∈ Λ et  > 0. On a, pour tout λ ∈ Λ

d(xλ , xλ0 ) = d(fλ (xλ ), fλ0 (xλ0 ))


≤ d(fλ (xλ ), fλ (xλ0 )) + d(fλ (xλ0 ), fλ0 (xλ0 ))
≤ kd(xλ , xλ0 ) + d(fλ (xλ0 ), fλ0 (xλ0 )),

d’où
(1 − k)d(xλ , xλ0 ) ≤ d(fλ (xλ0 ), fλ0 (xλ0 )).
Utilisons la continuité de fx0 avec x0 = xλ0 . Il existe η > 0 tel que, pour tout λ ∈ B(λ0 , η),

d(f (λ, xλ0 ), f (λ0 , xλ0 ) ≤ (1 − k).

107
Il en résulte que, pour tout λ ∈ B(λ0 , η),

(1 − k)d(xλ , xλ0 ) ≤ (1 − k),

d’où
d(xλ , xλ0 ) ≤ ,
ce qui achève la démonstration. 

Remarque 6.1.1 Dans la démonstration précédente, on a eu besoin de la continuité de la seule


application partielle fx0 où x0 = xλ0 .

6.2 Equations Différentielles : Généralités


Dans toute la suite un intervalle de R sera supposé non réduit à un point. Etant donné une
fonction f : I −→ E où I est un intervalle de R et E est un espace normé, on dit que f (.) est
dérivable en t0 ∈ I si le rapport (f (t) − f (t0 ))/t − t0 admet une limite quand t tend vers t0 en
restant dans I et on pose

f 0 (t0 ) := lim (f (t) − f (t0 ))/(t − t0 ).


I
t−→t0

Quand t0 est l’une des extrémités de I on obtient par cette définition la dérivée à droite ou à gauche
en t0 .

Définition 6.2.1
E QUATION D IFF ÉRENTIELLE DU P REMIER O RDRE
Soit U ⊂ R × R un ouvert et f : U −→ R une fonction. Une solution de l’équation différentielle
x0 (t) = f (t, x(t)) consiste en la donnée d’un intervalle I ⊂ R et d’une fonction dérivable x :
I −→ R telle que, pour tout t ∈ I,

(t, x(t)) ∈ U et x0 (t) = f (t, x(t)).

S YST ÈME D ’E QUATIONS DU P REMIER O RDRE


Soit U un ouvert de R × Rn et f1 , . . . fn : U −→ R des fonctions. On définit de façon analogue
une solution du système d’équations différentielles :

0
 x1 (t) = f1 (t, x1 (t), . . . , xn (t))

.. (6.1)
.
 x0 (t) = f (t, x (t), . . . , x (t))

n n 1 n

comme étant la donnée d’un intervalle I et de n fonctions dérivables x1 , . . . , xn : I −→ R telles


que, pour tout t ∈ I, on ait (t, x1 , . . . , xn (t)) ∈ U et que (6.1) soit vérifié.
E QUATIONS D IFF ÉRENTIELLES V ECTORIELLES DU P REMIER O RDRE

108
Posons x = (x1 , . . . , xn ), le système (6.1) se réduit alors à une seule équation écrite sous forme
vectorielle en définissant une application f : U −→ Rn par f (t, x) = (f1 (t, x), . . . , fn (t, x)).
Une solution de l’équation est la donnée d’un intervalle I et d’une fonction vectorielle dérivable
x : I −→ Rn telle que, pour tout t ∈ I, on ait

(t, x(t)) ∈ U et x0 (t) = f (t, x(t)).

L’ensemble {(t, x(t)) : t ∈ I} ⊂ U est alors appelé trajectoire associée à la solution x(.),
l’ensemble {x(t) : t ∈ I} ⊂ Rn est alors appelé orbite de la solution (I, x). Deux trajectoires
différentes peuvent avoir la même orbite.
On remarque que si I = (a, b], (resp. I = [a, b)) l’équation vérifiée en t = b (resp. t = a) est
x0g (b) = f (t, x(b)) (resp. x0d (a) = f (t, x(a))) où x0g (b) (resp. x0d (a)) est la dérivée à gauche en
t = b (resp. à droite en t = a).
Il est important de bien comprendre le mécanisme de transformation d’un système en une équation
unique.
P ROBL ÈME DE C AUCHY
Etant donné (t0 , x0 ) ∈ U , résoudre le problème de Cauchy avec les données (t0 , x0 ) c’est trouver
une solution (I, x(.)) de l’équation différentielle x0 (t) = f (t, x(t)) telle que t0 ∈ I et
 0
x (t) = f (t, x(t)) pour tout t ∈ I
x(t0 ) = x0 .

Remarquons que si la fonction f est continue, toute solution est alors continuement dérivable car
la fonction t 7→ f (t, x(t)) est continue sur I comme composée de deux applications continues.
E QUATIONS D ’O RDRE S UP ÉRIEUR
Soient p ∈ N, U un ouvert de R × Rp et f : U −→ R une fonction. Une solution de l’équation
différentielle d’ordre p associée à la fonction f est la donnée d’un intervalle I et d’une fonction p
fois dérivable x : I −→ R telle que, pour tout t ∈ I, on ait

(t, x(t), x0 (t), . . . , x(p−1) (t)) ∈ U et x(p) (t) = f (t, x(t), x0 (t), .., x(p−1) (t))

où x(i) désigne la dérivée i eme de x(.). Une telle équation se ramène à une équation vectorielle
du premier ordre en introduisant de nouvelles variables z1 , · · · , zp par

z1 = x
z2 = x0
..
.
zp = x(p−1)

de telle sorte que

z10 = x0 = z2

109
z20 = x00 = z3
..
.
0 (p−1)
zp−1 =x = zp
zp0 = x(p) = f (t, x, x0 , · · · , x(p−1) ) = f (t, z1 , · · · , zp ).

Il en résulte que z 0 = g(t, z) avec g : U −→ Rp définie par

g(t, z) = (z2 , . . . , zp , f (t, z1 , . . . , zp )). (6.2)

Réciproquement, si (I, z) est une solution de (6.2) et si l’on pose x = z1 , on a

x0 (t) = z10 (t) = z2 (t)


x00 (t) = z20 (t) = z3 (t)
..
.
0
x(p−1) (t) = zp−1 (t) = zp (t)
x(p) (t) = zp0 (t) = f (t, z1 (t), . . . , zp (t))

donc x(p) (t) = f (t, x(t), · · · , x(p−1) (t).


De manière analogue une équation différentielle vectorielle d’ordre supérieur

x(p) (t) = f (t, x(t), x0 (t), .., x(p−1) (t)),

où x(t) ∈ Rn et f : U −→ Rn avec U ouvert de R × Rnp se ramène également à une équation


vectorielle du premier ordre en introduisant g : U −→ Rnp

g(t, z) = (z2 , . . . , zp , f (t, z1 , . . . , zp )).

E QUATIONS AUTONOMES
Une équation différentielle autonome est une équation où la variable t ne figure pas explicitement
dans le second membre, elle est donc de la forme

x0 (t) = f (x(t))

où f : U −→ Rn , U étant un ouvert de Rn

Remarque 6.2.1 Si x(.) est une solution de l’équation autonome x0 (t) = f (x(t)) définie sur I et
si t0 ∈ R, la fonction z(t) := x(t + t0 ) définie sur l’intervalle translaté I − t0 est aussi solution.
Les orbites associées à ces deux solutions sont identiques mais les trajectoires associées ne le sont
pas.

110
Remarque 6.2.2 Toutes les équations différentielles peuvent être ramenées à la forme autonome.
En effet considérons un ouvert U ⊂ Rn × R et soit f : U −→ Rn une application. Posons

z1 = x1
..
.
zn = xn
zn+1 = t

et introduisons l’application g : U ⊂ Rn+1 → Rn+1 définie par

g(z) = g(z1 , . . . , zn+1 ) := (f (z1 , . . . , zn+1 ), 1).

Soit (x1 , . . . , xn , s0 ) ∈ U , supposons connue une solution (I, z(.)) de l’équation autonome
 0
z (s) = g(z(s)) sur I,
z(s0 ) = (x1 , .., xn , s0 ).
0
On a donc zn+1 (s) = 1 et zn+1 (s0 ) = s0 , donc zn+1 (s) = s sur I. Il en résulte que, pour tout
s ∈ I, on a  0
x (s) = f (x(s), s)
x(s0 ) = (x1 , . . . , xn ),
ce qui montre bien le résultat annoncé.

Les équations autonomes ont une interprétation géométrique simple. A tout point x ∈ U est
attaché un vecteur f (x) ∈ Rn . Une trajectoire de l’équation différentielle x0 (t) = f (x(t)) est
donc une courbe contenue dans U telle qu’en chacun de ses points x, le vecteur f (x) soit tangent
à la courbe.

6.3 Résolution Locale du Problème de Cauchy


Définition 6.3.1 Soit U une partie de R × Rn et f : U −→ Rp . On dit que f est Lipschitzienne
par rapport à la deuxième variable s’il existe k ∈ R+ tel que, pour tout (t, x), (t, z) ∈ U ,
kf (t, x) − f (t, z)k ≤ kkx − zk.
On dit que f est localement Lipschitzienne par rapport à la deuxième variable, si pour tout
(t, x) ∈ U , il existe un voisinage de (t, x) sur lequel f est Lipschitzienne par rapport à la deuxième
variable.

Exemple 6.3.1 Si f est de classe C 1 sur U c’est-a-dire si f1 , · · · , fp possèdent des dérivées par-
tielles continues sur U , alors f est localement Lipschitzienne par rapport à la deuxième variable.

Pour résoudre le problème de Cauchy, nous aurons besoin du lemme technique suivant :

111
Lemme 6.3.1 Soient U un ouvert de R × Rn et f : U −→ Rn une application continue sur U
et localement Lipschitzienne par rapport à la deuxième variable. Alors, pour tout (t0 , x0 ) ∈ U , il
existe k ≥ 0, l, r > 0 tels que
i) S := [t0 − l, t0 + l] × B̄(x0 , r) ⊂ U

ii) r ≥ M l où M = sup(t,x)∈S kf (t, x)k,

iii) f est k-Lipschitzienne par rapport à la deuxième variable sur S et kl < 2.

Démonstration. Comme U est ouvert, il existe η > 0, ρ > 0, k ≥ 0 tels que

Σ = [t0 − η, t0 + η] × B̄(x0 , ρ) ⊂ U.

Comme f est localement Lipschitzienne par rapport à la deuxième variable, on peut qupposer
quitte à diminuer au besoin η et ρ que f soit k-Lipschitzienne sur Σ. Remarquons que l’application
continue f est bornée sur tout compact. On pose alors µ = sup(t,x)∈Σ kf (t, x)k, on choisit 0 <
l < min(η, ρ/µ, 2/k)), et on pose r = µl. On a alors S ⊂ U où S = [t0 − l, t0 + l] × B̄(x0 , r).
En effet, on a l < η et r = µl < ρ. De plus r = µl ≥ M l où M = sup(t,x)∈S kf (t, x)k car µ ≥M.
Enfin iii) est vérifié de manière évidente.
La proposition suivante est un outil important.
Proposition 6.3.1 Soient U un ouvert de R × Rn et f : U −→ Rp une application continue sur
U et localement Lipschitzienne par rapport à la deuxième variable et soit (t0 , x0 ) ∈ U . Alors il
existe η > 0 et ρ > 0 tel que pour tout (t1 , x1 ) ∈ Σ := [t0 − η, t0 + η] × B̄(x0 , ρ), il existe une
solution x : [t1 − η, t1 + η] −→ Rn de
 0
x (t) = f (t, x(t)) pour tout t ∈ [t1 − η, t1 + η]
(6.3)
x(t1 ) = x1 .

De plus, pour tout intervalle J 3 t1 et pour toute solution y(.) de


 0
y (t) = f (t, y(t)) pour tout t ∈ J
y(t1 ) = x1 ,

il existe 0 < δ ≤ η tel que y(t) = x(t) pour tout t ∈ [t1 − δ, t1 + δ] ∩ J.


Démonstration. Choisissons l, r, k comme dans le Lemme 6.3.1 et posons η = l/2 et ρ = r/2,
de telle sorte que pour (t1 , x1 ) ∈ [t0 − η, t0 + η] × B̄(x0 , ρ), on a

Σ := [t1 − η, t1 + η] × B̄(x1 , ρ) ⊂ [t0 − l, t0 + l] × B̄(x0 , r).

Introduisons I = [t1 − η, t1 + η] et l’ensemble X = C(I, B̄(x1 , ρ)) des fonctions continues de


I dans B̄(x1 , ρ). L’ensemble X est un espace métrique complet quand on le munit de la distance
d(x, z) = kx − zk∞ = supt∈I kx(t) − z(t)k. Remarquons que x(.) solution de (6.3) équivaut à
Z t
x(.) continue et pour tout t ∈ I, x(t) = x1 + f (s, x(s)) ds.
t1

112
Ceci découle de la continuité de s 7→ f (s, x(s)) comme composée de deux fonctions continues.
Pour x(.) ∈ X, posons pour tout t ∈ I
Z t
T x(t) = x1 + f (s, x(s)) ds.
t1

On a Z t

kT x(t) − x1 k ≤ kf (s, x(s))k ds ,
t1

(la valeur absolue permet de traiter les cas t ≤ t1 et t ≥ t1 ). Or, par l’inégalité triangulaire, on a
(s, x(s)) ∈ S = [t0 − l, t0 + l] × B̄(x0 , r), d’où kf (s, x(s))k ≤ M . On obtient donc, pour tout
t∈I
kT x(t) − x1 k ≤ M η ≤ ρ,
ce qui montre que T x(t) ∈ B̄(x1 , ρ) et donc que T x(.) ∈ X. Par ailleurs, pour tout x(.) et
z(.) ∈ X et pour tout t ∈ I, on a
Z t

kT x(t) − T z(t)k ≤ kf (s, x(s)) − f (s, z(s))k ds

Zt1t

≤ kkx(s) − z(s)kds ,
t1

car (s, x(s)), (s, z(s)) ∈ S et f est k-Lipschitzienne par rapport à la deuxième variable sur S. Il
en résulte que pour tout t ∈ I
Z t

kT x(t) − T z(t)k ≤ kx − zk∞ ds

t1
≤ kηkx − zk∞ ,

ce qui montre que d(T x(.), T z(.)) ≤ kη d(x(.), z(.)) et donc que T (.) est une contraction sur
C(I) car kη < 1. D’après le Theorème 6.1.1, on obtient que T (.) admet donc un point fixe unique
x(.) ∈ X qui vérifie donc T x(.) = x(.). Ainsi pour tout t ∈ I
Z t
x(t) = x1 + f (s, x(s))ds,
t1

ce qui montre bien que x(.) est solution de (6.3).


Soit alors J 3 t1 et y(.) solution de
 0
y (t) = f (t, y(t)) pour tout t ∈ J
y(t1 ) = x1 .

Par continuité de y(.), il existe 0 < δ ≤ η tel que y(t) ∈ B̄(x1 , ρ) pour tout t ∈ [t1 − δ, t1 + δ].
Posons I1 = J ∩ [t1 − δ, t1 + δ] et X1 = C(I1 , B̄(x1 , ρ)) et posons pour x(.) ∈ X1 et t ∈ I1 ,
Z t
Gx(t) = x1 + f (s, x(s)) ds.
t1

113
L’application G est une contraction (même raisonnement que dans la première partie de la démons-
tration) et y|I1 et x|I1 sont des points fixes de G, d’où y|I1 = x|I1 , ce qui achève la démonstration.

Remarque 6.3.1 Le résultat précédent est important car il permet de conclure qu’il existe η > 0
tel que, pour tout point (t1 , x1 ) voisin de (t0 , x0 ) ∈ U , la solution prenant la valeur x1 en t1 est
définie sur un intervalle centré en t1 dont la longueur est au moins égale à 2η.
Le résultat suivant est très utile.
Théorème 6.3.1 T H ÉOR ÈME D ’U NICIT É G LOBALE. Soit U un ouvert de R×Rn et f : U −→ Rn
une application continue sur U et localement Lipschitzienne par rapport à la deuxième variable.
Soient (I, ϕ(.)) et (J, ψ(.)) deux solutions de l’équation différentielle x0 (t) = f (t, x(t)). On sup-
pose que ϕ(.) et ψ(.) coı̈ncident en un point t0 ∈ I ∩ J. Alors ϕ(.) = ψ(.) sur I ∩ J.
Démonstration. Soit I0 = {t ∈ I ∩ J : ϕ(t) = ψ(t)}. Par hypothèse, I0 6= ∅. Nous allons
montrer que I0 est à la fois un ouvert et un fermé de I ∩ J ce qui montrera que I0 = I ∩ J car
I ∩ J est connexe. Il est clair que I0 est fermé comme ensemble de coı̈ncidence de deux fonctions
continues. Montrons que I0 est ouvert dans I ∩ J. Soit t1 ∈ I0 , on a ϕ(t1 ) = ψ(t1 ) := ξ1 et
(t1 , ξ1 ) ∈ U . D’après la Proposition 6.3.1, il existe η > 0 et z : [t1 − η, t1 + η] −→ Rn solution,
sur l’intervalle [t1 − η, t1 + η], de
 0
z (t) = f (t, z(t))
z(t1 ) = ξ1 .
Comme ϕ(t1 ) = ψ(t1 ) = z(t1 ) = ξ1 , le résultat d’unicité de la Proposition 6.3.1 nous permet de
conclure à l’existence de 0 < δ ≤ η tel que ϕ(.) = ψ(.) = z(.) sur I ∩ J ∩ [t1 − δ, t1 + δ] ce qui
montre que I ∩ J ∩ [t1 − δ, t1 + δ] ⊂ I0 . O n a donc bien démontré que I0 était ouvert dans I ∩ J,
ce qui achève la démonstration.

On obtient alors le :
Théorème 6.3.2 T H ÉOR ÈME D ’E XISTENCE ET U NICIT É L OCALE . Soient U un ouvert de
R × Rn et f : U → Rp une application continue sur U et localement Lipschitzienne par rapport
à la deuxième variable. Alors,
EXISTENCE : pour tout (t0 , x0 ) ∈ U , il existe un intervalle I 3 t0 et une solution x(.) définie
sur I de  0
x (t) = f (t, x(t)) pour tout t ∈ I
(6.4)
x(t0 ) = x0 .

UNICIT É : Pour tout intervalle J 3 t0 et pour toute solution y(.) de


 0
y (t) = f (t, y(t)) pour tout t ∈ J
y(t0 ) = x0 .
on a y(t) = x(t) pour tout t ∈ I ∩ J.

114
Démonstration. L’existence découle de la partie a) de la Proposition 6.3.1. L’unicité découle du
Théorème 6.3.1.

6.4 Solution Globale du Problème de Cauchy


Définition 6.4.1
a) Soient (I1 , x1 (·)) et (I2 , x2 (·)) deux solutions d’une équation différentielle x0 (t) = f (t, x(t)).
On dit que (I2 , x2 (·)) est un prolongement de (I1 , x1 (·)) si I1 ⊂ I2 et si x2 (·)|I1 = x1 (·).
b) On dit que la solution (I, x(·)) de l’équation différentielle x0 (t) = f (t, x(t)) est maximale
si son seul prolongement est (I, x(·)).
c) On dit qu’une solution x(.) de l’équation différentielle x0 (t) = f (t, x(t)) où f : I × U −→
R avec U ⊂ Rn est globale si elle est définie sur I tout entier.
n

d) Si ((a, b[, x(.)) est une solution de l’équation x0 (t) = f (t, x(t)), on appelle bout droit de
x(.) l’ensemble éventuellement vide

{(b, ξ) : ∃ (ti , ξi )i∈N −→ (b, ξ), ξi = x(ti )},

(définition analogue pour le bout gauche).

Remarque 6.4.1 Si f : U −→ Rn est continue sur U ouvert de R × Rn et localement Lipschit-


zienne par rapport à la deuxième variable, alors l’intervalle de définition d’une solution maximale
(I, x) est toujours ouvert. En effet si I = (a, b] on a (b, x(b)) ∈ U donc on peut prolonger x à
un intervalle de la forme (a, b + η[ d’après le Théorème 6.3.2, ce qui contredit la maximalité de
(I, x).

Théorème 6.4.1 Soient U un ouvert de R × Rn et f : U −→ Rn une application continue sur U


et localement Lipschitzienne par rapport à la deuxième variable. Alors pour tout (t0 , x0 ) ∈ U , il
existe une unique solution maximale (I, x(.)) de
 0
x (t) = f (t, x(t)) pour tout t ∈ I
x(t0 ) = x0 .

De plus les bouts (voir définition 6.4.1) de cette solution appartiennent à la frontière ∂U = U \U
de U .

Démonstration. D’après le Théorème 6.3.2 il existe une solution locale (I, x(.)) du problème de
Cauchy  0
x (t) = f (t, x(t)) pour tout t ∈ I
x(t0 ) = x0 .
Considérons l’ensemble de toutes les solutions locales (I, x(·)) de ce problème. Introduisons la
réunion I max de tous les intervalles I corespondants, I max est un intervalle car tous les intervalles
I contiennent t0 . Soient (I1 , x1 (·)) et (I2 , x2 (·)) deux solutions. Comme x1 (t0 ) = x2 (t0 ) = x0

115
on a x1 = x2 sur I1 ∩ I2 d’après le Théorème 6.3.1. Il y a donc un sens à définir ϕ sur Imax par
ϕ(t) = x(t) si t ∈ I avec (I, x(·)) solution du problème de Cauchy. Il est clair que (Imax , ϕ)
est solution et que cette solution est maximale. En effet si (I, ψ) prolonge (I max , ϕ), on a alors
I ⊂ Imax ⊂ I et ψ = ϕ sur I = Imax . Soit alors (I, ψ(.)) une autre solution maximale. On a alors
I ⊂ I scriptsize max , et d’après le Théorème 6.3.1 ψ = ϕ sur I ∩ Imax = I, ce qui montre que
(Imax , ϕ) prolonge (I, ψ(·)), donc (Imax , ϕ) = (I, ψ(·)) du fait de la maximalité de (I, ψ(·)).
Montrons enfin que les bouts de ϕ(.) sont contenus dans ∂U . On sait (c.f remarque 6.4.1)
que l’intervalle Imax est de la forme ]a, b[. Soit alors ξ ∈ Rn et une suite (ti )i∈N → b telle que
ϕ(ti ) → ξ, on a (b, ξ) ∈ Ū . Il reste à montrer que (b, ξ) 6∈ U . Supposons le contraire. On a donc
(b, ξ) ∈ U . Soient η et ρ associés à (b, ξ) dans la Proposition 6.3.1, on peut supposer, quite à
diminuer η, que a < b − η. Pour i assez grand on a (ti , x(ti )) ∈]b − η, b + η[×B̄(ξ, ρ). Il existe
donc une solution ψ(.) de
 0
ψ (t) = f (t, ψ(t)) pour tout t ∈ [ti − η, ti + η]
ψ(ti ) = ϕ(ti ),

de sorte que b ∈]ti − η, ti + η[. Définissons alors x : (a, ti + η] −→ Rn par



 ϕ(t) if t ∈ (a, ti ]
x(t) =
ψ(t) if t ∈ [ti , ti + η].

Il est clair que x est solution de x0 (t) = f (t, x(t)) sur (a, ti + η] et x(ti ) = ϕ(ti ). D’après le
Théorème 6.3.1, on a donc x = ϕ sur (a, b[ et x(t) est défini pour des valeurs de t supérieures à b,
ce qui contredit la maximalité de ϕ.

Exemple 6.4.1
a) Considérons l’équation x0 (t) = x(t)2 , x(0) = x0 > 0. La solution est x(t) = x0 /(1 − x0 t).
La solution maximale est définie sur l’intervalle ] − ∞, 1/x0 [ elle n’est donc pas globale.
b) L’unicité d’une solution maximale n’est pas toujours assurée comme le montre l’exemple
suivant. Le problème de Cauchy :
 0
x (t) = 2|x(t)|1/2 ,
x(0) = 0,

possède une infinité de solutions globales. En effet pour tout τ ∈ R+ la fonction



(t − τ )2 si t ≥ τ,
xτ (t) =
0 si t ≤ τ,

est solution. On remarque bien sûr que f (t, x) = |x|1/2 définie sur U = R×R n’est pas localement
Lipschitzienne au voisinage d’un élément de la forme (t0 , 0).

On a alors le

116
Corollaire 6.4.1 Soient U un ouvert de R × Rn et f : U −→ Rn une application continue sur
U et localement Lipschitzienne par rapport à la deuxième variable. Alors pour toute solution
maximale (]a, b[, x) et pour tout compact K ⊂ U , il existe ε > 0 tel que (t, x(t)) ∈
/ K pour tout
t ∈]a, b[\]a + ε, b − ε[. De plus, si U = R × Rn , on a
b = +∞ ou lim kx(t)k = +∞
t→b
et
a = −∞ ou lim kx(t)k = +∞.
t→a

Démonstration. Raisonnons par l’absurde. Si la première conclusion du Corollaire n’est pas


1
vraie, il existe une suite (ti )i∈N∗ telle que pour tout i ∈ N∗ , on ait (ti , x(ti )) ∈ K et a < ti ≤ a+
n
1 1 ∗
ou b − ≤ ti < b. On peut alors supposer disons que b − ≤ ti < b pour tout i ∈ N . Comme
n n
K est compact, il en résulte qu’il existe un élément du bout droit de la solution qui est dans K et
donc dans U , contredisant ainsi le Théorème 6.4.1.
Dans le cas où U = R × Rn , supposons que b < +∞ et que kx(t)k ne tend pas vers +∞
quand t tend vers b. Il existe alors une suite (ti )i∈N qui converge vers b telle que la suite (x(ti ))i∈N
soit bornée. Le bout droit de la solution est donc non vide, ce qui est impossible car ce bout est
contenu, d’après le Théorème 6.4.1, dans la frontière de R×Rn qui est vide. On fait alors le même
raisonnement si a > −∞ et kx(t)k ne tend pas vers +∞ quand t tend vers a.

Remarque 6.4.2 Soit x : [a, b[→ Rn une solution de l’équation x0 (t) = f (t, x(t)) où f : U → Rn
est continue sur l’ouvert U ⊂ R × Rn et localement Lipschitzienne par rapport à x. On suppose
que limt→b x(t) = ξ existe et que (b, ξ) ∈ U . Alors il existe un prolongement de x(.) à droite de b.
En effet on peut prolonger x(.) par continuité en b en posant x(b) = ξ. On peut alors passer à la
limite sur t → b dans l’égalité
Z t
x(t) = x(a) + f (s, x(s)) ds,
a
0
ce qui implique x (b) = f (b, x(b)). Le Théorème 6.3.2 montre alors l’existence d’une solution y(.)
de y 0 (t) = f (t, y(t)), y(b) = ξ définie sur un intervalle de la forme [b, b + η] qui par recollement
avec x(.) fournit le prolongement annoncé.
On peut donner un résultat d’existence et d’unicité globale dans le cas suivant.
Théorème 6.4.2 Soient U un ouvert de R × Rn et f : U −→ Rn une application continue. On
suppose que f est Lipschitzienne par rapport à la deuxième variable sur [a, b] × Rn ⊂ U . Alors
pour tout (t0 , x0 ) ∈ [a, b] × Rn , il existe une unique solution globale ([a, b], x(.)) de
 0
x (t) = f (t, x(t)) pour tout t ∈ [a, b]
(6.5)
x(t0 ) = x0 .
De plus, si U = I × Rn où I est un intervalle ouvert et si f est Lipschitzienne par rapport à la
n n
 b]0 × R pour tout [a, b] ⊂ I, alors, pour tout (t0 , x0 ) ∈ I × R , il existe
deuxième variable sur [a,
x (t) = f (t, x(t)) sur I
une unique solution de définie sur I tout entier.
x(t0 ) = x0

117
Démonstration. Soit k ≥ 0 telle que f soit k-Lipschitzienne par rapport à la deuxième variable
sur [a, b] × Rn ⊂ U et soit X = C([a, b], Rn ). Pour tout x ∈ X, posons

kxk = max e−2k|t−t0 | kx(t)k = ke−2k|·−t0 | x(·)k∞ .


t∈[a,b]

On a kxk ≤ kxk∞ ≤ e2r kxk avec r = max(|b − t0 |, |a − t0 |) (vérification immédiate). Les normes
k · k et k · k∞ sont donc équivalentes. On en déduit que (X, k · k) est un espace de Banach. Pour
tout x ∈ X et pour tout t ∈ [a, b], posons
Z t
T (x)(t) = x0 + f (s, x(s)) ds.
t0

On définit ainsi une application T de X dans X. Pour tout x1 , x2 ∈ X et pour tout t ∈ [a, b], on a
Z t
kT (x1 )(t) − T (x2 )(t)k ≤ kf (s, x1 (s)) − f (s, x2 (s))k ds

t0
Z t
≤ kkx1 (s) − x2 (s)k ds

t0
Z t
2k|s−t0 |
≤ ke kx1 − x2 k ds

t0
2k|t−t0 |
e
≤ kx1 − x2 k.
2
On a donc
1
kT (x1 )(t) − T (x2 )(t)ke−2k|t−t0 | ≤ kx1 − x2 k,
2
d’où, passant à la borne supérieure sur t ∈ [a, b],
1
kT (x1 ) − T (x2 )k ≤ kx1 − x2 k,
2
ce qui montre que T possède un unique point fixe qui est alors l’unique solution de (6.5).
Supposons alors que U = I × Rn avec I =]a, b[ et que f est Lipschitzienne par rapport à la
deuxième variable sur [a, b] × Rn pour tout [a, b] ⊂ I. Considérant des suites (ai )i∈N et (bi )i∈N
convergeant respectivement 0 vers a et b. Pour tout i assez grand, on a t0 ∈ [ai , bi ], notons alors
x (t) = f (t, x(t)) sur [ai , bi ]
xi l’unique solution de obtenue d’après la première partie de la
xi (t0 ) = x0
démonstration. D’après le Théorème 6.3.1, on a xj |[ai ,bi ] = xi pour tout j ≥ i. Il y a donc un sens
à définir x : R −→ Rn par x(t) = xi (t) pour t ∈ [ai , bi ]. Il est clair que
 x(·) est alors solution de
0 0

x (t) = f (t, x(t)) sur I y (t) = f (t, y(t)) sur I
. De plus, si y : R −→ Rn est solution de ,
x(t0 ) = x0 y(t0 ) = x0
on déduit du résultat d’unicité de la première partie de la démonstration que y|[ai ,bi ] = xi , d’où
y = x.

118
Chapitre 7

Flot d’une Équation Différentielle

7.1 Lemme de Gronwall


Lemme 7.1.1 Soient t0 ∈ [t1 , t2 ] et u, v : [t1 , t2 ] :−→ R+ des fonctions continues telles que
Z t
u(t) ≤ a + u(s)v(s) ds pour tout t ∈ [t1 , t2 ].

t0

Alors Rt
| v(s) ds|
u(t) ≤ ae pour tout t ∈ [t1 , t2 ].
t0

Rt Rt
Démonstration. Supposons que t ∈ [t0 , t2 ] et posons w(t) = t0 u(s)v(s) ds, V (t) = t0 v(s) ds
et ϕ(t) = w(t)e−V (t) . On a

ϕ0 (t) = (w0 (t) − w(t)V 0 (t))e−V (t) = v(t)(u(t) − w(t))e−V (t) ≤ av(t)e−V (t) ,

d’où Z t Z t
0
ϕ(t) = ϕ (s) ds ≤ a v(s)e−V (s) ds = a(1 − e−V (t) ),
t0 t0

et donc
u(t) − a ≤ w(t) = ϕ(t)eV (t) ≤ aeV (t) − a,
Rt
v(s) ds
d’où u(t) ≤ ae t0 . Si t ∈ [t1 , t0 ], introduisons û, v̂ : [−t0 , −t1 ] −→ R+ par û(t) = u(−t) et
v̂(t) = v(−t). Pour tout τ ∈ [−t0 , −t1 ], on a
Z t0 Z τ
û(t) ≤ a + u(s)v(s) ds = a + û(σ)v̂(σ) dσ.
−τ −t0

D’après la première partie de la démonstration, on a


Rτ R t0
v̂(s) ds v(s) ds
û(τ ) ≤ ae −t0
= ae −τ ,

119
d’où avec τ = −t, R t0
v(s) ds
u(t) = û(τ ) ≤ ae t .

Corollaire 7.1.1 Soit U un ouvert de R × Rn , et soit U −→ Rn une application continue sur


U qui est k-Lipschitzienne par rapport à la deuxième variable. Soit x1 x2 : [t1 , t2 ] −→ Rn des
solution de l’équation différentielle x0 (t) = f (t, x(t)). Alors, pour tout t0 , t ∈ [t1 , t2 ], on a
kx1 (t) − x2 (t)k ≤ kx1 (t0 ) − x2 (t0 )kek|t−t0 | .
Rt Rt
Démonstration. On a x1 (t) = x1 (t0 ) + t0 f (s, x1 (s)) ds et x2 (t) = x2 (t0 ) + t0 f (s, x2 (s)) ds,
d’où Z t
kx1 (t) − x2 (t)k ≤ kx1 (t0 ) − x2 (t0 )k + kf (s, x1 (s)) − f (s, x2 (s))k ds

t0
et Z t
kx1 (t) − x2 (t)k ≤ kx1 (t0 ) − x2 (t0 )k + kkx1 (s) − x2 (s)k ds .

t0

Il suffit alors d’appliquer le Lemme de Gronwall avec a = kx1 (t0 ) − x2 (t0 )k, v(t) ≡ k et u(t) =
kx1 (t) − x2 (t)k.

7.2 Tube de solutions


Nous aurons besoin du résultat suivant.
Lemme 7.2.1 Soit I un espace métrique, soit U un ouvert de I × Rq et soit f : U −→ Rp une
application continue sur U et localement Lipschitzienne par rapport à la deuxième variable. Alors
f est Lipschitzienne par rapport à la deuxième variable sur tout compact K ⊂ U .
Démonstration. Supposant le contraire, il existe pour tout n ∈ N des éléments (tn , xn ), (tn , zn ) ∈
K tels que
kf (tn , xn ) − f (tn , zn )k > nkxn − zn k. (7.1)
On peut supposer que les suites ((tn , xn ))n∈N et ((tn , zn ))n∈N convergent vers des éléments (t, x) ∈
K et (t, z) ∈ K. D’après (7.1), on a x = z. Il existe un voisinage V de (t, x) et k ≥ 0 tel que
(t, y1 ) ∈ V et (t, y2 ) ∈ V impliquent kf (t, y1 ) − f (t, y2 )k ≤ kky1 − y2 k. Pour tout n assez grand
on a donc la contradiction
nkxn − zn k < kf (tn , xn ) − f (tn , zn )k ≤ kkxn − zn k.

Notre outil principal est le Lemme de prolongement suivant.

120
Lemme 7.2.2 Soient (E, d) et I des espace métrique, soit S ⊂ E, et soit f : I × S −→ R
une fonction uniformément continue qui est k-Lipschitzienne par rapport à la deuxième variable.
Alors la fonction f˜ : I × E −→ R définie pour tout t ∈ I, x ∈ E par

f˜(t, x) = inf (f (t, z) + kd(x, z))


z∈S

est uniformément continue sur I × E, k-Lipschitzienne par rapport à la deuxième variable et

f˜|I×S = f.

Démonstration. Soient t ∈ I, x ∈ E et z0 ∈ S. Pour tout z ∈ S on a

f (t, z) + kd(x, z) ≥ f (t, z0 ) − kd(z, z0 ) + kd(x, z) ≥ f (t, z0 ) − kd(x, z0 )

car d(z, z0 ) ≤ d(x, z) + d(x, z0 ). On obtient donc que f˜(t, x) ≥ f (t, z0 ) − kd(x, z0 ), d’où f˜ est à
valeurs finies sur I × E. Soient t ∈ I, x1 et x2 ∈ E, pour tout z ∈ S on a

f˜(t, x1 ) ≤ f (t, z) + kd(x1 , z) ≤ f (t, z) + kd(x2 , z) + kd(x1 , x2 )

donc f˜(t, x1 ) ≤ f˜(t, x2 ) + kd(x1 , x2 ), et en échangeant x1 et x2

|f˜(t, x1 ) − f˜(t, x2 )| ≤ kd(x1 , x2 ).

Pour tout x ∈ S on a f˜(t, x) ≤ f (t, x) + kd(x, x) = f (t, x). De plus, pour tout x, z ∈ S on a
f (t, z) + kd(x, z) ≥ f (t, x), d’où f˜(t, x) ≥ f (t, x).
Montrons alors que f˜ est uniformément continue. Soit ε > 0 et soit α > 0 tel que pour
tout z ∈ S, on a |f˜(t, z) − f˜(t0 , z)| ≤ ε pour tout t, t0 ∈ I avec d(t, t0 ) ≤ α. Posons η =
k −1 ε, considérons (t, x), (t0 , x0 ) ∈ I × E tels que d(t, t0 ) ≤ α, d(x, x0 ) ≤ η et z ∈ S tel que
f (t, z) + kd(x, z) ≤ f˜(t, x) + ε. On a

f˜(t0 , x0 ) ≤ f (t0 , z) + kd(x0 , z) ≤ f (t, z) + ε + kd(x0 , x) + kd(x, z) ≤ f˜(t, x) + 3ε,

d’où échangeant t et t0 , il vient |f˜(t0 , x0 ) − f˜(t, x)| ≤ 3ε.


Le résultat suivant nous sera très utile. Il affirme que sous les hypothèses usuelles d’existence
et d’unicité d’une solution, il existe un tube autour de toute solution de l’équation diffŕentielle tel
que, pour toute donnée initiale dans ce tube, il existe une solution définie au moins sur le même
intervalle que la solution de départ.

Théorème 7.2.1 Soit U un ouvert de R × Rn et soit f : U −→ Rn une application continue sur


U et localement Lipschitzienne par rapport à la deuxième variable. Soit x : [t1 , t2 ] −→ Rn une
solution de l’équation différentielle x0 (t) = f (t, x(t)). Alors il existe δ > 0 et M ≥ 0 tels que
pour tout (s0 , z0 ) ∈ U tels que z0 ∈ B̄(x(s0 ), δ) il existe une solution z = zs0 ,z0 du problème de
Cauchy  0
 z (t) = f (t, z(t)) pour tout t ∈ [t1 , t2 ]

z(s0 ) = z0 ,

121
telle que
sup kz(t)k ≤ M.
t∈[t1 ,t2 ]

De plus, il existe c ≥ 0 tel que pour tout t0 ∈ [t1 , t2 ] et pour tout x0 ∈ B̄(x(t0 ), δ), on ait

kzs0 ,z0 (t) − zt0 ,x0 (t)k ≤ c(kz0 − x0 k + |s0 − t0 |) pour tout t ∈ [t1 , t2 ], (7.2)

avec x0 = x(t0 ).

Démonstration. Soit K = {(t, x(t)) : t ∈ [t1 , t2 ], comme K est compact, il existe η > 0 tel
que Kη ⊂ U avec Kη = {(t, z) ∈ Rn : d((t, z), K) ≤ η}. L’application f est uniformément
continue sur le compact Kη ⊂ U et, utilisant le Lemme 7.2.1, elle est Lipschitzienne par rapport à
deuxième variable sur le compact Kη . D’après le lemme précédent appliqué à chaque composante
de f , l’application f se prolonge en une application f˜ : [t1 , t2 ] × Rn −→ Rn continue et k-
Lipschitzienne par rapport à la deuxième variable pour un certain k ≥ 0. Choisissons alors δ tel
que 2ek|t2 −t1 | δ < η. Appliquant le Théorème 6.4.2, il existe alors une solution z : [t1 , t2 ] −→ Rn
de 
 z 0 (t) = f˜(t, z(t)) pour tout t ∈ [t1 , t2 ]

z(s0 ) = z0 .

On remarque que f (t, x(t)) = f˜(t, x(t)) car (t, x(t)) ∈ K pour tout t ∈ [t1 , t2 ]. On a alors, pour
tout t ∈ [t1 , t2 ],
Z t Z t
z(t) = z0 + ˜
f (s, z(s)) ds et x(t) = x(s0 ) + f˜(s, x(s)) ds.
s0 s0

On a donc
Z t
˜ ˜
kz(t) − x(t)k ≤ kz0 − x(s0 )k + (kf (s, z(s)) − f (s, x(s)))k ,

s0

d’où Z t
kz(t) − x(t)k ≤ kz0 − x(s0 )k + kkz(s) − x(s)k ds .

s0

Utilisant le Lemme de Gronwall, on a donc pour tout t ∈ [t1 , t2 ],

kz(t) − x(t)k ≤ kz0 − x(s0 )kek|t−s0 | ≤ kz0 − x(s0 )kek|t1 −t2 | .

Posant δ = e−k|t1 −t2 | η, on en déduit que

kz(t) − x(t)k ≤ η pour tout t ∈ [t1 , t2 ]

pourvu que z0 ∈ B̄(x(s0 ), δ). Cela implique que (t, z(t)) ∈ Kη pour tout t ∈ [t1 , t2 ]. donc
f˜(t, z(t)) = f (t, z(t)) pour tout t ∈ [t1 , t2 ] donc z est bien solution de (7.2). Comme Kη est
compact, il existe bien M ≥ 0 tel que supt∈[t1 ,t2 ] kz(t)k ≤ M .

122
Posons z = zs0 ,z0 (t) et y = zs0 ,z0 (t). On a alors, pour tout t ∈ [t1 , t2 ],
Z t Z t
z(t) = z0 + f (τ, z(τ )) dτ, et y(t) = x0 + f (τ, y(τ )) dτ,
s0 t0

d’où Z t0 Z t
z(t) − y(t) = z0 − x0 + f (s, z(s)) ds + (f (s, z(s)) − f (s, y(s)))
s0 t0
ce qui conduit à
Z t
kz(t) − y(t)k ≤ kz0 − x0 k + C|s0 − t0 | + kkz(τ ) − y(τ )k dτ .

s0

où C = sup(s,u)∈Kη kf (s, u)k. D’après le lemme de Gronwall, on obtient donc

kz(t) − y(t)k ≤ (kz0 − x0 k + C|s0 − t0 |)ek|t2 −t1 | ,

donc
kz(t) − y(t)k ≤ c(kz0 − x0 k + |s0 − t0 |)
avec c = max(C, 1)ek|t2 −t1 | , ce qui achève la démonstration.

7.3 Propriétés du flot d’une équation différentielle


Définition 7.3.1 Soit U un ouvert de R × Rn et soit f : U −→ Rn une application continue sur
U et localement Lipschitzienne par rapport à la deuxième variable. On sait (voir Théorème 6.4.1
du chapitre 6) que pour tout (t0 , x0 ) ∈ U , il existe une solution maximale z : It0 ,x0 −→ Rn du
problème de Cauchy  0
 z (t) = f (t, z(t)) sur It0 ,x0

z(t0 ) = x0 .

Posons
Ω = {(t, t0 , x0 ) ∈ R × R × Rn : t ∈ It0 ,x0 },
et x(·, ·, ·) : Ω −→ Rn définie par
x(t, t0 , x0 ) = z(t).
On dit que l’application x(·, ·, ·) est le flot de l’équation différentielle x0 (t) = f (t, x(t)).

Exemple 7.3.1 Dans le cas d’une équation différentielle linéaire x0 (t) = A(t)x(t), où A : I −→
Mn (R) est une application continue définie sur un intervalle ouvert I, on sait que Ω = I ×I ×Rn
et x(t, t0 , x0 ) = R(t, t0 )x0 .

Théorème 7.3.1 CONTINUIT É DU FLOT. Soit U un ouvert de R × Rn et soit f : U −→ Rn une


application continue sur U et localement Lipschitzienne par rapport à la deuxième variable. Alors
l’ensemble Ω de définition du flot est ouvert et le flot x(·, ·, ·) est continu sur Ω.

123
Démonstration. Soit (s0 , t0 , x0 ) ∈ Ω, de telle sorte que s0 ∈ It0 ,x0 ; notons x : It0 ,x0 −→ Rn la
solution de 
 x(t) = f (t, x(t)) sur It0 ,x0
.
x(t0 ) = x0

Soient t1 , t2 ∈ It0 ,x0 tels que s0 ∈]t1 , t2 [ et [t1 , t2 ] ⊂ It0 ,x0 , et soit ε > 0 tel que [s0 − ε, s0 + ε] ⊂
[t1 , t2 ] ⊂ It0 ,x0 . Soit alors δ > 0 fourni par la conclusion du Théorème 7.2.1. Il existe η > 0 tel que
kx(τ )−x(t0 )k = kx(τ )−x0 k ≤ δ/2 pour tout τ ∈ [t0 −η, t0 +η]. Soit alors τ0 ∈ [t0 −η, t0 +η] et
z0 ∈ B̄(x0 , δ/2) de telle sorte que kx(τ0 ) − z0 k ≤ δ. Il existe donc une solution z : [t1 , t2 ] −→ Rn
du problème  0
 z (t) = f (t, z(t)) sur [t1 , t2 ]

z(τ0 ) = z0 ,

on a donc [t1 , t2 ] ⊂ Is,z0 d’où [s0 − ε, s0 + ε] × [t0 − η, t0 + η] × B̄(x0 , δ) ⊂ Ω et x(t, τ0 , z0 ) = z(t)


pour tout t ∈ [t1 , t2 ] et pour tout (τ0 , z0 ) ∈ [t0 − η, t0 + η] × B̄(x0 , δ). On a donc bien montré que
Ω est ouvert. Montrons alors la continuité de l’application x(·, ·, ·) en (s0 , t0 , x0 ) ∈ Ω. Appliquant
le Théorème 7.2.1, il existe une constante c ≥ 0 telle que tout t ∈ [t1 , t2 ] et pour tout (τ0 , z0 ) ∈
[t0 − η, t0 + η] × B̄(x0 , δ), on ait

kx(t, τ0 , z0 ) − x(t, t0 , x0 )k = kz(t) − x(t)k ≤ c(kz0 − x0 k + |τ0 − t0 |).

On a alors

kx(t, τ0 , z0 ) − x(s0 , t0 , x0 )k ≤ kx(t, τ0 , z0 ) − x(t, t0 , x0 )k + kx(t, t0 , x0 ) − x(s0 , t0 , x0 )k

≤ c(kz0 − x0 k + |τ0 − t0 |) + kx(t) − x(s0 )k.

Comme limt→s0 kx(t) − x(s0 )k = 0, on a donc bien

lim x(t, τ0 , z0 ) = x(s0 , t0 , x0 ).


(t,τ0 ,z0 )→(s0 ,t0 ,x0 )

Nous aurons besoin du résultat technique suivant :

Lemme 7.3.1 Soit U ⊂ R × Rn un ouvert et soit f : U −→ Rn une application de classe C 1 et


soit x ∈ C([t1 , t2 ], Rn ) tel que {(t, x(t)) : t ∈ [t1 , t2 ]} ⊂ U . Alors pour tout y ∈ C([t1 , t2 ], Rn )
assez proche de x, on a {(t, y(t)) : t ∈ [t1 , t2 ]} ⊂ U et

sup kf (t, y(t)) − f (t, x(t)) − J2 f (t, x(t))(y(t) − x(t))k = o(kx − yk∞ ).
t∈[t1 ,t2 ]

Démonstration. L’ensemble K = {(t, x(t)) : t ∈ [t1 , t2 ]} ⊂ U étant compact, il existe η > 0 tel
que l’ensemble compact Kη = {(s, z) ∈ U : d((s, z), K) ≤ η} soit aussi contenu dans U . Soit

124
alors y ∈ C([t1 , t2 ], Rn ) tel que ky − xk ≤ η. Pour tout t ∈ [t1 , t2 ], on a k(t, y(t)) − (t, x(t))k ≤ η
donc (t, y(t)) ∈ Kη ⊂ U d’où (t, y(t)) ∈ U .
Soit t ∈ [t1 , t2 ]. On a alors, utilisant la formule de Taylor au rang 0 avec reste intégral,
f (t, y(t) − f (t, x(t)) − J2 f (t, x(t))(y(t) − x(t)) =
Z 1
(J2 f (t, x(t) + θ(y(t) − x(t)) − J2 f (t, x(t)))(y(t) − x(t) dθ.
0

Par ailleurs, du fait de l’uniforme continuité de J2 f sur le compact Kη , il existe, pour tout ε > 0
un réel δ ∈]0, η[ tel que (s, ξ), (s, ζ) ∈ Kη avec kξ − ζk ≤ δ implique
kJ2 f (s, ξ) − J2 f (s, ζ)k ≤ ε.
Si ky − xk ≤ δ et θ ∈ [0, 1], on a (t, x(t)) ∈ Kη , et
d((t, x(t) + θ(y(t) − x(t))), K) ≤ θky(t) − x(t)k ≤ δ ≤ η,
donc (t, x(t) + θ(y(t) − x(t)) ∈ Kη d’où
kJ2 f (t, x(t) + θ(y(t) − x(t)) − J2 f (t, x(t))k ≤ ε,
donc, pour tout t ∈ [t1 , t2 ], on a
kJ2 f (t, x(t) + θ(y(t) − x(t)) − J2 f (t, x(t)))(y(t) − x(t)k ≤ εky(t) − x(t)k ≤ εky − xk∞ ,
d’où le résultat.

Proposition 7.3.1 Soit U un ouvert de R × Rn et soit f : U −→ Rn une application de classe C 1 .


Alors le flot x(·, ·, ·) possède une différentielle partielle par rapport à la troisième variable qui est
continue, et l’on a, pour tout (t, t0 , x0 ) ∈ Ω,
J3 x(t, t0 , x0 ) = V (t),
où V (·) est l’unique solution de
 0
 V (τ ) = J2 f (τ, x(τ, t0 , x0 ))V (t) sur It0 ,x0

V (t0 ) = In .

Autrement dit, pour tout i ∈ [1, n],


∂x
(t, t0 , x0 ) = v(t)
∂x0i
où v(·) est l’unique solution de
 0
 v (τ ) = J2 f (τ, x(τ, t0 , x0 ))v(t) sur It0 ,x0

v(t0 ) = ei .

125
Démonstration. Soit (t, t0 , x0 ) ∈ Ω. Notons alors x(·) la solution de
 0
 x (τ ) = f (t, x(τ )) sur It0 ,x0

x(t0 ) = x0 ,

et considérons un intervalle [t1 , t2 ] ⊂ It0 ,x0 tel que t ∈]t1 , t2 [. Appliquant le Théorème 7.2.1, pour
tout h assez petit, il existe une solution xh : [t1 , t2 ] −→ Rn de
 0
 xh (τ ) = f (τ, xh (τ )) sur [t1 , t2 ]

xh (t0 ) = x0 + hei .

De plus, il existe M ≥ 0 et c ≥ 0 tels que xh ([t1 , t2 ]) reste contenu dans une boule B̄(0, M ) pour
tout h assez petit et
kxh − xk∞ ≤ c|h|.
On a alors x(τ, t0 , x0 ) = x(τ ) et x(τ, t0 , x0 + hei ) = xh (τ ) pour tout τ ∈ [t1 , t2 ]. Pour tout
τ ∈ [t1 , t2 ], on a alors
 Z τ
 x(τ ) = x0 + f (s, x(s)) ds


t0
Z τ
 xh (τ ) = x0 + hei + f (s, xh (s)) ds,


t0

donc τ
xh (τ ) − x(τ ) f (s, xh (s)) − f (s, x(s))
Z
= ei + ds.
h t0 h
Posons rh (s) = f (s, xh (s)) − f (s, x(s)) − J2 f (s, x(s))(xh (s) − x(s)). Comme kxh (s) − x(s)k ≤
c|h| pour tout s ∈ [t1 , t2 ], on obtient d’après le Lemme 7.3.1 que

sup krh (s)k = o(h). (7.3)


s∈[t1 ,t2 ]

Il en résulte que
τ Z τ
xh (τ ) − x(τ )  x (s) − x(s) 
Z
h
= ei + J2 f (s, x(s)) ds + h−1 rh (s) ds.
h t0 h t0

Soit alors v(·) solution de


 0
 v (τ ) = J2 f (τ, x(τ, t0 , x0 ))v(τ ) sur It0 ,x0

v(t0 ) = ei ,

on a Z τ
v(τ ) = ei + J2 f (s, x(s))v(s) ds.
t0

126
xh (τ ) − x(τ )
Posant uh (τ ) = − v(τ ), on obtient donc
h
Z τ Z τ
uh (τ ) = J2 f (s, x(s))uh (s) ds + h−1 rh (s) ds,
t0 t0

d’où, pour tout τ ∈ [t1 , t2 ] , utilisant (7.3),


Z τ
kuh (τ )k ≤ kJ2 f (s, x(s))kkuh (s)k ds + |h|−1 o(h),

t0
Z τ
≤ C kuh (s)k ds + |h|−1 o(h)

t0

avec C = sups∈[t1 ,t2 ] kJ2 f (s, x(s))k. Utilisant le Lemme de Gronwall, on obtient donc
kuh (τ )k ≤ |h|−1 o(h)eC|τ −t0 | ≤ |h|−1 o(h)eC|t2 −t1 | pour tout τ ∈ [t1 , t2 ],
donc
xh (τ ) − x(s)
lim = v(τ ) pour tout τ ∈ [t1 , t2 ],
h→0 h
d’où le résultat.
∂x
Montrons que les applications Ω 3 (s, s0 , z0 ) 7−→ (s, s0 , z0 ) sont continues pour tout
∂x0i
i ∈ [1, n] en (t, t0 , x0 ) ∈ Ω. Notons V (·) la solution de
 0
 V (τ ) = J2 f (τ, x(τ, t0 , x0 ))V (τ ) sur It0 ,x0

V (t0 ) = In

et W (·) la solution de
 0
 W (τ ) = J2 f (τ, x(τ, s0 , z0 ))W (τ ) sur Is0 ,z0

W (s0 ) = In .

Notons aussi v(·) la solution de


 0
 v (τ ) = J2 f (τ, x(τ, t0 , x0 ))v(τ ) sur It0 ,x0

V vt0 ) = ei

et w(·) la solution de
 0
 w (τ ) = J2 f (τ, x(τ, s0 , z0 ))w(τ ) sur Is0 ,z0

w(s0 ) = ei .

Remarquons que [t1 , t2 ] ⊂ It0 ,x0 ∩ Is0 ,z0 pour tout (s0 , z0 ) voisin de (t0 , x0 ). Il nous faut montrer
que w(s) tend vers w(t) quand (s, s0 , z0 ) tend vers (t, t0 , x0 ). Comme w(s) = W (s)ei et v(t) =
V (t)ei , il suffit de montrer que W (s) tend vers V (t) quand (s, s0 , z0 ) tend vers (t, t0 , x0 ), ce qui
est démontré dans le Lemme 7.3.2 suivant.

127
Lemme 7.3.2 Soit t1 , t2 ∈ R, soient s0 , t0 ∈]t1 , t2 [, et soient V (·) la solution de
 0
 V (τ ) = J2 f (τ, x(τ, t0 , x0 ))V (τ ) sur [t1 , t2 ]

V (t0 ) = In

et W (·) la solution de
 0
 W (τ ) = J2 f (τ, x(τ, s0 , z0 ))W (τ ) sur [t1 , t2 ]

W (s0 ) = In .

Alors, pour tout t ∈]t1 , t2 [, on a

lim W (s) = V (t).


(s,s0 ,z0 )→(t,t0 ,x0 )

Démonstration. Comme

kW (s) − W (t)k ≤ kW (s) − V (s)k + kV (s) − V (t)k

et lims→t V (s) = V (t), il suffit de montrer que kW (s) − V (s)k tend vers 0 quand (s0 , z0 ) tend
vers (t0 , x0 ). On a Z s
W (s) = In + J2 f (τ, x(τ, s0 , z0 ))W (τ ) dτ,
s0
et Z s
V (s) = In + J2 f (τ, x(τ, t0 , x0 ))V (τ ) dτ,
t0

de sorte que
Z s0
kW (s) − V (s)k ≤ kJ2 f (τ, x(τ, t0 , x0 ))V (τ )k dτ +

t0
Z s
kJ2 f (τ, x(τ, s0 , z0 ))W (τ ) − J2 f (τ, x(τ, t0 , x0 ))V (τ )k dτ .


s0

Il en résulte que
Z s
kW (s) − V (s)k ≤ µ|t0 − s0 | + kJ2 f (τ, x(τ, s0 , z0 ))kkW (τ ) − V (τ )k +

s0
Z s
kJ2 f (τ, x(τ, s0 , z0 )) − J2 f (τ, x(τ, t0 , x0 ))kkV (τ )k dτ


s0

avec µ = supτ ∈[t1 ,t2 ] kJ2 f (τ, x(τ, t0 , x0 ))V (τ )k. Comme les applications x(·, ·, ·) et J2 f (·, ·) sont
continues, elles sont bornées sur tout compact, il existe donc c ≥ 0 tel que kJ2 f (τ, x(τ, s0 , z0 )k ≤
c pour tout τ ∈ [t1 , t2 ] et pour tout (s0 , z0 ) voisin de (t0 , x0 ), conduisant à

128
Z s
kW (s) − V (s)k ≤ µ|t0 − s0 | + ckW (τ ) − V (τ )k +

s0
Z s
kJ2 f (τ, x(τ, s0 , z0 )) − J2 f (τ, x(τ, t0 , x0 ))kkV (τ )k dτ


s0

Étant donné ε > 0, il existe, par l’uniforme continuité locale de (τ, s0 , z0 ) 7−→ J2 f (τ, x(τ, s0 , z0 )),
un η > 0 tel que
kJ2 f (τ, x(τ, s0 , z0 )) − J2 f (τ, x(τ, t0 , x0 ))k ≤ ε
pour tout τ ∈ [t1 , t2 ] et pour tout (s0 , z0 ) ∈ B̄((t0 , x0 ), η), ce qui implique
Z s
kW (s) − V (s)k ≤ µ|t0 − s0 | + |t2 − t1 |kV k∞ ε + c kW (τ ) − V (τ )k .

t0

Utilisant de nouveau le lemme de G RONWALL, il vient

kW (s) − V (s)k ≤ (µ|t0 − s0 | + |t2 − t1 |kV k∞ ε)ec(t2 −t1 )

pour tout (s0 , z0 ) ∈ B̄((t0 , x0 ), η), ce qui montre bien que kW (s) − V (s)k tend vers 0 quand
(s0 , z0 ) tend vers (t0 , x0 ).

Proposition 7.3.2 Soit U un ouvert de R × Rn et soit f : U −→ Rn une application de classe


C 1 . Alors le flot x(·, ·, ·) possède une dérivée partielle par rapport à la deuxième variable qui est
continue, et l’on a, pour tout (t, t0 , x0 ) ∈ Ω,
∂x
(t, t0 , x0 ) = w(t)
∂t0
où w(·) est l’unique solution de
 0
 w (t) = J2 f (t, x(t, t0 , x0 ))w(t) sur It0 ,x0

w(t0 ) = −f (t0 , x0 ).

Démonstration. Soit (t, t0 , x0 ) ∈ Ω. Notons alors de nouveau x(·) la solution de


 0
 x (τ ) = f (t, x(τ )) sur It0 ,x0

x(t0 ) = x0 ,

et considérons un intervalle [t1 , t2 ] ⊂ It0 ,x0 tel que t ∈]t1 , t2 [. Notons xh (·) l’unique solution
définie pour tout h assez petit de
 0
 xh (τ ) = f (t, xh (τ )) sur [t1 , t2 ]

x(t0 + h) = x0 ,

129
dont l’existence est garantie par le Théorème 7.2.1. D’après ce même théorème, il existe une
constante c ≥ 0 telle que kxh (τ ) − x(τ )k ≤ c|h| pour tout τ ∈ [t1 , t2 ] et pour tout h assez petit.
On a alors x(t, t0 , x0 ) = x(t) et x(t, t0 + h, x0 ) = xh (t), de plus on a, pour tout τ ∈ [t1 , t2 ],
Z τ Z τ
xh (τ ) = x0 + f (s, xh (s)) ds et x(τ ) = x0 + f (s, x(s)) ds.
t0 +h t0

On a donc
Z τ Z t0
xh (τ ) − x(τ ) = (f (s, xh (s)) − f (s, x(s))) ds + f (s, x(s)) ds.
t0 +h t0 +h

Comme dans la démonstration de la Proposition 7.3.1, on a

sup krh (s)k = o(h).


s∈[t1 ,t2 ]

où rh (s) = f (s, xh (s)) − f (s, x(s)) − J2 f (s, x(s))(xh (s) − x(s)). Il vient alors
Z τ
xh (τ ) − x(τ ) xh (τ ) − x(τ ) 1 t0
Z
−1
= (J2 f (s, x(s)) + h rh (s)) ds + f (s, x(s) ds.
h t0 +h h h t0 +h

Comme w(τ ) = −f (t0 , x0 ) + t0 J2 f (s, x(s))w(s) ds, on obtient
Z τ
xh (τ ) − x(τ )  x (τ ) − x(τ )
h

− w(τ ) = (J2 f (s, x(s)) − w(τ ) + h−1 rh (s)) ds+
h t0 +h h
Z t0 +h
1 t0
Z
J2 f (s, x(s))x(s) ds + (f (s, x(s) − f (t0 , x0 )) ds.
t0 h t0 +h

xh (τ ) − x(τ )
Posant uh (τ ) = − w(τ ), on obtient alors
h
Z τ
kuh (τ )k ≤ k kuh (s)k ds + kδ(h)k + h−1 o(h),

t0 +h

1 t0
Z
avec k = sups∈[t1 ,t2 ] kJ2 f (s, x(s))k < +∞ et δ(h) = (f (s, x(s) − f (t0 , x0 )) ds. Utilisant
h t0 +h
le Lemme de Gronwall, il vient
x (τ ) − x(τ )
h
− w(t) ≤ (kδ(h)k + h−1 o(h))ek|τ −t0 −h| ≤ (kδ(h)k + h−1 o(h))ek|t2 −t1 | .

h

Comme limh→0 δ(h) = 0, on obtient bien que


xh (τ ) − x(τ )
lim = w(τ ) pour tout τ ∈ [t1 , t2 ],
h→0 h
soit
x(τ, t0 + h, x0 ) − x(τ, t0 , x0 )
lim = w(τ ) pour tout τ ∈ [t1 , t2 ],
h→0 h

130
ce qui montre bien que
∂x
(τ, t0 , x0 ) = w(τ ) pour tout τ ∈ [t1 , t2 ].
∂t0

∂x
Montrons alors que l’application Ω 3 (s, s0 , z0 ) 7−→ (s, s0 , z0 ) est continue en (t, t0 , x0 ) ∈
∂t0
Ω. Notons V (·) la solution de
 0
 V (τ ) = J2 f (τ, x(τ, t0 , x0 ))V (τ ) sur It0 ,x0

V (t0 ) = In

et W (·) la solution de
 0
 W (τ ) = J2 f (τ, x(τ, s0 , z0 ))W (τ ) sur Is0 ,z0

W (s0 ) = In .

Notons aussi v(·) la solution de


 0
 v (τ ) = J2 f (τ, x(τ, t0 , x0 ))v(τ ) sur It0 ,x0

V vt0 ) = −f (t0 , x0 )

et w(·) la solution de
 0
 w (τ ) = J2 f (τ, x(τ, s0 , z0 ))w(τ ) sur Is0 ,z0

w(s0 ) = −f (s0 , z0 ).

Remarquons que [t1 , t2 ] ⊂ It0 ,x0 ∩ Is0 ,z0 pour tout (s0 , z0 ) voisin de (t0 , x0 ). Il nous faut montrer
que w(s) tend vers w(t) quand (s, s0 , z0 ) tend vers (t, t0 , x0 ). Comme w(s) = −W (s)f (s0 , z0 ) et
v(t) = −V (t)f (t0 , x0 ), il suffit de montrer que W (s) tend vers V (t) quand (s, s0 , z0 ) tend vers
(t, t0 , x0 ), ce qui est démontré dans le Lemme 7.3.2.

Théorème 7.3.2 DIFF ÉRENTIABILIT É DU FLOT. Soit U un ouvert de R×Rn et soit f : U −→ Rn


une application de classe C 1 . Alors le flot x(·, ·, ·) : Ω ⊂ R × R × Rn −→ Rn est de classe C 1 . De
plus, on a
J3 x(t, t0 , x0 ) = V (t),
où V (·) est l’unique solution de
 0
 V (t) = J2 f (t, x(t, t0 , x0 ))V (t) sur It0 ,x0

V (t0 ) = In .

131
Autrement dit, pour tout i ∈ [1, n],
∂x
(t, t0 , x0 ) = v(t)
∂x0i
où v(·) est l’unique solution de
 0
 v (t) = J2 f (t, x(t, t0 , x0 ))v(t) sur It0 ,x0

v(t0 ) = ei .

De plus, on a
∂x
(t, t0 , x0 ) = w(t)
∂t0
où w(·) est l’unique solution de
 0
 w (t) = J2 f (t, x(t, t0 , x0 ))w(t) sur It0 ,x0

w(t0 ) = −f (t0 , x0 ).

Démonstration. Par définition du flot, on a


∂x
(t, t0 , x0 ) = f (t, x(t, t0 , x0 )).
∂t
∂x
Il en résulte que est continue sur Ω comme composée d’applications continues. De plus, on a
∂t
∂x
montré dans les propositions 7.3.1 et 7.3.2 que J3 x et existaient et étaient continues sur Ω. Il
∂t0
∂x
en résulte bien que x(·, ·, ·) est de classe C 1 sur Ω. Les expressions de J3 x et résultent alors
∂t0
des propositions 7.3.1 et 7.3.2.

Exemple 7.3.2 Considérons l’équation différentielle x0 (t) = (x(t))2 . On a alors


1


 ] − ∞, t0 + [ si x0 > 0
x0




It0 ,x0 = ]t + 1 , +∞[ si x < 0 ,
0 0



 x0

] − ∞, +∞[ si x0 = 0

et  x0
 si x0 6= 0
x(t, t0 , x0 ) = x0 (t0 − t) + 1 .

0 si x0 = 0
S
Soit (t, t0 , x0 ) ∈ Ω = (t0 ,x0 )∈R2 It0 ,x0 × (t0 , x0 ).

132
∂x
Supposons x0 6= 0, on sait, d’après le Théorème 7.3.2, que (t, t0 , x0 ) = v(t) où v(·) est
∂x0
solution de  x0
 v 0 (t) = 2v(t) sur It0 ,x0
x0 (t0 − t) + 1

v(t0 ) = 1,
soit
C
v(t) = 1 2.
(t0 − t + x0
)
Comme v(t0 ) = 1, on trouve C = x−2
0 d’où

1
v(t) = ,
(x0 (t0 − t) + 1)2
∂x
qui est bien égal à (t, t0 , x0 ). On sait aussi que
∂x0
∂x
(t, t0 , x0 ) = w(t)
∂t0
où w(·) est l’unique solution de
 x0
 w0 (t) = 2w(t) sur It0 ,x0
x0 (t0 − t) + 1
w(t0 ) = −x20 ,

x20 ∂x
soit w(t) = − 2
qui est bien égal à (t, t0 , x0 ).
(x0 (t0 − t) + 1) ∂t0
∂x
Si x0 = 0, alors (t, t0 , 0) = v(t) où v(·) est solution de
∂x0
 0
 v (t) = 0 sur R

v(t0 ) = 1,

∂x
soit v(t) ≡ 1 qui est bien égal à (t, t0 , 0). De même, on a
∂x0
∂x
(t, t0 , 0) = w(t)
∂t0
où w(·) est l’unique solution de
 0
 w (t) = 0 sur It0 ,x0

w(t0 ) = 0,

∂x
soit w(t) ≡ 0 qui est bien égal à (t, t0 , 0).
∂t0

133

Vous aimerez peut-être aussi