Académique Documents
Professionnel Documents
Culture Documents
FONDAMENTALES
D. Azé
2008
Table des matières
1
5.4.3 Sous-espace tangent . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
2
Chapitre 1
k · k : E → R+ ,
vérifiant
i) kxk = 0 =⇒ x = 0,
ii) kλxk = |λ|kxk, pour tout λ ∈ R et x ∈ E,
iii) kx + yk ≤ kxk + kyk, pour tout x, y ∈ E.
A toute norme est associée une distance d(x, y) = kx − yk. Un espace normé est un espace
métrique et donc un espace topologique. Une partie U ⊂ E est ouverte si, pour tout a ∈ U , il
existe r > 0 tel que B̄(a, r) ⊂ U où B̄(a, r) = {x ∈ E : kx − ak ≤ r}. Les boules ouvertes
B(a, r) = {x ∈ E : kx − ak < r} sont des ouverts et tout ouvert est réunion d’une famille
de boules ouvertes. Une partie F de E est fermée si son complémentaire est ouvert (les boules
fermées sont des fermés). Une suite (xn ) d’éléments de E est dite converger vers x ∈ E si la suite
réelle (kxn − xk) converge vers 0. On écrit alors x = lim xn ou xn → x. La limite, quand elle
n→∞
existe, est unique ; elle est caractérisée par la propriété :
Les ensembles fermés F sont alors caractérisés par le fait que tout x ∈ E tel que pour tout r > 0,
F ∩ B(x, r) 6= ∅ appartient à F , ce qui équivaut à dire qu’ils contiennent toute limite d’une suite
à valeurs dans F (le démontrer en exercice).
Remarque 1.1.1
a) Pour tout x, y ∈ X on déduit des inégalités
kxk ≤ kx − yk + kyk
3
et
kyk ≤ ky − xk + kxk
que l’on a
|kxk − kyk| ≤ kx − yk.
b) Les applications (λ, x) 7−→ λx et (x, y) 7−→ x + y sont continues respectivement de R × E
dans E et de E × E dans E. En effet si les suites (xn ), (yn ) et (λn ) convergent respectivement
vers x ∈ E, y ∈ E et λ ∈ R, on a
k(xn + yn ) − (x + y)k ≤ kxn − xk + kyn − yk,
kλn xn − λxk = k(λn − λ)xn + λ(xn − x)k
≤ |λn − λ|kxn k + |λ|kxn − xk
≤ |λn − λ|M + |λ|kxn − xk
où M = supkxn k < +∞ car une suite convergente est bornée. Il en résulte bien que x + y =
n∈N
lim (xn + yn ) et que λx = lim λn xn .
n→∞ n→∞
c) Dans le cas où E = Rn , on identifiera u ∈ Rn à une matrice n × 1. Cela donne un sens
au produit matriciel AX ∈ Rn d’une matrice A ∈ M(m, n) par un vecteur X ∈ Rn . Avec ces
notations, le produit scalaire euclidien s’écrit, pour X, Y ∈ Rn ,
n
X
hX, Y i = Y T X = Xi Yi ,
i=1
Etant donnée une famille finie d’espaces normés E1 , · · · , Ed dont les normes sont indifférem-
ment dénotées par k · k. Nous utiliserons sur le produit cartésien E = E1 × · · · × Ed les normes
suivantes (démontrer en exercice que ce sont bien des normes).
Définition 1.1.2 On pose
d
X
k(x1 , · · · , xd )k1 = kxi k,
i=1
d
X 1/2
k(x1 , · · · , xd )k2 = kxi k2 ,
i=1
et plus généralement pour p ≥ 1
d
X p1
k(x1 , · · · , xd )kp = kxi kp ,
i=1
on pose aussi
k(x1 , · · · , xd )k∞ = sup kxi k.
1≤i≤d
n
C’est un exercice facile de montrer qu’une suite (x )n∈N dans E1 × · · · × Ed converge pour ces
normes vers x si et seulement si les d suites (xn i )n∈N convergent vers xi pour tout i ∈ [1, d].
4
1.2 Espaces de Banach
Rappellons que dans un espace métrique (E, d), une suite (xn ) est dite de Cauchy si
lim d(xn , xm ) = 0,
(m,n)→∞
ce qui équivaut à
L’espace métrique (E, d) est dit complet si toute suite de Cauchy est convergente.
Définition 1.2.1 Un espace de Banach est un espace normé (E, k · k) complet pour la distance
associée à la norme k · k.
Exemple 1.2.1
a) Considérons Rd muni de l’une des normes k · k1 , k · k2 , k · k∞ de la définition 1.1.2. On a,
pour tout x ∈ Rd ,
kxk2 ≤ kxk1 ≤ nkxk∞ et kxk∞ ≤ kxk2 .
Ces inégalités montrent que les suites convergentes sont les mêmes pour ces trois normes et qu’une
suite converge si et seulement si les d suites de ses composantes convergent au sens usuel de R
vers des limites qui sont alors les composantes de la limite. L’espace Rd est alors de Banach pour
ces trois normes (il est en fait complet pour toute norme comme on le verra dans la suite de ce
chapitre).
b) Plus généralement un produit fini d’espaces de Banach est de Banach pour les normes de la
définition 1.1.2.
c) Soit p un élément de R tel que 1 ≤ p ≤ ∞, on définit
où ∞
X 1/p
p
kxkp = |xn | si 1 ≤ p < +∞,
n=1
Pour montrer que k · kp est une norme sur `p pour 1 ≤ p < +∞, il faut faire appel aux inégalités
de Hölder et de Minkowski, le cas p = +∞ étant plus simple (voir T.D.). Montrons que `p est
complet pour la norme k · kp . Remarquons que si (xn )n∈N∗ est une suite dans `p , chaque terme xn
est une suite de nombres réels dont les termes sont notés (xni )i∈N∗ . On a donc un tableau infini à
double entrée,
x11 , · · · , x1i , · · ·
..
.
xn1 , · · · , xni , · · ·
..
.
5
Traitons le cas où 1 ≤ p < +∞. Soit (xn )n∈N∗ une suite de Cauchy. Pour tout ε > 0, il existe
n0 ∈ N∗ tel que, pour tout m, n ≥ n0 , on ait
∞
X
|xni − xm p p
i | ≤ ε .
i=1
Pour tout i ∈ N∗ on obtient donc que la suite (xni )n∈N∗ est de Cauchy dans R et converge donc
vers un réel xi . Pour tout N ∈ N∗ , on a
N
X ∞
X
|xni − xm
i |
p
≤ |xni − xm p p
i | ≤ ε .
i=1 i=1
ce qui implique que xn − x ∈ `p d’où x = xn − (xn − x) ∈ `p car `p est un espace vectoriel. Enfin,
passant à la limite sur N dans l’inégalité 1.1, on obtient que pour tout n ≥ n0 ,
kxn − xkp ≤ ε,
d’où le résultat. Dans le cas p = +∞, la démonstration est analogue.
d) On se donne un espace métrique (X, d), un espace normé (Y, k · k) et on considère l’en-
semble Cb (X, Y ) des applications de X dans Y qui sont continues et bornées (i.e. supx∈X kf (x)k <
+∞). On munit Cb (X, Y ) de la norme
kf k∞ = sup kf (x)k.
x∈X
Quand Y = R, on notera simplement Cb (X, R) = Cb (X). C’est un exercice facile de montrer que
(Cb (X, Y ), k·k∞ ) est un espace de Banach quand c’est le cas pour (Y, k·k). Dans le cas particulier
où X = N et Y = R, on retrouve l’exemple c) en remarquant que Cb (N) = `∞ car toute fonction
définie sur N est continue !
e) L’ensemble C 1 ([0, 1]) des fonctions continuement dérivables sur [0, 1] est un espace de Ba-
nach muni de la norme
kf kC 1 = kf k∞ + kf 0 k∞
est un espace de Banach (le démontrer en exercice). Plus généralement il en est de même de
l’ensemble C m ([0, 1]) des fonctions m fois continuement dérivables sur [0, 1] avec m ∈ N∗ muni
de la norme
kf kC m = kf k∞ + kf 0 k∞ + · · · + kf (m) k∞ .
f) L’espace C([0, 1]) des fonctions continues sur [0,1] à valeurs réelles muni de la norme
Z 1
kf k1 = |f (t)| dt
0
6
PnSoit (E, k · k) un espace normé et (xn ) une suite dans E. On pose, pour tout
Définition 1.2.2
n ∈ N, Sn = i=0 xi . On dit que la série de terme général (xn ) converge s’il en est de même de
la suite (Sn ) et on pose
X∞
xi = lim Sn .
n→∞
i=0
On dit que la série de terme général (xn ) est normalement convergente si la série de terme général
(kxn k) est convergente.
Théorème 1.2.1 Dans un espace de Banach (E, k · k), toute série normalement convergente est
convergente et
X∞
X ∞
xn
≤ kxn k.
n=0 n=0
kSn − Sm k = kxm+1 + · · · + xn k ≤ Tn − Tm ,
où Tn = ni=0 kxi k. La suite (Tn ) étant convergente est de Cauchy. Il en est donc de même de
P
(Sn ) qui est donc convergente. Par ailleurs passant à la limite quand n → +∞ dans l’inégalité
kSn k ≤ Tn on obtient que kSk ≤ kT k, d’où le résultat.
Démonstration. Il est clair que i) ⇒ ii) et que iii) ⇒ i) car, pour tout x, y ∈ X,
Il reste à montrer que ii) ⇒ iii). De part la continuité de f en 0, il existe η > 0 tel que, pour tout
z ∈ B(0, η),
kf (z)k = kf (z) − f (0)k ≤ 1.
η
Soit alors x ∈ E\{0}. Remarquant que z := x ∈ B(0, η), on obtient
kxk
η
kf (x)k = kf (z)k ≤ 1,
kxk
7
d’où
kf (x)k ≤ (1/η)kxk.
Remarque 1.3.1 On peut montrer, en utilisant le Théorème de Hahn-Banach, que pour tout es-
pace normé (E, k · k), E ∗ = L(E, R) 6= {0}. On peut aussi montrer qu’il existe des applications
linéaires non continues.
Cette définition a bien un sens car l’ensemble de réels dont on considère la borne inférieure est
non vide (Théorème 1.3.1) et minoré par 0.
Proposition 1.3.1 La fonction k.k définie ci-dessus est une norme sur L(E, F ) et l’on a,
kf (x)k
kf k = sup = sup kf (x)k = sup kf (x)k.
x6=0 kxk kxk≤1 kxk=1
Démonstration. Soit M ≥ 0 tel que kf (x)k ≤ M kxk pour tout x ∈ E. On a donc pour tout
x 6= 0,
kf (x)k
≤ M,
kxk
d’où
kf (x)k
sup ≤ M.
x6=0 kxk
Passant à la borne inférieure sur M , il vient
kf (x)k
sup ≤ kf k.
x6=0 kxk
8
d’où
kf (x)k
sup ≥ kf k
x6=0 kxk
en faisant tendre ε vers 0. On a donc bien
kf (x)k
kf k = sup ,
x6=0 kxk
kf (x)k x
on a alors, notant que = f( )
kxk kxk
kf (x)k
kf k = sup ≤ sup kf (z)k.
x6=0 kxk kzk=1
Par ailleurs
sup kf (x)k ≤ kf k
kxk≤1
d’où le résultat. Nous laissons alors au lecteur le soin de vérifier que la fonction k · k ainsi définie
sur L(E, F ) est une norme.
Remarque 1.3.2
a) Pour montrer qu’une application linéaire est continue, il suffit donc de montrer qu’elle est
bornée sur la boule unité de l’espace de départ.
b) Ce qu’il faut retenir c’est que si une application linéaire de E dans F est telle qu’il existe
M ≥ 0 telle que, pour tout x ∈ E,
kf (x)k ≤ M kxk,
alors f est continue et kf k ≤ M . Notons également que pour tout f ∈ L(E, F ) et pour tout
x ∈ E, on a
kf (x)k ≤ kf kkxk,
on en déduit aisément que, pour tout f ∈ L(E, F ), g ∈ L(F, G), on a
kg ◦ f k ≤ kgkkf k. (1.2)
En effet, pour tout x ∈ E avec kxk ≤ 1
kg(f (x))k ≤ kgkkf (x)k ≤ kgkkf k,
d’où
kg ◦ f k = sup kg(f (x))k ≤ kgkkf k.
kxk≤1
L’inégalité 1.2 ne peut pas être remplacée par une égalité. En effet si f et g sont les projections
orthogonales sur deux sous-espaces orthogonaux non réduits à {0} de Rd , on a g ◦ f = 0 et
kf k = kgk = 1.
9
Exemple 1.3.1
a) Soit E = C([0, 1]) l’ensemble des fonctions continues définies sur [0, 1) muni de la norme
kf k∞ = supt∈[0,1] |f (t)|. L’application L : E −→ R définie par
Z 1
L(f ) = f (t) dt
0
b) Soit 1 < p < +∞ et soit `p défini dans l’exemple 1.2.1 b). Soit 1 < q < +∞ tel que
1 1
+ = 1. Soit y ∈ `q et L : `p −→ R définie pour tout x ∈ `p par
p q
∞
X
L(x) = xn yn .
n=1
kg ◦ f k ≤ kgkkf k. (1.3)
L : L(E, F ) −→ L(E, G)
f 7−→ f ◦ g
et
M : L(F, G) −→ L(E, G)
g 7−→ f ◦ g
sont linéaires. Elles sont aussi continues car pour tout f ∈ L(E, F ), g ∈ L(F, G) il découle de
(1.3) que
kL(f )k ≤ kgkkf k
et
kM (g)k ≤ kf kkgk.
10
Théorème 1.3.2 Soient (E, k · k) un espace normé et (F, k · k) un espace de Banach. Alors
L(E, F ) est un espace de Banach muni de la norme de la Définition 1.3.1.
Démonstration. Soit (fn ) une suite de Cauchy dans L(E, F ). Pour tout ε > 0, il existe n0 ∈ N
tel que, pour tout m, n ≥ n0 ,
Pour tout x ∈ B = B(0, 1), la suite (fn (x)) est de Cauchy, elle converge donc vers un élément
noté ϕ(x). Il existe donc une application
ϕ:B→F
telle que la restriction fn |B converge uniformément vers ϕ. Posons, pour tout x ∈ X\{0}
Il est alors aisé de vérifier, en passant à la limite dans les égalités fn (λx) = λfn (x) et fn (x + y) =
fn (x) + fn (y), que f est linéaire. Montrons que f est continue. En effet en prennant n = n0 et en
faisant tendre m vers l’infini dans (1.4) il vient
d’où
sup kf (x)k ≤ kfn0 k + ε,
kxk≤1
ce qui, compte tenu de la Remarque 1.3.2 a) montre la continuité de f . Enfin, revenant à 1.4, on a
faisant tendre m vers l’infini,
Définition 1.3.2 Soient E et F des espaces normés. On dit que f ∈ L(E, F ) est un isomorphisme
si f est bijective et si f −1 ∈ L(F, E). On note alors Isom (E, F ) l’ensemble éventuellement vide
des isomorphismes de E dans F .
11
Remarque 1.3.3
a) Si E est un espace de Banach et si F est isomorphe à E, alors F est un espace de Banach.
En effet, il existe D > 0 telles que, pour tout y, y 0 ∈ F ,
kf −1 (y) − f −1 (y 0 )k ≤ Dky − y 0 k.
Il en résulte que si (yn ) est de Cauchy dans F alors (f −1 (yn )) est de Cauchy dans E et converge
donc vers un élément x ∈ E, ce qui implique la convergence de (yn ) vers y = f (x).
b) Il est clair que la composée de deux isomorphismes est un isomorphisme.
c) Il existe des applications linéaires continues et bijectives qui ne sont pas des isomorphismes.
Cependant on a le résultat positif suivant que nous démontrerons dans le chapitre 4.
Théorème 1.3.3 Soient E et F des espaces de Banach et soit f ∈ L(E, F ) telle que f est bijec-
tive. Alors f est un isomorphisme.
Définition 1.3.3 On dit que f ∈ L(E, F ) est une isométrie si pour tout x ∈ E
kf (x)k = kxk.
ϕh : R −→ E
t 7−→ th
Théorème 1.3.4 Soient E, F des espaces de Banach, alors Isom (E, F ) est ouvert (éventuellement
vide) dans L(E, F ) et l’application u 7−→ u−1 est continue sur Isom (E, F ).
Démonstration. Soit v ∈ L(E) tel que kvk < 1. LaP série de terme général (v n ) est alors norma-
lement convergente car kv n k ≤ kvkn . Posons Sn = nk=0 v k , on a
v ◦ Sn = Sn ◦ v = Sn+1 − I
12
où I désigne l’application identique de E dans E. Il résulte alors
Pde la continuité des applications
∞
u 7−→ u ◦ v et u 7−→ v ◦ u (voir Exemple (1.3.1), c)) que S = k=0 v k vérifie
(I − v) ◦ S = S ◦ (I − v) = I,
donc que I − v est bijective, c’est donc un isomorphisme d’après le Théorème 1.3.3. Soit alors
u ∈ Isom (E, F ) et v ∈ L(E, F ). On a,
v ∈ Isom(E, F ) → u−1 ◦ v ∈ Isom(E).
Or u−1 ◦ v = I − w avec w = I − (u−1 ◦ v) = u−1 ◦ (u − v). On a,
kwk = ku−1 ◦ (u − v)k ≤ ku−1 kk(u − v)k.
donc B(u, 1/ku−1 k) ⊂ Isom (E, F ). Par ailleurs on a
v −1 = (u ◦ (I − w))−1 = (I − w)−1 ◦ u−1 ,
d’où ∞
X
−1 −1 −1 −1
v −u = ((I − w) − I) ◦ u = wk ◦ u−1 .
k=1
On obtient alors
∞ ∞
−1 −1
X
−1
X kwk
kv −u k≤
k
w
ku k ≤ kwk kku−1 k ≤ kuk−1 .
k=1 k=1
1 − kwk
Il en résulte immédiatement le
Théorème 1.4.1 Soient k · k1 et k · k2 deux normes sur un espace vectoriel E. Les propriétés
suivantes sont équivalentes,
i) k · k1 et k · k2 sont des normes équivalentes,
ii) il existe a, b > 0 telles que, pour tout x ∈ E,
kxk1 ≤ akxk2 et kxk2 ≤ bkxk1 .
13
Démonstration. Elle résulte de la Définition 1.4.1 et du Théorème 1.3.2, remarquant que ii)
équivaut à la continuité des applications linéaires
Démonstration. Posons, pour tout x ∈ Rd , kxk = di=1 |xi | et considérons une norme ρ(.) sur
P
Rd . Pour tout i = 1, · · · , d définissons le vecteur ei = (0, · · · , 1, · · · , 0), dont toutes les compo-
santes sont nulles sauf celle de rang i. Pour tout x, y ∈ Rd on a
d
X
ρ(x − y) = ρ (xi − yi )ei
i=1
d
X
≤ |xi − yi |ρ(ei )
i=1
≤ M kx − yk,
où M = sup1≤i≤d ρ(ei ). La fonction ρ(.) est donc continue, elle atteint alors sa borne inférieure
sur le compact S = {x ∈ Rd : kxk = 1}. Il existe donc m > 0 tels que, pour tout x 6= 0, on a
m ≤ ρ(x/kxk),
d’où mkxk ≤ ρ(x) ≤ M kxk, ce qui montre que les normes k · k et ρ(.) sont équivalentes. Soient
alors ρ1 et ρ2 deux normes sur Rd . Comme ρ1 est équivalente à k · k et que k · k est équivalente à
ρ2 , on obtient que ρ1 est équivalente à ρ2 (le vérifier).
Corollaire 1.4.1
i) Rd est un espace de Banach pour toute norme.
ii) Toute application linéaire de Rd dans un espace normé (F, k · k) est continue.
Démonstration. i) Résulte du fait qu’un espace de Banach l’est encore quand on remplace sa
norme par une norme équivalente, du Théorème 1.4.2 et du fait que Rd est complet muni de l’une
de ses normes usuelles (voir Exemple 1.2.1 a)).
ii) Exercice facile.
14
Remarque 1.4.1
a) Soit (E, k · k) un espace vectoriel de dimension d rapporté à une base (u1 , · · · , ud ). L’ap-
plication
d
X
ϕ(x1 , · · · , xd ) = x i ui
i=1
est bijective linéaire et continue (le démontrer) de Rd dans E. La bijection réciproque ϕ−1 est aussi
continue. En effet la fonction kϕ(.)k qui est une norme sur Rd est équivalente à la norme k · k∞ .
Il existe donc c > 0 tel que k · k∞ ≤ ckϕ(.)k, ce qui implique bien la continuité de ϕ−1 . Ainsi E
est isomorphe à Rd et le Théorème 1.4.2 ainsi que le Corollaire 1.4.1 sont vrais en remplaçant Rd
par un espace vectoriel E de dimension finie d.
b) On peut montrer que la boule unité d’un espace normé de dimension infinie n’est jamais
compacte (Théorème de F. Riesz).
f : E1 × · · · × En −→ F
est multilinéaire si, pour tout i ∈ [1, n], et pour tout a = (a1 , · · · , an ) ∈ E1 × · · · × En , les
applications fi : Ei → F définies par
sont linéaires.
Théorème 1.5.1 Soient E1 , · · · En , F des espaces normés et soit une application multilinéaire
f : E1 × · · · × En −→ F . On munit l’espace vectoriel E1 × · · · × En d’une norme définissant
la topologie produit (par exemple l’une des normes équivalentes de la Définition 1.1.2). Alors, les
deux propriétés suivantes sont équivalentes.
i) f est continue sur E1 × · · · × En ,
ii) il existe M ≥ 0 telle que, pour tout x ∈ E1 × · · · × En , on a
Démonstration. i) ⇒ ii). Comme f est continue en 0 et f (0) = 0, Il existe η > 0 tel que,
Soit alors x ∈ (E1 \{0}) × · · · × (En \{0}). Posons y = η(x1 /kx1 k, · · · ., xn /kxn k), on a kyk ≤ η.
Il en résulte kf (y)k ≤ 1, et donc
15
Enfin, si l’un des xi est nul l’inégalité ci-dessus est vérifiée avec 0 des deux côtés de l’inégalité.
ii) ⇒ i). On procède par récurrence sur n. Soient x, h ∈ E1 × · · · × En . On a
g(z2 , · · · , zn ) = f (x1 , z2 , · · · , zn )
De plus
kf (x + k) − f (x)k = kg(x2 + h2 , · · · , xn + hn ) − g(x2 , · · · , xn )k.
On applique alors l’hypothèse de récurrence et on obtient l’existence de η > 0 tel que
pourvu que sup2≤i≤n khi k ≤ η. Il en résulte que pour sup1≤i≤n khi k ≤ max(η, ε/2C), on a
kf k = sup kf (x)k
kxk≤1
et que si F est de Banach, l’espace L(E1 , · · · , En ; F ) est un espace de Banach muni de cette norme
(s’inspirer de la démonstration du Théorème 1.3.2). Enfin le lecteur démontrera que si E1 , · · · , En
sont de dimension finie toute application multilinéaire définie sur E1 × · · · × En est continue.
Le résultat suivant est fondamental pour l’étude des différentielles d’ordre supérieur.
16
Théorème 1.5.2 L’application
Φ : Lm (E; Ln (E; F )) → Ln+m (E; F )
définie pour g ∈ Lm (E; Ln (E; F )) et (x1 , · · · , xn+m ) ∈ E n+m par
Φ(g)(x1 , · · · , xn+1 ) = g(x1 , · · · , xm )(x2 , · · · , xn+1 )
est une isométrie de Lm (E; Ln (E; F )) dans Ln+m (E; F ) et l’isométrie réciproque
Ψ : Ln+m (E; F ) → Lm (E; Ln (E; F ))
est définie, pour tout f ∈ Ln+m (E; F ), (z1 , · · · , zm ) ∈ E m et (x1 , · · · , xn ) ∈ E n par
(Ψ(f )(z1 , · · · , zm ))(x1 , · · · , xn ) = f (z1 , · · · , zm , x1 , · · · , xn ).
Démonstration. On a
kΦ(g)(x1 , · · · , xn+m )k ≤ kg(x1 , · · · , xm )kLn (E;F ) k(xm+1 k · · · kxn+1 k
≤ kgkLm (E;Ln (E;F )) kx1 k · · · kxm k · kx2 k · · · kxn+1 k
ce qui montre que Φ(g) ∈ Ln+m (E; F ) et
kΦ(g)kLn+m (E;F ) ≤ kgkLm (E;Ln (E;F )) . (1.5)
Par ailleurs, pour tout (z1 , · · · , zm ) ∈ E m ,
kΨ(f )(z1 · · · , zm )(x1 , · · · , xn )k ≤ kf kLn+m (E;F ) kz1 k · · · kzm k · kx1 k · · · kxn k
ce qui montre que Ψ(f ) ∈ Lm (E; Ln (E; F )) et
kΨ(f )(z1 , · · · , zm )kLn (E;F ) ≤ kf kLn+1 (E;F ) kz1 k · · · kzm k
d’où
kΨ(f )kLm (E;Ln (E;F )) ≤ kf kLn+m (E;F ) . (1.6)
Les applications Φ et Ψ sont donc linéaires continues. Il est clair qu’elles sont aussi réciproque
l’une de l’autre. On a alors pour tout f ∈ Ln+m (E; F ), g ∈ Lm (E; Ln (E; F ))
kf kLn+m (E;F ) = k(Φ ◦ Ψ)(f )kLn+m (E;F ) = kΦ(Ψ(f ))kLn+m (E;F ) ≤ kΨ(f )kLm (E;Ln (E;F ))
et
kgkLm (E;Ln (E;F )) = k(Ψ ◦ Φ)(g)kLm (E;Ln (E;F )) = kΨ(Φ(g))kLm (E;Ln (E;F )) ≤ kΦ(g)kLn+m (E;F ) ,
ce qui combiné à (1.5) et (1.6) montre que
kΦ(g)kLn+m (E;F ) = kgkLm (E;Ln (E;F ))
et
kΨ(f )kLm (E;Ln (E;F )) = kf kLn+m (E;F ) .
On a donc bien le résultat.
17
1.6 Espaces de Hilbert
Définition 1.6.1 Un produit scalaire h., .i sur un espace vectoriel E est une fonction de E × E
dans R qui est bilinéaire symétrique (hx, yi = hy, xi pour tout x, y ∈ E) non dégénérée positive
(hx, xi ≥ 0 pour tout x ∈ E et hx, xi = 0 implique x = 0), E muni du produit scalaire h., .i est
dit alors préhilbertien.
Exemple 1.6.1
a) Pour tout x, y ∈ Rd on pose
hx, yi = x1 y1 + · · · + xd yd .
hx + λy, x + λyi ≥ 0
d’où
λ2 hy, yi + 2λhx, yi + hx, xi ≥ 0.
18
Le discriminant du trinôme du second degré est donc négatif ou nul, ce qui donne l’inégalité
annoncée. Par ailleurs il est clair que l’inégalité est une égalité si y = µx. Réciproquement si x
et y sont non colinéaires alors x + λy 6= 0 pour tout λ ∈ R ce qui montre que le trinôme n’a
pas de racine réelle. Il en résulte que son discriminant est strictement négatif, d’où |hx, yi|2 <
hx, xihy, yi.
Proposition 1.6.1 Soit (E, h., .i) un espace préhilbertien. On définit alors une norme sur E en
posant pour tout x ∈ E
kxk = hx, xi1/2 .
Démonstration. La seule vérification non évidente est celle de l’inégalité triangulaire. Soient
x, y ∈ E, on a, utilisant l’inégalité de Cauchy-Schwarz
Remarque 1.6.1
a) Théorème de Pyhagore. Soit (E, h., .i) un espace préhilbertien et soient x, y ∈ E tels que
hx, yi = 0. Alors
kx + yk2 = kxk2 + kyk2 .
En effet
kx + yk2 = hx + y, x + yi
= hx, xi + hx, yi + hy, yi
= hx, xihy, yi
= kxk2 + kyk2 .
La (x) = ha, xi
ce qui montre que l’application linéaire La est continue et que kLa k ≤ kak. De plus |La (a)| =
kak2 donc kLa k ≥ kak ce qui montre que kLa k = kak.
Définition 1.6.2 Un espace de Hilbert est un espace préhilbertien (H, h., .i) qui est complet pour
la norme définie dans la Proposition 1.6.1.
19
Exemple 1.6.2
a) L’espace Euclidien Rd muni du produit scalaire usuel (exemple 1.6.1, a)) est un espace de
Hilbert.
b) Soit `2 défini dans l’exemple 1.2.1, c) muni du produit scalaire
∞
X
hx, yi = xn yn .
n=1
(exemple 1.6.1, b)). Alors `2 est un espace de Hilbert pour ce produit scalaire.
c) L’espace E = C([0, 1]) muni du produit scalaire
Z 1
hf, gi = f (t)g(t) dt.
0
Définition 1.6.3 Soit (E, d) un espace métrique, a ∈ E et soit B une partie non vide de E). La
distance de a à la partie B est
En général la projection n’existe pas et, s’il en existe, il peut en exister plusieurs.
Définition 1.6.4 Une partie C d’un espace vectoriel E est dite convexe si, pour tout x, y ∈ C et
pour tout λ ∈ [0, 1]
λx + (1 − λ)y ∈ C.
Dans le cas d’un espace préhilbertien il y a existence et unicité de la projection sur une partie
convexe complète comme le montre le résultat fondamental suivant.
kx − yk = d(x, C).
hx − pC (x), z − pC (x)i ≤ 0
pour tout z ∈ C.
20
Démonstration. Remarquons que d(x, C) = d(0, C − x). Comme C − x est aussi convexe com-
plet, on peut supposer que x = 0. Soit yn ∈ C tel que
1
kyn k ≤ d(0, C) + .
n
Pour tout x, z ∈ E, on a
d’où
x + z
2
2 2 2
kx − zk = 2kx k + 2kzk − 4
.
2
On obtient alors
y + y
2
2 2 2
m n
kym − yn k = 2kym k + 2kyn k − 4
.
2
ym + yn
Comme C est convexe, on a ∈ C donc
2
y + y
m n
d(0, C) ≤
.
2
Il en résulte que
kym − yn k2 ≤ 2kym
2
k + 2kyn k2 − 4d2 (0, C)
≤ 4d(0, C)(1/m + 1/n) + 2/m2 + 2/n2 .
La suite (yn ) est donc de Cauchy dans C qui est complet, elle converge donc vers un certain y ∈ C
(C est fermé car C est complet). Passant à la limite dans l’inégalité kyn k ≤ d(0, C) + 1/n, il vient
kyk ≤ d(0, C) et donc kyk = d(0, C) car kyk ≥ d(0, C). Montrons l’unicité de y. Si y1 et y2 sont
solutions, on a
ky1 − y2 k2 ≤ 2ky1 k2 + 2ky2 k2 − 4d2 (0, C) = 0
donc y1 = y2 . Enfin, revenant au cas général, pC (x) est caractérisé par
soit
0 ≤ −2thx − pC (x), y − pC (x)i + t2 ky − pC (x)k2 .
Divisant par t et faisant tendre t vers 0 on a bien
hx − pC (x), y − pC (x)i ≤ 0
pour tout y ∈ C. Réciproquement, supposant que z ∈ C est tel que hx − z, y − zi ≤ 0 pour tout
y ∈ C, il vient
kx − yk2 = kx − zk2 + kz − yk2 − hx − z, y − zi
21
d’où
kx − yk2 ≥ kx − zk2
pour tout y ∈ C, et donc z = pC (x).
Proposition 1.6.2 Soit C une partie convexe et complète d’un espace préhilbertien (E, h., .i).
Alors, pour tout x1 , x2 ∈ E
hx1 − y1 , y2 − y1 i ≤ 0 (1.7)
et
hx2 − y2 , y1 − y2 i ≤ 0. (1.8)
On a alors
D’après (1.7) et (1.8), le premier et le troisième terme de l’inégalité précédente sont positifs ou
nuls. Il en résulte que
On a alors
kx1 − x2 kky1 − y2 k ≥ hx1 − x2 , y1 − y2 i ≥ ky1 − y2 k2
d’où
ky1 − y2 k ≤ kx1 − x2 k
ce achève la démonstration.
Définition 1.6.5 Soit (E, h., .i) un espace préhilbertien et soient x, y ∈ E. On dit que x est
orthogonal à y et on note x ⊥ y si hx, yi = 0. Étant donné F ⊂ E, on note
et que hx, .i est linéaire continue (voir Remarque (1.6.1), b)). On obtient alors que F ⊥ est fermé
comme intersection de fermés.
Dans le cas où C est un sous-espace vectoriel le Théorème 1.6.2 prend la forme suivante
22
Théorème 1.6.3 PROJECTION SUR UN SOUS - ESPACE VECTORIEL COMPLET
Soit F un sous-espace vectoriel complet d’un espace préhilbertien (E, h., .i). Alors
E = F ⊕ F⊥
et
pF ∈ L(E).
Pour tout x ∈ E, pF (x) est l’unique vecteur de F tel que
De plus,
kpF (x)k ≤ kxk
pour tout x ∈ E.
Démonstration. D’après le Théorème 1.6.2 pF (x) est l’unique vecteur de F tel que
x = pF (x) + x − pF (x)
où
pF (x) ∈ F et x − pF (x) ∈ F ⊥ .
Comme F ∩ F ⊥ = {0}, on a bien E = F ⊕ F ⊥ . De plus pF (.) est la projection algébrique
sur F parallèlement à F ⊥ , c’est donc une application linéaire. Remarquons alors que, d’après le
Théorème de Pythagore
ce qui montre que kpF (x)k ≤ kxk pour tout x ∈ E et que pF est continue.
23
Démonstration. a) Observons que F ⊂ F ⊥⊥ et que F ⊥ est un sous-espace vectoriel fermé de
E (F ⊥ = x∈F ker hx, .i et ker hx, .i est fermé comme noyau d’une forme linéaire continue
T
(Remarque 1.6.1, b))). Les sous-espaces vectoriels F et F ⊥ sont donc complets ce qui permet
d’appliquer le Théorème 1.6.3. On a alors
F ⊂ F ⊥⊥
E = F ⊕ F⊥
E = F ⊥⊥ ⊕ F ⊥
donc F = F ⊥⊥ .
b) Si F = H il est clair que F ⊥ = {0}. Réciproquement si F ⊥ = {0} on a H = F ⊕ {0}
donc F = E.
Définition 1.6.6 On dit qu’une famille de vecteurs (ei )i∈I est orthogonale si
Le résultat suivant dont la démonstration élémentaire est laissée au lecteur est d’une grande im-
portance pratique.
Proposition 1.6.3 Soit (e1 , · · · , en ) une famille
P orthononormée d’un espace préhilbertien (E, h., .i,
soit n ∈ N∗ et λ1 , · · · , λn ∈ R. Posons x = ni=1 λi ei , alors
et n
X
2
kxk = |λi |2 .
i=1
Théorème 1.6.4 Soit (E, h., .i) un espace préhilbertien et soit (e1 , · · · , en ) une famille ortho-
normée. On pose
En = [e1 , · · · , en ]
(sous-espace vectoriel engendré par e1 , · · · , en ). Alors pour tout x ∈ E,
a) pEn (x) = ni=1 hx, ei iei ,
P
Démonstration. Remarquons qu’un sous-espace vectoriel de dimension finie est complet (voir
Remarque 1.4.1). On peut donc appliquer le Théorème 1.6.3. On sait que pEn (x) est caractérisé
par
hx − pEn (x), ei i = 0 pour tout i ∈ [1, n].
24
Il en résulte que
n
X n
X
pEn (x) = hpEn (x), ei iei = hx, ei iei .
i=1 i=1
De plus, on a
x = x − pEn (x) + pEn (x)
et
(x − pEn (x)) ⊥ pEn (x).
D’après le Théorème de Pythagore, il vient
kxk2 − kx − pEn (x)k2 = kpEn (x)k2 ,
ce qui montre bien que
n
X
kxk2 − d2 (x, En ) = |hx, ei i|2 .
i=1
Démonstration. Pour tout n ∈ N∗ , on a kpEn (x)k2 ≤ kxk2 et, d’après le Théorème 1.6.4 et la
Proposition 1.6.3 on a
Xn
kpEn (x)k2 = |hx, ei i|2 ,
i=1
d’où le résultat.
Définition 1.6.7 Soit (en )n∈N ∗ une famille de vecteurs d’un espace normé (E, k · k). On dit que
cette famille est totale si
∞
[
E= Fn ,
n=1
où Fn = [e1 , · · · , en ]. Autrement dit, si pour tout x ∈ X et pour tout ε > 0, il existe n ≥ 1 et
xn ∈ Fn tel que kx − xn k ≤ ε. De façon équivalente la famille (en )n∈N ∗ est totale si et seulement
si pour tout x ∈ E, on a limn→∞ d(x, En ) = 0 (le démontrer).
Proposition 1.6.4 Soit (H, h., .i) un espace de Hilbert. Alors la famille (en )n∈N ∗ est totale si et
seulement si
{en : n ∈ N∗ }⊥ = 0.
25
Démonstration. On a
∞
[ ⊥
{en : n ∈ N∗ }⊥ = Fn .
n=1
En effet il est clair que
∞
[ ⊥
∗ ⊥
{en : n ∈ N } = Fn ,
n=1
et l’orthogonal d’un sous espace vectoriel est égal à celui de son adhérence (le vérifier). On a donc
∞
[
Fn = H
n=1
si et seulement si
∞
[ ⊥
Fn = {0},
n=1
d’où le résultat.
Démonstration. i) ⇒ ii). Étant donné ε > 0, il existe n ∈ N∗ et des réels λ1 , · · · , λn tels que
n
X
x − λi ei
≤ ε.
i=1
On a alors n n
X
X
2
2 2 2
kxk − |hx, ei i| = kx − pEn (x)k ≤
x − λi ei
≤ ε2 ,
i=1 i=1
2
P∞ 2 2
d’où kxk ≤ i=1 |hx, ei i| + ε ce qui implique bien ii) en faisant tendre ε vers 0.
ii) ⇒ iii). On a x = (x − pEn (x)) + pEn (x) et x − pEn (x) et x − pEn (x) sont orthogonaux.
On obtient donc
kxk2 − kpEn (x)k2 = kx − pEn (x)k2 = d2 (x, En )
soit utilisant le Théorème (1.6.4)
n
X
2
kxk − |hx, ei i|2 = kx − pEn (x)k2 ,
i=1
26
Pn
il en résulte que limn→∞ pEn (x) = x d’où le résultat car pEn (x) = i=1 hx, ei iei .
Exemple 1.6.3 Soit dans `2 la famille (ei )i∈N ∗ définie par ein = δi,n . Pour x ∈ `2 , on a hx, ei i = xi ,
la famille (ei )i∈N∗ est donc totale dans `2 d’après le Théorème 1.6.4, ii).
Soit alors (H, h., .i) un espace de Hilbert et a ∈ H. L’application la : H → R définie par
la = ha, .i est linéaire et on a
|ha, xi| ≤ kakkxk
Il en résulte que la est continue : la ∈ H ∗ . Le résultat suivant montre que tous les éléments de H ∗
sont représentables de cette manière.
l : H −→ H ∗
x 7−→ lx
27
28
Chapitre 2
Définition 2.1.1 On dit que l’application f : U −→ F est différentiable au point a ∈ U s’il existe
ϕ ∈ L(E, F ) telle que pour tout ε > 0, il existe η > 0 tel que pour tout x ∈ B(a, η)
Remarque 2.1.1
a) Pour simplifier l’écriture, on écrira souvent, h étant un vecteur de E, Df (a)h au lieu de
Df (a)(h).
b) La définition s’écrit de façon équivalente, posant R(x) = f (x) − f (a) − ϕ(x − a),
où
lim ε(x) = 0.
x→a
29
On note parfois o(khk) une fonction α(h) définie au voisinage de 0 et à valeurs réelles telles que
limh→0 khk−1 α(h) = 0. La différentibilité en a s’écrit alors
Définition 2.1.2 Soit f : I −→ E une fonction vectorielle définie sur un intervalle ouvert I de R.
On dit que f est dérivable en t0 ∈ I si la limite
f (t) − f (t0 )
lim
t→t0 t − t0
existe. On pose alors
df f (t) − f (t0 )
f 0 (t0 ) = (t0 ) = lim .
dt t→t0 t − t0
30
Théorème 2.1.1 Soit f : I −→ E une fonction vectorielle définie sur un intervalle ouvert I de
R. Alors les deux propriétés suivantes sont équivalentes
i) f est dérivable en t0 ∈ I,
ii) f est différentiable en t0 ∈ I.
De plus pour tout h ∈ R, on a
df
Df (t0 )(h) = h (t0 ),
dt
df
(t0 ) = Df (t0 )(1).
dt
Démonstration. On sait (voir chap. 1, Exemple 1.3.2 que L(R, E) s’identifie à E quand on iden-
tifie ϕ ∈ L(R, E) avec le vecteur ϕ(1) et x ∈ E avec ϕ ∈ L(R, E) définie par ϕ(t) = tx.
Remarquons que
f (t) − f (t0 )
lim =x
t→t0 t − t0
équivaut à
f (t) − f (t0 ) − (t − t0 )x = (t − t0 )ε(t − t0 )
avec lim ε(h) = 0, ce qui démontre le théorème.
h→0
Exemple 2.1.1
a) Soit (E, k.k) un espace normé, alors la norme n’est pas différentiable en 0. Dans le cas
contraire, on aurait (remarque 2.1.1, d)) pour tout h ∈ E
ce qui est absurde car le rapport kthk/t a une limite à droite égale à khk et une limite à gauche
égale à −khk quand t tend vers 0.
b) Soient E, F des espaces normés et soit f ∈ L(E, F ). Il découle de l’égalité,
31
est continue car
Il en résulte que toute application bilinéaire continue f ∈ L2 (E, F ; G) est différentiable sur E ×F
et que pour tout (a, b) ∈ E × F , (u, v) ∈ E × F
∂f f (a1 , · · · , z, · · · , an ) − f (a1 , · · · , an )
(a) = lim ,
∂xi z→ai z − ai
soit
∂f f (a1 , · · · , ai + t, · · · , an ) − f (a1 , · · · , an )
(a) = lim .
∂xi t→0 t
Autrement dit
∂f f (a + tei ) − f (a)
(a) = lim ,
∂xi t→0 t
6 i
0 si j = ∂f
où (ei )j = . Il résulte donc de (2.1) que si f est différentiable en a alors (a)
1 si j = i ∂xi
existe. On a de plus
n n n
X X X ∂f
Df (a)(h) = Df (a) hi ei = Df (a)(ei )hi = (a)hi .
i=1 i=1 i=1
∂x i
32
Autrement dit
Df (a)(h) = h∇f (a), hi pour tout h ∈ Rn
∂f
(a)
∂x1
où h., .i désigne le produit scalaire usuel sur Rn et ∇f (a) =
.. est appelé le vecteur
∂f .
(a)
∂xn
∂f
gradient de f en a. On montrera dans la suite que si pour tout i = 1, · · · , n la fonction (.) est
∂xi
définie au voisinage de a et continue en a alors f est différentiable en a et que sa différentiellle en
a est définie par
Df (a)(h) = h∇f (a), hi.
où Jf (a) est la matrice à m lignes et n colonnes dont les lignes sont .. , autrement dit
.
∇fm (a)T
∂fi
[Jf (a)]ij = (a) pour tout (i, j) ∈ [1, m] × [1, n].
∂xj
On dit que Jf (a) est la matrice Jacobienne de f en a. On montrera que si les dérivées partielles
∂f
i
(.) existent au voisinage de a et sont continues en a on montrera que f est
∂xj (i,j)∈[1,m]×[1,n]
différentiable en a et que Df (a) est donné, pour tout vecteur h ∈ Rm par
Df (a)(h) = Jf (a)h.
33
Définition 2.1.4 Soit f : U ⊂ E −→ F une application. On dit que f est de classe C 1 sur U si f
est différentiable sur U et si l’application, x 7−→ Df (x) est continue de U dans L(E, F ).
Démonstration. On sait que Isom (E, F ) est ouvert dans L(E, F ) (Chapitre 1, Théorème 1.3.4).
On remarque que L(.) définie par L(h) = −u−1 ◦ h ◦ u−1 est linéaire ; L(.) est aussi continue car
Soit u ∈ Isom (E, F ), on peut supposer que h est assez petit pour que u + h ∈ Isom (E, F ). On a
alors
Posons
R(h) = I(u + h) − I(u) − L(h).
On a donc
Ψ(v, w)(h) = −v ◦ h ◦ w
34
Il est clair que Ψ(v, w)(.) est linéaire de L(E, F ) dans L(F, E). Elle est aussi continue car
On a alors
DI = Ψ ◦ (I, I)
ce qui montre que DI est continue comme composée d’applications continues.
(λ, x) 7→ λx et (x, y) 7→ x + y
(voir chapitre 1, Remarque 1.2).
Le résultat suivant est très important en calcul différentiel et il est impératif de savoir l’appliquer
sans hésitation.
Démonstration. On a,
f (x) = f (a) + Df (a)(x − a) + r1 (x),
g(y) = g(b) + Dg(b)(y − b) + r2 (y),
35
avec
r1 (x)
lim =0
x→a kx − ak
et
r2 (y)
lim = 0.
y→b ky − bk
On donc
g(f (x)) = g(b) + Dg(b)(Df (a)(x − a) + r1 (x)) + r2 (f (x)).
Il en résulte que
g(f (x)) = g(b) + (Dg(b) ◦ Df (a))(x − a) + R(x),
où
R(x) = Dg(b)(r1 (x)) + r2 (y).
Il reste à montrer que
R(x)
lim = 0.
x→a kx − ak
Observons que
kDg(b)(r1 (x))k ≤ kDg(b)kkr1 (x)k,
ce qui montre que
Dg(b)(r1 (x))
lim = 0.
x→a kx − ak
r1 (x)
Par ailleurs utilisant le fait que lim = 0, il existe α > 0 tel que
x→a kx − ak
kr1 (x)k ≤ kx − ak
pour tout x tel que kx − ak ≤ α. Il vient, pour tout x ∈ B(a, α),
kf (x) − bk = kDf (a)(x − a) + r1 (x)k
36
et donc, utilisant (2.3),
ε
kr2 (f (x))k ≤ kf (x) − bk
kDf (a)k + 1
ε
≤ (kDf (a)k + 1)kx − ak
kDf (a)k + 1
≤ εkx − ak,
ce qui achève la démonstration.
Corollaire 2.2.1
a) Soit I ⊂ R un intervalle ouvert de R, soient E, F des espaces normés et soit x : I −→ E
et f : U −→ F une application définie sur un ouvert U de E. On suppose que x(I) ⊂ U , que x(.)
est dérivable en t ∈ I et que f est différentiable en x(t). Alors f ◦ x est dérivable en t et
(f ◦ x)0 (t) = Df (x(t))(x0 (t)).
Exemple 2.2.1 Si (E, h·, ·i) est un espace de Hilbert et x, y : I −→ E sont dérivables en t ∈ I,
on déduit du corollaire précédent que
(hx(t), y(t)i)0 = hx0 (t), y(t)i + hx(t), y 0 (t)i.
37
2.3 Applications à valeurs dans un produit d’espaces
Soient F1 , · · · , Fm des espaces normés et F = F1 × · · · × Fm leur produit cartésien. On définit,
pour tout i = 1, · · · , m
pi : F −→ Fi par pi (x1 , · · · , xm ) = xi
et
ui : Fi −→ F par ui (y) = (0, · · · , y, · · · , 0),
où toutes les composantes sont nulles sauf celle de rang i qui est égale à y. On a pi ∈ L(F, Fi ),
ui ∈ L(Fi , F ) (le démontrer) et, pi ◦ ui = IFi .
38
∇f1 (a)T
oú Jf (a) = ..
. est la matrice m × n définie par [Jf (a)]ij = ∂fi (a), soit
∂xj
∇fm (a)T
∂f ∂f1
1
(a) · · · (a)
∂x1 ∂xn
Jf (a) =
.
.. .
.. .
∂f · · ·
m ∂fm
(a) · · · (a)
∂x1 ∂xn
Démonstration. La première partie de la conclusion découle du Théorème 2.3.1. Utilisant ce
même Théorème, il vient
On a donc bien
h∇f1 (a), hi
Df (a)(h) = .. = Jf (a)h.
.
h∇fm (a), hi
39
Démonstration. Soient x, z ∈ U et t ∈ [0, 1]. De part la convexité de U on a tx + (1 − t)z ∈ U .
En fait il existe η > 0 tel que tx + (1 − t)z ∈ U pour tout t ∈ [−η, 1 + η] (choisir η > 0 tel que
B(x, ηkx − zk) ⊂ U et B(z, ηkx − zk) ⊂ U ). Soit l ∈ F ∗ telle que klk ≤ 1. Posons pour tout
t ∈ [−η, 1 + η]
ϕ(t) = l(f (tx + (1 − t)z)) = l(f (α(t))).
Utilisant la règle de différentiation des applications composées on obtient que ϕ est dérivable sur
] − η, 1 + η[ et
On a alors
Utilisant le théorème des accroissements finis pour les fonctions d’une variable réelle il vient
E = E1 × · · · × En ,
40
Proposition 2.4.3 Soit f : U ⊂ E −→ F où U est un ouvert de E = E1 × · · · × En . Supposons
que f est différentiable en a. Alors pour tout i = 1, · · · , n, Di f (a) existe et pour tout h ∈ Ei
vi (z) = (a1 , · · · , z, · · · , an ),
vi (z) − vi (ai ) = ui (z − ai ),
ce qui montre que vi est différentiable en ai et que Dvi (ai ) = ui . D’après le Théorème 2.2.1,
ϕi = f ◦ vi est différentiable en ai et que, pour tout h ∈ Ei
Dϕi (ai )(h) = Df (vi (ai )) ◦ Dvi (ai ) (h) = Df (a)(ui (h)),
d’où le résultat.
Le résultat suivant découle immédiatement de la Proposition 2.4.3
Proposition 2.4.4 Soit f : U −→ R où U est un ouvert de Rn . Alors il est équivalent de dire que
f admet une différentielle partielle en a par rapport à la ième variable et que la dérivée partielle
∂f
(a) existe. De plus on a
∂xi
∂f
(a) = Df (a)(ei ),
∂xi
∂f
Di f (a)(h) = h (a),
∂xi
et
∂f
(a) = Di f (a)(1).
∂xi
41
Démonstration. On remarque que l’application
L : E1 × · · · × En −→ F
Pn
définie par L(h) = i=1 Di f (a)(hi ) est linéaire et continue. Posons
n
X
R(x) = f (x) − f (a) − Di f (a)(xi − ai ).
i=1
On a
où
Les applications gi sont définies et différentiables dans un voisinage de ai pour tout x voisin de a.
Par définition de la différentielle partielle, on a
Utilisant la continuité de l’application D1 f , étant donné ε > 0, il existe η > 0 tel que, pour tout
y ∈ B(a, η) et pour tout i ∈ [1, n], on ait
42
On obtient donc pour tout x ∈ B(a, η) et pour tout i ∈ [1, n],
Appliquant alors la Proposition 2.4.2, il vient pour tout x ∈ B(a, η) et pour tout i ∈ [1, n],
d’où n
X
kR(x)k ≤ ε kxi − ai k = εkx − ak1 ,
i=1
On obtient donc
n
X
k(Df (z) − Df (x))kL(E1 ×···×En ,F ) ≤ k(Di f (z) − Di f (x))kL(Ei ,F )
i=1
43
Corollaire 2.4.2 Soit U un ouvert de Rn et f : U −→ Rm , f = (f1 , · · · , fm ).
∂fi
a) On suppose que les dérivées partielles , (i, j) ∈ [1, m] × [1, n] existent au voisinage
∂xj
d’un point a ∈ U et sont continues en a. Alors f est différentiable en a et pour tout h ∈ Rn
Df (a)(h) = Jf (a)h,
∂fi
b) De plus si les dérivées partielles , (i, j) ∈ [1, m] × [1, n] sont continues sur U alors f
∂xj
est de classe C 1 sur U .
Démonstration. a) Utilisant la Proposition 2.4.4, on a, pour tout i ∈ [1, m], j ∈ [1, n], x ∈ U et
h ∈ R,
∂f ∂fi
i
|(Dj fi (x) − Dj fi (a))(h)| = (x) − (a) h
∂xj ∂xj
∂f ∂fi
i
= (x) − (a)|h|,
∂xj ∂xj
ce qui montre que
∂f ∂fi
i
kDj fi (x) − Dj fi (a)kL(R,R) = (x) − (a).
∂xj ∂xj
Il en résulte que les applications Di fj sont continues en a. Utilisant les Théorèmes 2.3.1 et 2.4.1,
on obtient bien que f est différentiable en a. Le calcul de Df (a)(h) découle alors du Corollaire
2.3.1.
b) Montrons que les différentielles partielles Di f , 1 ≤ i ≤ n sont continues. Pour tout u ∈ R
et pour tout x ∈ U , on a, utilisant la Proposition 2.4.4
Di f (x)(u) = Df (x)(uei )
= (Df1 (x)(uei ), · · · , Dfm (x)(uei ))
∂f1 ∂fm
= u (x), · · · , (x) .
∂xi ∂xi
Il en résulte que
∂f1 ∂f1 ∂fm ∂fm
kDi f (z) − Di f (x)kL(R,Rm ) =
(z) − (x), · · · , (z) − (x)
.
∂xi ∂xi ∂xi ∂xi
Il suffit alors d’appliquer le Corollaire 2.4.1.
44
Remarque 2.4.1 Dans le cas où m = 1 on peut aussi écrire
où ∂f ∂f
∇f (a) = (a), · · · , (a) .
∂x1 ∂xn
Corollaire 2.4.3 Soient E1 , · · · , En , F des espaces normés et soit
f ∈ Ln (E1 , · · · , En ; F )
une application multilinéaire continue. Alors f est de classe C 1 sur E1 × · · · × En et pour tout
x, h ∈ E1 × · · · × En
ϕi (z) = f (a1 , · · · , z, · · · , an ),
est alors linéaire et continue de Ei dans F . Elle est donc différentiable d’après l’Exemple 2.1.1,
b) et
Di f (a) = ϕi .
Montrons alors que, pour tout 1 ≤ i ≤ n, l’application Di f est continue sur E1 × · · · × En ce
qui démontrera le résultat grâce au Corollaire 2.4.1. Il suffit de faire la démonstration pour i = 1.
Pour tout x ∈ E1 × · · · × En on a
D1 f (x) = Ψ(x2 , · · · , xn )
où
Ψ : E2 × · · · × En −→ L(E1 , F )
est définie pour tout z ∈ E2 × · · · × En par
Ψ(z) = f (., z2 , · · · , zn ).
Il en résulte que
kψ(z)kL(E1 ,F ) ≤ kf kkz2 k · · · kzn k,
donc d’après le Théorème 1.5.1 du Chapitre 1, Ψ est continue sur E2 × · · · × En ce qui implique
que D1 f est continue sur E1 × · · · × En .
On a aussi le
45
Corollaire 2.4.4 Soient f : U ⊂ E −→ R et g : U ⊂ E −→ R∗ différentiables en a ∈ U . Alors
f
l’application est différentiable en a, et, pour tout u ∈ E,
g
f g(a)Df (a)(u) − f (a)Dg(a)(u)
D (a)(u) = .
g g(a)2
f s
Démonstration. On a = ϕ ◦ (f, g) avec ϕ : R × R∗ −→ R définie par ϕ(s, t) = . On a
g t
∂ϕ 1 ∂ϕ s
(s, t) = et (s, t) = − 2 . Ces dérivées partielles étant continues sur R × R∗ , on déduit du
∂s t ∂t t
f
Corollaire 2.4.2 que ϕ est différentiable sur R × R∗ . Il en résulte que est différentiable en a, et
g
que, pour tout u ∈ E,
f 1 f (a)
D (a)(u) = Dϕ(f (a), g(a))(Df (a)(u), Dg(a)(u)) = Df (a)(u) − Dg(a)(u),
g g(a) g(a)2
d’où le résultat.
Remarquons que si, dans le corollaire précédent, E est un espace de H ILBERT, on a alors
f g(a)∇f (a) − f (a)∇g(a)
∇ (a) = .
g g(a)2
46
Chapitre 3
Le résultat suivant est connu sous le nom de Théorème des accroissements finis.
Théorème 3.1.1 Soit E un espace normé et soient f : [a, b] −→ E, g : [a, b] −→ R des fonctions
continues sur [a, b] et dérivables sur ]a, b[. On suppose que, pour tout t ∈]a, b[
kf 0 (t)k ≤ g 0 (t).
Alors
kf (b) − f (a)k ≤ g(b) − g(a).
Démonstration. Montrons que l’on a
ce qui donnera bien la conclusion du théorème en faisant tendre u vers a et v vers b, utilisant la
continuité de f et g en a et b. Supposons le contraire, il existe donc a < u < v < b tels que
Définissons a0 = u et b0 = v. Comme
u+v
u+v
kf (v) − f (u)k − (g(v) − g(u)) ≤
f (v) − f ( )
− g(v) − g( ) +
u2+ v
u2+ v
f ( ) − f (u) − g( ) − g(u)
2 2
47
on a
u+v
u+v η
f (v) − f ( ) − g(v) − g( ) ≥ ,
2 2 2
ou bien
u+v
u+v η
f ( ) − f (u) − g( ) − g(u) ≥ .
2 2 2
avec limh→0 ε(h) = 0 et limh→0 η(h) = 0. Revenant à (3.1), et utilisant l’inégalité triangulaire, il
vient
η
kf (bn ) − f (c)k + kf (c) − f (an )k − (g(bn ) − g(c)) − (g(c) − g(an )) ≥ n .
2
On obtient donc, utilisant (3.2) et le fait que an ≤ c ≤ bn ,
η
≤ kf 0 (c)k(bn − c + c − an ) − g 0 (c)(bn − an ) + rn
2n
avec
rn ≤ 4(bn − an )ε,
48
donc limn→∞ (bn − an )−1 rn = 0. On arrive donc à la contradiction
Théorème 3.1.2 Soient f : [a, b] −→ E, g : [a, b] −→ R des fonctions continues sur [a, b] et
dérivables à droite sur ]a, b[ sauf éventuellement sur une partie au plus dénombrable D de ]a, b[.
On suppose que, pour tout t ∈]a, b[\D,
Alors
kf (b) − f (a)k ≤ g(b) − g(a).
Démonstration. Soit n 7−→ ρn une surjection de N sur D. Soit ε > 0, on va montrer que, pour
tout t ∈ [a, b]
kf (t) − f (a)k ≤ g(t) − g(a) + ε(t − a + 2),
ce qui démontrera bien le résultat en faisant t = b et en faisant tendre ε vers 0. Posons
où X
ψ(s) = kf (s) − f (a)k − (g(s) − g(a)) − ε(s − a) − ε 2−n ,
ρn <s
P
avec la convention ∅ = 0. On a a ∈ A et ]a, t[⊂ A si t ∈ A. Il en résulte que A est un intervalle.
Soit c la borne supérieure de A ; on a A = [a, c] car c ∈ A. En effet si t ∈ [a, c[, il existe t0 ∈ A
tel que t < t0 , ce qui implique ψ(t) ≤ 0, d’où ψ(t) ≤ 0 sur [a, c[ donc c ∈ A. Observons que
ψ(c) ≤ 0. En effet, si (si ) ∈ A est une suite qui tend en croissant vers c, on a ψ(si ) ≤ 0, d’où
X
kf (si ) − f (a)k − (g(si ) − g(a)) ≤ ε(si − a) + ε 2−n
ρn <si
X
≤ ε(c − a) + ε 2−n ,
ρn <c
49
On a donc
Comme ψ(c) ≤ 0, on a
X
kf (c) − f (a)k ≤ (g(c) − g(a)) + ε(c − a) + ε 2−n . (3.3)
ρn <c
On
P obtient donc,
P ajoutant membre à membre les deux précédentes inégalités, et observant que
−n −n
ρn <c 2 ≤ ρn <s 2
X
kf (s) − f (a)k ≤ g(s) − g(a) + ε(s − a) + ε 2−n ,
ρn <s
d’où ψ(s) ≤ 0 sur [c, c + η] comme ψ(s) ≤ 0 sur [a, c], on a ψ(s) ≤ 0 sur [a, c + η], ce qui
implique la contradiction c + η ∈ A.
Si c ∈ D, il existe m ∈ N tel que c = ρm . Par continuité de f et g en c, il existe η > 0 tel que,
pour tout s ∈]c, c + η]
ε
kf (s) − f (c)k ≤ 2−m ,
2
ε −m
|g(s) − g(c)| ≤ 2 .
2
Pour tout s ∈]c, c + η] on a utilisant 3.3
ε
kf (s) − f (a)k ≤ kf (c) − f (a)k + 2−m
2 X ε
≤ g(c) − g(a) + ε(c − a) + ε 2−n + 2−m
ρn <c
2
X
≤ g(s) − g(a) + ε(c − a) + ε 2−n + ε2−m
ρn <c
X
≤ g(s) − g(a) + ε(s − a) + ε 2−n + ε2−m ,
ρn <s
50
Corollaire 3.1.1 Soit f : [a, b] −→ E une fonction continue sur [a, b] et dérivable à droite sur
]a, b[ sauf éventuellement sur une partie au plus dénombrable D de ]a, b[. On suppose qu’il existe
M ≥ 0 telle que, pour tout t ∈]a, b[\D,
kfd0 (t)k ≤ M.
Alors
kf (b) − f (a)k ≤ M (b − a).
Démonstration. Il suffit d’appliquer le Théorème 3.1.2 avec g(t) = M t.
Remarque 3.1.1
a) Le Théorème 3.1.2 et le Corollaire 3.1.1 sont vrais en remplaçant la dérivée à droite par la
dérivée à gauche.
b) Quand E 6= R, il n’existe pas en général d’élément c ∈ [a, b] tel que f (b) − f (a) =
0
f (c)(b − a) (voir T.D.).
51
Proposition 3.2.1 Foit U ⊂ E un ouvert d’un espace normé E et soit f : U −→ F une applica-
tion différentiable que l’on suppose M -lipschitzienne sur U . Alors,
kDf (x)k ≤ M pour tout x ∈ U.
Démonstration. Pour tout x ∈ U et u ∈ E, on sait que
f (x + tu) − f (x)
Df (x)(u) = lim ,
t→0 t
donc
f (x + tu) − f (x)
kDf (x)(u)k = lim
.
t→0 t
Pour tout t assez petit, on a x + tu ∈ U de telle sorte que
kf (x + tu) − f (x)k ≤ M |t|kuk,
d’où
f (x + tu) − f (x)
kDf (x)(u)k = lim
≤ M kuk,
t→0 t
ce qui montre bien que kDf (x)k ≤ M pour tout x ∈ U .
Une application utile du Théorème des accroissements finis est de donner une condition suffisante
pour passer à la limite sur la différentielle d’une suite de fonctions différentiables.
Alors il existe une application différentiable f : U −→ F telle que pour tout a ∈ U , la suite
(fp ) converge uniformément vers f sur B(a) et l’on a Df = g sur U .
52
Démonstration. Soient p, q ∈ N et a ∈ U . On définit
h(x) = fp (x) − fp (a) − (fq (x) − fq (a)).
On a Dh(x) = Dfp (x) − Dfq (x) et h(a) = 0. Appliquant le Corollaire 3.2.1 à l’application h et
à l’ouvert convexe B(a), on a pour tout x ∈ B(a) et pour tout p, q ∈ N,
kfp (x) − fp (a) − (fq (x) − fq (a))k ≤ kDfp − Dfq kC(B(a),F ) kx − ak. (3.4)
avec kDfp − Dfq kC(B(a),F ) = supy∈B(a) kDfp (y) − Dfq (y)k. La suite (fp (x) − fp (a)) est donc
de Cauchy dans F . Il en résulte que les suites (fp (x)) et (fp (a)) convergent ou divergent simul-
tanément. Ceci implique que l’ensemble A des x ∈ U tels que (fp (x)) converge est à la fois ouvert
et fermé dans U . En effet, d’après ce qui précéde on a B(a) ⊂ A ou B(a) ⊂ U \ A suivant que
a ∈ A ou a ∈ U \ A. L’ensemble A qui est non vide par hypothèse est donc égal à U car U est
connexe. Notons que pour tout x ∈ U , f (x) = limp→∞ fp (x). Soit r(a) > 0 le rayon de la boule
B(a). D’après 3.4 on a, pour tout x ∈ B(a) et pour tout p, q ∈ N,
kfp (x) − fp (a) − (fq (x) − fq (a))k ≤ kDfp − Dfq kC(B(a),F ) r(a),
d’où, faisant tendre q vers l’infini, et passant à la borne supérieure sur x ∈ B(a),
sup kfp (x) − fp (a) − (f (x) − f (a))k ≤ kDfp − DgkC(B(a),F ) r(a).
x∈B(a)
Il en résulte que la suite d’applications (fp − fp (a)) converge uniformément vers f − f (a) sur
B(a), donc (fp ) converge uniformément vers f sur B(a).
Il reste à démontrer que f est différentiable et que Df = g. Soit a ∈ U . Posons pour tout x ∈ U
R(x) = f (x) − f (a) − g(a)(x − a) = R1 (x) + R2 (x) + R3 (x),
où
R1 (x) = f (x) − f (a) − (fp (x) − fp (a)),
R2 (x) = fp (x) − fp (a) − Dfp (a)(x − a),
R3 (x) = (Dfp (a) − g(a))(x − a).
On sait que pour tout x ∈ B(a) et pour tout p ∈ N
kR1 (x)k = kfp (x) − fp (a) − (f (x) − f (a))k ≤ sup kDfp (y) − g(y)kkx − ak.
y∈B(a)
≤ kx − akε/3.
53
Fixons alors p0 (qui ne dépend que de ε). Utilisant la différentiabilité de fp0 en a, il existe η > 0
tel que, pour tout x ∈ B(a, η) ⊂ B(a)
Corollaire 3.2.3 Soit U ⊂ E un ouvert connexe d’un espace normé et soit up : U −→ F une
suite d’applications différentiables à valeurs dans un espace de Banach F . On suppose
i) Il existe a ∈ U tel que la série de terme général (up (a)) converge dans F .
ii) La série de fonctions de terme général (Dup (.)) converge uniformément vers une applica-
tion g : U −→ L(E, F ), ce qui signifie que
Xp
lim sup
Duk (y) − g(y)
= 0.
p→∞ y∈U L(E,F )
k=0
Alors la série d’applications de terme général (up (.)) converge uniformément sur U et on a
∞
X X∞
D uk (x) = Duk x.
k=0 k=0
54
3.3 Applications Strictement Différentiables
Définition 3.3.1 Soit f : U −→ F une application définie sur un ouvert d’un espace normé E et
à valeurs dans un espace normé F . On dit que f est strictement différentiable en a ∈ U s’il existe
une application linéaire continue ϕ ∈ L(E, F ) telle que, pour tout ε > 0, il existe η > 0 tel que
f − ϕ soit ε-Lipschitzienne sur B(a, η), ce qui signifie
pour tout x, z ∈ B(a, η), kf (z) − f (x) − ϕ(z − x)k ≤ εkz − xk.
Théorème 3.3.1 Soit f : U −→ F une application définie sur un ouvert d’un espace normé E et
à valeurs dans un espace normé F . On suppose que f est différentiable sur U et que l’application
Df est continue en a. Alors f est strictement différentiable en a.
Démonstration. Posons g(x) = f (x) − f (a) − Df (a)(x − a). On a Dg(x) = Df (x) − Df (a).
Utilisant la continuité de Df en a et pour tout ε > 0, il existe donc η > 0 tel que, pour tout
y ∈ B(a, η)
kDg(y)k ≤ ε.
D’après le Corollaire 3.2.1 pour tout x, z ∈ B(a, η), on a
≤ εkz − xk
d’où le résultat.
Il existe des applications strictement différentiable en un point sans que la différentielle soit
continue en 0.
et posons pour x ∈] − 1, 1[ Z x
f (x) = h(t) dt.
0
Soit ε > 0 et n ∈ N∗ tel que n + 1−1 ≤ εn−1 . Comme |h(t)| ≤ ε sur ]−ε, ε[, f est ε-Lipschitzienne
sur ] − ε, ε[ ce qui montre que f est strictement différentiable en 0 avec f 0 (0) = 0 alors que f
n’est pas dérivable aux points x = n−1 .
55
On a cependant la
Proposition 3.3.1 Soit f : U −→ F une application définie sur un ouvert d’un espace normé E
et à valeurs dans un espace normé F . On suppose que f est différentiable sur U et strictement
différentiable en a ∈ U . Alors Df est continue en a.
Démonstration. Soit ε > 0 et η > 0 tel que h = f − Df (a) soit ε-Lipschitzienne sur B(a, η). Il
résulte de la Proposition 3.2.1 que kDh(x)k = kDf (x) − Df (a)k ≤ ε pour tout x ∈ B(a, η).
Théorème 3.4.1 L’ensemble Ω défini en 3.5 est ouvert dans C(I, E) et l’application Nf est conti-
nue.
Démonstration. a) Ω est ouvert. Soit x ∈ Ω. Pour tout z ∈ x(I), il existe ηz > 0 tel que
B(z, 2ηz ) ⊂ U . Du fait de la compacité de x(I), il existe n ∈ N∗ et z1 , . . . , zn ∈ x(I) tels que
n
[
x(I) ⊂ B(zi , ηzi ).
i=1
56
Soit alors 0 < η ≤ min1≤i≤n ηzi assez petit pour que B(x, η) ⊂ Ω. Pour tout y ∈ B(x, η) et pour
tout t ∈ I, il existe i ∈ [1, n] tel que x(t) ∈ B(zi , ηzi ). On a
d’où
kf (y(t) − f (x(t))k ≤ kf (y(t) − f (zi )k + kf (zi ) − f (x(t))k ≤ ε.
On a alors
d’où le résultat.
L’opérateur Nf est alors appelé opérateur de Nemicki associé à f . On considère alors un ouvert
U ⊂ R × E et f : U −→ F une application continue. On pose
Ω = {u ∈ C(I, R × E) : u(I)) ∈ U }
et
L : C(I, E) −→ C(I, R × E)
est définie par
L(x) = (IdR , x).
Comme L est continue et Ω ouvert, il en est donc bien de même de A. Introduisons
Nf : A −→ C(I, F )
définie par
Nf (x) = (Nf ◦ L)(x),
à savoir Nf (x) = f (·, x(·)). L’application Nf est alors continue comme composée de deux appli-
cations continues. Etudions alors la différentiabilité de Nf .
Théorème 3.4.2 Soit f : U −→ F continue telle que D2 f existe et est continue sur U . Alors
l’application Nf est de classe C 1 sur A et pour tout x ∈ A, h ∈ C(I, E), t ∈ I,
(DNf (x)(h) (t) = D2 f (t, x(t))(h(t)).
57
Démonstration. D’après le Théorème 3.4.1, l’application
définie par
ND2 f = ND2 f ◦ L
est continue. Soit x ∈ A. Pour tout ε > 0, il existe donc η > 0 tel que ky − xk∞ ≤ η implique
y ∈ A et
kND2 f (y) − ND2 f (x)k∞ = sup kD2 f (t, y(t)) − D2 f (t, x(t))kL(E,F ) ≤ ε.
t∈I
D’où
sup kDϕt (ξ)k ≤ sup kD2 f (t, x(t) + ξ) − D2 f (t, x(t))k ≤ ε.
kξk<η kξk<η
kf (t, x(t) + h(t)) − f (t, x(t)) − D2 f (t, x(t))(h(t))k = kϕt (h(t)) − ϕt (0)k
≤ sup kDϕt (ξ)k kh(t)k
kξk<η
≤ εkhk∞ .
d’où
kNf (x + h) − Nf (x) − L(h)k∞ ≤ εkhk∞
avec L(h) ∈ C(I, F ) défini par
où
M = sup kD2 f (t, x(t)k
t∈I
58
(M est fini comme borne supérieure d’une fonction continue sur un compact). Il en résulte que
kL(h)k ≤ M khk,
ce qui montre que L ∈ L(C(I, E), C(I, F )) et donc que Nf est différentiable en x. Reste à montrer
que DNf est continue. Pour tout x, y, pour tout h ∈ C(I, E) et pout tout t ∈ I, on a
k((DNf (y) − DNf (x))(h))(t)k ≤ kD2 f (t, y(t)) − D2 f (t, x(t))kL(E,F ) kh(t)k,
k(DNf (y) − DNf (x))(h)k∞ ≤ sup kD2 f (t, y(t)) − D2 f (t, x(t))kL(E,F ) khk∞
t∈I
donc
kDNf (y) − DNf (x)kL(C(I,E),C(I,F )) ≤ sup kD2 f (t, y(t)) − D2 f (t, x(t))kL(E,F ) ,
t∈I
Alors,
a) If est continue sur A.
b) Si de plus D2 f existe et est continue sur U , l’application If est de classe C 1 sur A et, pour
x ∈ A et h ∈ C(I, E)
Z b
(DIf (x))(h) = D2 f (t, x(t))h(t) dt.
a
59
Démonstration. a) Définissons
I : C(I, Rn ) −→ Rn
par Z b
I(z) = z(t) dt.
a
Il est clair que I est linéaire continue et que If = I ◦ Nf . On obtient donc bien que If est continue
comme composée de deux applications continues.
b) D’après le Théorème 3.4.2 l’application Nf est continuement différentiable. Il en est donc
de même de If . Pour x ∈ A et h ∈ C(I, E), on a
Z b
(DIf (x)h) = (I ◦ DNf (x))(h) = D2 f (t, x(t))(h(t)) dt.
a
Remarque 3.4.1 Dans le cas où U ⊃ I × V où V est un ouvert de E, le Théorème 3.4.1 montre
que l’ensemble Ω = {x ∈ C(I, E) : x(I) ⊂ V } est ouvert dans C(I, E). Comme A ⊃ Ω , il en
résulte que A est non vide.
Le résultat suivant caractérise l’ensemble des fonctions réglées sur un intervalle compact
comme étant l’adhérence pour la topologie de la convergence uniforme de l’ensemble des fonc-
tions en escalier
60
Démonstration
i) =⇒ ii). Pour tout n ∈ N∗ et pour tout t ∈ I il existe, par application du critère de Cauchy à
droite et à gauche en t, un intervalle ouvert I(t) =]a(t), b(t)[ contenant t tel que
pour tout s, s0S∈ I∩]t, b(t)[ ou s, s0 ∈ I∩]a(t), t)[. Par compacité il existe m ∈ N∗ et t1 , . . . , tm ∈ I
tels que I ⊂ m i=1 I(ti ). Soit alors c0 < c1 < · · · < ck la suite telle que
Chaque cj appartient à un intervalle I(ti ). Si cj ∈]a(ti ), ti [ alors cj < cj+1 ≤ ti . Si cj ∈ [ti , b(ti )[,
alors cj < cj+1 ≤ b(ti ). Dans tous les cas on a |f (s) − f (s0 )| ≤ 1/n sur ]cj , cj+1 [∩I. Soit alors la
fonction fn définie par
fn (cj ) = f (cj ) si cj ∈ I,
fn (t) = f (τj ) si t ∈]cj , cj+1 [∩I où τj ∈]cj , cj+1 [∩I.
kf (s0 ) − f (s)k ≤ kf (s0 ) − fn (s0 )k + kfn (s0 ) − fn (s)k + kfn (s0 ) − f (s)k ≤ .
Le critère de Cauchy est alors vérifié à droite et à gauche en t. Il en résulte bien l’existence de
limites à droite et à gauche en t, l’espace E étant supposé complet.
Démonstration
D’après la définition des primitives, il existe deux parties au plus dénombrables D1 et D2 de
I telles que (Φ1 − Φ2 )0 = 0 sur I \ (D1 ∪ D2 ). Écrivons I comme réunion d’une suite croissante
d’intervalles compacts In . D’après le Corollaire 3.1.1 la fonction Φ1 − Φ2 est constante sur chaque
In donc sur I, (détaillez le raisonnement en exercice).
61
Démonstration
Soient a < b les extrémités de I et soit t−1 = 0 et a = t0 < · · · < tn = b telle que pour tout
0 ≤ i ≤ n − 1 f (t) = ci sur l’intervalle ]ti , ti+1 [. Posons F (t) = c0 (t − t0 ) pour t ∈ [t0 , t1 ] et pour
1 ≤ i ≤ n − 1 et t ∈ [ti , ti+1 ]
i−1
X
F (t) = ci (t − xi ) + ck (tk+1 − tk )
k=0
Nous laissons au lecteur le soin de vérifier que F est continue et vérifie F 0 (t) = f (t) pour tout
t ∈ I \ {t0 , . . . , tn }.
Démonstration
Remarquons que I s’écrit comme réunion croissante d’une suite (In ) d’intervalles compacts.
Soit t0 ∈ int (I). Supposons démontré que f possède
une primitive Φn dans In telle que Φn (t0 ) =
0. On observe alors que si m ≥ n, on a Φm | = Φn . En effet ces deux primitives d’une même
n
fonction différent d’une constante d’après la Proposition 3.5.1. Comme elles sont égales en t0
elles coı̈ncident sur In . On définit alors sans ambiguı̈té une primitive Φ de f par Φ(t) = Φn (t) si
t ∈ In .
On peut donc supposer I compact. D’après le Théorème 3.5.1 f est limite uniforme dans I
d’une suite de fonctions en escalier (fn ). Soit Φn une primitive de fn et Dn ⊂ I telle que Φ0n = fn
sur I \ Dn . Choisissons Φn telle que Φn (t0 ) = 0 où t0 ∈ I. On peut alors appliquer le Théorème
3.2.2 qui nous permet de conclure que la suite (Φ Sn ) converge uniformément vers une fonction Φ
0
telle que Φ = f sur l’ensemble I \ D où D = n≥0 Dn est au plus dénombrable, ce qui achève
la démonstration.
On peut alors définir l’intégrale d’une fonction réglée définie sur un intervalle I et à valeurs
dans un espace de Banach. Pour cette intégrale une primitive de fonction réglée est l’intégrale de
sa dérivée.
où Φ est une primitive de f dont l’existence est garantie par le Théorème 3.5.2. On a alors
Z b
Z b
f (t)dt ≤ kf (t)kdt .
a a
62
Démonstration Rb
La définition de a f (t)dt ne dépend pas de la primitive Φ car d’après la Proposition 3.5.1,
deux primitives d’une même fonction différent d’une constante. Pour démontrer l’inégalité
Z b
Z b
f (t)dt
≤ kf (t)kdt
a a
Il existe alors une partie au plus dénombrable D ⊂ [a, b] telle que sur [a, b] \ D,
Φ0 (t) = f (t),
d’où kΦ0 (t)k = kf (t)k. Remarquons que la fonction kf (.)k est réglée car la norme est
R t continue.
0
Il existe donc ∆ ⊂ [a, b] au plus dénombrable telle que G (t) = kf (t)k où G(t) = a kg(s)kds.
Pour t ∈ [a, b] \ (D ∪ ∆) on a donc
d’où
Z b
Z b
f (t)dt
≤ kf (t)kdt.
a a
Remarque 3.5.1
a) Soit I = [a, b], f : I −→ E une fonction en escalier à valeurs dans un espace de Banach
E et soient a = t0 < · · · < tn = b telle que f (t) = ci sur ]ti , ti+1 [. On sait que la fonction
Φ : I −→ E définie par Φ(t) = c0 (t − t0 ) si t ∈ [t0 , t1 ] et
i−1
X
Φ(t) = ci (t − ti ) + ck (tk+1 − tk )
k=0
d’où
Z b n−1
X
f (t)dt = ck (tk+1 − tk ).
a k=0
63
b) Il est important d’observer que si f : [a, b] −→ E est une fonction réglée, la fonction
Φ : [a, b] → E définie par Z t
Φ(t) = f (s)ds
a
Etant donné > 0 il existe η > 0 tel que |s − t| ≤ η implique kf (s) − f (t)k ≤ . On a donc, pour
|s − t| ≤ η
Z t+h
kΦ(t + h) − Φ(t) − hf (t)k ≤ ds = |h|,
t
d’où le résultat.
Démonstration
Comme g 0 est réglée, la fonction
Z t
γ(t) = g(t0 ) + g 0 (s)ds
t0
est une primitive de g 0 sur [a, b]. Comme g est aussi une primitive de g 0 et que g(t0 ) = γ(t0 ) on a
g(.) = γ(.) sur I, ce qui achève la démonstration.
Nous laissons au lecteur le soin d’établir les règles de calcul pour cette intégrale. Nous donnons
cependant le résultat utile suivant qui permet d’établir un lien entre l’intégrale de la limite et la
limite des intégrales.
64
Théorème 3.5.5 Soit I = [a, b] un intervalle compact et soit fn : I −→ F une suite de fonctions
réglées à valeurs dans un espace de Banach F . On suppose que (fn ) converge uniformément vers
f dans I. Alors f est réglée dans I et
Z b Z b
lim fn (t)dt = f (t)dt.
n→∞ a a
Démonstration
La fonction f est réglée. En effet, d’après le Théorème 3.5.1 pour tout n ∈ N, il existe une
fonction ϕn en escalier dans I telle que
kϕn − fn k ≤ 1/n.
La suite (ϕn ) converge donc uniformément vers f dans I, ce qui montre, utilisant de nouveau le
Théorème 3.5.1 que f est réglée dans I. On a alors
Z b Z b
Z b
fn (s)ds − f (s)ds
≤ kfn (s) − f (s)kds ≤ (b − a)kfn − f k∞
a a a
d’où le résultat.
Théorème 3.5.6 Soient F , G des espaces de Banach, soit I = [a, b] un intervalle compact, soit
f : I −→ F une fonction réglée et soit u ∈ L(F, G). Alors u ◦ f est réglée et
Z b Z b
u f (t)dt) = u(f (t))dt.
a a
Démonstration
Le fait que u ◦ f soit réglée découle de la continuité de u. Supposons que f est en escalier, il
en est alors de même de u ◦ f . On a alors
Z b n−1
X
f (t)dt = ck (tk+1 − tk ),
a k=0
Z b n−1
X
u f (t)dt = u(ck )(tk+1 − tk )
a k=0
Z b
= u(f (t))dt.
a
Revenons au cas général. Il existe une suite (fn ) de fonctions en escalier qui converge uni-
formément vers f sur I. Comme, pour tout n ∈ N et pour tout t ∈ I, on a
65
la suite de fonctions en escalier (u ◦ fn ) converge uniformément vers u ◦ f sur I. Utilisant le
Théorème 3.5.5, il vient
Z b Z b
u(f (t))dt = lim u(fn (t))dt
a n→∞ a
Z b
= lim u (fn (t))dt car fn est en escalier,
n→∞ a
Z b
= u lim (fn (t))dt car u est continue,
n→∞ a
Z b
= u f (t)dt
a
Exemple 3.5.1
a) Dans le cas où F = Rn , G = R, i ∈ [1, n], u(x1 , . . . , xn ) = xi et f (t) = (f1 (t), . . . , fn (t)),
on a
Z b Z b
f (t)dt = fi (t)dt, et donc
a i a
Z b Z b Z b
f (t)dt = f1 (t)dt, . . . , fn (t)dt .
a a a
b) Dans le cas où u : L(E, F ) → F est définie par u(A) = A(h), h étant un élément fixé de
E (vérifiez que u ∈ L(L(E, F ), F )) et si A : I → L(E, F ) est réglée, le Théorème 3.5.6 conduit
à Z b Z b
A(t)(h)dt = A(t)dt (h).
a a
66
Chapitre 4
67
est une isométrie linéaire de L(E, Lp−1 (E; F )) dans Lp (E; F ) et l’isométrie réciproque
et
Φ(D(Dp−1 f )(a)) = Dp f (a). (4.2)
Si de plus f est p fois différentiable dans un voisinage V de a, alors
D(Dp−1 f ) = Ψ ◦ Dp f sur V,
et
Dp f = Φ ◦ D(Dp−1 f ) sur V.
Dans le cas où f est définie sur un intervalle ouvert de R, il est utile de faire le lien entre
différentielle d’ordre p et dérivée d’ordre p.
Proposition 4.1.1 Soit f : I −→ E une fonction définie sur un intervalle ouvert I de R. Alors
f est p fois dérivable en a si et seulement si f est p fois différentiable en a. De plus pour tout
(u1 , · · · , up ) ∈ Rp on a
Dp f (a)(u1 , · · · , up ) = u1 · · · up f (p) (a) (4.3)
et
f (p) (a) = Dp f (a)(1, · · · , 1). (4.4)
Démonstration. Par récurrence sur p. Pour p = 1, c’est le Théorème 2.1.1 du Chapitre 2. Suppo-
sons le résultat à l’ordre p. Les relations (4.3) et (4.4) peuvent s’ecrire
Dp f = α ◦ f (p) et f (p) = e ◦ Dp f,
68
d’où
= e(D(Dp f )(a)(1))
= (D(Dp f )(a)(1))(1, · · · , 1)
Définition 4.1.3 On dit que f est de classe C p sur U si Dp f existe sur U et si l’application
Dp f : U −→ Lp (E; F ) est continue. On dit que f est de classe C ∞ si f est de classe C p pour tout
p ∈ N∗ .
Proposition 4.1.2 Soit f ∈ L2 (E, F ; G) une application bilinéaire continue, alors f est de classe
C ∞ et Dp f = 0 pour tout p > 2.
Démonstration. On sait (voir chapitre 2, exemple 2.1.1, c)) que f est différentiable sur E × F et
que pour tout (x1 , x2 ) ∈ E 2 , (u, v) ∈ E 2
69
Démonstration. Définissons Φ : L(F, G) × L(E, F ) −→ L(E, G) par Φ(A, B) = A ◦ B.
L’application Φ est bilinéaire et comme kΦ(A, B)k ≤ kAkkBk, elle est continue. Utilisant le
Théorème 2.2.1 du chapitre 2, on a, pour tout x voisin de a
Les propositions suivante sont utiles pour le calcul des différentielles d’ordre supérieur.
Dp f (a)(u1 , · · · , up ) = Dg(a)(u1 ).
70
Démonstration. a) On a ϕ = (e ◦ g)(a + tu) avec e(A) = A(v) pour A ∈ Lp−1 (E; F ) est linéaire
et continue et g(x) = Dp−1 f (x) donc g est différentiable an a et
b) Remarquons que ψ est définie dans un intervalle ouvert contenant t. Pour p = 1, ψ est
dérivable en t car f est différentiable en a + tu et t 7−→ a + tu est dérivable sur R, et, d’après la
règle de la différentielle d’une composée, on a
ψ 0 (t) = Df (a + tu)(u).
Théorème 4.2.1 Soit f : U −→ F une application deux fois différentiable en a ∈ U . Alors pour
tout u, v ∈ E
D2 f (a)(u, v) = D2 f (a)(v, u).
71
pour tout w tel que kwk ≤ δ. Posons, pour tout kuk ≤ δ/2 et kvk ≤ δ/2,
On a donc
kDGu (v)kL(E,F ) ≤ ε(kuk + kvk) + εkvk ≤ 2ε(kuk + kvk).
Utilisant le corollaire 3.2.1 avec C = B̄(0, kvk), il en résulte que, pour tout kuk ≤ δ/2 et kvk ≤
δ/2,
On a alors
d’où
f (a + tu + tv) − f (a + tv) − f (a + tu) + f (a)
(D(Df )(a)(u))(v) = lim .
t→0 t2
Comme le membre de droite ne change pas quand on permute u et v, il en est de même du membre
de gauche donc (D(Df )(a)(u))(v) = (D(Df )(a)(v))(u), soit D2 f (a)(u, v) = D2 f (a)(v, u).
car toute permutation de [1, p] est produit d’un nombre fini de telles transpositions. Procédons par
récurrence sur p. Pour p = 2 le résultat est démontré (Théorème 4.2.1). Supposons alors le résultat
vrai pour tout 2 ≤ k ≤ p − 1 avec p ≥ 3.
72
Si {i, j} = {1, 2}. Soient (u3 , · · · , up ) ∈ E p−2 et soit g(x) = Dp−2 f (x)(u3 , · · · , up ). L’ap-
plication g définie au voisinage de a est 2 fois différentiable au voisinage de a grâce à la Pro-
position 4.1.3 car g = e ◦ Dp−2 f avec e : Lp−2 (E; F ) −→ F linéaire continue définie par
e(A) = A(u3 , · · · , up ). D’après la Proposition 4.1.4, on a pour tout u2 ∈ E,
D2 g(a)(u2 , u1 ) = Dp f (a)(u1 , u2 , · · · , up ).
La proposition suivante est importante. Si sa conclusion coule de source, il n’en est pas de même
de sa démonstration.
73
pour tout x voisin de a. Cela s’écrit
Dq (Dp f ) = Ψ ◦ Dq+p f,
avec Ψ : Lp+q (E; F ) −→ Lq (E; Lp (E; F )) linéaire continue (le vérifier) définie par
pour tout uq+1 ∈ E. Par ailleurs, on a g = e ◦ Φ avec e : Lp (E; F ) −→ F linéaire continue définie
par e(A) = A(v1 , · · · , vp ) et Φ : U −→ Lp (E; F ) définie par Φ(x) = (Dq (Dp f )(x))(u1 , · · · , uq ).
On a alors, appliquant la Proposition 4.1.4 à Dp f , et utilisant la symétrie des différentielles d’ordre
supérieur,
DΦ(a)(uq+1 ) = Dq+1 (Dp f )(a)(u1 , · · · , uq , uq+1 )
et
Dg(a)(uq+1 ) = e(DΦ(a)(uq+1 )) = (Dq+1 (Dp f )(a)(u1 , · · · , uq , uq+1 ))(v1 , · · · , vp ),
ce qui joint à (4.6) montre la propriété au rang q + 1.
74
Théorème 4.2.3 Soit f : U −→ V et g : V −→ G deux applications telles que f (U ) ⊂ V où U
et V sont des ouverts d’espaces normés E, F et G est un espace normé.
a) Si f est p fois différentiable en a ∈ U et si g est p fois différentiable en b = f (a) ∈ V , alors
g ◦ f est p fois différentiable en a.
b) Si f est de classe C p sur U et si g est de classe C p sur V , alors g ◦ f est de classe C p sur U .
Démonstration. a) Procédons par récurrence sur p. Pour p = 1 le résultat est vrai. Supposons le
résultat vrai à l’ordre p − 1. On a, dans un voisinage W de a
où A : U −→ L(F, G) et B : U −→ L(E, F ) sont définis par A(x) = (Dg ◦ f )(x), B(x) =
Df (x) et
Φ : L(F, G) × L(E, F ) −→ L(E, G)
est définie par Φ(A, B) = A ◦ B. Or Dg et f sont p − 1 fois différentiables en a (utiliser la
Proposition 4.2.1), donc il en est de même de A = Dg ◦ f , de B = Df (utiliser les Pro-
priétés 4.2.1 et 4.2.2) et de (A, B) (Proposition 4.2.2). Par ailleurs Φ est bilinéaire et continue
car kΦ(A, B)k ≤ kAkkBk, elle est donc p − 1 fois différentiable d’après la Proposition 4.1.2.
L’hypothèse de récurrence nous permet de conclure que D(g ◦ f ) = Φ ◦ (A, B) est p − 1 fois
différentiable en a donc g ◦ f est bien p fois différentiable en a (utiliser de nouveau les Propriétés
4.2.1 et 4.2.2).
b) Même méthode que dans a).
Démonstration. On sait que Isom(E, F ) est ouvert dans L(E, F ), que I est de classe C 1 (chapitre
2) et que pour tout h ∈ L(E, F ), on a DL(u)h = −u−1 ◦ h ◦ u−1 . Pour tout (v, w) ∈ L(F, E) ×
L(F, E), et pour tout h ∈ L(E, F ), posons
ψ(v, w)(h) = v ◦ h ◦ w.
On a donc Ψ(v, w) ∈ L(L(E, F ) × L(F, E)). L’application Ψ est alors bilinéaire de L(F, E) ×
L(F, E) dans L(L(E, F ) × L(F, E)), elle est de plus continue car
75
d’après (4.7). Par ailleurs
DI(u) = Ψ(I(u), I(u)).
Supposons que I soit de classe C p , il en est alors de même de l’application (I(.), I(.)) ainsi que
de Ψ qui est bilinéaire continue. Utilisant le Théorème 4.2.3, b) on obtient que DI = Ψ ◦ (I, I)
est de classe C p donc I est de classe C p+1 . Par récurrence, on a donc bien I de classe C ∞ .
Comme application de la différentielle seconde, nous allons maintenant caractériser la conve-
xité des fonctions deux fois différentiables.
Définition 4.2.1 On dit qu’une fonction f : U −→ R définie sur un ouvert convexe U d’un espace
normé E est convexe si, pour tout x, y ∈ x, y ∈ U et pour tout t ∈ [0, 1], on a
Théorème 4.2.5 Soit f : U −→ R définie sur un ouvert convexe U d’un espace normé E. On
suppose que f est deux fois différentiable sur U . Alors f est convexe si et seulement si
ainsi donc
Df (y)(x − y) ≤ f (x) − f (y),
d’où par addition
(Df (y) − Df (x))(y − x) ≥ 0 pour tout x, y ∈ U.
Introduisons alors, pour x ∈ U et u ∈ E, la fonction ϕ(t) = Df (x + tu)(u) définie pour tout t
voisin de 0. Pour 0 ≤ t, on a
donc ϕ(t) ≥ ϕ(0). Il en résulte que ϕd (0) ≥ 0 donc D2 f (x)(u, u) ≥ 0. Réciproquement, suppo-
sons (4.8). Pour tout x, y ∈ U et t ∈ [0, 1], posons ψ(t) = f (x + t(y − x)) − Df (x)(x + t(y − x))
de telle sorte que ψ 0 (t) = (Df (x + t(y − x)) − Df (x))(y − x) et
76
Posant xt = x + t(y − x), t ∈ [0, 1], il vient
et
f (x) ≥ f (xt ) + tDf (xt )(y − x).
Multipliant la première inégalité par t, la seconde par 1 − t et ajoutant, on obtient
Dj f = Φj ◦ Df
Φj (A) = A ◦ ϕj .
77
Comme Df et Φj sont différentiables en a il en est de même de Dj f . Il en résulte que les
différentielles partielles
Di Dj f (a) ∈ L(Ei , L(Ej , F ))
existent pour tout i, j ∈ [1, n]. On remarque alors que
n
X
Df = Tj ◦ Dj f
j=1
où
Tj ∈ L(L(Ej , F )), L(E1 × · · · × En , F ))
est définie par
Tj (A) = A ◦ πj
avec πj (x1 , · · · , xn ) = xj . On a alors pour 1 ≤ i ≤ n, 1 ≤ j ≤ n, et u, v ∈ E1 × · · · × En
n
X
D(Df )(a) = Tj ◦ D(Dj f )(a)
j=1
donc
n
X
D(Df )(a)(u) = Tj D(Dj f )(a)u)
j=1
Xn n
X
= Tj Di (Dj f )(a)ui
j=1 i=1
n
XX n
= Di Dj f (a)ui ◦ πj
i=1 j=1
d’où n X
n
X
D2 f (a)(u, v) = Di Dj f (a)(ui , vj ).
i=1 j=1
Posons alors, pour ū ∈ Ek , v̄ ∈ El , u = (0, · · · , ū, · · · , 0), v = (0, · · · , v̄, · · · , 0). On a alors
et
D2 f (a)(v, u) = Dl Dk f (v̄, ū).
Comme D2 f (a)(u, v) = D2 f (a)(v, u), on a bien Dk Dl f (ū, v̄) = Dl Dk f (v̄, ū).
Comme cas particulier, on obtient que, pour tout 1 ≤ i ≤ n, Di Di f (a) ∈ L2 (Ei ; F ) est
symétrique.
78
Théorème 4.2.6 Soit f : U ⊂ E1 × · · · × En −→ F une application telle que les différentielles
partielles Di Dj f existent et sont continues en un point a ∈ U . Alors f est deux fois différentiable
en a et, pour tout u, v ∈ E1 × · · · × En
n X
X n
2
D f (a)(u, v) = Dj Di f (a)(uj , vi ).
i=1 j=1
Pn
Démonstration. On a Df = i=1 Ti ◦ Di f (voir la démonstration du Corollaire 4.2.3) et Di f
est différentiable en tout x ∈ U car les différentielles partielles Dj Di f existent et sont continues
en a. Il résulte donc du Théorème 2.4.1 que Df est différentiable en a et donc que f est deux fois
différentiable en a. La formule donnant D2 f (a) a été démontrée dans le Corollaire 4.2.3.
On a alors
n X n
X ∂2f
D2 f (a)(u, v) = Dg(a)(v) = (a)ui vj = hHf (a), ui,
i=1 j=1
∂x j ∂x i
∂2f
(Hf (a))ij = (a).
∂xj ∂xi
Remarquons que
∂2f ∂2f
(a) = D2 f (a)(ei , ej ) = D2 f (a)(ej , ei ) = (a).
∂xj ∂xi ∂xi ∂xj
Remarquons aussi que
∂2f
Di Dj f (a)(s, t) = st (a),
∂xj ∂xi
79
donc
∂2f ∂2f
kDi Dj f (b) − Di Dj f (a)kL2 (R;R) =
(b) − (a)
.
∂xj ∂xi ∂xj ∂xi
∂2f
Il en résulte que si les dérivées partielles secondes existent et sont continues en a alors les
∂xj ∂xi
différentielles partielles secondes existent au voisinage de a et sont continues en a. Le Théorème
4.2.6 nous permet alors d’affirmer que f est deux fois différentiables en a et que l’on a alors en
particulier
∂2f ∂2f
(a) = (a).
∂xj ∂xi ∂xi ∂xj
Dans le cas où l’application f est définie sur un ouvert U de E1 × · · · × En , pour toute suite
finie {i1 , · · · , ip } ⊂ [1, n], on introduit par récurrence les différentielles partielles d’ordre p
Di1 Di2 · · · Dip f (a) ∈ Lp (Ei1 × · · · × Eip , F ).
On montre alors facilement par récurrence que si f est p fois différentiable en a on a pour tout
(u1 , · · · up ) ∈ (E1 × · · · × En )p
X
Dp f (a)(u1 , · · · , up ) = Di1 Di2 · · · Dip f (a)(ui1 , · · · , uip ).
{i1 ,···,ip }⊂[1,n]
80
(−1)p [f (p+1) , g] + (−1)p [f (p) , h]
d’où p
X 0
(−1)i [f i , g p−i ] = [f, g (p+1) ] − (−1)p+1 [f (p+1) , g]
i=0
Théorème 4.3.1
a) F ORMULE DE TAYLOR AVEC RESTE INT ÉGRAL. Soient I un intervalle ouvert de R, f :
I −→ E une fonction à valeurs dans un espace de Banach E qui est p + 1 fois continuement
dérivable sur I. Alors, pour tout a, t ∈ I
p t
(t − a)i (t − s)p (p+1)
X Z
(i)
f (t) = f (a) + f (s)ds.
i=0
i! a p!
b) F ORMULE DE TAYLOR -L AGRANGE. Si l’on suppose seulement que f est p+1 fois dérivable
sur I et que
sup kf (p+1) (s)k ≤ M < +∞
s∈I
alors p
X
|t − a|p+1
(t − a)i (i)
f (t) − f (a)
≤ M.
i=0
i! (p + 1)!
(t − s)p
Démonstration. a) On applique la Proposition 4.3.1 avec g(s) = , F = R, G = E et
p!
[x, t] = tx. On remarque que
(t − s)p−i
g (i) (s) = (−1)i pour 0 ≤ i ≤ p,
(p − i)!
g (p+1) (s) ≡ 0,
de telle sorte que
81
donc p
(t − s)p (p+1) X (t − s)i (i) 0
f (s) = f (s) . (4.9)
p! i=0
i!
Intégrant entre a et t, on obtient
p
Z t
(t − s)p (p+1) X (t − a) i
f (s) = f (t) − f (i) (a)
a p! i=0
i!
d’où le résultat.
Pp (t − s) i (i)
b) Posons ψ(s) = i=0 f (s). D’après (4.9) on a
i!
0 (t − s)p (p+1)
ψ (s) = f (s).
p!
Supposons t ≥ a, le cas t ≤ a se traı̂tant de manière analogue. Pour tout s ∈ I, on a
0 |t − s|p
kψ (s)k ≤ M .
p!
(t − s)p
kψ 0 (s)k ≤ M = g 0 (s)
p!
(t − s)p+1
avec g(s) = −M . On applique alors le Théorème des accroissements finis et on obtient
(p + 1)!
Pp (t − a) i (i)
d’où le résultat car ψ(t) = f (t) et ψ(a) = i=0 f (a).
i!
Dans le cas d’applications entre espaces normés, on a les formules de Taylor suivantes
Théorème 4.3.2
a) F ORMULE DE TAYLOR AVEC RESTE INT ÉGRAL. Soit f : U −→ F une application p + 1
fois continuement différentiable définie sur un ouvert U d’un espace normé E à valeurs dans un
espace de Banach F . Alors pour tout x ∈ U et h ∈ E tels que le segment [x, x + h] soit contenu
dans U , on a
p Z 1
X 1 i i (1 − s)p p+1
f (x + h) = D f (x)h + D f (x + sh)hp+1 ds
i=0
i! 0 p!
où hi = (h, · · · , h) ∈ E i .
82
b) F ORMULE DE TAYLOR -L AGRANGE. Soit f : U −→ F une application p + 1 fois différen-
tiable définie sur un ouvert U d’un espace normé E à valeurs dans un espace de Banach F . On
suppose qu’il existe M ≥ 0 telle que kDp+1 f (z)k ≤ M pour tout z ∈ U . Alors pour tout x ∈ U
et h ∈ E tels que le segment [x, x + h] soit contenu dans U , on a
p
X 1 i
khkp+1
f (x + h) − D f (x)hi
≤ M .
i=0
i! (p + 1)!
Démonstration. a) Remarquons qu’il existe η > 0 tel que x + sh ∈ U pour tout s ∈] − η, 1 + η[.
Posons alors g(s) = f (x + sh), g est alors p + 1 fois continuement dérivable sur ] − η, 1 + η[
et, utilisant la Proposition 4.1.5, b), on a g i (s) = Di f (x + sh)hi . On applique alors le Théorème
4.3.1 avec a = 0 et t = 1 et on a le résultat.
b) Posons g(t) = f (x + th), on a g (i) (t) = Di f (x + th)hi pour 1 ≤ i ≤ p + 1 (Proposition
4.1.5, b)), d’où supt∈[0,1] kg (p+1) (t)k ≤ M khkp+1 . On applique alors le Théorème 4.3.1, b) et on
obtient que
p
X
M khkp+1
g (i) (0)
g(1) −
≤
i=0
i! (p + 1)!
soit p
X 1 i
M khkp+1
i
f (x + h) − D f (x)h
≤ ,
i=0
i! (p + 1)!
d’où le résultat.
Il est également possible d’obtenir une formule de Taylor sous des hypothèses plus faibles.
Théorème 4.3.3 F ORMULE DE TAYLOR -YOUNG. Soit f : U −→ F une application définie sur
un ouvert U d’un espace normé E à valeurs dans un espace normé F que l’on suppose p fois
différentiable en a ∈ U . Alors
p
X 1 i
f (a + h) = D f (a)hi + khkp ε(h)
i=0
i!
Posons
1 i 1
ϕi (z) = D f (a)z i = (Di f (a) ◦ L)(z)
i! i!
83
avec L(z) = (z, · · · , z) ∈ E i . Utilisant le calcul de la différentielle d’une application multilinéaire
continue (voir chapitre 2, exemple 2.1.4, c)), on a pour tout u ∈ E,
i
X 1 i 1
Dϕi (z)(u) = (D f (a)(z, · · · , u, · · · , z) = Di f (a)(z i−1 , u)
k=1
i! (i − 1)!
donc
Dϕi (z) = Di−1 (Df )(a)(z i−1 ).
Il en résulte que
p−1
X 1 j
Dg(z) = Df (a + z) − D (Df )(a)(z j ).
j=0
j!
Par hypothèse de récurrence appliquée à Df , pour tout ε > 0, il existe η > 0 tel que kzk ≤ η
implique
kDg(z)k ≤ εkzkp−1 .
Soit khk ≤ η et soit θ(t) = g(th) pour tout t ∈ [0, 1]. On a θ0 (t) = Dg(th)h donc kθ0 (t)k ≤
εkhkp−1 khk = εkhkp . D’après le Théorème des accroissements finis, on a donc
d’où le résultat.
Remarque 4.3.1 Dans le cas d’une fonction f : U −→ R définie sur un ouvert U de Rn , et deux
fois différentiable en a, on a
n
1 X ∂f
f (a) + Df (a)u + D2 f (a)(u, u) = f (a) + (a)ui +
2 i=1
∂x i
n
1 X ∂2f 2
X ∂2f
(a)(ui ) + 2 (a)ui uj .
2 i=1 ∂x2i 1≤i<j≤n
∂xi ∂xj
Si f est trois fois différentiable en a, on peut calculer D3 f (a)(u, u, u) par exemple de la manière
suivante. On pose
n X n
X ∂2f
g(x) = D2 f (x)(u, u) = (x)ui uj ,
i=1 j=1
∂x i ∂x j
84
que l’on peut écrire
n
3
X ∂3f X ∂3f
D f (a)(u, u, u) = 3
(a)(ui )3 + 3 2 2
(a)(ui )2 uj +
i=1
∂xi 1≤i<j≤n
∂x i ∂x j
X ∂3f
6 (a)ui uj uk .
1≤i<j<k≤n
∂x i ∂xj ∂xk
Théorème 4.4.1
a) Si f admet un extremum local en a ∈ U et si f est différentiable en a, alors
Df (a) = 0.
D2 f (a)(h, h)
85
Si f est deux fois différentiable en a, on a
t2 2
D f (a)(h, h) + t2 ε(t) = f (a + th) − f (a) ≥ 0.
2
Divisant par t2 et faisant tendre t vers 0, il vient
D2 f (a)(h, h) ≥ 0.
Dans le cas où f : U −→ R est une fonction convexe définie sur un ouvert convexe, on a une
condition nécessaire et suffisante de minimalité.
Théorème 4.4.2 f : U −→ R est une fonction convexe définie sur un ouvert convexe d’un espace
normé. Alors les propriétés suivantes sont équivalentes pour a ∈ U tel que f soit différentiable en
a:
a) f (a) = minx∈U f (x)
b) Df (a) = 0.
Démonstration. Il suffit de démontrer que b) implique a). Pour tout x ∈ U et t ∈]0, 1], on a
f (a + t(x − a)) ≤ tf (x) + (1 − t)f (a), donc
f (a + t(x − a)) − f (a)
≤ f (x) − f (a).
t
faisant tendre t vers 0, il vient
0 = Df (a)(x − a) ≤ f (x) − f (a),
pour tout x ∈ U , d’où le résultat.
On peut aussi obtenir des conditions d’optimalité pour des problèmes avec contraintes c’est à
dire pour un extremum local de f non plus sur U mais sur U ∩ M où M est une partie fermée de
E. On donnera un résultat général de ce type dans le chapitre suivant. Dans le cas des fonctions
convexes, on peut dès maintenant donner un résultat.
86
Théorème 4.4.3 Soit U ⊂ X un ouvert d’un espace de Hilbert et soient f , g : U −→ R deux
fonctions convexes. On suppose que
a) f est différentiable sur U et il existe y ∈ U tel que f (y) < 0.
b) x̄ ∈ S := {x ∈ U : f (x) ≤ 0} est tel que g(x̄) = inf x∈S g(x) et f est différentiable en x̄.
Alors il existe λ ≤ 0 tel que
∇g(x̄) = λ∇f (x̄)
(4.10)
λf (x̄) = 0.
Démonstration. On remarque que S est convexe, que son intérieur est non vide et que
Si f (x̄) < 0, alors g a un minimum local en x̄, donc ∇g(x̄) = 0 = 0∇f (x̄) avec 0f (x̄) = 0.
Supposons alors f (x̄) = 0. Si ∇g(x̄) = 0, on a la conclusion voulue. On peut donc supposer
que ∇g(x̄) 6= 0. Pour tout x ∈ S et t ∈]0, 1], on a x̄ + t(x − x̄) ∈ S donc
Cela implique que h∇g(x̄), x − x̄i > 0 pour tout x ∈ int S. Sinon, il existerait x0 ∈ int S tel que
h∇g(x̄), x0 − x̄i ≤ 0, ce qui impliquerait h∇g(x̄), x0 − x̄i = 0 et
La fonction convexe h∇g(x̄), ·i aurait alors un minimum local, donc global (voir Remarque 4.4.1),
ce qui impliquerait la contradiction ∇g(x̄) = 0. On en déduit que h∇g(x̄), x − x̄i ≤ 0 implique
x∈/ int S donc f (x) ≥ 0 = f (x̄). On obtient donc
où
H = {x ∈ X : h∇g(x̄), x − x̄i ≤ 0}.
Soit alors u ∈ X tel que h∇g(x̄), ui ≤ 0. Comme x̄ + tu ∈ H ∩ U pour tout t > 0 assez
f (x̄ + tu) − f (x̄)
petit, il vient ≥ 0 donc h∇f (x̄), ui ≥ 0. Il en résulte que h∇f (x̄), ui = 0 si
t
h∇g(x̄), ui = 0, ce qui implique l’existence de λ ∈ R∗ tel que ∇g(x̄) = λ∇f (x̄). On remarque
enfin que λ < 0 car h∇f (x̄), ui ≥ 0 si h∇g(x̄), ui ≤ 0 et que λf (x̄) = 0.
87
Réciproquement, supposons que (4.10) est vérifié. Si λ = 0, alors ∇g(x̄) = 0 donc x̄ réalise le
minimum de g sur U donc sur S. Supposons donc λ 6= 0 de telle sorte que f (x̄) = 0. On a alors,
pour tout x ∈ S,
0 ≥ f (x) − f (x̄) ≥ h∇f (x̄), x − x̄i,
donc h∇g(x̄), x − x̄i ≥ 0 car ∇g(x̄) = λ∇f (x̄) avec λ < 0. On a alors, pour tout x ∈ S,
88
89
Chapitre 5
Nous illustrons dans ce chapitre le principe qu’une application différentiable se comporte locale-
ment comme sa différentielle.
Définition 5.1.1
a) Une application f : E −→ F où E et F sont des espaces topologiques est un homéomor-
phisme si
– f est bijective
– f et f −1 sont continues.
Autrement dit f est donc un homéomorphisme si et seulement
– f est bijective,
– f (U ) est ouvert dans F pour tout ouvert U de E,
– f −1 (V ) est ouvert dans E pour tout ouvert V de F.
b) Soient U ⊂ E et, V ⊂ F des ouverts d’espaces de Banach E et F . On dit qu’une applica-
tion f : U −→ V est un difféomorphisme si
– f est bijective,
– f et f −1 sont différentiables.
c) On dit que f est un C r difféomorphisme si f est un difféomorphisme et si f et f −1 sont de
classe C r .
Remarque 5.1.1
a) Une application bijective et continue n’est pas toujours un homéomorphisme. En effet, soit
(E, d) un espace métrique dont la topologie n’est pas la topologie discrète et δ(x, y) la distance
définie par
0 si x = y
δ(x, y) =
1 si x 6= y.
90
Considérons f : (E, δ) −→ (E, d) définie par f = IE . C’est une application continue bijective
mais f −1 n’est pas continue car si X ⊂ E qui n’est pas ouvert pour (E, d) on a X est ouvert
pour (E, δ) alors que f (X) = X n’est pas ouvert pour (E, d).
b) On remarque qu’un difféomorphisme est un homéomorphisme. Mais la fonction f (x) =
x3 qui est un homéomorphisme différentiable de R dans R n’est pas un difféomorphisme car
f −1 (y) = y 1/3 n’est pas différentiable en 0.
c) On remarque également que si f : U −→ V est un difféomorphisme alors Df (x) ∈
Isom(E, F ) pour tout x ∈ U . En effet, f et f −1 sont différentiables en x et y = f (x) et on a
f ◦ f −1 = IdV ,
f −1 ◦ f = IdU .
Utilisant le résultat de dérivation d’une composée, on a
Df (x) ◦ Df −1 (y) = IdF
et
Df −1 (y) ◦ Df (x) = IdE ,
ce qui montre que bien que Df (x) est bijective et que Df −1 (y) = (Df (x))−1 .
Le résultat suivant est une étape vers le résultat principal de cette section à savoir le Théorème du
difféomorphisme local 5.1.2.
Théorème 5.1.1 TH ÉOR ÈME D ’ INVERSION LOCALE Soit f : U −→ F une application diffé-
rentiable définie sur un ouvert U d’un espace de Banach et à valeurs dans un espace de Banach
F . On suppose que Df est continue en a ∈ U et que Df (a) ∈ Isom (E, F ). Alors
a) il existe des voisinages ouverts U 0 de a et V 0 de b = f (a) tels que f soit un homéomorphisme
de U 0 dans V 0 .
b) f −1 est Lipschitzienne sur V 0 , différentiable en b et on a Df −1 (b) = (Df (a))−1 .
Démonstration. Posons ψ = (Df (a))−1 ∈ Isom (F, E), et r(x) = f (x) − b − Df (a)(x − a).
Observons que pour y ∈ F et x ∈ U ,
y = f (x) ⇐⇒ y = b + Df (a)(x − a) + r(x)
⇐⇒ x = a + ψ(y − b − r(x))
⇐⇒ x = Fy (x)
où Fy (x) = a + ψ(y − b − r(x)). Choisissons η > 0 tel que
1
kDr(x)k = kDf (x) − Df (a)k ≤
2kψk
1
sur B̄(a, η), de telle sorte que r(.) est 2kψk -Lipschitzien sur B̄(a, η) ; et soit y ∈ B̄(b, δ) où δ =
η
2kψk
. Pour tout x ∈ B̄(a, η) on a, notant que 0 = r(a)
η 1
kFy (x) − ak ≤ kψk(ky − bk + kr(x)k) ≤ kψk( + kx − ak) ≤ η.
2kψk 2kψk
91
On a donc défini une application Fy : B̄(a, η) −→ B̄(a, η). Pour tout x, z ∈ B̄(a, η), on a
1 kx − zk
kFy (x) − Fy (z)k ≤ kψkkr(x) − r(z)k ≤ kψk kx − zk = .
2kψk 2
D’après le Théorème des applications contractantes de Banach, il existe un unique x ∈ B̄(a, η) tel
que f (x) = y noté x = g(y). Ceci montre l’existence d’une application g : B̄(b, δ) −→ B̄(a, η)
telle que f (g(y)) = y pout tout y ∈ B̄(b, δ). Notons que g(b) = a car Fb (a) = a et que, pour tout
y ∈ B̄(b, δ), g(y) est l’unique x ∈ B̄(a, η) tel que f (x) = y. Il en résulte que f est surjective de
B̄(a, η) dans B̄(b, δ). Considérons y, y 0 ∈ B(b, δ), on a
si ky − bk < δ d’où g(B(b, δ)) ⊂ B(a, η) en notant, comme d’habitude, B(x, r) la boule ouverte
de centre x et de rayon r. Posons alors V 0 = B(b, δ) et U 0 = g(B(b, δ)) ⊂ B(a, η). Pour tout
y ∈ B(b, δ), on a g(y) = f −1 (y) ∩ B(a, η), donc U 0 = f −1 (B(b, δ)) ∩ B(a, η), ce qui montre
que U 0 est ouvert. Remarquons que f (U 0 ) ⊂ V 0 et que f : U 0 −→ V 0 est surjective. Elle est
aussi injective car si x, x0 ∈ U 0 vérifient f (x) = f (x0 ) = y, on a x ∈ B(a, η) donc g(y) = x
et g(y) = x0 d’où x = x0 . On a donc montré que f : U 0 −→ V 0 est un homéomorphisme et que
f −1 = g est Lipschitzienne sur V 0 .
Il reste à prouver la différentiabilité de f −1 en b. Soit ε > 0 et 0 < α < η tel que kDr(x)k ≤ 2kψk
ε
2
ε
sur B(a, α), de telle sorte que r(.) est 2kψk2 -Lipschitzienne sur B(a, α). Posons β = α/2kψk.
Pour tout y ∈ B(b, β) on a
d’où
g(y) − g(b) − ψ(y − b) = −ψ(r(g(y))) = ψ(r(g(b))) − ψ(r(g(y))).
Il en résulte que
kg(y) − g(b) − ψ(y − b)k ≤ kψkkr(g(y)) − r(g(b))k.
92
Comme r(.) est Lipschitzienne de rapport ε/2kψk2 sur B(a, α), et comme g(y), g(b) ∈ B(a, α),
il vient
ε ε ε
kr(g(y) − r(g(b))k ≤ kg(y) − g(b)k ≤ 2kψkky − bk ≤ ky − bk.
2kψk2 2kψk2 kψk
ce qui montre bien que g et donc f −1 est différentiable en b avec Df −1 (b) = (Df (a))−1 .
On en déduit le
Théorème 5.1.2 TH ÉOR ÈME DU DIFF ÉOMORPHISME LOCAL
Soit f : U −→ F une application de classe C r , r ≥ 1 définie sur un ouvert U d’un es-
pace de Banach E et à valeurs dans un espace de Banach F . Soit a ∈ U tel que Df (a) ∈
Isom (E, F ). Alors, il existe des voisinages ouverts U 0 de a et V 0 de b = f (a) tels que f soit un C r
difféomorphisme de U 0 dans V 0 .
Démonstration. Comme Df (a) ∈ Isom (E, F ) qui est ouvert dans L(E, F ) et comme Df est
continue en a, on peut supposer en diminuant U au besoin, que Df (x) ∈ Isom (E, F ) pour tout
x ∈ U . Appliquant le Théorème 5.1.1, il existe des voisinages ouverts U 0 de a et V 0 de b = f (a)
tels que f soit un homéomorphisme de U 0 dans V 0 et tel que f −1 soit différentiable en b avec
Df −1 (b) = (Df (a))−1 . On peut alors appliquer de nouveau le Théorème 5.1.1 pour tout x ∈ U 0 . Il
en résulte que, pour tout y ∈ V 0 l’application f −1 est différentiable en y et Df −1 (y) = (Df (x))−1 .
L’application Df −1 est continue sur V 0 car
Df −1 = Φ ◦ Df ◦ f −1
où Φ : Isom (E, F ) −→ Isom (F, E) est définie par φ(u) = u−1 pour tout u ∈ Isom (E, F ).
Notons que f −1 , Df sont continues ainsi que Φ qui est de classe C ∞ (voir chapitre 4, Théorème
4.2.4). Il en résulte que f −1 est de classe C 1 sur V 0 . Supposons démontré que f −1 est de classe C s
sur V 0 pour s ∈ [1, r − 1]. On a f −1 de classe C s ainsi que Df et Φ. D’après le Théorème 4.2.3
du chapitre 2, on obtient donc que Df −1 est de classe C s sur V 0 d’où f −1 est de classe C s+1 . Le
théorème est alors complètement démontré.
Remarque 5.1.2 Si les hypothèses du théorème précédent sont vérifiées dans des espaces de di-
mension finie E = Rn et F = Rp , on a nécessairement n = p et l’hypothèse Df (a) ∈ Isom (E, F )
se traduit par det(Jf (a)) 6= 0 où Jf (a) est la matrice Jacobienne de f en a définie par
∂fi
Jf (a)i,j = (a)
∂xj
avec f = (f1 , . . . , fn ).
93
Le résultat suivant est une version globale du Théorème 5.1.1.
Théorème 5.1.3 Soit f : U −→ F une application définie sur un ouvert U d’un espace de Banach
E et à valeurs dans un espace de Banach F . On suppose que f est de classe C r . Alors, pour que
f soit un C r difféomorphisme de U dans f (U ) qui est alors ouvert, il faut et il suffit que f soit
injective et que Df (x) ∈ Isom (E, F ) pour tout x ∈ U .
Démonstration. Supposons que f est un C r difféomorphisme d’un ouvert U de E dans un en-
semble V = f (U ) de F . Il résulte de la Remarque 5.1.1, b) que Df (x) ∈ Isom (E, F ) pour tout
x ∈ U . Montrons alors que V = f (U ) est ouvert. Soit b = f (a) ∈ V avec a ∈ U . Il existe d’après
le Théorème 5.1.1 des voisinage ouverts U 0 ⊂ U de a et V 0 de b tel que f soit un homéomorphisme
de U 0 dans V 0 . On a alors V 0 ⊂ f (U ) = V .
Réciproquement Soit f : U −→ F une application injective de classe C r telle que Df (x) ∈
Isom (E, F ) pour tout x ∈ U . Observons que f est bijective de U dans f (U ). Par ailleurs f (U )
est ouvert et f −1 est continue sur f (U ). En effet, si on considère y = f (x) ∈ f (U ) avec x ∈ U ,
il existe d’après le Théorème 5.1.1 des voisinages ouverts U 0 de x et V 0 de y tels que f soit un
homéomorphisme de U 0 dans V 0 , ce qui implique que V 0 ⊂ f (U ) et que f −1 est continue en y.
L’application f est donc un homéomorphisme de U dans l’ouvert V = f (U ). De plus, comme
Df (x) ∈ Isom (E, F ), on peut appliquer le Théorème 5.1.2 qui nous assure que f −1 est r fois
continuement différentiable au voisinage de y. Ce qui montre que f est un C r difféomorphisme de
U dans l’ouvert f (U ), d’où le résultat.
94
Démonstration. Comme Isom (F, G) est ouvert dans L(F, G) et comme D2 f est continue, on a
(D2 f )−1 (Isom (F, G)) est un ouvert qui contient (a, b). On peut alors supposer que D2 f (x, y) ∈
Isom (F, G) pour tout (x, y) ∈ U . Définissons
h : U −→ E × G
par
h(x, y) = (x, f (x, y)).
pour tout (x, y) ∈ U . L’application h est de classe C r car h = (h1 , h2 ) avec h1 et h2 de classe C r .
On a donc, pour tout (u, v) ∈ E × F
On observe que L = Dh(a, b) est bijective. En effet si (u, v) ∈ ker L, alors u = 0 et D2 f (a, b)v =
0 d’où v = 0. De plus, si on considère (u, w) ∈ E × G, on a L(u, v) = (u, w) où l’on a posé
v = (D2 f (a, b))−1 (w − D1 f (a, b)u). Observons que l’on a montré que
ce qui implique que Dh(a, b) est un isomorphisme. On peut donc appliquer le Théorème 5.1.2 qui
garantit l’existence d’un voisinage V 0 de (a, b) tel que h soit un C r difféomorphisme de V 0 dans
l’ouvert W 0 = h(V 0 ) qui est un voisinage de h(a, b) = (a, 0). Il existe alors un voisinage ouvert
A de a et un voisinage ouvert B de 0 dans G tels que A × B ⊂ W ’. Posons W = A × B et
V = h−1 (W ). Il est clair que h est un C r difféomorphisme de V dans W . Pour tout x ∈ A, posons
L’application ϕ est de classe C r comme composée de trois applications de ce type. Pour tout
x ∈ A, on a h−1 (x, 0) = (x, ϕ(x)) donc (x, 0) = h(x, ϕ(x)) = (x, f (x, ϕ(x))) ce qui montre que
f (x, ϕ(x)) = 0. De plus, si (x, y) ∈ V vérifie f (x, y) = 0 on a h(x, y) = (x, 0) = h(x, ϕ(x)) et
(x, ϕ(x)) ∈ V ce qui implique y = ϕ(x) car h est injective sur V . Il reste alors à calculer Dϕ. On
remarque pour ceci que pour tout x ∈ A on a f (x, ϕ(x)) = 0. Remarquons alors que f ◦ Φ = 0
où Φ : A −→ V est définie par Φ(x) = (x, ϕ(x)). Il en résulte que, pour tout x ∈ A et pour tout
u ∈ E, on a D(f ◦ Φ)(x)(u) = 0, d’où D1 f (x, ϕ(x))(u) + D2 (f, ϕ(x))(Dϕ(x)(u)) = 0. Il en
résulte bien que
Remarque 5.2.1 On vient de démontrer le Théorème des fonctions implicites à l’aide du Théorème
du difféomorphisme local. On peut également faire l’inverse. En effet, étant donné f : U −→ F
une application de classe C r , r ≥ 1 définie sur un ouvert U d’un espace de Banach E et à valeurs
dans un espace de Banach F et a ∈ U tel que Df (a) ∈ Isom (E, F ), on définit g : U × F → F
95
par g(x, y) = f (x) − y. Posant b = f (a) on a D1 g(a, b) = Df (a) ∈ Isom (E, F ). D’après le
Théorème 5.2.1 il existe un voisinage ouvert V de (a, b), un voisinage ouvert B de b et une appli-
cation ψ : B −→ X de classe C r telle que (x, y) ∈ V et g(x, y) = 0 si et seulement si y ∈ B et
x = ψ(y). Posons
A = {x ∈ X : (x, f (x)) ∈ V }.
C’est un ensemble ouvert comme image réciproque d’un ouvert par une application continue et
a ∈ A. On a alors que f est bijective de A dans B et f −1 = ψ sur B. En effet si x1 , x2 ∈ A vérifient
f (x1 ) = f (x2 ) := y on a (x1 , y), (x2 , y) ∈ V et g(x1 , y) = g(x2 , y) = 0 donc x1 = x2 = ψ(y).
Par ailleurs si y ∈ B, posant x = ψ(y) on a (x, y) ∈ V et f (x) = y donc x ∈ A. On a donc bien
montré que f était un C r difféomorphisme de A dans B.
96
avec
Dϕ(0) = −(D2 h(0, 0))−1 ◦ D1 h(0, 0) = −(Dg(a)|Y )−1 ◦ Dg(a)|X = 0,
car Dg(a)|X = 0. Supposant que a est un minimum local de f sur S, on a, pour tout v dans un
voisinage de 0,
f (a + v + ϕ(v)) ≥ f (a) = f (a + 0 + ϕ(0)),
ce qui implique que la fonction θ(v) = f (a + v + ϕ(v)) a un minimum local en 0, d’où
Df (a)|Y = (λ ◦ Dg(a))|Y .
De plus
Df (a)|X = (λ ◦ Dg(a))|X = 0,
donc Df (a) = λ ◦ Dg(a) car E = X ⊕ Y . L’unicité de λ découle du fait que Df (a) = λ ◦ Dg(a)
implique Df (a)|Y = (λ ◦ Dg(a))|Y , d’où λ = Df (a) ◦ (Dg(a)|Y )−1 .
Remarque 5.3.1 a) Le théorème précédent reste vrai sans avoir à supposer que ker Dg(a) admet
un supplémentaire topologique ; mais la démonstration dépasse alors le niveau de ce cours.
b) Dans le cas où E est un espace de Hilbert, il est toujours vrai que ker Dg(a) admet un
supplémentaire topologique (son orthogonal, par exemple).
On en déduit le
Corollaire 5.3.1 Soient U ⊂ Rn un ouvert, g : U −→ Rm une application de classe C 1 et
f : U −→ R une fonction. On pose S = g −1 (0) et on suppose que a ∈ S est un extremum local
de f sur S. On suppose aussi que f est différentiable en a et que :
Démonstration. On a Dg(a)u = (h∇g1 (a), ui, · · · , h∇gm (a), ui) pour tout u ∈ Rn , de telle
m
sorte que Dg(a)T (v) = i=1 vi ∇gi (a) pour tout v ∈ Rm . Comme (∇g1 (a), · · · , ∇gm (a)) sont
P
linéairement indépendant, il en résulte que Dg(a)T est injective donc Dg(a) est surjective. Par
ailleurs ker Dg(a) admet un supplémentaire topologique (son orthogonal, par exemple). Appli-
quant le Théorème 5.3.1, il existe λ ∈ Rm unique tel que Df (a)u = hλ, Dg(a)ui pour tout
u ∈ Rn , soit
Xm DXm E
h∇f (a), ui = λi h∇gi (a), ui = λi ∇gi (a), u ,
i=1 i=1
97
d’où m
X
∇f (a) = λi ∇gi (a).
i=1
Remarque 5.3.2 La condition nécessaire donnée dans le Théorème 5.3.1 permet parfois de dé-
terminer l’extremum.
98
De plus, si f (a) = 0, on a
f (V ∩ S) = f (V ) ∩ (Rd × {0}).
Théorème 5.4.3 Considérons les propriétés suivantes relatives à une partie non vide S ⊂ Rn .
i) S est une sous-variété de classe C r et de dimension d.
ii) Pour tout a ∈ S, il existe un ouvert Rn ⊃ U 3 a et une application h = (h1 , · · · , hn−d ) : U −→
Rn−d de classe C r avec (∇h1 (a), · · · , ∇hn−d (a)) linéairement indépendants (ce qui équivaut à
dire que Dh(a) est surjective) telles que
S ∩ U = h−1 (0).
99
iii) Pour tout a ∈ S, il existe un ouvert Rn ⊃ V 3 a, un ouvert Rd ⊃ W 3 (a1 , · · · , ad ) et une
application g : W −→ Rn−d de classe C r telle que, à une permutation près des coordonnées, on
ait
S ∩ V = {(z, g(z)) : z ∈ W }.
(Dh(a)ei1 , · · · , Dh(a)ein−d )
soient linéairement indépendants. Quitte à permuter les coordonnées, on peut supposer que
(Dh(a)ed+1 , · · · , Dh(a)en )
ce qui montre que D2 h(a) ∈ L(Rn−d , Rn−d ) est injective donc bijective. Appliquant le Théorème
des fonctions implicites, il existe des voisinages ouverts A de (a1 , · · · , ad ) dans Rd et V ⊂ U de a
dans Rn et une application g : A −→ Rn−d de classe C r tels que
soit
S ∩ V = S ∩ U ∩ V = h−1 (0) ∩ V = {(z, g(z)) : z ∈ A}.
iii) =⇒ iv). Posons Ω = W − â, où â = (a1 , · · · , ad ), de telle sorte que g(â) = (ad+1 , · · · , an ), et,
pour tout t ∈ Ω, p(t) = (â + t, g(â + t)) d’où p(0) = (â, g(â)) = a. L’application p est de classe
C r et Dp(0)(u) = (u, Dg(a)(u)) pour tout u ∈ Rd ce qui montre que Dp(0) est injective. On a
p(Ω) = S ∩ V.
100
De plus, p étant injective est une bijection de Ω dans p(Ω) = S ∩ V . Enfin la bijection inverse est
définie pour tout x ∈ S ∩ V par (x1 − a1 , · · · , xd − ad ) qui est continue, ce qui montre bien que p
est un homéomorphisme de Ω dans S ∩ V .
iv) =⇒ i). D’après le Théorème 5.4.1, il existe un ouvert Ω̂ ⊂ Ω contenant 0, un ouvert Ŵ 3 a tel
que p(Ω̂) ⊂ Ŵ et un C r -difféomorphisme f de Ŵ dans un ouvert f (Ŵ ) tels que
et f (V̂ ∩ S) ⊂ f (V̂ ) et f (V̂ ∩ S) = f (p(Ω̂)) ⊂ Rd × {0} donc f (V̂ ∩ S) ⊂ f (V̂ ) ∩ (Rd × {0}),
d’où
f (V̂ ∩ S) = f (V̂ ) ∩ (Rd × {0}).
Remarque 5.4.1 C’est un bon exercice de montrer d’autres implications que celles strictement
nécessaires à la démonstration du théorème précédent.
ii) =⇒ i). D’après le Théorème 5.4.2, il existe un ouvert V ⊃ V 0 3 a et un C r -difféomorphisme g
de V 0 dans un ouvert g(V 0 ) de Rn tel que πd (g(x)) = f (x) pour tout x ∈ V 0 avec πd (y1 , · · · , yn ) =
(yd+1 , · · · , yn ) et tel que g(V 0 ∩ S) = g(V 0 ) ∩ (Rd × {0}).
iii) =⇒ ii). Considérons l’ouvert V̂ = V ∩ (W × Rd ). On vérifie immédiatement que a ∈ V̂ et que
S ∩ V̂ = {(z, g(z)) : z ∈ W }. Introduisons l’application h : V̂ −→ Rn−d par h(z, y) = y − g(z).
On vérifie alors que
h−1 (0) = V̂ ∩ S.
De plus pour tout (w, v) ∈ Rd × Rn−d on a Dh(a)(w, v) = v − Dg(a1 , · · · , ad )(w) donc
v = Dh(a)(0, v) d’où Dh(a) est surjective, ce qui équivaut à ∇h1 (a), · · · , ∇hm (a) linéairement
indépendants.
i) =⇒ iv). On peut supposer sans perte de généralité que f (a) = 0. Définissons
π0 (y1 , · · · , yn ) = (y1 , · · · , yd )
101
iv) =⇒ iii). (C’est un peu moins facile). Comme Dp(0) est injective, on a Dp(0)T est surjective,
ce qui implique que le sous-espace vectoriel engendré par ∇p1 (0), · · · , ∇pn (0) est Rd . Il existe
donc i1 , · · · , id ∈ [1, n] tels que (∇pi1 (0), · · · , ∇pid (0)) est une base de Rd . En permutant les co-
ordonnées, on peut supposer que (∇p1 (0), · · · , ∇pd (0)) est une base de Rd , ce qui implique que
l’application q : Ω −→ Rd définie par q(t) = (p1 (t), · · · , pd (t)) vérifie Dq(0) ∈ Isom (Rd ).
Il existe donc un ouvert Ω̂ 3 0 tel que q soit un C r -difféomorphisme de Ω̂ dans un ouvert
Rd ⊃ Ŵ 3 â = (a1 , · · · , ad ). Comme p est un homéomorphisme de Ω dans S ∩ V , il existe
un ouvert Rn ⊃ V̂ 3 a tel que p(Ω̂) = S ∩ V̂ . Introduisons alors g : Ŵ −→ Rn−d par
g(ẑ) = (pd+1 (q −1 (ẑ), · · · , pn (q −1 (ẑ)). L’application g est de classe C r sur Ŵ et
{(ẑ, g(ẑ)) : ẑ ∈ Ŵ } = S ∩ V̂ .
donc x ∈ p(Ω̂) = S ∩ V̂ .
iii) =⇒ i). Soit U l’ouvert de Rn défini par U = W × Rn−d et soit f : U −→ Rn définie
par f (y, z) = (y, g(y) − z). L’application f est de classe C r et, pour tout u = (v, w) ∈ Rn ,
on a Df (a)u = (v, Dg(â)v − w) où â = (a1 , · · · , ad ). Il en résulte que Df (a) est injective
donc bijective car Df (a) ∈ L(Rn , Rn ). D’après le Théorème du difféomorphisme local, il existe
donc un ouvert V̂ 3 a tel que V̂ ⊂ W × Rn−d et tel que f soit un C r difféomorphisme de V̂
dans l’ouvert Ŵ = f (V̂ ). Étant donné x = (y, z) ∈ S ∩ V̂ , on a y ∈ W donc z = g(y) et
f (x) = (y, 0) ∈ f (V̂ ) ∩ Rd × {0}. Réciproquement, si x = (y, 0) ∈ f (V̂ ) ∩ Rd × {0}, alors
y ∈ W et il existe z ∈ Rn−d tel que x = (y, g(y) − z) = (y, 0) d’où z = g(y) donc (y, z) ∈ S et
x ∈ f (S ∩ V̂ ). On a donc bien
f (S ∩ V̂ ) = f (V̂ ) ∩ Rd × {0}.
102
à diminuer η que ϕ(] − η, +η[) ⊂ S ∩ V . Définissant alors α :] − η, +η[−→ Rd × {0} par
α(t) = f (ϕ(t)), on a
α0 (0) = Df (ϕ(0))ϕ0 (0) = Df (a)u,
et α0 (0) ∈ Rd × {0} donc Df (a)u ∈ Rd × {0}. Réciproquement, soit w ∈ Rd × {0}. On a
0 = f (a) ∈ f (V ) ∩ Rd × {0} et f (V ) ∩ Rd × {0} est un ouvert de Rd × {0} car f (V ) est un ouvert
de Rn . Il existe donc η > 0 tel que tw ∈ f (V )∩Rd ×{0} = f (S∩V ) pour tout t ∈]−η, +η[. Posant
ϕ(t) = f −1 (tw), on a ϕ :] − η, +η[−→ S ∩ V , ϕ(0) = a et ϕ0 (0) = Df −1 (0)w = (Df (a))−1 (w)
et u = ϕ0 (0) ∈ Ta S. On a alors w = Df (a)u avec u ∈ Ta S. On a donc montré que
Comme (Df (a))−1 est un isomorphisme et comme Rd × {0} est un espace vectoriel de dimension
d, il en est de même pour Ta S.
on peut aussi calculer l’espace tangent Ta S à l’aide des définitions équivalentes des sous-variétés
données dans le théorème 5.4.4.
Ta S = {(v, Dg(â)v) : v ∈ Rd }.
103
104
Chapitre 6
Dans ce chapitre, après avoir défini les notions de base de la théorie des équations différentielles,
nous étudions l’existence et l’unicité de la solution du problème de Cauchy. Les résultats sont
basés sur la méthode des approximations successives pour les contractions dans les espaces mé-
triques complets.
Exemple 6.1.1
a) Soit f : U −→ Rn où f = (f1 , . . . , fn ) et U ⊂ Rm est un ouvert convexe. On suppose que
les fonctions f1 , . . . , fn admettent des dérivées partielles sur U par rapport à x1 , . . . , xm et que
∂fi
sup sup
(x) ≤ k
(i,j)∈[1,n]×[1,m] x∈U ∂xj
105
Alors f est k-Lipschitzienne sur U (voir Chapitre 3).
b) Dans a), si on suppose que les dérivées partielles sont continues sur U , alors la fonction f
est localement Lipschitzienne sur U car, pour tout a ∈ U , il existe une boule fermée de centre a
sur laquelle les dérivées partielles sont bornées et il suffit d’appliquer a) sur cette boule.
c) Soit f : U −→ R où U est un ouvert de Rm . Si f est k-Lipschitzienne sur U et si f admet
une dérivée partielle au point a ∈ U par rapport à la variable xj , alors
∂f
sup
(x) ≤ k,
x∈U ∂xj
(exercice facile). √
d) La fonction f : R+ −→ R+ définie par f (x) = x n’est pas Lipschitzienne car le rapport
(f (x) − f (0))/x n’est pas borné au voisinage de 0.
e) Soit A une partie non vide d’un espace métrique (E, d). On pose, pour tout x ∈ E,
d(x, A) = inf a∈A d(x, a). La fonction d(., A) est alors 1-Lipschitzienne (le démontrer).
Démonstration
Soit x0 ∈ X et soit (xn ) la suite définie par, xn = f n (x0 ). On a, pour tout n ∈ N, xn+1 =
f (xn ). Soient m, n ∈ N∗ avec m > n, on obtient que
d(xm , xn ) = d(f (xm−1 ), f (xn−1 )) ≤ kd(xm−1 , xn−1 ).
De proche en proche, il vient
d(xm , xn ) ≤ k n d(xm−n , x0 )
≤ k n (d(xm−n , xm−n−1 ) + . . . + d(x1 , x0 ))
≤ k n d(x1 , x0 )(k m−n−1 + . . . + k + 1)
≤ k n (1 − k)−1 d(x1 , x0 ).
La suite (xn ) est alors de Cauchy car limn→∞ k n = 0. Elle converge donc vers un élément x ∈ E.
De l’égalité xn+1 = f (xn ) et de la continuité de f , il résulte que x = f (x).
Unicité : Si x, z ∈ E vérifient f (x) = x et f (z) = z, il vient
d(x, z) = d(f (x), f (z)) ≤ kd(x, z),
d’où (1 − k)d(x, z) ≤ 0, ce qui impose d(x, z) = 0 et x = z.
Ce résultat admet la légère variante suivante
106
Théorème 6.1.2 Soit f : (E, d) −→ (E, d) une application pour laquelle il existe p ∈ N∗ tel
que f p soit une contraction. Alors f admet un point fixe unique vers lequel converge toute suite
xn = f n (x0 ) où x0 ∈ E est arbitraire.
Quand l’application f dépend d’un paramètre, il peut être intéressant d’étudier la dépendance du
point fixe par rapport au paramètre. C’est l’objet du
Théorème 6.1.3 Soit une application f : Λ × E → E où (E, d) et (Λ, δ) sont deux espaces
métriques (E, d) étant complet. On suppose que, pour tout λ ∈ Λ, l’application partielle fλ =
f (λ, .) est une contraction de rapport k indépendant de λ. On suppose également que, pour tout
x ∈ X, l’application partielle fx = f (., x) est continue.
Alors le point fixe xλ de fλ dépend continuement du paramètre λ.
Démonstration
Soit λ0 ∈ Λ et > 0. On a, pour tout λ ∈ Λ
d’où
(1 − k)d(xλ , xλ0 ) ≤ d(fλ (xλ0 ), fλ0 (xλ0 )).
Utilisons la continuité de fx0 avec x0 = xλ0 . Il existe η > 0 tel que, pour tout λ ∈ B(λ0 , η),
107
Il en résulte que, pour tout λ ∈ B(λ0 , η),
d’où
d(xλ , xλ0 ) ≤ ,
ce qui achève la démonstration.
Quand t0 est l’une des extrémités de I on obtient par cette définition la dérivée à droite ou à gauche
en t0 .
Définition 6.2.1
E QUATION D IFF ÉRENTIELLE DU P REMIER O RDRE
Soit U ⊂ R × R un ouvert et f : U −→ R une fonction. Une solution de l’équation différentielle
x0 (t) = f (t, x(t)) consiste en la donnée d’un intervalle I ⊂ R et d’une fonction dérivable x :
I −→ R telle que, pour tout t ∈ I,
108
Posons x = (x1 , . . . , xn ), le système (6.1) se réduit alors à une seule équation écrite sous forme
vectorielle en définissant une application f : U −→ Rn par f (t, x) = (f1 (t, x), . . . , fn (t, x)).
Une solution de l’équation est la donnée d’un intervalle I et d’une fonction vectorielle dérivable
x : I −→ Rn telle que, pour tout t ∈ I, on ait
L’ensemble {(t, x(t)) : t ∈ I} ⊂ U est alors appelé trajectoire associée à la solution x(.),
l’ensemble {x(t) : t ∈ I} ⊂ Rn est alors appelé orbite de la solution (I, x). Deux trajectoires
différentes peuvent avoir la même orbite.
On remarque que si I = (a, b], (resp. I = [a, b)) l’équation vérifiée en t = b (resp. t = a) est
x0g (b) = f (t, x(b)) (resp. x0d (a) = f (t, x(a))) où x0g (b) (resp. x0d (a)) est la dérivée à gauche en
t = b (resp. à droite en t = a).
Il est important de bien comprendre le mécanisme de transformation d’un système en une équation
unique.
P ROBL ÈME DE C AUCHY
Etant donné (t0 , x0 ) ∈ U , résoudre le problème de Cauchy avec les données (t0 , x0 ) c’est trouver
une solution (I, x(.)) de l’équation différentielle x0 (t) = f (t, x(t)) telle que t0 ∈ I et
0
x (t) = f (t, x(t)) pour tout t ∈ I
x(t0 ) = x0 .
Remarquons que si la fonction f est continue, toute solution est alors continuement dérivable car
la fonction t 7→ f (t, x(t)) est continue sur I comme composée de deux applications continues.
E QUATIONS D ’O RDRE S UP ÉRIEUR
Soient p ∈ N, U un ouvert de R × Rp et f : U −→ R une fonction. Une solution de l’équation
différentielle d’ordre p associée à la fonction f est la donnée d’un intervalle I et d’une fonction p
fois dérivable x : I −→ R telle que, pour tout t ∈ I, on ait
(t, x(t), x0 (t), . . . , x(p−1) (t)) ∈ U et x(p) (t) = f (t, x(t), x0 (t), .., x(p−1) (t))
où x(i) désigne la dérivée i eme de x(.). Une telle équation se ramène à une équation vectorielle
du premier ordre en introduisant de nouvelles variables z1 , · · · , zp par
z1 = x
z2 = x0
..
.
zp = x(p−1)
z10 = x0 = z2
109
z20 = x00 = z3
..
.
0 (p−1)
zp−1 =x = zp
zp0 = x(p) = f (t, x, x0 , · · · , x(p−1) ) = f (t, z1 , · · · , zp ).
E QUATIONS AUTONOMES
Une équation différentielle autonome est une équation où la variable t ne figure pas explicitement
dans le second membre, elle est donc de la forme
x0 (t) = f (x(t))
Remarque 6.2.1 Si x(.) est une solution de l’équation autonome x0 (t) = f (x(t)) définie sur I et
si t0 ∈ R, la fonction z(t) := x(t + t0 ) définie sur l’intervalle translaté I − t0 est aussi solution.
Les orbites associées à ces deux solutions sont identiques mais les trajectoires associées ne le sont
pas.
110
Remarque 6.2.2 Toutes les équations différentielles peuvent être ramenées à la forme autonome.
En effet considérons un ouvert U ⊂ Rn × R et soit f : U −→ Rn une application. Posons
z1 = x1
..
.
zn = xn
zn+1 = t
Soit (x1 , . . . , xn , s0 ) ∈ U , supposons connue une solution (I, z(.)) de l’équation autonome
0
z (s) = g(z(s)) sur I,
z(s0 ) = (x1 , .., xn , s0 ).
0
On a donc zn+1 (s) = 1 et zn+1 (s0 ) = s0 , donc zn+1 (s) = s sur I. Il en résulte que, pour tout
s ∈ I, on a 0
x (s) = f (x(s), s)
x(s0 ) = (x1 , . . . , xn ),
ce qui montre bien le résultat annoncé.
Les équations autonomes ont une interprétation géométrique simple. A tout point x ∈ U est
attaché un vecteur f (x) ∈ Rn . Une trajectoire de l’équation différentielle x0 (t) = f (x(t)) est
donc une courbe contenue dans U telle qu’en chacun de ses points x, le vecteur f (x) soit tangent
à la courbe.
Exemple 6.3.1 Si f est de classe C 1 sur U c’est-a-dire si f1 , · · · , fp possèdent des dérivées par-
tielles continues sur U , alors f est localement Lipschitzienne par rapport à la deuxième variable.
Pour résoudre le problème de Cauchy, nous aurons besoin du lemme technique suivant :
111
Lemme 6.3.1 Soient U un ouvert de R × Rn et f : U −→ Rn une application continue sur U
et localement Lipschitzienne par rapport à la deuxième variable. Alors, pour tout (t0 , x0 ) ∈ U , il
existe k ≥ 0, l, r > 0 tels que
i) S := [t0 − l, t0 + l] × B̄(x0 , r) ⊂ U
Σ = [t0 − η, t0 + η] × B̄(x0 , ρ) ⊂ U.
Comme f est localement Lipschitzienne par rapport à la deuxième variable, on peut qupposer
quitte à diminuer au besoin η et ρ que f soit k-Lipschitzienne sur Σ. Remarquons que l’application
continue f est bornée sur tout compact. On pose alors µ = sup(t,x)∈Σ kf (t, x)k, on choisit 0 <
l < min(η, ρ/µ, 2/k)), et on pose r = µl. On a alors S ⊂ U où S = [t0 − l, t0 + l] × B̄(x0 , r).
En effet, on a l < η et r = µl < ρ. De plus r = µl ≥ M l où M = sup(t,x)∈S kf (t, x)k car µ ≥M.
Enfin iii) est vérifié de manière évidente.
La proposition suivante est un outil important.
Proposition 6.3.1 Soient U un ouvert de R × Rn et f : U −→ Rp une application continue sur
U et localement Lipschitzienne par rapport à la deuxième variable et soit (t0 , x0 ) ∈ U . Alors il
existe η > 0 et ρ > 0 tel que pour tout (t1 , x1 ) ∈ Σ := [t0 − η, t0 + η] × B̄(x0 , ρ), il existe une
solution x : [t1 − η, t1 + η] −→ Rn de
0
x (t) = f (t, x(t)) pour tout t ∈ [t1 − η, t1 + η]
(6.3)
x(t1 ) = x1 .
112
Ceci découle de la continuité de s 7→ f (s, x(s)) comme composée de deux fonctions continues.
Pour x(.) ∈ X, posons pour tout t ∈ I
Z t
T x(t) = x1 + f (s, x(s)) ds.
t1
On a Z t
kT x(t) − x1 k ≤ kf (s, x(s))k ds ,
t1
(la valeur absolue permet de traiter les cas t ≤ t1 et t ≥ t1 ). Or, par l’inégalité triangulaire, on a
(s, x(s)) ∈ S = [t0 − l, t0 + l] × B̄(x0 , r), d’où kf (s, x(s))k ≤ M . On obtient donc, pour tout
t∈I
kT x(t) − x1 k ≤ M η ≤ ρ,
ce qui montre que T x(t) ∈ B̄(x1 , ρ) et donc que T x(.) ∈ X. Par ailleurs, pour tout x(.) et
z(.) ∈ X et pour tout t ∈ I, on a
Z t
kT x(t) − T z(t)k ≤ kf (s, x(s)) − f (s, z(s))k ds
Zt1t
≤ kkx(s) − z(s)kds ,
t1
car (s, x(s)), (s, z(s)) ∈ S et f est k-Lipschitzienne par rapport à la deuxième variable sur S. Il
en résulte que pour tout t ∈ I
Z t
kT x(t) − T z(t)k ≤ kx − zk∞ ds
t1
≤ kηkx − zk∞ ,
ce qui montre que d(T x(.), T z(.)) ≤ kη d(x(.), z(.)) et donc que T (.) est une contraction sur
C(I) car kη < 1. D’après le Theorème 6.1.1, on obtient que T (.) admet donc un point fixe unique
x(.) ∈ X qui vérifie donc T x(.) = x(.). Ainsi pour tout t ∈ I
Z t
x(t) = x1 + f (s, x(s))ds,
t1
Par continuité de y(.), il existe 0 < δ ≤ η tel que y(t) ∈ B̄(x1 , ρ) pour tout t ∈ [t1 − δ, t1 + δ].
Posons I1 = J ∩ [t1 − δ, t1 + δ] et X1 = C(I1 , B̄(x1 , ρ)) et posons pour x(.) ∈ X1 et t ∈ I1 ,
Z t
Gx(t) = x1 + f (s, x(s)) ds.
t1
113
L’application G est une contraction (même raisonnement que dans la première partie de la démons-
tration) et y|I1 et x|I1 sont des points fixes de G, d’où y|I1 = x|I1 , ce qui achève la démonstration.
Remarque 6.3.1 Le résultat précédent est important car il permet de conclure qu’il existe η > 0
tel que, pour tout point (t1 , x1 ) voisin de (t0 , x0 ) ∈ U , la solution prenant la valeur x1 en t1 est
définie sur un intervalle centré en t1 dont la longueur est au moins égale à 2η.
Le résultat suivant est très utile.
Théorème 6.3.1 T H ÉOR ÈME D ’U NICIT É G LOBALE. Soit U un ouvert de R×Rn et f : U −→ Rn
une application continue sur U et localement Lipschitzienne par rapport à la deuxième variable.
Soient (I, ϕ(.)) et (J, ψ(.)) deux solutions de l’équation différentielle x0 (t) = f (t, x(t)). On sup-
pose que ϕ(.) et ψ(.) coı̈ncident en un point t0 ∈ I ∩ J. Alors ϕ(.) = ψ(.) sur I ∩ J.
Démonstration. Soit I0 = {t ∈ I ∩ J : ϕ(t) = ψ(t)}. Par hypothèse, I0 6= ∅. Nous allons
montrer que I0 est à la fois un ouvert et un fermé de I ∩ J ce qui montrera que I0 = I ∩ J car
I ∩ J est connexe. Il est clair que I0 est fermé comme ensemble de coı̈ncidence de deux fonctions
continues. Montrons que I0 est ouvert dans I ∩ J. Soit t1 ∈ I0 , on a ϕ(t1 ) = ψ(t1 ) := ξ1 et
(t1 , ξ1 ) ∈ U . D’après la Proposition 6.3.1, il existe η > 0 et z : [t1 − η, t1 + η] −→ Rn solution,
sur l’intervalle [t1 − η, t1 + η], de
0
z (t) = f (t, z(t))
z(t1 ) = ξ1 .
Comme ϕ(t1 ) = ψ(t1 ) = z(t1 ) = ξ1 , le résultat d’unicité de la Proposition 6.3.1 nous permet de
conclure à l’existence de 0 < δ ≤ η tel que ϕ(.) = ψ(.) = z(.) sur I ∩ J ∩ [t1 − δ, t1 + δ] ce qui
montre que I ∩ J ∩ [t1 − δ, t1 + δ] ⊂ I0 . O n a donc bien démontré que I0 était ouvert dans I ∩ J,
ce qui achève la démonstration.
On obtient alors le :
Théorème 6.3.2 T H ÉOR ÈME D ’E XISTENCE ET U NICIT É L OCALE . Soient U un ouvert de
R × Rn et f : U → Rp une application continue sur U et localement Lipschitzienne par rapport
à la deuxième variable. Alors,
EXISTENCE : pour tout (t0 , x0 ) ∈ U , il existe un intervalle I 3 t0 et une solution x(.) définie
sur I de 0
x (t) = f (t, x(t)) pour tout t ∈ I
(6.4)
x(t0 ) = x0 .
114
Démonstration. L’existence découle de la partie a) de la Proposition 6.3.1. L’unicité découle du
Théorème 6.3.1.
d) Si ((a, b[, x(.)) est une solution de l’équation x0 (t) = f (t, x(t)), on appelle bout droit de
x(.) l’ensemble éventuellement vide
De plus les bouts (voir définition 6.4.1) de cette solution appartiennent à la frontière ∂U = U \U
de U .
Démonstration. D’après le Théorème 6.3.2 il existe une solution locale (I, x(.)) du problème de
Cauchy 0
x (t) = f (t, x(t)) pour tout t ∈ I
x(t0 ) = x0 .
Considérons l’ensemble de toutes les solutions locales (I, x(·)) de ce problème. Introduisons la
réunion I max de tous les intervalles I corespondants, I max est un intervalle car tous les intervalles
I contiennent t0 . Soient (I1 , x1 (·)) et (I2 , x2 (·)) deux solutions. Comme x1 (t0 ) = x2 (t0 ) = x0
115
on a x1 = x2 sur I1 ∩ I2 d’après le Théorème 6.3.1. Il y a donc un sens à définir ϕ sur Imax par
ϕ(t) = x(t) si t ∈ I avec (I, x(·)) solution du problème de Cauchy. Il est clair que (Imax , ϕ)
est solution et que cette solution est maximale. En effet si (I, ψ) prolonge (I max , ϕ), on a alors
I ⊂ Imax ⊂ I et ψ = ϕ sur I = Imax . Soit alors (I, ψ(.)) une autre solution maximale. On a alors
I ⊂ I scriptsize max , et d’après le Théorème 6.3.1 ψ = ϕ sur I ∩ Imax = I, ce qui montre que
(Imax , ϕ) prolonge (I, ψ(·)), donc (Imax , ϕ) = (I, ψ(·)) du fait de la maximalité de (I, ψ(·)).
Montrons enfin que les bouts de ϕ(.) sont contenus dans ∂U . On sait (c.f remarque 6.4.1)
que l’intervalle Imax est de la forme ]a, b[. Soit alors ξ ∈ Rn et une suite (ti )i∈N → b telle que
ϕ(ti ) → ξ, on a (b, ξ) ∈ Ū . Il reste à montrer que (b, ξ) 6∈ U . Supposons le contraire. On a donc
(b, ξ) ∈ U . Soient η et ρ associés à (b, ξ) dans la Proposition 6.3.1, on peut supposer, quite à
diminuer η, que a < b − η. Pour i assez grand on a (ti , x(ti )) ∈]b − η, b + η[×B̄(ξ, ρ). Il existe
donc une solution ψ(.) de
0
ψ (t) = f (t, ψ(t)) pour tout t ∈ [ti − η, ti + η]
ψ(ti ) = ϕ(ti ),
Il est clair que x est solution de x0 (t) = f (t, x(t)) sur (a, ti + η] et x(ti ) = ϕ(ti ). D’après le
Théorème 6.3.1, on a donc x = ϕ sur (a, b[ et x(t) est défini pour des valeurs de t supérieures à b,
ce qui contredit la maximalité de ϕ.
Exemple 6.4.1
a) Considérons l’équation x0 (t) = x(t)2 , x(0) = x0 > 0. La solution est x(t) = x0 /(1 − x0 t).
La solution maximale est définie sur l’intervalle ] − ∞, 1/x0 [ elle n’est donc pas globale.
b) L’unicité d’une solution maximale n’est pas toujours assurée comme le montre l’exemple
suivant. Le problème de Cauchy :
0
x (t) = 2|x(t)|1/2 ,
x(0) = 0,
est solution. On remarque bien sûr que f (t, x) = |x|1/2 définie sur U = R×R n’est pas localement
Lipschitzienne au voisinage d’un élément de la forme (t0 , 0).
On a alors le
116
Corollaire 6.4.1 Soient U un ouvert de R × Rn et f : U −→ Rn une application continue sur
U et localement Lipschitzienne par rapport à la deuxième variable. Alors pour toute solution
maximale (]a, b[, x) et pour tout compact K ⊂ U , il existe ε > 0 tel que (t, x(t)) ∈
/ K pour tout
t ∈]a, b[\]a + ε, b − ε[. De plus, si U = R × Rn , on a
b = +∞ ou lim kx(t)k = +∞
t→b
et
a = −∞ ou lim kx(t)k = +∞.
t→a
Remarque 6.4.2 Soit x : [a, b[→ Rn une solution de l’équation x0 (t) = f (t, x(t)) où f : U → Rn
est continue sur l’ouvert U ⊂ R × Rn et localement Lipschitzienne par rapport à x. On suppose
que limt→b x(t) = ξ existe et que (b, ξ) ∈ U . Alors il existe un prolongement de x(.) à droite de b.
En effet on peut prolonger x(.) par continuité en b en posant x(b) = ξ. On peut alors passer à la
limite sur t → b dans l’égalité
Z t
x(t) = x(a) + f (s, x(s)) ds,
a
0
ce qui implique x (b) = f (b, x(b)). Le Théorème 6.3.2 montre alors l’existence d’une solution y(.)
de y 0 (t) = f (t, y(t)), y(b) = ξ définie sur un intervalle de la forme [b, b + η] qui par recollement
avec x(.) fournit le prolongement annoncé.
On peut donner un résultat d’existence et d’unicité globale dans le cas suivant.
Théorème 6.4.2 Soient U un ouvert de R × Rn et f : U −→ Rn une application continue. On
suppose que f est Lipschitzienne par rapport à la deuxième variable sur [a, b] × Rn ⊂ U . Alors
pour tout (t0 , x0 ) ∈ [a, b] × Rn , il existe une unique solution globale ([a, b], x(.)) de
0
x (t) = f (t, x(t)) pour tout t ∈ [a, b]
(6.5)
x(t0 ) = x0 .
De plus, si U = I × Rn où I est un intervalle ouvert et si f est Lipschitzienne par rapport à la
n n
b]0 × R pour tout [a, b] ⊂ I, alors, pour tout (t0 , x0 ) ∈ I × R , il existe
deuxième variable sur [a,
x (t) = f (t, x(t)) sur I
une unique solution de définie sur I tout entier.
x(t0 ) = x0
117
Démonstration. Soit k ≥ 0 telle que f soit k-Lipschitzienne par rapport à la deuxième variable
sur [a, b] × Rn ⊂ U et soit X = C([a, b], Rn ). Pour tout x ∈ X, posons
On a kxk ≤ kxk∞ ≤ e2r kxk avec r = max(|b − t0 |, |a − t0 |) (vérification immédiate). Les normes
k · k et k · k∞ sont donc équivalentes. On en déduit que (X, k · k) est un espace de Banach. Pour
tout x ∈ X et pour tout t ∈ [a, b], posons
Z t
T (x)(t) = x0 + f (s, x(s)) ds.
t0
On définit ainsi une application T de X dans X. Pour tout x1 , x2 ∈ X et pour tout t ∈ [a, b], on a
Z t
kT (x1 )(t) − T (x2 )(t)k ≤ kf (s, x1 (s)) − f (s, x2 (s))k ds
t0
Z t
≤ kkx1 (s) − x2 (s)k ds
t0
Z t
2k|s−t0 |
≤ ke kx1 − x2 k ds
t0
2k|t−t0 |
e
≤ kx1 − x2 k.
2
On a donc
1
kT (x1 )(t) − T (x2 )(t)ke−2k|t−t0 | ≤ kx1 − x2 k,
2
d’où, passant à la borne supérieure sur t ∈ [a, b],
1
kT (x1 ) − T (x2 )k ≤ kx1 − x2 k,
2
ce qui montre que T possède un unique point fixe qui est alors l’unique solution de (6.5).
Supposons alors que U = I × Rn avec I =]a, b[ et que f est Lipschitzienne par rapport à la
deuxième variable sur [a, b] × Rn pour tout [a, b] ⊂ I. Considérant des suites (ai )i∈N et (bi )i∈N
convergeant respectivement 0 vers a et b. Pour tout i assez grand, on a t0 ∈ [ai , bi ], notons alors
x (t) = f (t, x(t)) sur [ai , bi ]
xi l’unique solution de obtenue d’après la première partie de la
xi (t0 ) = x0
démonstration. D’après le Théorème 6.3.1, on a xj |[ai ,bi ] = xi pour tout j ≥ i. Il y a donc un sens
à définir x : R −→ Rn par x(t) = xi (t) pour t ∈ [ai , bi ]. Il est clair que
x(·) est alors solution de
0 0
x (t) = f (t, x(t)) sur I y (t) = f (t, y(t)) sur I
. De plus, si y : R −→ Rn est solution de ,
x(t0 ) = x0 y(t0 ) = x0
on déduit du résultat d’unicité de la première partie de la démonstration que y|[ai ,bi ] = xi , d’où
y = x.
118
Chapitre 7
Alors Rt
| v(s) ds|
u(t) ≤ ae pour tout t ∈ [t1 , t2 ].
t0
Rt Rt
Démonstration. Supposons que t ∈ [t0 , t2 ] et posons w(t) = t0 u(s)v(s) ds, V (t) = t0 v(s) ds
et ϕ(t) = w(t)e−V (t) . On a
ϕ0 (t) = (w0 (t) − w(t)V 0 (t))e−V (t) = v(t)(u(t) − w(t))e−V (t) ≤ av(t)e−V (t) ,
d’où Z t Z t
0
ϕ(t) = ϕ (s) ds ≤ a v(s)e−V (s) ds = a(1 − e−V (t) ),
t0 t0
et donc
u(t) − a ≤ w(t) = ϕ(t)eV (t) ≤ aeV (t) − a,
Rt
v(s) ds
d’où u(t) ≤ ae t0 . Si t ∈ [t1 , t0 ], introduisons û, v̂ : [−t0 , −t1 ] −→ R+ par û(t) = u(−t) et
v̂(t) = v(−t). Pour tout τ ∈ [−t0 , −t1 ], on a
Z t0 Z τ
û(t) ≤ a + u(s)v(s) ds = a + û(σ)v̂(σ) dσ.
−τ −t0
119
d’où avec τ = −t, R t0
v(s) ds
u(t) = û(τ ) ≤ ae t .
Il suffit alors d’appliquer le Lemme de Gronwall avec a = kx1 (t0 ) − x2 (t0 )k, v(t) ≡ k et u(t) =
kx1 (t) − x2 (t)k.
120
Lemme 7.2.2 Soient (E, d) et I des espace métrique, soit S ⊂ E, et soit f : I × S −→ R
une fonction uniformément continue qui est k-Lipschitzienne par rapport à la deuxième variable.
Alors la fonction f˜ : I × E −→ R définie pour tout t ∈ I, x ∈ E par
f˜|I×S = f.
car d(z, z0 ) ≤ d(x, z) + d(x, z0 ). On obtient donc que f˜(t, x) ≥ f (t, z0 ) − kd(x, z0 ), d’où f˜ est à
valeurs finies sur I × E. Soient t ∈ I, x1 et x2 ∈ E, pour tout z ∈ S on a
Pour tout x ∈ S on a f˜(t, x) ≤ f (t, x) + kd(x, x) = f (t, x). De plus, pour tout x, z ∈ S on a
f (t, z) + kd(x, z) ≥ f (t, x), d’où f˜(t, x) ≥ f (t, x).
Montrons alors que f˜ est uniformément continue. Soit ε > 0 et soit α > 0 tel que pour
tout z ∈ S, on a |f˜(t, z) − f˜(t0 , z)| ≤ ε pour tout t, t0 ∈ I avec d(t, t0 ) ≤ α. Posons η =
k −1 ε, considérons (t, x), (t0 , x0 ) ∈ I × E tels que d(t, t0 ) ≤ α, d(x, x0 ) ≤ η et z ∈ S tel que
f (t, z) + kd(x, z) ≤ f˜(t, x) + ε. On a
z(s0 ) = z0 ,
121
telle que
sup kz(t)k ≤ M.
t∈[t1 ,t2 ]
De plus, il existe c ≥ 0 tel que pour tout t0 ∈ [t1 , t2 ] et pour tout x0 ∈ B̄(x(t0 ), δ), on ait
kzs0 ,z0 (t) − zt0 ,x0 (t)k ≤ c(kz0 − x0 k + |s0 − t0 |) pour tout t ∈ [t1 , t2 ], (7.2)
avec x0 = x(t0 ).
Démonstration. Soit K = {(t, x(t)) : t ∈ [t1 , t2 ], comme K est compact, il existe η > 0 tel
que Kη ⊂ U avec Kη = {(t, z) ∈ Rn : d((t, z), K) ≤ η}. L’application f est uniformément
continue sur le compact Kη ⊂ U et, utilisant le Lemme 7.2.1, elle est Lipschitzienne par rapport à
deuxième variable sur le compact Kη . D’après le lemme précédent appliqué à chaque composante
de f , l’application f se prolonge en une application f˜ : [t1 , t2 ] × Rn −→ Rn continue et k-
Lipschitzienne par rapport à la deuxième variable pour un certain k ≥ 0. Choisissons alors δ tel
que 2ek|t2 −t1 | δ < η. Appliquant le Théorème 6.4.2, il existe alors une solution z : [t1 , t2 ] −→ Rn
de
z 0 (t) = f˜(t, z(t)) pour tout t ∈ [t1 , t2 ]
z(s0 ) = z0 .
On remarque que f (t, x(t)) = f˜(t, x(t)) car (t, x(t)) ∈ K pour tout t ∈ [t1 , t2 ]. On a alors, pour
tout t ∈ [t1 , t2 ],
Z t Z t
z(t) = z0 + ˜
f (s, z(s)) ds et x(t) = x(s0 ) + f˜(s, x(s)) ds.
s0 s0
On a donc
Z t
˜ ˜
kz(t) − x(t)k ≤ kz0 − x(s0 )k + (kf (s, z(s)) − f (s, x(s)))k,
s0
d’où Z t
kz(t) − x(t)k ≤ kz0 − x(s0 )k + kkz(s) − x(s)k ds.
s0
pourvu que z0 ∈ B̄(x(s0 ), δ). Cela implique que (t, z(t)) ∈ Kη pour tout t ∈ [t1 , t2 ]. donc
f˜(t, z(t)) = f (t, z(t)) pour tout t ∈ [t1 , t2 ] donc z est bien solution de (7.2). Comme Kη est
compact, il existe bien M ≥ 0 tel que supt∈[t1 ,t2 ] kz(t)k ≤ M .
122
Posons z = zs0 ,z0 (t) et y = zs0 ,z0 (t). On a alors, pour tout t ∈ [t1 , t2 ],
Z t Z t
z(t) = z0 + f (τ, z(τ )) dτ, et y(t) = x0 + f (τ, y(τ )) dτ,
s0 t0
d’où Z t0 Z t
z(t) − y(t) = z0 − x0 + f (s, z(s)) ds + (f (s, z(s)) − f (s, y(s)))
s0 t0
ce qui conduit à
Z t
kz(t) − y(t)k ≤ kz0 − x0 k + C|s0 − t0 | + kkz(τ ) − y(τ )k dτ .
s0
donc
kz(t) − y(t)k ≤ c(kz0 − x0 k + |s0 − t0 |)
avec c = max(C, 1)ek|t2 −t1 | , ce qui achève la démonstration.
z(t0 ) = x0 .
Posons
Ω = {(t, t0 , x0 ) ∈ R × R × Rn : t ∈ It0 ,x0 },
et x(·, ·, ·) : Ω −→ Rn définie par
x(t, t0 , x0 ) = z(t).
On dit que l’application x(·, ·, ·) est le flot de l’équation différentielle x0 (t) = f (t, x(t)).
Exemple 7.3.1 Dans le cas d’une équation différentielle linéaire x0 (t) = A(t)x(t), où A : I −→
Mn (R) est une application continue définie sur un intervalle ouvert I, on sait que Ω = I ×I ×Rn
et x(t, t0 , x0 ) = R(t, t0 )x0 .
123
Démonstration. Soit (s0 , t0 , x0 ) ∈ Ω, de telle sorte que s0 ∈ It0 ,x0 ; notons x : It0 ,x0 −→ Rn la
solution de
x(t) = f (t, x(t)) sur It0 ,x0
.
x(t0 ) = x0
Soient t1 , t2 ∈ It0 ,x0 tels que s0 ∈]t1 , t2 [ et [t1 , t2 ] ⊂ It0 ,x0 , et soit ε > 0 tel que [s0 − ε, s0 + ε] ⊂
[t1 , t2 ] ⊂ It0 ,x0 . Soit alors δ > 0 fourni par la conclusion du Théorème 7.2.1. Il existe η > 0 tel que
kx(τ )−x(t0 )k = kx(τ )−x0 k ≤ δ/2 pour tout τ ∈ [t0 −η, t0 +η]. Soit alors τ0 ∈ [t0 −η, t0 +η] et
z0 ∈ B̄(x0 , δ/2) de telle sorte que kx(τ0 ) − z0 k ≤ δ. Il existe donc une solution z : [t1 , t2 ] −→ Rn
du problème 0
z (t) = f (t, z(t)) sur [t1 , t2 ]
z(τ0 ) = z0 ,
On a alors
sup kf (t, y(t)) − f (t, x(t)) − J2 f (t, x(t))(y(t) − x(t))k = o(kx − yk∞ ).
t∈[t1 ,t2 ]
Démonstration. L’ensemble K = {(t, x(t)) : t ∈ [t1 , t2 ]} ⊂ U étant compact, il existe η > 0 tel
que l’ensemble compact Kη = {(s, z) ∈ U : d((s, z), K) ≤ η} soit aussi contenu dans U . Soit
124
alors y ∈ C([t1 , t2 ], Rn ) tel que ky − xk ≤ η. Pour tout t ∈ [t1 , t2 ], on a k(t, y(t)) − (t, x(t))k ≤ η
donc (t, y(t)) ∈ Kη ⊂ U d’où (t, y(t)) ∈ U .
Soit t ∈ [t1 , t2 ]. On a alors, utilisant la formule de Taylor au rang 0 avec reste intégral,
f (t, y(t) − f (t, x(t)) − J2 f (t, x(t))(y(t) − x(t)) =
Z 1
(J2 f (t, x(t) + θ(y(t) − x(t)) − J2 f (t, x(t)))(y(t) − x(t) dθ.
0
Par ailleurs, du fait de l’uniforme continuité de J2 f sur le compact Kη , il existe, pour tout ε > 0
un réel δ ∈]0, η[ tel que (s, ξ), (s, ζ) ∈ Kη avec kξ − ζk ≤ δ implique
kJ2 f (s, ξ) − J2 f (s, ζ)k ≤ ε.
Si ky − xk ≤ δ et θ ∈ [0, 1], on a (t, x(t)) ∈ Kη , et
d((t, x(t) + θ(y(t) − x(t))), K) ≤ θky(t) − x(t)k ≤ δ ≤ η,
donc (t, x(t) + θ(y(t) − x(t)) ∈ Kη d’où
kJ2 f (t, x(t) + θ(y(t) − x(t)) − J2 f (t, x(t))k ≤ ε,
donc, pour tout t ∈ [t1 , t2 ], on a
kJ2 f (t, x(t) + θ(y(t) − x(t)) − J2 f (t, x(t)))(y(t) − x(t)k ≤ εky(t) − x(t)k ≤ εky − xk∞ ,
d’où le résultat.
V (t0 ) = In .
v(t0 ) = ei .
125
Démonstration. Soit (t, t0 , x0 ) ∈ Ω. Notons alors x(·) la solution de
0
x (τ ) = f (t, x(τ )) sur It0 ,x0
x(t0 ) = x0 ,
et considérons un intervalle [t1 , t2 ] ⊂ It0 ,x0 tel que t ∈]t1 , t2 [. Appliquant le Théorème 7.2.1, pour
tout h assez petit, il existe une solution xh : [t1 , t2 ] −→ Rn de
0
xh (τ ) = f (τ, xh (τ )) sur [t1 , t2 ]
xh (t0 ) = x0 + hei .
De plus, il existe M ≥ 0 et c ≥ 0 tels que xh ([t1 , t2 ]) reste contenu dans une boule B̄(0, M ) pour
tout h assez petit et
kxh − xk∞ ≤ c|h|.
On a alors x(τ, t0 , x0 ) = x(τ ) et x(τ, t0 , x0 + hei ) = xh (τ ) pour tout τ ∈ [t1 , t2 ]. Pour tout
τ ∈ [t1 , t2 ], on a alors
Z τ
x(τ ) = x0 + f (s, x(s)) ds
t0
Z τ
xh (τ ) = x0 + hei + f (s, xh (s)) ds,
t0
donc τ
xh (τ ) − x(τ ) f (s, xh (s)) − f (s, x(s))
Z
= ei + ds.
h t0 h
Posons rh (s) = f (s, xh (s)) − f (s, x(s)) − J2 f (s, x(s))(xh (s) − x(s)). Comme kxh (s) − x(s)k ≤
c|h| pour tout s ∈ [t1 , t2 ], on obtient d’après le Lemme 7.3.1 que
Il en résulte que
τ Z τ
xh (τ ) − x(τ ) x (s) − x(s)
Z
h
= ei + J2 f (s, x(s)) ds + h−1 rh (s) ds.
h t0 h t0
v(t0 ) = ei ,
on a Z τ
v(τ ) = ei + J2 f (s, x(s))v(s) ds.
t0
126
xh (τ ) − x(τ )
Posant uh (τ ) = − v(τ ), on obtient donc
h
Z τ Z τ
uh (τ ) = J2 f (s, x(s))uh (s) ds + h−1 rh (s) ds,
t0 t0
avec C = sups∈[t1 ,t2 ] kJ2 f (s, x(s))k. Utilisant le Lemme de Gronwall, on obtient donc
kuh (τ )k ≤ |h|−1 o(h)eC|τ −t0 | ≤ |h|−1 o(h)eC|t2 −t1 | pour tout τ ∈ [t1 , t2 ],
donc
xh (τ ) − x(s)
lim = v(τ ) pour tout τ ∈ [t1 , t2 ],
h→0 h
d’où le résultat.
∂x
Montrons que les applications Ω 3 (s, s0 , z0 ) 7−→ (s, s0 , z0 ) sont continues pour tout
∂x0i
i ∈ [1, n] en (t, t0 , x0 ) ∈ Ω. Notons V (·) la solution de
0
V (τ ) = J2 f (τ, x(τ, t0 , x0 ))V (τ ) sur It0 ,x0
V (t0 ) = In
et W (·) la solution de
0
W (τ ) = J2 f (τ, x(τ, s0 , z0 ))W (τ ) sur Is0 ,z0
W (s0 ) = In .
V vt0 ) = ei
et w(·) la solution de
0
w (τ ) = J2 f (τ, x(τ, s0 , z0 ))w(τ ) sur Is0 ,z0
w(s0 ) = ei .
Remarquons que [t1 , t2 ] ⊂ It0 ,x0 ∩ Is0 ,z0 pour tout (s0 , z0 ) voisin de (t0 , x0 ). Il nous faut montrer
que w(s) tend vers w(t) quand (s, s0 , z0 ) tend vers (t, t0 , x0 ). Comme w(s) = W (s)ei et v(t) =
V (t)ei , il suffit de montrer que W (s) tend vers V (t) quand (s, s0 , z0 ) tend vers (t, t0 , x0 ), ce qui
est démontré dans le Lemme 7.3.2 suivant.
127
Lemme 7.3.2 Soit t1 , t2 ∈ R, soient s0 , t0 ∈]t1 , t2 [, et soient V (·) la solution de
0
V (τ ) = J2 f (τ, x(τ, t0 , x0 ))V (τ ) sur [t1 , t2 ]
V (t0 ) = In
et W (·) la solution de
0
W (τ ) = J2 f (τ, x(τ, s0 , z0 ))W (τ ) sur [t1 , t2 ]
W (s0 ) = In .
Démonstration. Comme
et lims→t V (s) = V (t), il suffit de montrer que kW (s) − V (s)k tend vers 0 quand (s0 , z0 ) tend
vers (t0 , x0 ). On a Z s
W (s) = In + J2 f (τ, x(τ, s0 , z0 ))W (τ ) dτ,
s0
et Z s
V (s) = In + J2 f (τ, x(τ, t0 , x0 ))V (τ ) dτ,
t0
de sorte que
Z s0
kW (s) − V (s)k ≤ kJ2 f (τ, x(τ, t0 , x0 ))V (τ )k dτ +
t0
Z s
kJ2 f (τ, x(τ, s0 , z0 ))W (τ ) − J2 f (τ, x(τ, t0 , x0 ))V (τ )k dτ .
s0
Il en résulte que
Z s
kW (s) − V (s)k ≤ µ|t0 − s0 | + kJ2 f (τ, x(τ, s0 , z0 ))kkW (τ ) − V (τ )k+
s0
Z s
kJ2 f (τ, x(τ, s0 , z0 )) − J2 f (τ, x(τ, t0 , x0 ))kkV (τ )k dτ
s0
avec µ = supτ ∈[t1 ,t2 ] kJ2 f (τ, x(τ, t0 , x0 ))V (τ )k. Comme les applications x(·, ·, ·) et J2 f (·, ·) sont
continues, elles sont bornées sur tout compact, il existe donc c ≥ 0 tel que kJ2 f (τ, x(τ, s0 , z0 )k ≤
c pour tout τ ∈ [t1 , t2 ] et pour tout (s0 , z0 ) voisin de (t0 , x0 ), conduisant à
128
Z s
kW (s) − V (s)k ≤ µ|t0 − s0 | + ckW (τ ) − V (τ )k+
s0
Z s
kJ2 f (τ, x(τ, s0 , z0 )) − J2 f (τ, x(τ, t0 , x0 ))kkV (τ )k dτ
s0
Étant donné ε > 0, il existe, par l’uniforme continuité locale de (τ, s0 , z0 ) 7−→ J2 f (τ, x(τ, s0 , z0 )),
un η > 0 tel que
kJ2 f (τ, x(τ, s0 , z0 )) − J2 f (τ, x(τ, t0 , x0 ))k ≤ ε
pour tout τ ∈ [t1 , t2 ] et pour tout (s0 , z0 ) ∈ B̄((t0 , x0 ), η), ce qui implique
Z s
kW (s) − V (s)k ≤ µ|t0 − s0 | + |t2 − t1 |kV k∞ ε + c kW (τ ) − V (τ )k.
t0
pour tout (s0 , z0 ) ∈ B̄((t0 , x0 ), η), ce qui montre bien que kW (s) − V (s)k tend vers 0 quand
(s0 , z0 ) tend vers (t0 , x0 ).
w(t0 ) = −f (t0 , x0 ).
x(t0 ) = x0 ,
et considérons un intervalle [t1 , t2 ] ⊂ It0 ,x0 tel que t ∈]t1 , t2 [. Notons xh (·) l’unique solution
définie pour tout h assez petit de
0
xh (τ ) = f (t, xh (τ )) sur [t1 , t2 ]
x(t0 + h) = x0 ,
129
dont l’existence est garantie par le Théorème 7.2.1. D’après ce même théorème, il existe une
constante c ≥ 0 telle que kxh (τ ) − x(τ )k ≤ c|h| pour tout τ ∈ [t1 , t2 ] et pour tout h assez petit.
On a alors x(t, t0 , x0 ) = x(t) et x(t, t0 + h, x0 ) = xh (t), de plus on a, pour tout τ ∈ [t1 , t2 ],
Z τ Z τ
xh (τ ) = x0 + f (s, xh (s)) ds et x(τ ) = x0 + f (s, x(s)) ds.
t0 +h t0
On a donc
Z τ Z t0
xh (τ ) − x(τ ) = (f (s, xh (s)) − f (s, x(s))) ds + f (s, x(s)) ds.
t0 +h t0 +h
où rh (s) = f (s, xh (s)) − f (s, x(s)) − J2 f (s, x(s))(xh (s) − x(s)). Il vient alors
Z τ
xh (τ ) − x(τ ) xh (τ ) − x(τ ) 1 t0
Z
−1
= (J2 f (s, x(s)) + h rh (s)) ds + f (s, x(s) ds.
h t0 +h h h t0 +h
Rτ
Comme w(τ ) = −f (t0 , x0 ) + t0 J2 f (s, x(s))w(s) ds, on obtient
Z τ
xh (τ ) − x(τ ) x (τ ) − x(τ )
h
− w(τ ) = (J2 f (s, x(s)) − w(τ ) + h−1 rh (s)) ds+
h t0 +h h
Z t0 +h
1 t0
Z
J2 f (s, x(s))x(s) ds + (f (s, x(s) − f (t0 , x0 )) ds.
t0 h t0 +h
xh (τ ) − x(τ )
Posant uh (τ ) = − w(τ ), on obtient alors
h
Z τ
kuh (τ )k ≤ k kuh (s)k ds + kδ(h)k + h−1 o(h),
t0 +h
1 t0
Z
avec k = sups∈[t1 ,t2 ] kJ2 f (s, x(s))k < +∞ et δ(h) = (f (s, x(s) − f (t0 , x0 )) ds. Utilisant
h t0 +h
le Lemme de Gronwall, il vient
x (τ ) − x(τ )
h
− w(t)
≤ (kδ(h)k + h−1 o(h))ek|τ −t0 −h| ≤ (kδ(h)k + h−1 o(h))ek|t2 −t1 | .
h
130
ce qui montre bien que
∂x
(τ, t0 , x0 ) = w(τ ) pour tout τ ∈ [t1 , t2 ].
∂t0
∂x
Montrons alors que l’application Ω 3 (s, s0 , z0 ) 7−→ (s, s0 , z0 ) est continue en (t, t0 , x0 ) ∈
∂t0
Ω. Notons V (·) la solution de
0
V (τ ) = J2 f (τ, x(τ, t0 , x0 ))V (τ ) sur It0 ,x0
V (t0 ) = In
et W (·) la solution de
0
W (τ ) = J2 f (τ, x(τ, s0 , z0 ))W (τ ) sur Is0 ,z0
W (s0 ) = In .
V vt0 ) = −f (t0 , x0 )
et w(·) la solution de
0
w (τ ) = J2 f (τ, x(τ, s0 , z0 ))w(τ ) sur Is0 ,z0
w(s0 ) = −f (s0 , z0 ).
Remarquons que [t1 , t2 ] ⊂ It0 ,x0 ∩ Is0 ,z0 pour tout (s0 , z0 ) voisin de (t0 , x0 ). Il nous faut montrer
que w(s) tend vers w(t) quand (s, s0 , z0 ) tend vers (t, t0 , x0 ). Comme w(s) = −W (s)f (s0 , z0 ) et
v(t) = −V (t)f (t0 , x0 ), il suffit de montrer que W (s) tend vers V (t) quand (s, s0 , z0 ) tend vers
(t, t0 , x0 ), ce qui est démontré dans le Lemme 7.3.2.
V (t0 ) = In .
131
Autrement dit, pour tout i ∈ [1, n],
∂x
(t, t0 , x0 ) = v(t)
∂x0i
où v(·) est l’unique solution de
0
v (t) = J2 f (t, x(t, t0 , x0 ))v(t) sur It0 ,x0
v(t0 ) = ei .
De plus, on a
∂x
(t, t0 , x0 ) = w(t)
∂t0
où w(·) est l’unique solution de
0
w (t) = J2 f (t, x(t, t0 , x0 ))w(t) sur It0 ,x0
w(t0 ) = −f (t0 , x0 ).
et x0
si x0 6= 0
x(t, t0 , x0 ) = x0 (t0 − t) + 1 .
0 si x0 = 0
S
Soit (t, t0 , x0 ) ∈ Ω = (t0 ,x0 )∈R2 It0 ,x0 × (t0 , x0 ).
132
∂x
Supposons x0 6= 0, on sait, d’après le Théorème 7.3.2, que (t, t0 , x0 ) = v(t) où v(·) est
∂x0
solution de x0
v 0 (t) = 2v(t) sur It0 ,x0
x0 (t0 − t) + 1
v(t0 ) = 1,
soit
C
v(t) = 1 2.
(t0 − t + x0
)
Comme v(t0 ) = 1, on trouve C = x−2
0 d’où
1
v(t) = ,
(x0 (t0 − t) + 1)2
∂x
qui est bien égal à (t, t0 , x0 ). On sait aussi que
∂x0
∂x
(t, t0 , x0 ) = w(t)
∂t0
où w(·) est l’unique solution de
x0
w0 (t) = 2w(t) sur It0 ,x0
x0 (t0 − t) + 1
w(t0 ) = −x20 ,
x20 ∂x
soit w(t) = − 2
qui est bien égal à (t, t0 , x0 ).
(x0 (t0 − t) + 1) ∂t0
∂x
Si x0 = 0, alors (t, t0 , 0) = v(t) où v(·) est solution de
∂x0
0
v (t) = 0 sur R
v(t0 ) = 1,
∂x
soit v(t) ≡ 1 qui est bien égal à (t, t0 , 0). De même, on a
∂x0
∂x
(t, t0 , 0) = w(t)
∂t0
où w(·) est l’unique solution de
0
w (t) = 0 sur It0 ,x0
w(t0 ) = 0,
∂x
soit w(t) ≡ 0 qui est bien égal à (t, t0 , 0).
∂t0
133