Vous êtes sur la page 1sur 228

~THÉMATIQUES

1 2e cycle /
rs et exercices corrigés
MATHÉMATIQUES POUR LE 2E CYCLE
Collection dirigée par Charles-Michel MARLE et Philippe PILIBOSSIAN

CALCUL
DIFFÉRENTIEL

Gilles CHRISTOL
Professeur
Université Pierre et Marie Curie
(Paris VI)

AnneCOT
Professeur agrégé
Université de Versailles-Saint Quentin

Charles-Michel MARLE
Professeur
Université Pierre et Marie Curie
(Paris VI)
Dans la même collection Mathématiques pour le 2J cycle

.,. Théorie de Galois, Ivan Gozard, 224 pages .


.,. Topologie, Gilles Christol, Anne Cot, Charles-Michel Marle, 192 pages .
.,. Éléments d'analyse convexe et variationnelle, Dominique Azé, 240 pages .
.,. Intégration et théorie de la mesure - Une approche géométrique, Paul Krée,
240 pages.

ISBN 2-7298-6751-1

© ellipses / édition marketing S.A., 1997


32 rue Bargue, Paris (15•).

La loi du 11mars1959' n'autorisant aux termes des alinéas 2 et 3 de !'Article 41, d'une part, que les
« copies ou reproductions strictement réservées à l'usage privé du copiste et non d'estinées à une
utilisation collective », et d'autre part, que les analyses et les courtes citations dans un but
d'exemple et d'illustration, « toute représentation ou reproduction intégrale, ou partielle, faite sans
le consentement de l'auteur ou de ses ayants droit ou ayants cause, est illicite », (Alinéa 1er de
!'Article 40).
Cette représentation ou reproduction, par quelque procédé que ce soit, sans autorisation de
l'éditeur ou du Centre français d'Exploitation du Droit de Copie (3, rue Hautefeuille, 75006 Paris),
constituerait donc une contrefaçon sanctionnée par les Articles 425 et suivants du Code pénal.
Présentation de la Collection

Mathématiques pour le deuxième cycle

Cette collection se propose de mettre à la disposition des étudiants de licence et


de maîtrise de mathématiques des ouvrages couvrant l'essentiel des programmes
actuels des universités françaises. Certains de ces ouvrages pourront être utiles
aussi aux étudiants qui préparent le CAPES ou l'agrégation, ainsi qu'aux élèves
des grandes écoles.

Nous avons voulu rendre ces livres accessibles à tous : les sujets traités sont
présentés de manière simple et progressive, tout en respectant scrupuleusement
la rigueur mathématique. Chaque volume comporte un exposé du cours avec des
démonstrations détaillées de tous les résultats essentiels, et de nombreux exercices
corrigés.

Les auteurs de ces ouvrages ont tous une grande expérience de l'enseignement des
mathématiques au niveau supérieur.

Nous avons apporté le plus grand soin à la présentation et à la mise en page des
textes de ces livres; le choix du logiciel TEX de Donald E. Knuth s'est imposé pour
ce travail.

Charles-Michel Marle Philippe Pilibossian


Avant-propos
Le Calcul différentiel a été créé par sir Isaac Newton et Gottfried Wilhelm Leibniz, dans la
seconde moitié du XVII-ème siècle. Très vite, il s'est imposé comme une avancée majeure
des Mathématiques et même, plus généralement, de la Science. Newton lui-même! 'utilise,
vers 1680, pour expliquer le mouvement des planètes. Avec le développement des théories
des équations différentielles et des équations aux dérivées partielles, le Calcul différentiel
est rapidement devenu l'outil essentiel pour la formulation mathématique de nombreuses
théories physiques, dans les domaines les plus divers : Mécanique, Électromagnétisme,
Thermodynamique, Optique, .... La place de choix qu'occupe le Calcul différentiel dans
les enseignements de deuxième cycle de Mathématiques est donc pleinement justifiée.
Le présent ouvrage traite du Calcul différentiel dans des espaces vectoriels normés, pas
nécessairement de dimension finie, ou dans les espaces affines qui leur sont associés. Nous
pensons en effet que traiter le Calcul différentiel uniquement dans les espaces ~n serait une
erreur, malheureusement assez commune dans certains enseignements universitaires : une
telle limitation masque la nature essentiellement géométrique de la notion de différentielle
et conduit à traiter le sujet de manière calculatoire, peu propice à l'appréhension des idées,
sans pour autant permettre de notable simplification. Mais conformément aux caractères
généraux de la présente collection, nous introduisons toutes les notions abstraites de
manière simple et progressive, et nous les illustrons par des exemples, en particulier dans
les nombreux exercices, qui tous sont résolus.
Nous supposons le lecteur familiarisé avec les notions de base de la Topologie et les
propriétés élémentaires des espaces vectoriels normés, exposées par exemple dans le
volume Topologie des mêmes auteurs, dans la même collection. Nous renvoyons à cet
ouvrage par des références telles que [T.VIII.3.8], qui renvoie au sous-paragraphe 3.8 du
chapitre VIII du livre Topologie (théorème d' Ascoli).
Nous avons voulu éviter au lecteur d'avoir à se reporter trop souvent à d'autres parties
éloignées du texte. C'est pourquoi le repérage des formules, par des signes tels que ( *),
(**)ou ( ***),est le plus souvent local; il n'a de valeur que dans le paragraphe courant. Les
renvois à d'autres parties du texte se font par le numéro de chapitre en chiffres romains,
suivi des numéros de paragraphe et de sous-paragraphe et, éventuellement, de la lettre
repérant le sous-sous-paragraphe. Exemples : 1.2.4 désigne le théorème d'inversion locale,
page 43; V.2.7 désigne le théorème de Cauchy-Lipschitz, page 119. À l'intérieur d'un
même chapitre, le numéro de chapitre est omis.
Les auteurs remercient leurs collègues Dominique Bernardi et Philippe Pilibossian, ainsi
que Corinne Baud, des éditions Ellipses, pour leur aide patiente et attentive.
Paris, juillet 1997

Gilles Christol Anne Cot Charles-Michel Marle


Table des matières

Notations . . . . . . . . . . . . . . . . . . viii
Chapitre premier. Applications différentiables . 1
1 La notion de différentielle . . . . . . . . 1
2 Applications à valeurs dans un produit . . 11
3 Applications définies sur un ouvert d'un produit 12
4 IR-différentiabilité et <C-différentiabilité . 15
5 Le théorème des accroissements finis . 17
6 Exercices . . . . . . . . . . . . . . 24
7 Solutions . . . . . . . . . . . . . . . 28
Chapitre Il. Fonctions inverses et fonctions implicites 40
1 Difféomorphismes de classe C 1 . . . 40
2 Le théorème des fonctions inverses 41
3 Le théorème des fonctions implicites . 45
4 Exercices . . . . . . . . . . . . . 48
5 Solutions . . . . . . . . . . . . . . 51
Chapitre III. Différentielles d'ordre supérieur 59
1 Définition et propriétés élémentaires . . 59
2 Symétrie des différentielles d'ordre supérieur 62
3 Propriétés des différentielles d'ordre supérieur 65
4 La formule de Taylor . . . . . 68
5 Maxima et minima relatifs 71
6 Maxima et minima relatifs liés . 76
7 Exercices . . . . . . . . . . 80
8 Solutions . . . . . . . . . . . 84
Chapitre IV. Équations différentielles; généralités 95
1 Équations différentielles sous forme canonique 95
2 Équations différentielles autonomes . . . . . 97
3 Équations différentielles sous forme non canonique 100
4 Intégrales premières . . . . . . 101
5 Effets de quelques transformations 103
6 Exercices . . . . . . . . . . . 106
7 Solutions . . . . . . . . . . . . 108
Chapitre V. Équations différentielles; le problème de Cauchy 112
1 Solutions maximales, unicité locale et unicité globale 112
2 Solution du problème de Cauchy : cas lipschitzien 114
3 Solution du problème de Cauchy : cas continu 123
4 Bouts d'une solution maximale 127
5 Exercices . . . . . . . . . . . . . . . . 130
6 Solutions . . . . . . . . . . . . . . . . . 133
Chapitre VI. Le flot d'une équation différentielle 143
1 Inégalités vérifiées par les solutions d'une équation différentielle . 143
2 La continuité du flot . . . . . . . . . . . . . . 148
3 Équations différentielles dépendant d'un paramètre 157
4 La différentiabilité du flot 158
5 Exercices 163
6 Solutions . . . . . . . . 165
Table des matières vii

Chapitre VII. Équations différentielles linéaires 172


1 Propriétés générales . . . . . . . . . . 172
2 Equations différentielles linéaires homogènes . 174
3 Méthode de variation de la constante . . . . . 177
4 Étude de l'équation résolvante . . . . . . . . 179
5 Equations différentielles linéaires homogènes autonomes dans !Rn 184
6 Exercices . . . . . . . . . . 188
7 Solutions . . . . . . . . . . . . 191
Chapitre VIII. Calcul des variations 195
1 L'espace des courbes de classe C 1 195
2 La différentielle de la fonctionnelle de Lagrange 197
3 L'équation d'Euler . . . . . . . . . . . . . . 200
4 Transformation de Legendre et équation de Hamilton 206
5 Exercices . . . . . 209
6 Solutions . . . . . . 210
Bibliographie commentée 213
1 Conseils de lecture 213
2 Références 214
Index . . . . . . . . . 215
Notations
Toutes les notations particulières à cet ouvrage sont définies dans le texte lors de leur
emploi, et ont généralement une valeur locale, limitée au paragraphe où elles sont
employées. Les quelques notations ayant une valeur globale sont énumérées ci-dessous,
avec indication du numéro de la page où elles sont définies (éventuellement précédé de la
lettre T, pour celles définies dans le livre Topologie des mêmes auteurs).

E symbole d'appartenance, T 4. N ensemble des entiers naturels, T 8.


V quantificateur universel, T 2. Q corps des nombres rationnels, T 12.
3 quantificateur existentiel, T 2. lR corps des nombres réels, T 12.
0 ensemble vide, T 5. iR droite numérique achevée, T 23.
I : E ---7 F application appelée 1. Z anneau des entiers relatifs, T 11.
définie sur l'ensemble E et à
valeurs dans l'ensemble F, T 7. C* = C\{O}, N* = N\{O},
I : x 1-7 y application appelée I, JR* =IR\ { 0 }, Z* = Z\ { 0 }.
associant à l'élément x de l'ensemble L(E, F), Lc(E, F), LJF.(E, F),
sur lequel elle est définie, 1' élément y espaces des applications linéaires,
de l'ensemble dans lequel elle prend C-linéaires, JR-linéaires, continues
ses valeurs, T 7. de E dans F, T 136.
1- 1 (A) image réciproque par L(Ek ; F) espace des applications
l'application I de la partie A de k-multilinéaires continues de E
l'ensemble dans lequel I prend ses dans F, 59.
valeurs; lorsque I est bijective, DI ou I', différentielle de I, 8.
1- 1 désigne son inverse; T 7. Dn I ou l(n), différentielle d'ordre n
go I : x 1-7 g(f(x)) application de 1. 60.
composée des applications I et g. I~ ou Dxl, dérivée ou différentielle
I (x) ---7 l signifie que I (x) tend vers la partielle de I, 13.
limite l, 59.
al(x,
ax y) ' d'envee
. ' . Il d
partie e e
I par
limx-+a., xEA l(x) limite de l(x)
lorsque x tend vers a en restant rapport à la variable réelle x, 13.
dans A, T 59.
dcp(t) dncp(t) dérivées de 1/"J par
supiEJ Xi. inf iEJ Xi, bornes supérieure dt dtn ' r
et inférieure de {Xi ; i E I } . rapport à la variable réelle t, 95.
C corps des complexes, T 12. ~ virage dangereux, erreur à éviter.
Chapitre premier
Applications différentiables

Le lecteur est sans doute déjà familiarisé avec le calcul de la dérivée d'une fonction d'une
variable, ou des dérivées partielles d'une fonction de plusieurs variables. La notion de
différentielle, introduite dans le présent chapitre, permet d'étendre ce type de calcul aux
fonctions (ou applications) définies sur un ouvert d'un espace vectoriel normé. Nous allons
en étudier les propriétés élémentaires. Puis nous introduirons une importante inégalité
connue sous le nom de théorème des accroissements finis.
Les espaces vectoriels normés considérés dans ce chapitre sont des espaces vectoriels sur
un corps OC qui pourra être lR ou C.

1. La notion de différentielle

1.1. Définition. - Soit U un ouvert d'un espace vectoriel normé E, f une application
de U dans un autre espace vectoriel normé F, et a un point de U. On dit que f
est tangente à zéro à l'ordre n au point a (avec n EN), et on écrit
f(x) = o(llx - alln),
si pour tout€ > 0, il existe T/ > 0 tel que, pour tout x E U,
llx - ail ~ T/ implique llJ(x)ll ~ €jjx - alln.
Pour n = 1, on dit simplement tangente à zéro.
On dit que deux applications f et g de U dans F sont tangentes à l'ordre n en a si
J- g est tangente à zéro à l'ordre n au point a.

1.2. Remarques et exemple


. a) Relation d'équivalence. - On vérifie aisément que la propriété "f et g sont tangentes
à l'ordre n au point a" est une relation d'équivalence.
b) Addition et multiplication par les scalaires. - Soient fi et fz deux applications de
U dans F tangentes à zéro à l'ordre n en un point a de U, et À E OC un scalaire. On vérifie
aisément que fi + fz et .\fi sont tangentes à zéro à 1' ordre n au point a.
c) Expression en termes de limite. - Dire que f est tangente à zéro à l'ordre n au point
a équivaut à dire que f(a) = 0 et que
lim J(x) = 0.
x->a, xf-a llx - alln
2 Chapitre premier. Applications différentiables

En particulier, pour n = 0, une fonction f est tangente à zéro à l'ordre 0 au point a si et


seulement si f s'annule en a et est continue en ce point.
d) Remplacement des normes par d'autres équivalentes. - Soit f :U -> F une
application définie sur un ouvert U de l'espace vectoriel normé E, à valeurs dans l'espace
vectoriel normé F, tangente à zéro à l'ordre n (n E N) en un point a de U. Si l'on
remplace les normes de E et de F par d'autres, équivalentes à celles dont ces espaces
étaient initialement munis, l'application f reste tangente à zéro à l'ordre n au point a.
Soit en effet x ~ llxll1 la norme dont l'espace E est initialement muni, et supposons
qu'on remplace cette norme par une autre équivalente, notée x ~ llxll2- L'équivalence de
ces deux normes (voir par exemple [T.IX.1.2.b]) signifie qu'il existe deux réels>. > 0 et
µ > 0 tels que, pour tout x E E,

>-llxll1 :S llxll2 :S µllxlli ·


Soit c > O. Posons c 1 = Ànc. Puisque f est tangente à zéro à l'ordre n au point a lorsque
E est muni de sa norme initiale, il existe 77 1 > 0 tel que, pour tout x E U,

llx - alli :S 7]1 implique


Mais llx - all1 :::; >.- 111x - all2· Posons 1J = À1J1. Nous voyons alors que x E U et
llx - all2 :S 1] implique llx - all1 :::; 7Ji. qui à son tour implique
llf(x)ll :S c1 (llx - all1t :S c(llx - all2)n,
ce qui exprime que f est tangente à zéro à l'ordre n au point a lorsque E est muni de la
nouvelle norme x ~ llxll2-
Nous laissons au lecteur le soin de traiter le cas où c'est la norme de F qu'on remplace
par une autre norme équivalente.
e) Comparaison des ordres. - Si f est tangente à zéro à l'ordre n au point a, avec n E N,
alors pour tout m E N vérifiant 0:::; m :::; n, la fonction f est tangente à zéro à l'ordre m
au point a. Nous pouvons en effet toujours imposer au réel 77 > 0 de la définition 1.1 de
vérifier 1J:::; 1; pour llxll :S 1J:::; 1, nous avons alors llx - alln :S llx - allm.
f) Relation avec la continuité. -- Si f est tangente à zéro à l'ordre n au point a.,
nécessairement f(a) = 0 et f est continue en a. Si f et g sont tangentes à l'ordre n en a,
nécessairement f(a) = g(a), et si l'une de ces applications est continue en a, l'autre l'est
aussi.
g) Cas d'une application linéaire. - Une application linéaire <p: E-> Fest tangente
à zéro à l'ordre n à l'origine, avec n E N*, si et seulement si elle est identiquement nulle.
Supposons en effet <p tangente à zéro à l'ordre n ~ 1 à l'origine.D'après la remarque 1.2.e,
elle est tangente à zéro à !'ordre 1 à !'origine. Pour tout c > 0, il existe 1J > 0 tel que, pour
tout x E E vérifiant llxll :S 77,
jj<p(x)jj :S cllxll ·
Mais tout x E E, x # 0, peut s'écrire

X= llxll z,
avec z = llxll
T/
x, donc llzll = TJ.
1]
§ 1. La notion de différentielle 3

Par suite, l'inégalité(*) ci-dessus est vérifiée pour tout élément non nul x de E. Elle est
évidemment vérifiée aussi pour x = 0, donc pour tout x E E. Cette inégalité montre
que la norme ll<pll de l'application linéaire <p est majorée par€. Comme€ peut être choisi
arbitrairement petit, nous avons bien <p = O.
Réciproquement, l'application nulle de E dans Fest bien évidemment tangente à zéro à
l'ordre n à l'origine, pour tout n E N.
h) Exemple : tangente et cercle osculateur en un point à un graphe. - Nous
supposons le lecteur familiarisé avec les notions de dérivabilité et de dérivées première
et seconde d'une fonction d'une variable réelle, afin d'illustrer dès maintenant par un
exemple la définition 1. 1, et de justifier la terminologie employée.
Soit f :I ~ lR une fonction définie sur un intervalle ouvert Ide JR, à valeurs réelles, et a
un point de I. Nous supposons f dérivable au point a. Rappelons que cela signifie que la
limite limx->a , x#a (f (x) - f (a))/ (x - a) existe. Cette limite, notée f' (a), est la dérivée
de f au point a.
Soitkunréel,etgk: lR ~ JRI'applicationaffinegk(x) = f(a)+k(x-a).Lesapplications
f et g prennent la même valeur au point a, et nous avons

lim f(x) - gk(x) = J'(a) - k.


x->a , xfca X - a

Compte tenu de la remarque 1.2.c, nous voyons que f et gk sont tangentes à l'ordre 1 au
point a si et seulement si k = f'(a). Lorsque c'est le cas, le graphe de l'application affine
gk est la droite, tangente au graphe de f, au point (a, f (a)) (voir figure 1).
Plus généralement, on voit aisément que deux applications fi : I ~ lR et h :I ~ JR,
dérivables au point a, sont tangentes à l'ordre 1 au point a si et seulement si elles vérifient
fi(a) = h(a) et fi(a) =!Ha), c'est-à-dire si et seulement si leurs graphes sont deux
courbes tangentes au point d'abscisse a.
Supposons maintenant l'application f dérivable sur l, et notons f' : I ~ lR sa dérivée.
Supposons aussi f deux fois dérivable au point a; rappelons que cela signifie que f' est
dérivable au point a; la dérivée de f' en ce point est appelée dérivée seconde de f au point
a et notée f"(a).
Soit un réel R # O. Dans le plan JR. 2 (muni de sa structure euclidienne usuelle), considérons
le cercle C, de rayon IRI, centré sur le point de coordonnées
(a - Rj'(a)(l + (f'(a)) 2 )- 112 f(a) + R(l + (f'(a)) 2 )- 112 ) .

Le lecteur notera que le cercle C passe par le point (a, f (a)) et que son centre est sur la
normale au graphe de f en ce point. L'équation cartésienne de C est
2
( x - a+ Rj'(a)(l + (f'(a)) 2 )- 112 ) 2 +(y - f(a) - R(l + (f'(a)) 2 )- 112 ) = R2 •
Posons, pour alléger l'écriture, K = (1 + (f' (a)) 2 ) 112 . L'équation cartésienne du cercle
C s'écrit
(y- f(a) - R/K) 2 = R 2 - (x - a+ RJ'(a)/K) 2 .
4 Chapitre premier. Applications différentiables

Au voisinage du point (a, f(a)), le cercle C est le graphe de l'application

En utilisant des développements limités à l'ordre 2 (supposés acquis en premier cycle),


nous obtenons
K3 2
h(x) = f(a) + J'(a)(x - a)+ 2R (x - a) 2 + o(jx - ai) .

D'autre part, d'après la formule de Taylor (sur laquelle nous reviendrons au chapitre III,
mais que nous supposons avoir été acquise en premier cycle au moins pour les fonctions
d'une variable réelle),

f"(a) 2
f(x) = f(a) + J'(a)(x - a)+ - 2 - (x - a) 2 + o(jx - aj) .

Nous voyons que f eth sont tangentes à l'ordre 1 au point a, ce qui n'a rien d'étonnant
puisque le cercle C, centré sur la normale au graphe de f au point d'abscisse a, est tangent
à ce graphe en ce point. De plus, nous voyons que f eth sont tangentes à l'ordre 2 au point
a si et seulement si
1 f"(a) f"(a)
R K3 3/2 .
(1+ (/'(a)) 2 )
Lorsque f" (a) =f. 0, il existe un réel unique R vérifiant cette formule. Le cercle C
correspondant est appelé cercle osculateur au graphe de f au point d'abscisse a (voir
figure 1).

Figure 1. Tangente et cercle osculateur.

La notion de différentielle d'une application f en un point a s'introduit naturellement


lorsqu'on cherche une application affine (c'est-à-dire somme d'une application linéaire et
d'une constante) continue, tangente à l'ordre 1 à l'application f au point a.

1.3. Définition. - On dit qu'une application f de l'ouvert U de l'espace vectoriel


normé E dans l'espace vectoriel normé F est différentiable au point a E U, s'il
§ 1. La notion de différentielle 5

existe une application linéaire continue cp de E dans F telle que f et l'application


de U dans F
x 1-+ f(a) + cp(x - a)
soient tangentes en a à l'ordre 1, c'est-à-dire si
J(x) - f(a) - cp(x - a) = o(llx - ail) ·
Lorsque c'est le cas, l'application linéaire continue cp E C(E, F) est appelée
différentielle de J au point a.
1.4. Propriétés élémentaires
a) Différentiabilité et continuité. -- Si f est différentiable en a, f est continue en a. En
effet, en notant cp la différentielle de f en a, l'application affine x 1-+ f (a) + cp( x - a) est
continue en a, donc d'après 1.2.f, f l'est aussi.
b) Unicité de la différentielle. - Si f est différentiable en a, sa différentielle en ce point
est unique. Elle est généralement notée Df(a), ou f'(a). Soient en effet cp 1 et cp 2 deux
applications linéaires continues de E dans F telles que
f(x) - J(a) - <p1(x - a)= oJJx - ail, et f(x) - J(a) - cp2(x - a)= oJJx - ail·
En utilisant 1.2.b, nous en déduisons
(cp2 - cp1)(x - a)= o(llx - ail)·
En d'autres termes, cp 2- cp 1est tangente à zéro à l'ordre 1 à l'origine. Mais d'après 1.2.g,
cela implique cp2 = cp1.
c) Remplacement des normes. - Si on remplace les normes sur E et sur F par d'autres
normes équivalentes, les notions de différentiabilité et de différentielle restent inchangées :
une application différentiable en a pour les anciennes normes le reste pour les nouvelles,
et sa différentielle reste la même. C'est en effet une conséquence immédiate de 1.2.d.
d) Cas des espaces affines. - La notion d'application différentiable en un point, et celle
de différentielle, conservent un sens lorsque f est une application d'un ouvert U d'un
espace affine Ê, associé à l'espace vectoriel normé E, dans un espace affine F associé à
l'espace vectoriel normé F : il suffit en effet de choisir un point de Ê et un point de F pour
origines pour identifier ces espaces affines aux espaces vectoriels E et F, respectivement. Il
est facile de vérifier que la notion de différentiabilité, et celle de différentielle, ne dépendent
~ ~

pas du choix des points de E et de F pris pour origines.


Attention : il importe de remarquer que la différentielle est, encore dans ce cas, une
application linéaire continue de l'espace vectoriel E dans l'espace vectoriel F, et non
une application de Ê dans F.
1.5. Exemple : différentielle et dérivée usuelle. - Considérons le cas où OC = IR, où U
est un intervalle ouvert de IR et f une application de U dans l'espace vectoriel normé F.
L'application f est différentiable au point a E U s'il existe cp E C(IR, F) telle que f et
l'application affine x 1-+ f(a) + cp(x - a) soient tangentes en a, c'est-à-dire si
lim J(x) - J(a) - cp(x - a) =0.
X->a 1 X#a lx - al
6 Chapitre premier. Applications différentiables

Mais (voir par exemple [T.IX.3.8.a]) l'espace L:(IR, F) s'identifie à F, grâce à l'isomor-
phisme qui associe, à chaque élément cp de L:(IR, F), l'élément ép = cp(l) de F. Nous
pouvons donc écrire cp(x - a) = (x - a)ép. L'application f est donc différentiable au point
a et admet en ce point <p pour différentielle si et seulement si
f (a) = ép .
lim f (x) -
a
x->a, x#a X -
L'élément ép de Fest la dériv""ie de Taupoint·~~~-~-~~~~uel.
Ce qui précède reste applicable lorsque .OC. = C et que U est un ouvert de C.
1.6. Remarques, compléments et exemples
a) Dérivées directionnelles. - L'exemple précédent montre qu'une application f d'un
ouvert U de lR dans un espace vectoriel normé réel F est différentiable en un point a
de U, au sens de la définition 1.3, si et seulement si elle est dérivable en ce point au
sens usuel. Lorsque c'est le cas, sa différentielle au point a, élément de l'espace L:(IR, F)
des applications linéaires de lR dans F, et sa dérivée au point a, élément de l'espace F,
s'identifient de manière très naturelle, grâce à l'isomorphisme canonique de L:(IR, F)~r

F. Supposons maintenant l'application f définie sur un ouvert U d'un espace vectoriel


normé réel Ede dimension (finie ou infinie) strictement supérieure à 1, et soit a un point
de U. Soit v un élément de E. L'application t 1-+ f (a + tv) est définie sur un ouvert de lR
contenant l'origine, et à valeurs dans F. Nous dirons que f est dérivable dans la direction
du vecteur v si la limite
lim J(a + tv) - f(a)
t->O, t#O t
existe. Lorsque c'est le cas, cette limite est appelée dérivée directionnelle de f au point a
dans la direction du vecteur v, et notée Lvf(a).
Il est facile de vérifier que si f est différentiable en a, elle admet en ce point, pour tout
vecteur v E E, une dérivée directionnelle dans la direction de v dont l'expression, au
moyen de la différentielle D f (a) de f au point a, est
Lvf(a) = Df(a)(v).
Une application peut avoir, en un point, des dérivées directionnelles dans toutes les
directions sans être différentiable en ce point. Considérons par exemple l'application
f : IR 2 ---t IR,
x(x 2 - 3y 2 )
si (x, y) -::/= (0, 0),
J(x, y) = {
0
x2 + y2
si (x, y) = (0, 0).
L'application f, étant homogène de degré 1 en (x, y) admet à l'origine une dérivée direc-
tionnelle dans la direction de tout vecteur ( u, v) du plan IR 2 , et nous avons L(u,v)i(O, 0) =
J(u,v). Mais comme (u,v) 1-+ L(u,vif(O,O) n'est pas une forme linéaire sur IR 2 ,
l'application f n'est pas différentiable à lorigine.
Le lecteur astucieux aura remarqué qu'en coordonnées polaires (r, 8), l'expression de f
est J(r, 8) = r cos(38). Il pourra, à titre d'exercice, faire un dessin représentant le graphe
de f.
§ 1. La notion de différentielle 7

b) Différentielle au sens de Gâteaux. - La différentielle définie en 1.3 est souvent


appelée différentielle de Fréchet de l'application f au point a. On utilise aussi une autre
différentielle, appelée différentielle au sens de Gâteaux. On dit que l'application f d'un
ouvert U d'un espace vectoriel normé E dans un autre espace vectoriel normé F est
différentiable au sens de Gâteaux en un point a de U s'il existe une application linéaire
continue cp E .C(E, F) telle que, pour tout v E E,

lim f(a + tv) - f(a) = cp(v).


t--+0, tfO t
L'application linéaire cp est alors appelée différentielle de f au sens de Gâteaux au point
a.
En d'autres termes, f est différentiable au sens de Gâteaux au point a si pour tout vecteur
v E E, elle admet en a une dérivée directionnelle .Cvf(a) dans la direction de v, et si
v 1--+ .Cvf(a) est une application linéaire continue de E dans F.
Lorsqu'une application admet, en un point a, une différentielle au sens de Fréchet, elle
admet aussi en ce point une différentielle au sens de Gâteaux, égale à sa différentielle au
sens de Fréchet.
Ainsi que le montre l'exemple précédent, il existe des applications qui admettent, en un
point, des dérivées directionnelles dans toutes les directions et qui, en ce point, ne sont pas
différentiables au sens de Gâteaux, ni, a fortiori, au sens de Fréchet. On rencontre aussi
des applications qui, en un point, sont différentiables au sens de Gâteaux sans l'être au
sens de Fréchet. Considérons par exemple l'application f: IR 2 -->IR,

x6
{ si (x, y) -::J (0, 0),
f(x, y) = ~8 +(y_ x2)2
si (x, y) = (0, 0).
Soit (u, v) E IR 2 . Considérons lapplication de IR dans IR, t 1--+ f (tu, tv). Il est facile de
vérifier que
lim J(tu, tv) - J(O, 0) = 0 .
t--+0, tfO t
Cela prouve que f est différentiable au sens de Gâteaux à l'origine, et qu'en ce point sa
différentielle au sens de Gâteaux est nulle.D'autre part nous avons, pour tout x E IR- { 0},
f (x, x 2 ) = x- 2 . Par suite, lorsque x tend vers 0, (x, x 2 ) tend vers l'origine de IR 2 , tandis
que f (x, x 2 ) tend vers +oo. L'application f n'est donc pas continue à l'origine, et a fortiori
n'est pas différentiable au sens de Fréchet en ce point.
c) Dérivée ou différentielle. - Certains auteurs (notamment H. Cartan [6]) appellent
dérivée d'une application en un point ce que ·nous avons appelé différentielle de cette
application en ce point, et disent qu'une application est dérivable pour dire qu'elle est
différentiable. Il nous a semblé préférable de réserver le terme de dérivée pour désigner la
dérivée au sens usuel, comme dans l'exemple 1.5.
8 Chapitre premier. Applications différentiables

d) Dérivées à droite et à gauche. - Dans les hypothèses de lexemple 1.5, il est parfois
utile de généraliser la notion de dérivée, et de définir les dérivées à droite et à gauche de
l au point a comme étant, respectivement, les limites, lorsqu'elles existent,
l(x) - l(a) l(x) - l(a)
lim et lim
X-foa, x>a x-a x-+a, x<a x-a
L'application l est différentiable en a si et seulement si elle possède en ce point des
dérivées à gauche et à droite égales; lorsque c'est le cas, la valeur commune ij5 de ces
dérivées à droite et à gauche est la dérivé (au sens usuel) del en ce point; la différentielle
de l au point a est alors l'application linéaire de lR dans F : x ~ <p( x) = xij5.
La notion de dérivée à droite conserve un sens lorsque le point a est l'extrémité gauche
de l'intervalle U (qui n'est plus supposé ouvert). De même, la notion de dérivée à gauche
conserve un sens lorsque le point a est l'extrémité droite de U.

1.7. Définition. - On dit qu'une application l d'un ouvert U de l'espace vectoriel


normé E dans l'espace vectoriel normé F est différentiable dans U, ou, plus
brièvement, différentiable, si elle est différentiable en tout point de U. Dans ce cas,
on note Dl (x), ou aussi f' (x), sa différentielle au point x de U. On dit que l est de
classe ci (dans u)' ou continûment différentiable (dans u)' si elle est différentiable
dans U et si l'application de U dans .C(E, F) : x ~ Dl(x), est continue.

1.8. Proposition: différentielle d'une application composée. - Soient E, F, G trois


espaces vectoriels normés, U un ouvert de E, V un ouvert de F, l : U --+ F et
g : V --+ G deux applications, et a un point de U tel que l(a) appartienne à V. On
suppose l différentiable en a et g différentiable en l(a). Alors l'application go l
est différentiable en a, et a pour différentielle en ce point
D(g o f)(a) = Dg(f(a)) o Dl(a).
Si l est différentiable dans U (resp., de classe ci dans U) et g différentiable dans
V (resp., de classe ci dans V), l'application composée go l est différentiable dans
son domaine de définition Un l-i(V) (resp., de classe ci dans Un l-i(V)).

Preuve: Traitons d'abord le cas où let g sont différentiables, respectivement en a et en


b = l(a). Pour tous x E U et y E V, posons

A(x) = l(x) - l(a) - Dl(a)(x - a), B(y) = g(y) - g(b) - Dg(b)(y - b).
Nous avons
g(f(x)) - g(f(a)) - Dg(f(a)) o Dl(a)(x - a)= B(f(x)) + Dg(b)(A(x)). (*)
L'application Dg(b) étant linéaire continue,

llDg(b)(A(x)) Il ~ llDg(b)ll llA(x)ll ·


Compte tenu de A(x) = o(Jlx - aJJ), cette inégalité prouve que
Dg(b)(A(x)) = o(JJx - aJJ)
§ 1. La notion de différentielle 9

D'autre part,

lll(x) - bll = llDl(a)(x - a)+ A(x)ll :S llDl(a)ll llx - ail+ llA(x)ll · (**)

Nous allons voir que, compte tenu de B (f (x)) = o(lll (x) - bll). cette inégalité implique
B(f(x)) = o(llx - all). Soit en effet e > O. Posons ei = e(l + llDl(a)llri.
Puisque B(y) = o(llY - bll), il existe 'fJ > 0 tel que y E V et llY - bll :S 'fJ implique
llB(y)ll :S eillY - bll· Puisque A(x) = o(llx - ail), il existe 'f/i > 0 tel que x E U et
llx - ail :S 'f}i implique llA(x) Il :S llx - all, donc, d'après (** ),
lll(x) - bll :S (1 + llDl(a)ll)llx - ail·
Posons 'f/2 = inf('f/i,'f/(l + llDl(a)llri). Alors x E Un 1-i(V) et llx - ail :S 'f/2
implique llJ(x) - bll :S 'f/, donc

llB(f(x)) Il :Sei (1 + llDl(a)ll) llx - ail= ellx - ail,


ce qui prouve que B(f(x)) = o(llx - ail) Nous avons prouvé que chacun des deux
termes du membre de droite de (*)est o(llx - ail), donc que le membre de gauche de cette
égalité est lui aussi o(llx - a JI), ce qui montre que go I est différentiable en a et a pour
différentielle en ce point Dg (f (a)) o DI (a).
Supposons maintenant I différentiable sur U et g différentiable sur V; le résultat qui
précède montre que g o I est différentiable en tout point x de U n 1-i (V), et a pour
différentielle en ce point Dg(! (x)) o DI (x).
Supposons enfin / et g de classe ci. L'application de Un 1-i(V) dans C(E, G),
x 1--+ Dg(f (x)) o DI (x), est la composée des applications suivantes :
- l'application de Un 1-i (V) dans F x C(E, F), x 1--+ (f (x ), DI (x) ), qui est continue
car ses deux composantes le sont;

- l'application de V x C(E, F) dans C(F, G) x C(E, F), (y, A) 1--+ (Dg(y), A), qui est
continue car ses deux composantes le sont;

- l'application de C(F, G) x C(E, F) dans C(E, G), (B, A) 1--+ Bo A, qui est bilinéaire
continue.
Cette application, qui n'est autre que D(g o !), est donc continue; autrement dit,
l'application go I est de classe ci. D

Soient E et F deux espaces


1.9. Proposition : linéarité de la différentiation. -
vectoriels normés, et U un ouvert de E. L'ensemble des applications de U dans F
qui sont différentiables en un point a donné de U (resp., qui sont différentiables
sur U) est un espace vectoriel, et l'application qui associe, à chaque application I
élément de cet espace, sa différentielle D l(a) en a (resp., sa différentielle D !), est
linéaire.
10 Chapitre premier. Applications différentiables

Preuve : Nous traiterons par exemple le cas des applications différentiables en un point a
de U; celui des applications différentiables sur U s'en déduit immédiatement.
Soient f : U---+ F et g : U---+ F deux applications différentiables en a, D J(a) et Dg( a)
leurs différentielles en ce point, et À E OC un scalaire. Nous avons
J(x)-f(a)-Df(a)(x-a) = o(llx-ajj), g(x)-g(a)-Dg(a)(x-a) = o(jl.?:-ajl).
En utilisant 1.2.b, nous en déduisons
(J + g)(x) - (J + g)(a) - (Df(a) + Dg(a))(x - a)= o(ilx - ail),
Àf(x) - Àf(a) - ÀDf(a)(x - a)= o(ilx - ail),
ce qui prouve que f + g et
Àf sont différentiables en a et ont pour différentielle en ce
point, respectivement, Df(a) + Dg(a) et ÀDf(a). D

1.10. Différentielles de fonctions particulières


a) Applications constantes. - Toute application constante est différentiable, et sa
différentielle est identiquement nulle.
b) Applications linéaires continues. - Une application linéaire continue f E C(E, F)
est différentiable en tout point a de E, et sa différentielle en ce point est f. On a en effet
f(x) - f(a) - f(x - a)= O.
c) Applications multilinéaires continues. - Une application bilinéaire continue
f E C(E1 , E 2 ; F) est différentiable en tout point (a 1, a 2) E E 1 x E 2, et sa différentielle
en ce point est l'application linéaire de E 1 x E 2 dans F:
(hi, h2) t--t D f (a1, a2)(h1, h2) = f (h1, a2) + f (a1, h2) .
L'application de E1 x E2 dans F: (h1,h2) f(h1,a2) + J(a1,h2) est visiblement
t--t

linéaire. Montrons qu'elle est continue. Nous avons

Prenons par exemple pour norme, sur l'espace produit E1 x E2,

Nous pouvons alors écrire


llJ(h1, a2) + f(a1, h2)11:::; ilfll sup(lla1i1, 1ia2il) llhll,
ce qui prouve la continuité de cette application linéaire. D'autre part, puisque f est
bilinéaire, nous avons

donc

ce qui prouve le résultat annoncé.


Cette propriété se généralise immédiatement au cas d'une application multilinéaire
continue f E C(E1, ... , En ; F).
§ 2. Applications à valeurs dans un produit 11

2. Applications à valeurs dans un produit


2.1. Composantes d'une application. - Soit U un ouvert d'un espace vectoriel normé
E, et F = F1 x Fz un produit de deux espaces vectoriels normés F 1 et Fz. On sait que
F est un espace vectoriel, qu'on peut munir de diverses normes équivalentes, par exemple
Il (Y1, Yz) Il = sup(lly1 Il, llYz 11) (voir par exemple [T.IX.1.3]). L'espace .C(E, F1 x Fz) est
isomorphe, par un isomorphisme préservant la norme, à .C(E, Fi) x .C(E, Fz). Soient
p 1 : F ---> F 1 et pz : F ---> Fz les projections. Ce sont des applications linéaires continues.
Soit f : U---> F une application d'un ouvert U de E dans F. Les applications fi = p 1 of
et fz = pz of de l'ouvert U, respectivement, dans les espaces F 1 et Fz, sont appelées
composantes de l'application f.
L'application f peut s'exprimer au moyen de ses composantes, sous la forme
f = U1 o fi + Uz o fz ,
où u 1 : F 1 ---> F et uz : Fz ---> F sont les injections canoniques, définies par
u1(yi) = (y1,0), Uz(Yz) = (0,yz), YI E F1, Yz E Fz.
Remarquons que u 1 et uz sont des applications linéaires continues.

2.2. Proposition. - Une application f de U dans F = F1 x Fz est différentiable


en a E U si et seulement si fi = P1 o f et fz = pz o f sont différentiables en a.
Lorsque c'est le cas, on a
Df(a) = (Dfi(a),Dfz(a)), Dfi(a) = P1 o Df(a), Dfz(a) =pz o Df(a).
De même, f est différentiable (resp., de classe C 1 ) dans U, si et seulement si fi et
fz le sont.
Preuve : Supposons f différentiable au point a. Les projections p 1 et pz, étant linéaires et
continues, sont différentiables ( 1.10.b), et nous avons
D !1 (a) = D(p1 o f)(a) =Dpi (f (a)) o D f(a) = P1 o D f(a),
et, de même,
Dfz(a) =pzoDJ(a).
Réciproquement, supposons fi et fz différentiables en a. Munissons F 1 x Fz, par exemple,
de la norme jj(y1, yz)jj = sup(llY1!!, llYzll). et posons, pour tout u E E,
<I>(u) = (Dfi(a)(u),Dfz(a)(u)).
Nous avons, pour tout x E U,
Jjf(x) - f(a) - <I>(x - a)jj = sup Jlfi(x) - fi(a) - Dfi(a)(x - a)jj
iE{ l,Z}

= o(llx - ail) ·
Cela prouve que f est différentiable en a et admet en ce point <I> pour différentielle.
Les résultats concernant les cas où f est différentiable dans U, ou de classe C 1 dans U,
s'en déduisent immédiatement, car D f = (D fi, D fz) est continue si et seulement si ses
deux composantes le sont. D
12 Chapitre premier. Applications différentiables

2.3. Remarques
a) Expression de fa différentielle. - La différentielle de f en a peut s'exprimer, au
moyen des différentielles de fi et de h en a, sous la forme
Df(a) = u1 o Dfi(a) + u2 o Dh(a),
où u 1 : F1 - F et u2 : F2 - F sont les injections canoniques y1 f--+ (y 1, 0) et
Y2 f--+ ( 0, Y2), respectivement.
b) Produit den facteurs. -- La proposition 2.2 se généralise immédiatement au cas où
F = F 1 x F 2 x · · · x Fn est le produit d'un nombre fini quelconque n d'espaces vectoriels
normés.

2.4. Application : différentielle d'un produit. - Soient E un espace vectoriel normé


sur le corps OC = ~ ou C, f et g deux applications d'un ouvert U de E dans OC, et a un
point de U. Posons h = f g. L'application h est composée de(!, g) : U - OC x li{, et de
lapplication <I> : OC x OC - li{, <I> (Y1, Y2) = Yi y2, qui est bilinéaire continue. Si f et g
sont différentiables en a, h = f g l'est aussi et nous avons, pour tout u E E, laformule de
Leibniz,
Dh(a)(u) = f(a) Dg(a)(u) + g(a) Df(a)(u).
La même règle s'étend au cas où f :U - F et g : U - G sont deux applications de U
dans des espaces vectoriels normés F et G, respectivement, et où <I> : F x G - H est
une application bilinéaire continue de F x G dans un espace vectoriel normé H : si f et g
sont différentiables en a, h = <I> o (!, g) l'est aussi et on a, pour tout u E E,
Dh(a)(u) = <I>(f(a),Dg(a)(u)) + <I>(Df(a)(u),g(a)).

3. Applications définies sur un ouvert d'un produit


3.1. Applications partielles et différentielles partielles
a) Différentielles partielles. - Soit U un ouvert d'un produit E = E 1 x E 2 de deux
espaces vectoriels normés E 1 et E 2 , et f : U - F une application de U dans un
troisième espace vectoriel normé F. On note f comme une fonction de deux variables,
(xi, x2) f--+ f(x1, x2).
Soit a= (ai, a 2 ) un point de U. On appelle première application partielle associée à f
au point a, lapplication

Elle est définie sur l'ouvert de Ei


U1 = {x1EEi1 (xi,a2) EU}.
De même, on appelle seconde application partielle associée à f au point a, l'application
x2 f--+ f(ai,x2).
Elle est définie sur l'ouvert de E 2

U2 = { x2 E E2 I (ai,x2) EU}.
§ 3. Applications définies sur un ouvert d'un produit 13

Si la première application partielle associée à f au point a est différentiable au point


ai E Ui. sa différentielle en ce point est appelée différentielle partielle de f par rapport
à sa première variable, ou par rapport à xi, au point a, et notée f~ 1 (a), ou Dif(a). De
même, si la seconde application partielle associée à f au point a est différentiable au point
a2 E U2, sa différentielle en ce point est appelée différentielle partielle de f par rapport
à sa seconde variable, ou par rapport à x 2, au point a, et notée f~ 2 (a), ou D2f (a).
Il importe de remarquer que f~ 1 (a) E C(Ei, F) et que f~ 2 (a) E C(E2, F).

Les considérations qui précèdent s'étendent sans difficulté au cas d'une application définie
sur un ouvert d'un produit E = TI~=i Ei den espaces vectoriels normés.
b) Dérivées partielles. - Soit U un ouvert de JR.n, et f :U --+ F une application de
U dans un espace vectoriel normé F. Soit a = (ai, ... , an) un point de U. On appelle
dérivée partielle de f au point a par rapport à sa première variable, lorsqu'elle existe,
la dérivée, au point ai, de l'application partielle xi ~ J(xi,a2, ... ,an). On la note

f x' (ai, ... , an ), ou encore âf(ai,ll ... , an) . C' est un e')'ement de I' espace F .
1 uXi

Pour chaque i (1 :::; i :::; n), on définit de même la dérivée partielle de f au point a par
, ., . bl ,
rapport a sa i-eme van a e, notee
f'x. (ai, ... , an ), ou encore âf(ai,ll ... ,an) •
' UXi
Ainsi que nous l'avons vu en 1.5, l'existence de la dérivée partielle de f au point a par
rapport à si i-ème variable équivaut à l'existence, en ce point, de la différentielle partielle
de f par rapport à sa i-ème variable, et moyennant l'isomorphisme canonique de C(JR, F)
sur F, la dérivée partielle de f et la différentielle partielle de f par rapport à sa i-ème
variable au point a s'identifient. Le léger abus de notations consistant à les désigner toutes
deux par f~; (ai, ... , an) ne risque donc pas d'avoir de conséquence fâcheuse.

3.2. Proposition. - f est différentiable au point a= (ai, a 2 ) E U,


Si l'application
les deux applications partielles associées à f au point a sont différentiables,
respectivement au point ai E Ui et au point a 2 E U2, et on a, entre la différentielle
de f en a et ses différentielles partielles en ce point, la relation

Preuve : La première application partielle, xi ~ f (xi, a2), est la composée de


l'application injective xi~ (xi,a 2) et de l'application f. L'application xi~ (xi,a2)
est différentiable en tout point, puisque ses deux composantes le sont. Sa différentielle
au point ai est l'application linéaire de Ei dans Ei x E2 : ui ~ (ui, 0). D'autre part,
f est, par hypothèse, différentiable au point a = (ai, a2)· D'après 1.8, l'application
partielle xi ~ J(xi, a2) est différentiable en a 1 . Sa différentielle en ce point est
l'application u 1 ~ f~ 1 (a)(u 1 ) = f'(a)(ui, 0). De même, la seconde application par-
tielle x 2 ~ f(a 1, x 2) est différentiable en a2, et sa différentielle en ce point est
14 Chapitre premier. Applications différentiables

l'application u2 1--t f~ 2 (a)(u2) = f'(a)(O,u2). En remarquant que J'(a) est linéaire


et que u = (u 1 , u 2 ) = (u 1 , 0) + (0, u 2 ), nous obtenons la formule (* ). D

3.3. Remarques
a) Cas d'un produit den facteurs. - La proposition précédente se généralise aisément
au cas où E est le produit den espaces vectoriels normés Ei, 1 ::::; i ::::; n.
b) D'autres notations. - Soit f une application différentiable définie sur un ouvert
de !Rn, et à valeurs dans IR. Soient x 1 , ... , xn les coordonnées d'un point x de !Rn. En
Géométrie différentielle, ainsi qu'en Mécanique et en Physique, la différentielle de f est
souvent notée df, plutôt que Df, ou que f' comme nous l'avons fait. L'équivalent de la
formule (*)de la proposition 3.2 (mais avec n facteurs au lieu de deux) s'écrit alors sous
la forme, facile à mémoriser,
n 8J i
df = L
i=l
8xi dx .

Dans cette expression, dxi désigne la différentielle de la i-ème fonction coordonnée,


x xi. La fonction i-ème coordonnée est la forme linéaire projection de !Rn sur son
1--t

i-ème facteur. D'après 1.1 O.b, dxi est l'application de U dans le dual de !Rn dont la valeur,
constante, est la projection de !Rn sur son i-ème facteur. Les valeurs des dxi (1 ::::; i ::::; n)
en un point quelconque a de U forment une base du dual de !Rn. La formule ci-dessus

montre que les composantes de df (a) dans cette base sont les :~ (a), 1 ::::; i ::::; n.
c) Différentielles partielles et différentiabilité. - L'existence des différentielles par-
tielles de f au point an' implique pas la différentiabilité de f en ce point.L'exemple suivant,
dû à Cauchy, le montre clairement. Considérons l'application f : IH'. 2 ----> IR, définie par

f(x,y)=x 2 7-y 2 si (x,y)f.(0,0),


{
f(0,0)=0.
Les deux applications partielles associées à f au point (0, 0) sont identiquement nulles,
donc les deux différentielles partielles de f en ce point existent et sont nulles. Cependant f
n'est pas continue en (0, 0), donc a fortiori n'est pas différentiable en ce point.
Nous verrons plus loin quel' existence des différentielles partielles de f, non pas seulement
en un point, mais en tout point de U, et leur continuité sur cet ouvert de E 1 x E 2 , équivaut
à la différentiabilité de f et à la continuité de sa différentielle sur U.
d) Matrice jacobienne. - Soit f = (!1 , ... , fp) une application différentiable, définie
sur un ouvert U de !Rn et à valeurs dans JRP. Sa différentielle, en un point a = (a 1 , ... , an)
de U, est l'application linéaire de !Rn dans JRP ayant pour matrice
8fi(a1, ... ,an) 8fi(a1, ... ,an)
8x1 axn

8fp(a1." ... ,an) 8fp(ai,· ... , an)


8x1 axn
§ 4. IR-différentiabilité et C-différentiabilité 15

appelée matrice jacobienne de l'application f au point a.

4. JR-différentiabilité et C-différentiabilité
4.1. Espaces vectoriels réels et complexes. - Soit E un espace vectoriel complexe,
c'est-à-dire un espace vectoriel sur le corps des complexes C. L'addition (x, y) f-+ x +y,
et la multiplication par les scalaires restreinte aux scalaires réels, (k,x) f-+ kx, k E lR, x
et y E E, définissent sur E une structure d'espace vectoriel réel. Cette structure est dite
sous-jacente à la structure d'espace vectoriel complexe de E.
Si l'espace vectoriel complexe E est muni d'une norme x f-+ llxll. cette application est
encore une norme lorsqu'on munit Ede la structure d'espace vectoriel réel sous-jacente.
Les propriétés topologiques et métriques de l'espace vectoriel normé E (en particulier,
le fait que E soit complet, ou ne soit pas complet) sont les mêmes, que cet espace soit
muni de sa structure d'espace vectoriel complexe, ou de la structure d'espace vectoriel
réel sous-jacènte.
Ainsi par exemple, lorsqu'on le munit de sa structure réelle sous-jacente, C s'identifie à
IR. 2 , grâce au choix de la base (pour la structure d'espace vectoriel réel) (1, i). Dans cette
identification, au scalaire complexe z = x + iy, avec x et y E IR, est associé l'élément
(x,y) de IR. 2 . Plus généralement, pour tout entier n 2: 1, en muni de sa structure réelle
sous-jacente s'identifie à JR 2 n.
De même, soit E un espace vectoriel complexe de dimension finie n, et ( e 1 , ... , en) une
base de cet espace. Pour la structure réelle sous-jacente, l'espace E est de dimension 2n,
et admet pour base ( e1, ... , en, ie1, ... , ien)·

4.2. Applications JR-linéaires et C-linéaires. - Soient E et F deux espaces vectoriels


complexes. Une application cp : E ---4 F est dite C-linéaire si elle est linéaire lorsque
E et F sont munis de leurs structures d'espaces vectoriels complexes, et JR-linéaire si
elle est linéaire lorsque E et F sont munis de leurs structures d'espaces vectoriels réels
sous-jacentes.
On voit immédiatement qu'une application C-Iinéaire est aussi JR-linéaire. Réciproque-
ment, une application JR-Iinéaire cp : E ---4 F n'est en général pas C-linéaire; on vérifie
aisément qu'elle est C-Iinéaire si et seulement si elle vérifie, pour tout x E E,
cp('ix) = icp( X) .
Considérons par exemple le cas où E = F = C, que l'on identifiera à JR. 2 comme indiqué
ci-dessus lorsqu'on le munira de sa structure d'espace vectoriel réel sous-jacente. Une
application JR-linéaire cp: JR. 2 ---4 JR. 2 s'exprime sous la forme
cp: (x, y) f-+ (ax + by, ex+ dy).
Elle est représentée par la matrice
16 Chapitre premier. Applications différentiables

L'application de <C dans lui-même z ~


iz (multiplication par le scalaire imaginaire
pur i) s'exprime, lorsqu'on explicite les parties réelle et imaginaire de z, sous la forme
(x + iy) ~ (-y+ ix). Lorsqu'on identifie <Cà IR. 2 , cette application est donc représentée
par la matrice

(~ ~1) .
L'application IR.-linéaire c.p est <C-linéaire si et seulement si la matrice qui la représente
commute avec la matrice qui représente la multiplication pari, c'est-à-dire si et seulement
si

( ~ ~) ( ~ ~1 ) = ( ~ ~1 ) ( ~ ~) '
ou, en explicitant, si et seulement si

a= d, b = -c.
Lorsque les espaces E et F sont normés, on note .Cc(E, F) et .CIR(E, F) les espaces des
applications, respectivement, <C-linéaires continues et IR.-linéaires continues de E dans F.

4.3. JR-différentielle et <C-différentielle. - Soient E et F deux espaces vectoriels normés


complexes, f une application d'un ouvert U de E dans F, et a un point de U. On dit que f
est <C-dif.férentiable (resp., JR-dif.férentiable) au point a si elle est différentiable en ce point
lorsqu'on munit E et F de leurs structures d'espaces vectoriels complexes (resp., de leurs
structures d'espaces vectoriels réels sous-jacentes). La différentielle de f au point a est
alors appelée <C-dif.férentielle (resp., IR.-dif.férentielle) de f en a.
On voit immédiatement que si f est <C-différentiable en a, elle est aussi JR-différentiable
en ce point, et qu'alors sa JR-différentielle et sa <C-différentielle en a coïncident.
Réciproquement, supposons que f soit IR.-différentiable en a, et notons c.p E .C~ (E, F)
sa IR.-différentielle en ce point. On voit aisément que f est <C-différentiable en a si et
seulement si c.p est élément de .Cc ( E, F); lorsque c'est le cas, la <C-différentielle de f en a
n'est autre que c.p.
Considérons par exemple le cas où E = F = <C. L'application f s'écrit

f(z) = X(z) + iY(z), z E <C,

où X et Y, à valeurs réelles, sont la partie réelle et la partie imaginaire de f, respectivement.


Lorsqu'on munit <C de sa structure d'espace vectoriel réel sous-jacente et qu'on l'identifie
à IR. 2 comme indiqué ci-dessus, l'application f s'identifie à l'application

(x,y) ~ (X(x,y), Y(x,y)).


Supposons que f soit IR.-différentiable au point a = a + i/3 E <C, a et /3 E R La matrice
de sa IR.-différentielle en ce point est

ây (a, /3) )
âX
âY .
ây (a, /3)
§ 5. Le théorème des accroissements finis 17

En utilisant le résultat obtenu en 4.2, on voit que f est CC-différentiable au point a si et


seulement si
ax aY
ox (a, (3) = oy (a, (3),
Ces conditions sont connues, dans la théorie des fonctions d'une variable complexe, sous
le nom de conditions de Cauchy.

5. Le théorème des accroissements finis

Le théorème des accroissements finis est un des résultats élémentaires les plus utiles du
calcul diftërentiel. Il permet de majorer la norme de la différence des valeurs prises par
une application en deux points distincts de son domaine de définition. Nous établirons
successivement deux formes de ce théorème, relatives, la première au cas où l'application
considérée est définie sur un intervalle fermé et borné de IR (théorème 5.1), et la
seconde au cas où cette application est définie sur un ouvert d'un espace vectoriel normé
(théorème 5.6).

5.1. Théorème.- Soient f: [a, b] ~ F et g: [a, b] ~IR deux applications continues


d'un intervalle fermé borné [a, b] de IR, la première dans un espace vectoriel normé
F, la seconde dans R On suppose que f et g possèdent, en tout point x de
l'intervalle ouvert ]a, b[, des dérivées à droite Jd,(x) et g~(x) vérifiant
11/d,(x)ll :::; g~(x) ·
Alors f et g vérifient
11/(b) - f(a)ll :::; g(b) - g(a).

Preuve : Soit é > O. Posons


Ae = { x E [a, b] ; Vz E [a, x], 11/(z) - f(a)ll :::; g(z) - g(a) + E(z - a)}.
D'après sa définition, Ae est un intervalle de IR contenant a et contenu dans [a, b]. Les
applications f et g étant continues, Ae est fermé, donc contient sa borne supérieure c, qui
est aussi son extrémité droite. Supposons c < b. Nous avons, pour tout x E [a, c],

llf(x) - f(a)ll :::; g(x) - g(a) + E(x - a).


D'autre part, d'après la définition de la dérivée à droite d'une application,

Il x-+c,limx>c f(x) - f(c) Il : :; lim g(x) - g(c)


X - C x-+c, x>c X - C

Il existe donc ry > 0, auquel nous pouvons imposer de vérifier ry ::; b - c, tel que pour tout
X E]c, c + ry[,
18 Chapitre premier. Applications différentiables

ou encore
llJ(x) - f(c)ll ~ g(x) - g(c) + E(x - c).
Donc pour tout x E]c, c + 77[,
llf(x) - f(a)ll :S llf(x) - f(c)ll + llf(c) - f(a)ll
::::; g(x) - g(c) + E(x - c) + g(c) - g(a) + E(c - a)
= g(x) - g(a) + E(x - a).
Mais ceci montre que Je, c + 17[ est contenu dans A,, ce qui contredit le fait que c est
l'extrémité droite de Ae. L'hypothèse c < bayant conduit à une contradiction, nous avons
nécessairement c = b, donc
llJ(b) - f(a)ll :S g(b) - g(a) + E(b - a).
En faisant tendre E vers 0, nous obtenons
llJ(b) - f(a)ll :S g(b) - g(a).
D

5.2. Corollaire. - Une fonction continue g, définie sur un intervalle de IR. et à


valeurs réelles, qui possède en tout point x intérieur à son intervalle de définition
une dérivée à droite g~(x) 2 0, est nécessairement non décroissante.
Preuve : Il suffit d'appliquer le théorème 5.1 en prenant pour f l'application nulle. D

5.3. Corollaire. - Soit f : [a, b] ~ F une application continue d'un intervalle


fermé borné [a, b] de IR. dans un espace vectoriel normé F, qui possède, en tout
point x E]a, b[, une dérivée à droite f~(x). S'il existe un réel M 2 0 tel que, pour
tout x E]a, b[,
llJ~(x)ll :SM,
alors
llJ(b) - f(a)ll :S M(b - a).

Preuve: Il suffit d'appliquer le théorème 5.1 en prenant pour g la fonction x 1-----t Mx. D

5.4. Remarques
a) Cas d'applications dérivables à gauche. - Les énoncés 5.1 à 5.3 restent valables
lorsqu'on remplace les dérivées à droite par des dérivées à gauche.
b) Théorème des accroissements finis classique. - Le théorème 5 .1 et son corollaire 5 .3
donnent des inégalités vérifiées par la différence des valeurs prises par l'application f
aux deux extrémités de son intervalle de définition. On enseigne traditionnellement en
premier cycle, sous le nom de théorème des accroissements finis, un résultat plus précis,
qui s'exprime non pas par une inégalité, mais par une égalité. Ce résultat est le suivant.
Soit f : [a, b] ~IR. une fonction continue, définie sur un intervalle fermé et borné [a, b]
de IR., à valeurs réelles, dérivable en tout point x E]a, b[. Il existe un point c E]a, b[ tel que
f(b) - f(a) = (b - a)J'(c).
§ S. Le théorème des accroissements finis 19

Ce résultat ne subsiste pas si l'application f est, non plus à valeurs réelles, mais à valeurs
dans un espace vectoriel normé de dimension supérieure à 1. Il suffit pour s'en convaincre
de considérer l'application f : [O, 27r] ---+ IR. 2 définie par

f (t) = (cos t, sin t) .


S.S. Définition. - Soient a et b deux points d'un espace vectoriel normé E. On
appelle segment d'extrémités a et b, et on note [a, b], l'ensemble des points de E

[a, b] = { a + t(b - a) ; 0 ::; t ::; 1 } .

S.6. Théorème. - Soient E et F deux espaces vectoriels normés, et f : U ---+ F une


application différentiable d'un ouvert U de E dans F. Soient a et b deux points
de U tels que le segment [a, b] soit contenu dans U. L'application f vérifie
llJ(b) - f(a)ll :'S sup llJ'(z)ll llb - ail·
zE[a,b]

En particulier, si U est convexe et s'il existe un réel A1 2'. 0 tel que, pour tout
XE U,
llJ'(x)ll :'SM,
pour tout couple (a, b) de points de U, l'application f vérifie
llf(b) - f(a)ll :'S Mllb- ail·

Preuve: Considérons l'application de l'intervalle [ü, 1] dans F:

t ~ <p(t) = f(a + t(b- a)).


Elle est continue sur [O, 1], différentiable en tout point t E]O, 1[ et de différentielle
<p1 ( t) = J' (a + t (b - a)) (b - a) .
Nous avons donc, pour tout t E]O, 1[,
ll'P'(t)ll :'S llJ'(a+t(b-a))llllb-all
:'S sup llf'(z)llllb- ail·
zE[a,b]

En appliquant à <p le corollaire 5.3, nous obtenons

ll'P(l) - <p(O)ll = llf(b) - f(a)ll :'S sup llf'(z)llllb - ail·


zE[a,b]

S.7. Corollaire. - Une application différentiable d'un ouvert connexe d'un espace
vectoriel normé dans un autre espace vectoriel normé dont la différentielle est
identiquement nulle est constante.
20 Chapitre premier. Applications différentiables

Preuve Soit a un point de louvert connexe U sur lequel est définie l'application
considérée f. En remarquant que tout point de U est centre d'une boule ouverte contenue
dans U, et en utilisant la convexité des boules afin d'appliquer le théorème 5.6, il est facile
de montrer que l'ensemble des points x de U tels que f(x) = f(a), qui est non vide
puisqu'il contient a, est à la fois ouvert et fermé dans U, donc est égal à U. D

Nous allons donner maintenant deux applications du théorème des accroissements fi-
nis, relatives, l'une à la convergence d'une suite d'applications différentiables et à la
différentiabilité de la limite de cette suite, l'autre aux relations entre la différentiabilité et
la con.tinuité de la différentielle d'une part, l'existence et la continuité de différentielles
partielles d'autre part.

5.8. Théorème. - Soient U un ouvert convexe d'un espace vectoriel normé E, F


un espace de Banach, et Un, n EN) une suite d'applications différentiables de U
dans F, vérifiant les deux propriétés suivantes :
(i) il existe un point a EU tel que la suite (fn(a), n EN) converge;
(ii) la suite (!~, n E N) des différentielles des applications f n converge
uniformément sur U vers une application g: U---+ .C(E, F).
Alors, pour tout x E U, la suite (fn(x), n E N) converge vers un élément, noté
f(x), de F, la convergence étant uniforme sur toute partie bornée de U. De plus,
l'application f :U ---+ F ainsi obtenue est différentiable sur U, et sa différentielle
n'est autre que g.

Preuve : Soit M un réel strictement positif, et x un point de U vérifiant llx - ail < M.
Pour tous net m E N, on a d'après le théorème des accroissements finis

llfm(x) - fn(x) - fm(a) + fn(a)ll::; sup llJ.'n(z) - f~(z)llllx - ail,


zE[a,x]

d'où

llfm(x) - fn(x)ll ::; llfm(a) - fn(a)ll + sup llJ.'n(z) - f~(z)llllx - ail·


zE[a,x]

Soit é > O. Puisque la suite (fn (a) , n E N) converge, elle est de Cauchy; il existe donc
N 1 E N tel que n ~ N1 et m ~ N1 implique
é
llfm(a) - fn(a)ll ::; 2 ·
La suite (!~), n E N, étant uniformément convergente, est de Cauchy pour la norme de
la convergence uniforme; il existe donc N 2 EN tel que n ~ N2 et m ~ Nz implique
é
sup llf.'n(z) - f~(z)ll ::; 2M,
zEU

d'où, puisque llx - ail ::; M,


é
sup llf.'n(z) - f~(z)illlx - ail::; 2 ·
zE[a,x]
§ S. Le théorème des accroissements finis 21

Par suite, n:::;:: sup{N1 , N2 ) et m:::;:: sup{N1 , N 2 ) implique


llfm(x) - fn(x)ll :::; é,

ce qui montre que la suite Un, n E N) est de Cauchy pour la norme de la convergence
uniforme sur l'intersection de U et de la boule fermée de centre a et de rayon M. L'espace
F étant complet, et le réel M > 0 étant arbitraire, ceci prouve que pour tout x E U, la
suite (Jn(x), n E N) converge vers un élément f(x) de F, et que la convergence est
uniforme sur toute partie bornée de U.
Pour tous x et y EU, met n EN,
fm(Y) - fm(x) - g(x)(y - x) = Um - fn)(y) - Um - fn)(x)
+ fn(Y) - fn(x) - f~(x)(y - x)
+ (J~(x) - g(x))(y- x).
Nous en déduisons
llfm(Y) - fm(x) - g(x)(y - x)ll :::; ll{fm - fn)(Y) - Um - fn)(x)ll
+ llfn(Y) - fn(x) - f~(x)(y - x)ll
+ llf~(x) - g(x)ll llY - xll.
En appliquant le théorème des accroissements finis à Um - f n), nous pouvons majorer le
premier terme du membre de droite de l'inégalité ci-dessus. Nous obtenons
llUm - fn)(y) - Um - fn)(x)ll:::; sup llJ:n(z) - f~(z)llllY - xll.
zE[x,y]

Considérons maintenant x comme fixé, et soit E > O. Puisque la suite (!~ , n E N)


converge uniformément, il existe N 3 E N tel que n :::;:: N3 et m :::;:: N3 implique
é
sup llJ:n(z) - f~(z)ll :::; -3 ,
zEV
donc
é
ll{fm - fn)(y) - Um - fn)(x)ll:::; 3llY - xll.
Puisque la suite (J~(x), n E N) converge vers g(x), il existe N 4 E N tel que n :::;:: N 4
implique
é
llf~(x) - g(x)ll :::; 3.
Fixons maintenant n, en lui imposant de vérifier n : :;: sup(N3, N 4 ). D'après la définition
même de la différentielle de f n au point x, il existe T/ > 0 tel que llY - xll :::; T/ implique
é
llfn(Y) - fn(x) - f~(x)(y - x)ll:::; 3llY - xll ·
Nous avons donc, pour tout m:::;:: sup(N3 , N 4 ) et tout y E U vérifiant llY - xll :::; TJ,
llfm(Y) - fm(x) - g(x)(y - x)ll :::; EllY - xll.
Faisons tendre m vers +oo. Puisque f m (y) et f m ( x) tendent, respectivement, vers J(y)
et f(x), nous obtenons l'inégalité, vérifiée pour tout y E Uîel que llY - xll :::; TJ,
llJ(y) - f(x) - g(x)(y - x)ll :::; EllY - xll ·
L'application f est donc différentiable en x et a en ce point pour différentielle g( x). D
22 Chapitre premier. Applications différentiables

5.9. Corollaire. - Soient U un ouvert connexe d'un espace vectoriel normé E, F


un espace de Banach, et Un, n EN) une suite d'applications différentiables de U
dans F, vérifiant les deux propriétés suivantes :
(i) il existe un point a EU tel que la suite (Jn(a), n EN) converge;
(ii) la suite U~ , n E N) des différentielles des applications f n converge
localement uniformément sur U vers une application g : U ~ L(E, F).
Cela signifie que tout point de U possède un voisinage sur lequel la suite
U~) converge uniformément vers g.

Alors, pour tout x E U, la suite (Jn(x), n E N) converge vers un élément, noté


J(x), de F, la convergence étant localement uniforme (ce qui signifie que tout
point de U possède un voisinage sur lequel la suite Un) converge uniformément).
De plus, l'application f : U ~ F ainsi obtenue est différentiable sur U, et sa
différentielle n'est autre que g.

Preuve : Soit A l'ensemble des points x E U tels que la suite (Jn(x), n E N)


converge. L'ensemble A est non vide, puisqu'il contient a. Soit z E U un point adhérent
à A. Ce point possède un voisinage ouvert convexe borné V c U, sur lequel la suite
U: n E N) converge uniformément. Ce voisinage rencontre A, puisque z est adhérent
1 ,

à A. Soit b E V n A. En restreignant la suite Un) à V, en remplaçant a par b et x par z,


nous pouvons appliquer le théorème 5.8. Nous voyons ainsi que la suite Un) converge
uniformément sur V, et que sa limite est une application différentiable de V dans F qui
n'est autre que la limite de la suite U~, n E N) restreinte à V. Par suite, V c A, ce qui
prouve que A est fermé (puisque z E A) et ouvert (puisque voisinage de z, donc de chacun
de ses points). L'ouvert U étant supposé connexe, nous concluons que A = U.
Nous avons vu au cours de la démonstration que tout point z E U possède un voisinage
ouvert V sur lequel la suite Un , nN) converge uniformément vers une application
E
différentiable de V dans F, dont la différentielle est la limite de de la suite U~ , n E N)
restreinte à V. Donc pour tout z E U, (Jn ( z) , n E N) converge vers un élément f (z) de F,
la convergence étant localement uniforme. La restriction à V de l'application f :U ~ F
ainsi définie est la limite de la restriction de la suite Un) à V, donc est différentiable et a
pour différentielle la limite de la restriction de la suite U~) à V. Ceci permet de conclure,
puisque la différentiabilité est une propriété locale. D

5.10. Théorème. - Soit f une application continue d'un ouvert U d'un produit
E = E 1 x · · · x En den espaces vectoriels normés Ei, 1 '.S i '.S n, dans un espace
vectoriel normé F. L'application f est de classe C 1 sur U si et seulement si les n
différentielles partielles de f existent en tout point de U et sont des applications
continues de U dans .C(Ei, F), 1 '.S i '.S n.

Preuve : Nous ferons la démonstration pour n = 2, le cas général pouvant s'en déduire
aisément par récurrence.
§ S. Le théorème des accroissements finis 23

Supposons f de classe C 1 . D'après la proposition 3.2, ses deux différentielles partielles,


notées f~ et f~, existent en tout point de U, et s'expriment, au moyen de la différentielle f'
de f, par les relations

Soient u 1 : E 1 ~ E et u2 : E2 ~ E les injections canoniques, définies par

L'application fi , i = 1 ou 2, est composée des deux applications suivantes :


(i) l'application x f---t (ui, f'(x)) de U dans (.C(Ei, E)) x (.C(E, F)); cette
application est continue, car ses deux composantes le sont;
(ii) l'application de (.C(Ei, E)) x (.C(E, F)) dans .C(Ei, F), (cp, 'lj;) f---t 'ljJ o cp; cette
application est bilinéaire continue.
Par suite, les applications fi, i = 1 ou 2, sont continues.
Supposons maintenant que les différentielles partielles fi de f, i = 1 ou 2, existent et
soient continues sur U. Posons, pour tout x EU, et tout v = (v 1 , v 2 ) E E = E1 x E2,

g(x)(v) = f{ (x)(vi) + f~(x)(v2).


Soient p 1 E ~ E 1 et p 2 : E ~ E 2 les projections canoniques. L'application
:

g : U ~ .C(E, F) ainsi définie est somme de deux termes. Le premier est composé
de l'application de U dans .C(E,E1 ) x .C(E1,F), x f---t (p 1 ,f~(x)), qui est continue
puisque ses deux composantes le sont, et de l'application de .C(E, Ei) x .C(E1 , F) dans
.C(E, F), (cp, 'lj,1) f---t 'ljJ o cp, qui est bilinéaire continue. Ce terme est donc continu. Il en est
de même du second terme de g, ce qui montre que cette application est continue.
Soient x = (x 1 , x 2 ) E U, et V un voisinage ouvert convexe de x contenu dans U. Pour
tout y = (y1, Y2) E V,

f(y) - f(x) - g(x)(y- x) = f(y1,Y2) - f(x1,Y2) - f{(x1,x2)(Y1 - x1)


+ f(x1, Y2) - f(x1, x2) - f~(x1, x2)(Y2 - x2).
Nous en déduisons
llf(y) - f(x) - g(x)(y- x)ll ~ llf(y1,Y2) - f(x1,Y2) - f{(x1,x2)(Y1 - x1)ll
+ llf(x1,Y2) - f(x1,x2) - f~(x1,x2)(y2 - x2)ll ·
Soit c > O. D'après la définition même de la différentielle partielle fHx1, xz), il existe
7J > 0 tel que llY2 - x2 li ~ 7J implique

llf(x1,Y2) - f(x1,x2) - f~(x1,x2)(Y2 - x2)ll ~ ~llY2 - x2JJ.


En considérant x 1 , x 2 et y 2 comme fixés et en appliquant le théorème des accroissements
finis à 1' application
24 Chapitre premier. Applications différentiables

nous obtenons
11/(yi, Y2) - f(xi, Y2) - f{(xi, x2)(yi - xi)IJ
< sup llf~(zi,Y2) - f{(xi,x2)ll llYi - xill ·
z1 E[x1 ,yi]

La différentielle partielle f{ étant continue au point x =(xi, x2), il existe 'r/i > 0 tel que
sup(llzi - xill, llY2 - x2ll) :S 'r/i implique

Il/~ (zi, Y2) - f~ (xi, x2) Il :S ~ ·


Si y = (Yi, Y2) E V vérifie llY - xll = sup(llYi - xi Il, llY2 - x2JI) :S inf(ry, 'r/1 ), alors
JIY2 - x2 li :S 'rJ et, pour tout zi E [xi, Yi]. sup(JJz1 - xi JJ, JIY2 - x2JJ) :S 'r/i. donc
ê ê
IJJ(y)-f(x)-g(x)(y-x)JI :S 2llYi -xill+2JJy2-x2JI :S êsup(IJYi -xill, JJy2-x2JJ) ·
Ceci prouve que f est différentiable au point x, et a g( x) pour différentielle en ce point.
Ayant déjà prouvé la continuité de g, nous concluons que f est de classe ci sur U. D

5.11. Corollaire. - Une application continue f d'un ouvert U de !Rn dans un


espace vectoriel normé F est de classe ci sur U si et seulement si les n dérivées
partielles:~ (1 :::; i :::; n) de f existent en tout point de U, et sont des applications
continues de U dans F.
Preuve: Compte tenu de 1.5 et de 3.1.b, c'est une conséquence immédiate du théorème
précédent. D

6. Exercices

Exercice I.1. Soient p, q E N* et f : lR. 2 ---+ lR. 1' application


xPyQ
f(x, y) = x2 _ xy + y2 si (x, y) -::J (0, 0), f(O, 0) = 0.
Pour quelles valeurs de pet q l'application f est-elle continue sur lR. 2 ? différentiable sur
lR. 2 ? de classe ci sur lR. 2 ? différentiable au sens de Gâteaux au point (0, 0)?

Exercice I.2. Soit f : IR. 2 ---+ IR. lapplication

J(x, y)= y 2 sin(~) si y -::J 0, f(x, 0) = 0.


Etudier successivement la continuité de f, 1' existence et la continuité des dérivées partielles
de f, la différentiabilité de f en tout point de lR. 2 .

Exercice I.3. Soit J : IR. 3 ---+ IR. 2 une application de classe ci et g lR. 2 ---+ IR. 2
l'application
g(u, v) = f (cos u +sin v, sin u + cosv, eu-v).
1) Montrer que g est de classe ci.
§ 6. Exercices 25

2) On suppose que f est différentiable au point A = (1, 1, 1) de IR. 3 , et que sa différentielle


en ce point est, en convenant d'identifier une application linéaire de IR. 3 dans IR. 2 avec sa
matrice,

J'(A) = (~ 3
-1
Déterminer la différentielle de g au point B = (7r /2, 7r /2).
Exercice I.4. Pour tout entier n, on note IRn[X] l'espace vectoriel des polynômes à une
variable X,à coefficients réels, de degré :Sn, muni de la norme llPll = supxE[0.1] IP(x) I·
Soit E = IRn[X], F = IR3n[X] et cp: E----> F l'application cp(P) = P3 .
1) Montrer que cp est différentiable sur E et déterminer sa différentielle Dcp( P) en tout
point P de E. Vérifier que cp est de classe C 1 sur E.

2) On fait n = 1. Donner l'expression de la matrice de Dcp(P) dans les bases canoniques


de E et de F.

Exercice I.5. {Dérivée d'un quotient]. Soient E un espace vectoriel normé, U un


ouvert de E, a un point de U, f et g deux applications de U dans IR différentiables au
point a. On suppose que g ne s'annule pas sur U. On définit une application q : U ----> IR
en posant, pour x E U, q(x) = ;~; ~. Montrer que q est différentiable au point a et

déterminer sa différentielle Dq(a).

Exercice I.6. {Différentiabilité de normes]. Soit E un espace vectoriel normé, N sa


norme.

1 a) Montrer que N n'est pas différentiable en O.

1 b) Soit a E E, a f O. On suppose N différentiable en a. Montrer que pour tout réel


>. > 0, N est différentiable au point >.a et que N' (>.a) = N' (a).
En considérant la dérivée en >. = 1 de l'application >. r--+ N(>.a), montrer que
N'(a) a= N(a). Démontrer alors que llN'(a)ll = 1.
2) On suppose l'espace vectoriel E réel, muni d'un produit scalaire (x, y) r--+ (xly) et de
la norme associée x r--+ N(x) = llxll = (xlx) 112 . Montrer que N est différentiable en
tout point a f 0 et calculer N' (a).

3) Dans cette question, E = !Rn.


3 a) Soit N 1 la norme x = (x 1, ... , xn) N 1(x) = L::~=l lxJ Montrer que N1 est
r--+

différentiable en un point a = (a 1 , ... , an) si et seulement si pour tout i E { 1, ... , n },


ai f O. Calculer dans ce cas Nf (a).

3 b) Soit N 00 la norme x = (x1, ... , Xn) r--+ N 00 (x) = sup 1 ~i~n lxil· Montrer
que N 00 est différentiable en un point a = (a 1, a2, ... , an) si et seulement s'il existe
io E { 1, 2, ... , n} tel que, pour tout i f i 0 , lail < laio 1- Calculer dans ce cas N~(a).
26 Chapitre premier. Applications différentiables

4) Dans cette question, E est l'espace C0 des suites de réels qui convergent vers 0, muni
de la norme définie, pour x = (xn,
n EN) E Co, par N(x) = supnEN lxnl· Montrer que
N est différentiable en a= (an, n EN) si et seulement s'il existe n 0 E N tel que, pour
tout n '/no, lanl < lan 0 I. Calculer dans ce cas N'(a).
Exercice I. 7. Soit E un espace vectoriel réel muni d'un produit scalaire (x, y) f-) (xly)
et de la norme associée x f-) llxll = (xlx) 1/ 2 . Soit u un endomorphisme continu, auto-
adjoint de E, c'est-à-dire vérifiant, pour tous x et y E E, (x J u(y)) = (u(x) J y). Soit
(x 1 u(x))
f: E - { 0} _. lR l'application f(x) = (xlx) .

1) Montrer que l'application de E dans R x f-) ( x 1 u( x)) est différentiable sur E.


Calculer sa différentielle.
2 a) Montrer que f est différentiable sur E - {O} et calculer sa différentielle D f.
2 b) Montrer qu'un élément non nul a de E vérifie D f (a) = 0 si et seulement si a est
vecteur propre de u.

Exercice I.8. Soit E un lR-espace de Banach et L,(E) l'espace des endomorphismes


linéaires continus de E.
1) Soit A E L,(E) et r.p : lR ---> L,(E) l'application r.p(t) = exp(tA). Montrer que r.p est
dérivable sur lR et que 'P'(t) =A o exp(tA).
2 a) On suppose que la norme sur E est associée à un produit scalaire (x, y) f-) (xly). Soit
x E E et F: lR---> lR l'application F(t) = (exp(tA)x 1 exp(tA)x). Montrer que Fest
dérivable sur lR et calculer sa dérivée.
2b)Onsupposedeplusquepourtousxety E E, (A(x) 1 y)= -(x 1 A(y)).Montrer
que pour tout t E lR, exp(tA) est unitaire.

Exercice I.9. Soit E = C([ü, ll) l'espace vectoriel des fonctions numériques définies
et continues sur [ü, 1], muni de la norme ·u f-) llull = suptE[o, 1Jlu(t)J de la convergence
uniforme. Soit r.p : u f-) r.p(u) l'application de E dans E telle que, pour tout t E [ü, 1],
r.p( u) (t) = sin u( t). Montrer que r.p est différentiable en tout pointu de E et déterminer sa
différentielle.

Exercice I.1 O. L'espace vectoriel E = C([a, bl) est muni de la norme de la convergence
uniforme f f-) 11!11 = SUPxE[a,bilf(x)J. Soit r.p: lR ---t lR une application de classe C 1 .
Montrer que lapplication g : E ---> JR,

g(f) =lb r.p(f(x)) dx

est différentiable sur E et que sa différentielle au point f est donnée, pour u E E, par

g'(f)(u) =larb r.p'(f(x))u(x)dx.


§ 6. Exercices 27

Exercice I.11. Soit f 1 l'espace vectoriel des suites réelles u = (Un , n E N) telles que
2:~:0 lunl < +oo. On munit €1 de la norme u llull = 2:~:0 lunl· Soit rp: €1 €1
i--+ -t

l'application rp(u) = v, où v = (vn, n E N) avec, pourtoutentiern, Vn = z:=;=O UpUn-p·


Montrer que rp est de classe C 1 et déterminer sa différentielle.
Exercice I.12. {Application point fixe}. Soient E et F deux espaces de Banach et À
un réel vérifiant 0 < À < 1. Soit rp : E x F --; F une application qui vérifie, pour tout
(x, y, z) E Ex F x F,
llrp(x, Y) - rp(x, z)ll ~ .XllY - zll ·
1) Montrer que pour tout x E E, il existe un unique élément de F, noté f(x), tel que
rp(x,f(x)) = f(x).
2) On suppose désormais l'application rp différentiable sur E x F et on note rp~ (x, y) et
rp;(x, y) ses différentielles partielles au un point (x, y) de Ex F.
2 a) Soit (a, b) un point de Ex F. Montrer que 11 rp; (a, b) 11 ~ À. En déduire que l'application
idp -rp;(a, b) est un élément inversible de C(F, F).
2 b) On suppose, dans cette question, que l'application f est différentiable au point a.
Calculer f' (a).
3 a) Montrer que pour tout élément h de E,

llrp(a + h, f(a)) - J(a)ll 2: (1 - .X)llJ(a + h) - f(a)ll ·


En déduire qu'il existe une fonction M : E--; IR, bornée dans un voisinage de 0, telle que
llJ(a + h) - f(a)ll ~ lhllM(h).
3 b)Montrerque (idp-rp;(a,f(a))) o (!(a+h)-f(a)-rp~(a,f(a))) h = o(llhll).
En déduire que la fonction f est différentiable sur F.

Exercice I.13. Soient E un espace vectoriel normé, I =]a, b[ un intervalle ouvert


de IR, et f :I --; E une application. On suppose que f admet en tout point x de I une
dérivée à droite fd(x). Montrer que si l'application x 1-+ fd(x) est continue en un point
x 0 de I, alors f est différentiable en x 0 . [On pourra considérer l'application g : I --; E,
g(x) = f(x) - fd(xo)(x - x 0 ), et lui appliquer le théorème des accroissements finis].
Exercice I.14. Soient E un espace vectoriel normé, [a, b] un intervalle fermé de IR,
f : ·[a, b] --; E et g : [a, b] --; IR deux applications continues sur [a, b], dérivables sur
l'intervalle ouvert]a, b[ et telles que, pour tout u E ]a, b[, llJ'(u)ll ~ gi(u). On suppose
de plus que llJ(b) - f(a)ll = g(b) - g(a).
1) Montrer que pour tous u et v E [a, b] vérifiant u < v, on a Il! (v )- f (u) Il = g(v )- g( u).
En déduire que pour tout u E [a, b], llf'(u) Il = g'(u).
2) On suppose de plus que la norme sur E est associée à un produit scalaire (x, y) 1-+ (xly).
Exprimer (f(b) - f(a) 1 f(u) - f(a)) à l'aide de la norme. En déduire que pour tout
u E [a, b], f(u) E [!(a), f(b)].
28 Chapitre premier. Applications différentiables

Exercice I.15. Soient E un espace vectoriel normé de dimension (finie ou infinie) au


moins égale à 2, Fun espace de Banach, a un point de E, r et k des réels strictement
positifs, B(a, r) la boule ouverte de Ede centre a et de rayon r. Soit f une application
différentiable définie sur l'ensemble n = B(a, r)- {a}, à valeurs dans F, vérifiant, pour
tout XE 0, llJ'(x)ll :::; k.

1) Montrer que pour x et y E n, on a llJ(x) - f(y) 11 :::; kllx - Yll· [Si y - a= >.(x - a),
avec >. < 0, on choisira un vecteur z linéairement indépendant de x - a et on majorera
jjJ(x) - f(a + Ez) Il· pour 0 < € < r /llzllJ.
2) Montrer que f a une limite a lorsque x tend vers a (on rappelle que F est complet).
3) On suppose que f' (x) tend vers une limite l lorsque x tend vers a, et on considère
l'application g définie sur B(a, r) par g(a) = a et g(x) = f(x) six =f- a. Soit€ > O.
Montrer que, si x et y sont suffisamment proches de a (et préciser ce que cele veut dire),
on a llg(x) -- g(y) - l(x - y)ll :::; Elix - Yll· En déduire que g est différentiable en a et
que g'(a) = l.
Exercice I.16. On note C le <(:>espace vectoriel des fonctions continues sur l'intervalle
[O, 2nJ, à valeurs dans C, muni de la norme de la convergence uniforme 11111 =
sup 0 ~x 9 njf(x)I. On note S le C-espace vectoriel des suites bornées a= (an, n EN)
de complexes, muni de la norme llall = supnEN lanl· Soit r E JO, 1[.
1) Soit a une suite élément de S. Montrer que la fonction l(a) définie, poùr x E [O, n], par
OO

l(a)(x) = L anrneinx, appartient à C. Montrer que l(a) est continûment différentiable


n=O
sur l'intervalle JO, 2n[.
2) Vérifier quel est une application linéaire continue de S dans C. Calculer lllll·
3) Si f E C et n E N, on pose c71 (!) = _!_ f 2 n f(x)e-inx dx.
Montrer que Cn
2n lo
est un élément du du.al topologique de C. Quelle est sa norme? Etablir la formule
an = r-nCn o l(a).
4) On note B l'ensemble des suites a E S telles que llall :::; 1, et on considère une
suite (fp, p E N) d'éléments de l(B) qui converge, dans C, vers une limite f. Expliquer
pourquoi, pour chaque n E N, la suite (en (fp) , p E N) converge vers Cn (!),et en déduire
que la suite a= ( r-ncn(f), n EN) appartient à B. Montrer que l(B) est un fermé de C.
5) Soit a un élément de S. On pose f = l(a) et on note f' la différentielle de f. Montrer
r
que 11!'11 :::; (l _ r) 2 llall· Montrer que l(B) est compact.

7. Solutions

Solution I.l. On munit ~ 2 de la norme Il (x, y) 11,\= (x 2 + y 2 ) 1 12 .


§ 7. Solutions 29

Etude de la continuité de f. La fonction f est évidemment continue sur IR 2 - { (0, 0)} car composée de
fonctions continues. Étudions sa continuité en (0,0). Nous remarquons d'abord que tout (x, y) E IR 2 vérifie
x 2 + y 2 ~ 2xy, donc x 2 + y 2 - xy ~ (x 2 + y 2)/2. Ainsi, si (x, y) # (0, 0),

lt(x,y)I ::;21~P+yql2 :::; 2ll(x,y)llp+q-2.


X y

Si p + q > 2, lim(x,y)-+(O,O) f(x, y) = 0 et f est continue en (0, 0).


Si p + q:::; 2, f(x, x) = xP+q- 2 . Par suite, f(x, x) n'a pas pour limite 0 lorsque x tend vers 0, ce qui prouve
que f n'est pas continue en (0, 0).
En définitive, f est continue sur IR 2 si et seulement si p + q > 2.
Étude de la différentiabilité de f. La fonction f admet des dérivées partielles continues sur IR 2 - { (0, 0) }
donc est de classe C 1 sur cet ouvert. Déterminons, si elles existent, ses dérivées partielles en (0,0). Nous obtenons
aisément
f (x, 0) - f(O, 0) __ 0 1 f' (0, O) = f(O, y) - f(O, 0) = 0.
f~(O, 0) = x-+0,
lim
x;o!O X y
lim
y-+0, y;ofO y

Si f est différentiable en (0, 0), sa différentielle D f (0, 0) est donc nécessairement l'application nulle.
Revenant à la définition de la différentielle, nous voyons que f est différentiable en (0, 0) si et seulement si
f (x, y) = o(ll(x, y) Il). Or une étude analogue à celle réalisée précédemment permet de prouver que lfl((x, y)I
x,y) 1
a pour limite 0 lorsque (x, y) --+ (0, 0) si et seulement si p + q > 3.
En définitive, f est différentiable sur IR 2 si et seulement si p + q > 3.
Valeurs de (p, q) pour lesquelles f est de classe C 1 sur IR 2 . On sait que ceci est réalisé si et seulement
si f admet des dérivées partielles continues sur IR 2 . On voit immédiatement que les dérivées partielles de f sont
continues sur IR 2 - { (0, 0) }. Il reste donc à étudier leur continuité en (0, 0). À l'aide des formules usuelles
de dérivation des fonctions d'une variable réelle, on détermine aisément les expressions de f~(x, y) et f~(x, y)
en tout point (x, y) # (0, 0). Par un raisonnement analogue aux précédents, on détermine leurs limites lorsque
(x, y) --+ (0, 0). On voit ainsi que f~(x, y) et f~(x, y) tendent vers 0 lorsque (x, y) --+ (0, 0) si et seulement
si p + q > 3. Ainsi, f est de classe C 1 sur IR 2 si et seulement si p + q > 3.
Différentiabilité de f au sens de Gâteaux en (0, 0). Posons, pour tout (x, y) E IR 2 ,

f((o,o) + t(x,y)) -f(O,O)


ip(x,y) = lim
t-+0,t;o!O

Le calcul donne ip(x, y) = limt-+O, t;o!O tP+q- 3 f (x, y). Par définition f est différentiable au sens de Gâteaux
en (0, 0) si et seulement si ip existe et est une application linéaire continue de IR 2 dans IR; nous voyons que c'est
le cas si et seulement si p + q > 3.

Solution I.2. Soit D f = IR 2 - { ( x, y) E IR 2 ; y = 0 } . D'après son expression, f est continue sur D f,


car sur cet ouvert elle est composée de fonctions usuelles continues. Pour la même raison elle admet, sur D f,
des dérivées partielles f ~ et /~ continues. Elle est donc de classe C 1 sur D f.
Continuité de f aux pointx (x, 0). Soit (h, k) E IR 2 . Nous avons

k 2 I sin ( x1 + h) < k 2
si k # 0,
lt(x + h,k)-f(x,0)1 = { k -
lt(x+h,0)-f(x,O)I =0 sik=O.

Dans les deux cas, lim(h,k)-+(O,O) f(x + h, k) - f(x, 0) = 0, ce qui prouve la continuité de f en (x, 0).
Existence et continuité des dérivées partielles de f en (x, 0). Le calcul donne

f' (x O) = lim f (x + h, 0) - f (x, 0) =0 . f y' (X, O) _- 1Jill


. f(x, k) - f(x, 0) _ 0
- .
X ' h-+O h . k-+O k

De plus, en tout point (x + h, y) tel que y# 0,


x+h x+h
f~(x + h,y) =y c ox+h
s--, f~(x + h,y) = 2y s i n - - -cos - - .
y y y
30 Chapitre premier. Applications différentiables

Nous avons donc jJ~(x + h, y) 1 ::::; IYI. ce qui prouve que f~(x + h, y) tend vers 0 lorsque (h, y)---+ (0, 0).
Ainsi f ~ est continue au point ( x, 0). De même, 2y sin ( ( x + h) /y) a pour limite 0 quand ( h, y) tend vers
(0, 0). Mais cos ( (x + h)/y) n'a pas de limite lorsque (h, y) ---+ (0, 0), donc f~ n'est pas continue en (x, 0).
Étude de la différentiabilité de f en (x, 0). Si f est différentiable en un tel point, sa différentielle en ce
point est la forme linéaire sur IR 2 : ( h, k) >--+ f ~ (x, O)h + f ~ (x, 0 )k; elle est donc nécessairement nulle. Or
nous avons
f(x +h,k)-f(x,O) = k 2 sin x: h si k "/= 0, 0 si k =O.

Munissons IR 2 de l'une de ses normes usuelle, par exemple ll(h, k)ll = sup (lhl, lkl). Puisque k2 ::::; ll(h, k) Il.
nous voyons que f(x + h, k) - f(x, 0) = o(ll(h, k)ll). Ainsi f est différentiable en tout point (x, 0), et sa
différentielle en ce point est nulle.

Solution I.3. Soit h: IR 2 ---+ IR 3 l'application h(u, v) = (cosu + sinv, sinu + cosv, eu-v).
1) On remarque que g = f o h. Étant composée de deux applications de classe et, lapplication g est de classe
et.
2) L'application h est différentiable en tout point ( u, v) E IR 2 . Sa différentielle en ce point, identifiée à sa matrice
jacobienne, a pour expression
- sin u cos v )
h' ( u, v) = ( cos u - sin v .
eu-v -eu-v

La différentielle de l'application g au point (u, v) est l'application composée g' (u, v) = f' (h( u, v)) oh' ( u, v ).
En particulier pour (u, v) = B = (7r /2, 7r /2), la formule précédente donne g' (B) = f' (A) o h' (B). Ainsi
g' (B), identifiée à sa matrice, est

g(B) = (12 -13 4)(-l


3 O
0) (31 =27) .
-l =
1 -1

Solution I.4. On note IR(X] l'espace vectoriel des polynômes à coefficients réels. On remarque que
sur cet espace, la norme P >--+ llPll = SUPo:<:;x:<:;t IP(x)I vérifie, pour tout couple (P, Q) de polynômes,
llPQll : : ; llPll llQll·
1) Pour tout polynôme H de E, cp(P + H) - cp(P) = 3P 2 H + 3P H 2 + H 3 . Montrons que l'application
H ---+ 3P 2 H
est la différentielle de cp au point P. C'est en effet une application linéaire de E vers F et, l'espace
E étant de dimension finie, elle est continue. De plus,

llcp(P + H) - cp(P) - 3P 2 Hll::::; llH 2 (3P + H)ll::::; llHll 2 113P + Hll = o(llHll).
On a donc bien Dcp(P)(H) = 3P 2 H, ce qui définit l'application Dcp en tout point P de E.
La continuité de Dcp au point P résulte de l'inégalité

llDcp(P + H) - Dcp(P)ll = 3ll(P + H) 2 - P2 11::::; 3ll2P + HllllHll,


et cette dernière expression a pour limite 0 quand llHll tend vers O.
L'application cp est donc de classe sur E. et
2) Dans cette question n = l. Un polynôme P quelconque de E est de la forme P(x) =a+ bx où a et b sont
des réels. Le calcul donne

Dcp(P)(l) = 3a 2 + 6abx + 3b2 x 2 , Dcp(P)(x) = 3a 2 x + 6abx 2 + 3b2 x 3 .


La matrice de Dcp(P) dans les bases canoniques de E et Fest donc

,.. 3a2 O )
( 6ab 3a 2 .
3b 2 6ab
0 3b 2
§ 7. Solutions 31

Solution I.5. {Dérivée d'un quotient}. Soit cp : IR x IR* ---->IR l'application cp(x, y) = x/y. Elle est de
classe C 1 , car elle admet sur IR x IR* des dérivées partielles continues. De plus, pour (h, k) E IR 2 ,

yh - xk
Dcp ( x, y ) ( h, k ) ='Px x, y h + 'Py(x, y)k =
, ( ) 1
.
y2

Soit u : U ----> IR 2 lapplication u( x) = (f Cx), g( x)) . Elle est différentiable en a et sa différentielle en ce point
a pour expression Du( a) h = (D f (a) h , Dg( a) h), où h E E. L'application q n'est autre que lapplication
composée q = cp ou; elle est donc différentiable en a et Dq(a) = Dcp(f(a), g(a)) o Du( a), soit, pour tout
hE E,
Dq(a)(h) = g(a) Df(a)(h) - f(a) Dg(a)(h).
g(a)2

Solution I.6. {Différentiabilité de normes).


1 a) Si N était différentiable en 0, sa différentielle N' (0) devrait vérifier N(x) - N' (O)(x) = o(N(x )), donc
limx_,O,x,iO ( 1- N'(O)(x)/N(x)) =O. De même, limx_,0,#0 ( 1 + N'(O)(x)/N(x)) = 0, qui s'obtient
en remplaçant x par -x. En faisant la somme des deux limites précédentes, nous voyons que 2 devrait tendre
vers 0 avec N(x), ce qui est absurde. La norme N n'est donc pas différentiable au point O.
1 b) Soit.>. > O. Puisque N est une norme, on a pour tout h E E,

N(.>.a + h) - N(.>.a) - N'(a)(h) = .>.(N(a + h/.>.) - N(a) - N'(a)(h/.>.)).

Mais N est différentiable au point a, ce qui signifie que

N(a + h/.>.) - N(a) - N'(a)(h/ .>.) = o( N(h/ .>.))


ce qui signifie que >-1 N(a + h/ .>.) - N(a) - N' (a)(h/ .>.) 1 (N(h) 1
r
tend vers 0 quand N(h) tend vers O.
Ainsi, N(.>.a + h) - N(.>.a) - N'(a)(h) =
o(N(h)), ce qui prouve que N est différentiable au point >.a et
que N'(.>.a) =
N'(a).
L'application cp : .>. >--> N (>.a) est la composée cp =N o f de lapplication f : .>. >--> >.a et de lapplication
norme N. L'application f est linéaire continue, donc différentiable en 1, et f' ( 1) = f; par hypothèse, N est
différentiable en f(l) =a; l'application composée cp est donc différentiable au point 1 et sa différentielle en ce
point vérifie, pour tout réel a, cp' (l)(a) = N' (f (1)) of' (l)(a) = N' (a)( a a) = aN' (a) a. En particulier,
en choisissant a= 1, on obtient cp'(l)(l) = N'(a) a.

D'autre part, le calcul direct donne cp' (1)(1) = limu_,o,u;60 ( u- 1 ( N( (1 + u)a) - N(a)) = N(a), ce qui
établit la relation N'(a) a= N(a).
Par définition, llN'(a)ll est le plus petit des réel M 2: 0 tels que, pour tout h E E, IN'(a) :S M N(h). hl
Puisque, pour h =
a, nous avons N' (a) a= N(a), nécessairement llN' (a)ll 2: l. Puisque N est différentiable
en a, pour tout E > 0, il existe T/ > 0 tel que, pour tout h E E vérifiant N ( h) :S 'fi, nous ayons

IN(a + h) - N(a) - N' (a) hl :S EN(h),


ce qui implique, compte tenu de la seconde inégalité du triangle,

IN'(a) hl :S IN(a + h) - N(a)I + EN(h) :S (1 + t::)N(h).


Les deux membres extrêmes de cette suite d'inégalités étant positivement homogènes de degré 1 par rapport à
N ( h ), nous pouvons nous affranchir de la condition N ( h) :S 'fi, et affirmer que pour tout ê > 0, et pour tout
h E E, IN'(a) hl
:S (1 + t::)N(h). Cela prouve que llN'a)ll :S 1 + ê. Nous avons montré d'autre part que
Il N'a) Il 2: l. Nous pouvons donc conclure que Il N'a) Il = l.
2) L'application N est dans ce cas la composée N = r o q op des applications p: x >--> (x, x) définie sur E,
q: (x, y)>--> (xly) définie sur Ex E, et r: t >--> ..fi définie sur JO, +oo[. Ces applications sont différentiables
en chaque point de leur domaine de définition. En effet,
- l'application p est linéaire continue, donc pour tout x E E, p' (x) = p;
32 Chapitre premier. Applications différentiables

- l'application q est bilinéaire continue et sa différentielle vérifie q'(x, y)(h, k) = (xlk) + (hly) pour tout
élément (h, k) de Ex E;
-quant à l'application r, sa différentielle en t E JO, +oo[ est l'application linéaire u >--+ r'(t) u = u/(2Vt).
L'application N est donc différentiable en tout point a :f:- 0 de E et nous avons, pour tout h E E,

N'(a)h=r'(ala)oq'(a,a)op'(a)h= ~~~~.

3) Nous allons étudier la différentiabilité des normes N1 et N 00 en un point a = (a1, a2, ... , an) E !Rn.
D'après la question 1 a, nous savons que ces normes ne sont pas différentiables à l'origine; nous pouvons donc
supposer le point a distinct de l'origine.
3 a) L'application N1 admet au point a une dérivée partielle par rapport à sa i-ème variable (1 $ i $ n) si et
seulement si ai :f:- O. Lorsque c'est le cas, (N1 )~(a) = ai/lail· Nous voyons ainsi que N1 admet au point a des
dérivées partielles par rapport à chacune de ses variables si et seulement si, pour tout i (1 $ i $ n), ai :f:- 0, et
que sur l'ouvert U = {a= (a1, ... , an E !Rn ; Vi, 1 $ i $ n, ai :f:- 0 }, ses dérivées partielles sont toutes
continues. Cela prouve (théorème 5.10) que l'ensemble des points de !Rn où N1 est différentiable est l'ouvert
U, et que sur cet ouvert N1 est de classe C 1 . Sa différentielle, en un point a de U, est la forme linéaire

N' (a) h =
1
'L..i"°'
n
ai hi
lail '
avec h = (h1, ... , hn) E !Rn.
i=l

3 b) Notons ( *) la condition : il existe io E { 1, ... , n} tel que, pour tout i :f:- io, lai 1< laio I·
Supposons la condition(*) satisfaite. Posons a= (1/2) infi#io (laio 1- lail). Soit h = (h1, ... , hn) E !Rn
tel que Noo(h) < a. Nous avons alors Noo(a + h) - Noo(a) = lai 0 + hiol - laiol· Or l'application
x >--+ Ixia 1 est différentiable au point a car la; 0 1 :f:- O. La norme Noo est donc différentiable au point a, et sa
différentielle en cc point a pour expression

Supposons maintenant que la condition (*)n'est pas satisfaite. Il existe donc pet q E {1, ... , n }, p :f:- q, tels
que N 00 (a) = lapl = laql > O. D'après la définition de N 00 nous avons, pour tout i vérifiant 1 $ i $ n,
i :f:- p, i :f:- q, lail $ lapl· Soit h = (h1, ... , hn) E !Rn vérifiant 0 < lhpl = lhql < N(a)/2, h; = 0 pour
tout i vérifiant 1 $ i $ n, i :f:- p, i :f:- q, hp de même signe que ap. hq de signe opposé à celui de aq. Nous
avons
Noo(a + h) = lap + hpl = lapl + lhpl = Noo(a) + Noo(h),
Noo(a - h) = laq - hql = laql + lhql = Noo(a) + Noo(h).
En ajoutant, nous obtenons

Noo(a + h) + Noo(a - h) - 2N00 (a) = 2Noo(h).


Or si N 00 était différentiable en a, nous aurions

N 00 (a + h) - N 00 (a) - N:X,(a) h = o{ N (h)) ,


00

N 00 (a - h) - N 00 (a) + N:X,(a) h = o(Noo(h)),

d'ou en ajoutant
N 00 (a + h) + N 00 (a - h) - 2N00 (a) = o(N 00 (h)).

Nous aurions donc 2N00 (h) = o( Noo (h)), ce qui n'est pas possible.
Nous avons donc prouvé que N 00 est différentiable en a = (a1, ... , an) si et seulement s'il existe
io E { 1, 2, ... , n} tel que, pour tout i i- io. 1ai 1 < 1ai 0 I ·
4) Soit ( **) la condition : il existe no E f\I tel que, pourtout n :f:- no. lan 1 < lan 0 I·
§ 7. Solutions 33

Supposons la condition ( **) satisfaite. Posons o: = ( 1/2) inf n;éno ( lan 0 1 - lan 1). La suite (an , n E f\l)
ayant pour limite 0, il existe N E f\l tel que, pour tout n ~ N, lan 1 < lan 0 1/2. Nous avons donc o: > O. Il est
alors facile de montrer, comme dans la question 3 b, que N est différentiable en a et que sa différentielle en ce
point a pour expression

N'(a) h = anohno ' avec h = (hn, n E f\l) E E.


lanol

Supposons maintenant que la condition(**) n'est pas réalisée. On montre, comme dans 3 b, que N n'est pas
différentiable en a.

Solution I. 7.
1) L'application <p : x >--+ ( xlu( x)) est la composée <p = q o p de p : x >--+ ( x, u( x)), application linéaire
continue de E dans EX E, etde q : (x, y) >--+ (xly), forme bilinéaire continue sur EX E. Ces applications sont
différentiables de classe C 1 sur leur domaine de définition. Nous avons Dp(x) =pet, pour tout (h, k) E Ex E,
Dq(x, y)(h, k) = (xlk) + (hly). L'application <p est donc différentiable de classe C 1 sur E et sa différentielle
au point x E E a pour expression

Dip(x) h = Dq( x, u(x)) o Dp(x) h = (xlu(h)) + (u(x)lh) = 2(xlu(h)), hE E.

Dans le cas particulier où u est l'application idE. l'application <p est l'application x >--+ N(x) = llxll 2 . Cette
application est donc différentiable de classe C 1 sur E et sa différentielle au point x E E a pour expression

DN(x) h = 2(xlh), hE E.

2 a) L'application f est le quotient f = N/ip de deux applications différentiables de classe C 1 . Elle est donc
différentiable de classe C 1 (voir exercice 5) sur l'ensemble des x E E tels que N(x) =F 0, c'est-à-dire sur le
complémentaire de l'origine dans E. De plus, pour tout x E E, x =F 0, et tout h E E,

Df(x) h = N(x) Dip(x) h - ip(x) DN(x) h


N(x) 2
= 2 (xlx) (u(x)lh) - (u(x)lx) (xlh) .
(xlx) 2

2 b) Soit a un vecteur propre de u associé à une valeur propre>... Nous avons u(a) = >..a donc, pour tout h E E,
Df(a) h =O. Cela prouve que Df(a) =O.
Réciproquement, soit a un vecteur non nul de Etel que D f(a) =O. Pour tout h E E,

(ala) (u(a)lh) - (u(a)la) (alh) = ((ala)u(a) - (u(a)la)a 1h)=0,

donc (ala) u(a) - (u(a)la)a = 0, soit encore u(a) = ( (u(a)la)/(ala)) a, ce qui prouve que a est un vecteur
propre de u associé à la valeur propre (u(a)la.)/(ala).

Solution I.8.
1) L'application identité de E est notée idE. L'application <pétant définie sur rnt, la notation ip'(t) désigne ici
la dérivée usuelle de <p au point t (voir 1.5). Soit h E rnt. En observant que les endomorphismes A, exp(tA) et
exp(hA) commutent, nous obtenons

ip(t + h) - ip(t) - hA o exp(tA) = exp(tA) o ( exp(hA) - ide -hA) .

Mais

:S'""
OO OO

llexp(hA) - ide -hAll = '""hn An lhlln llAlln = elhlllAll - 1 - lhl llAll.


~ n! ~ n.
n=2 n=2

Par suite, ip(t + h) - ip(t) - hA o exp(tA) o ( lhl), ce qui prouve que <p est dérivable en t et que
ip'(t) =A o exp(tA).
34 Chapitre premier. Applications différentiables

2 a) L'application Fest la composée F = qop des applications p : t ,__, ( cp( t) x, cp( t) x), et q : ( x, y) ,__, ( xly ),
forme bilinéaire continue sur E x E.
L'application ·If; : t ,__, cp( t) x est la composée de l'application cp et de lapplication linéaire continue u ,__, u x,
définie sur .C( E, E). Elle est donc dérivable en tout t E ~ et a pour dérivée 1/J' (t) = A o exp( tA) x.
L'application p est dérivable et p 1 ( t) = (A o exp( tA) x , A o exp( tA) x), car ses deux composantes sont
dérivables.
L'application q est différentiable en tout point (x, y) E Ex E et Dq(x, y) (h, k) = (xlk) + (hly) pour tout
élément (h, k) de Ex E.
Par application de la formule de dérivation des fonctions composées, nous obtenons

F'(t) = Dq(p(t))p'(t) = 2(exp(tA)x 1 Aoexp(tA)x).

2 b) On suppose que pour tout couple (x,y) E Ex E, (A(x) 1 y) = -(x 1 A(y)). Pour x E E
fixé, appliquons cette propriété au couple (exp( tA) x , exp( tA) x). Nous obtenons, pour tout t E ~.
F'(t) = 0, ce qui prouve que l'application Fest constante sur R Donc pour tout t E ~. F(t) = F(O),
soit Il exp(tA) xll = llxll. Ce résultat étant vrai pour tout x E E, l'application linéaire exp(tA) est unitaire.

Solution I.9. Soit u E E. Montrons que cp est différentiable au pointu. Soit h E E. Pour tout t E [O, lJ,
( cp(u + h) - cp(u)) (t) =sin( u(t) + h(t)) - sin( u(t)).
Appliquons à la fonction sinus la formule de Taylor- Lagrange entre les points u(t) + h(t) et u(t) : il existe
8(t) EJO, 1[ tel que

sin( u(t) + h(t)) - sin u(t) = h(t) cos u(t) - h(~) 2 sin( u(t) + 8(t)h(t)) .

Soit alors l(h) E E lafoncion t ,__, l(h)(t) = h(t) cos u(t). Nous avons ainsi défini une application l : E ---> E.
On vérifie immédiatement quel est linéaire. De plus, lll(h)ll = suptE(O,l) lh(t) cos u(t)I :::; llhll. ce qui prouve
que l est continue. Nous avons alors

2 2
llcp(u + h) - cp(u) -l(hlll = sup 1h(t) sin(u(t) + 8(t)h(t)) 1:::; llhll ,
tE(0,1) 2 2

ce qui prouve que cp est différentiable au point u et que sa différentielle Dcp( u) est lapplication linéaire
l: h ,__, l(h), avec l(h)(t) = h(t) cosu(t).

Solution I.10. Soit f E E et l(f) : u ,__, l(f)(u) l'application définie sur Epar

l(f)(u)= lb cp'(f(x))u(x)dx.

L'application l (!)est linéaire: c'est une conséquence immédiate de la linéarité de lintégrale. De plus, cp 1 of E E,
donc ll(J)(u) 1 :::; llcp' of 11 llull. ce qui prouve que l(f) est continue. Il reste à établir que pour tout u E E,
g(f + u) - g(f) - l(f)(u) = o(llull). Nous avons

Appliquons à cp la formule de Taylor-Lagrange entre les points f(x) + u(x) et u(x). Il existe 8(x) E JO, 1[ tel
que cp(f(x) + u(x)) - cp(f(x)) = cp' (f(x) + 8(x)·u(x) )u(x), d'où

g(f + u) - g(f) - l(f)(u) =lb ( cp1 (f(x) + 8(x)u(x)) - cp1 (f(x)) )u(x) dx.

On peut imposer à u la condition llull :::; 1; ainsi, lorsque x E [a, bJ, f(x) + 8(x)u(x) et f(x) appartiennent
à l'intervalle [Il! Il - 1, Il! Il + 1]. L'application cp étant de classe C 1 sur~. sa dérivée cp' est continue, donc
uniformément continue sur le compact [11!11 - 1, llfll + 1]. Soit€ > O. Il existe 7J E JO, 1[ tel que, pour tout
§ 7. Solutions 35

u E E vérifiant llull < rJ, jcp' (f(x) + O(x)u(x)) - cp' (f(x)) j < e:, d'où l'inégalité, qui prouve que g est
différentiable au point f, jg(f + u) - g(f) - l(f)(u) j ::; e:(b- a)llull· La différentielle g' (!)est l'application

u1-+g 1 (f)u= lb cp'(f(x))u(x)dx, uE E.

Solution I.11. Soit u E e1 . D'après la définition de la série produit de deux séries numériques, V = cp(u)
est la série produit u u. De plus, u étant absolument convergente, v l'est aussi, donc est bien élément de e1 .
Étudions la différentiabilité de cp au pointu. Pour h = (hn) E e1 , la série w = cp( u + h) - cp( u) a pour terme
général
n n
Wn = L (Uphn-p + hpUn-p) + L hphn-p.
p=O p=O

On reconnaît le terme général de la série w = 2u h + h h On pose l(u)(h) = 2u h. On définit ainsi sur e1 une
application l(u) : h >--+ l(u)(h). Cette application est visiblement linéaire; vérifions qu'elle est continue. En
effet,

On montre de même que llh hll ::; llhll 2 , ce qui prouve que cp est différentiable au pointu et que sa différentielle
en ce point est l'application linéaire, définie sur e1 , h ,_. Dcp( u)(h) = 2u h.
Solution I.12. {Application point fixe].
1) Pour x E E fixé, soit cpx : F-+ F l'application cpx(Y) = cp(x,y). D'après les hypothèses, l'application
cpx est contractante de rapport À. L'espace F étant complet, nous pouvons appliquer à cpx le théorème du point
fixe (voir par exemple [T.VI.4.3]): l'application cpx possède un unique point fixe, que nous notons f(x). Nous
avons ainsi défini une application f: E-+ F qui vérifie, pour tout x E E, cp( x, f(x)) = f(x).
2 a) Soit (a, b) E E x F. Puisque cp est différentiable au point (a, b), elle admet en ce point une différentielle
partielle par rapport à sa seconde variable, notée cp~ (a, b). Selon la définition de cette différentielle, pour tout
e: > 0, il existe rJ > 0 tel que, pour tout k E F vérifiant llkll < e:,

llcp(a, b + k) - cp(a, b) - cp~(a, b) kjj ::; e:llkll ·

Ceci entraîne llcp~ (a, b).kil ::; llcp(a, b + k) - cp(a, b) Il+ e:llkll ::; (À+ e:) llkll, puis encore, par définition de la
norme d'une application linéaire, llcp~(a, b)ll ::; À+ e:. Ce résultat étant valable pour toute:> 0 nous obtenons,
en faisant tendre e: vers 0, llcp~ (a, b) Il ::; À < 1. On sait (voir par exemple [T.X.4.3.a]) que cela implique que
idF -cp~(a, b) est un élément inversible"'de .C(F, F).
2b)L'application'l/J: x >--+ cp(x,f(x)) estlacomposée'!jJ = cpoFdesapplicationsF: x ,_. (x,f(x)) etcp.
L'application Fest différentiable en a car f l'est et, pour tout h E E, F' (a) h = ( h, f' (a) h). L'application cp
étant différentiable au point (a, f (a)), en appliquant le théorème de dérivation des fonctions composées [l.1.9],
nous obtenons 'l/J' (a) = cp~ (a, f (a)) + cp~ (a, f (a)) o f' (a), ce qui donne finalement

3 a) Soit h E E. En remarquant que cp( a+ h, f(a + h)) = f(a + h), nous avons

llcp( a+ h, f(a)) - f(a) Il = 11-cp( a+ h, f(a + h)) + cp( a+ h, f(a)) + f(a + h) - f(a) Il
2: 11 f (a + h) - f (a) 11 - 11 cp (a + h, f (a + h)) - cp (a + h, f (a)) 11 ,

et puisque jjcp( a+ h, f(a + h)) - cp( a+ h, f(a)) Il ::; >.jlf(a + h) - f(a) Il· nous obtenons finalement

llcp(a + h,f(a)) -/(a)jl 2: (1- >.)ljf(a + h)- /(a)ll ·


36 Chapitre premier. Applications différentiables

Définissons alors la fonction M sur Epar en posant M(O) = 0 et, si h f: 0,

M(h) = (1 - ~)llhll llcp( a+ h,f(a)) - f(a) Il·

La fonction M est telle que, pour tout h E E, Il f (a+ h) - f(a) Il


:::; llhll M(h). Mais, par définition de la
différentielle première de cp en (a, f(a)), il existe a > 0 tel que, pour tout h E E vérifiant llhll < a, on ait
llcp( a+ h,f(a)) - /(a) - cp~ (a, f(a)) Il :=:; llhll. soit encore

Ainsi, dès que llhll < a,

Ceci prouve que M est bornée au voisinage de O.

3 b)Posons, pour h E E, A(h) = (idp -cp~ (a, f (a))) o (t (a+h)- f (a)-cp~ (a, f(a))) h. Transformons
cette expression en utilisant la définition de f et l'expression de la différentielle de cp en (a, f(a)) à l'aide de
ses différentielles partielles. Nous obtenons

A(h) = f(a + h) - f(a) - cp~ (a, /(a)) (!(a+ h) - f(a)) - cp~ (a, f(a)) h
= cp( a+ h, f (a+ h)) - cp (a, f (a)) - cp1 (a, f (a))( h,f(a + h) - f (a))

=o(ll(h,J(a+h)-/(a))ll).

On peut par exemple choisir pour nonne sur E x F Il (x, y) Il = llxll + llYll· Nous avons alors, pour cette
nonne, Il (h, f (a+ h) - f(a)) Il = l!hll +Il/ (a+ h) - f (a)ll. Mais d'après 3 a, 11/(a + h) - f (a)ll llhll- 1
est borné au voisinage de 0, car M(h) l'est. Cela implique que o(Il (h, f (a+ h) - f (a)) Il) = o(llhll). En
définitive,
(idp -cp~ (a, f(a))) o (t(a + h) - f(a) - cp~ (a, f(a)) h = o(llhll).

En composant avec l'application linéaire continue (idp -cp~ (a, f (a))) - l les deux membres de cette égalité
nous obtenons

f(a + h) - f(a) - (idp -cp~ (a, f(a)) )-l ocp~ (a, f(a)) h = o(llhll) .
Cette dernière égalité prouve que/ est différentiable en a et redonne l'expression de sa différentielle obtenue en
2 b.

Solution I.13. L'application g : )a, b[-+ E, g(x) = f(x) - fd(xo)(x - xo), admet en tout point x de
I une dérivée à droite gd(x) = fd(x) - fd(xo). Écrivons que l'application Id est continue au point xo. Soit
E > O; il existe 77 > 0 tel que, pour tout x E I vérifiant lx - xol < 77, llgd(x)ll < E. Appliquons alors à g le

théorème des accroissements finis entre les points x et xo, le point x étant choisi tel que lx - xol < 77. Nous
obtenons
llg(x) - g(xo)ll :=:; sup llgd(z)ll lx - xol,
zE[xo,x)

et comme [xo, x) C Jxo - 77, xo - 77[, nous avons llg(x) - g(xo) Il :=:; t:lx - xol. d'où finalement
11/(x) - f(xo) - fd(xo)(x - xo)ll ~ t:lx - xol ·
Nous avons bien prouvé que f est différentiable en xo et qu'en ce point sa dérivée est !' (xo) = fd (xo).
§ 7. Solutions 37

Solution I.14. Soient u et v E [a, b] vérifiant u S v. Appliquons à f et g le théorème 5.1 sur chacun des
intervalles [a, u], [u, v] et [v, b]. Nous obtenons Il/ ( u) - f (a)ll S g( u)- g(a), Il/ (v)- f (u)ll S g(v)-- g(u)
et 11/(b) - f(v)ll S g(b) - g(v). Supposons que 11/(v) - /(u)ll < g(v) - g(u). Nous avons alors

11/(b) - /(a)ll S 11/(b) - /(v)ll + 11/(v) - /(u)ll + llf(u) - /(a)ll


< g(b) - g(v) + g(v) - g(u) + g(u) - g(a),
ou encore 11/(b) - f(a)ll < g(b) - g(a), ce qui est contraire à l'hypothèse. Donc pour tous u, v E [a, b]
vérifiants u Sv, 11/(v) - f(u)ll = g(v) - g(u).
Raisonnons par l'absurde en supposant qu'il existe uo E]a, b[ tel que Il!' ( uo) Il < g1 ( uo ), soit, en revenant aux
définitions des nombres dérivés,

.
11m 11/(uo + h) - f(uo)ll < .
11m g(uo + h) - g(uo)
h->0, h,,00 lhl h->O, h,,00 h

Il existe alors 1J > 0 tel que, pour tout h vérifiant lhl < 1J, uo + h E ]a, b[ et

11/(uo + h) - f(uo)ll g(uo + h) - g(uo)


lhl < h .

En particulier, pour tout h tel que 0 < h < 1J, 11/(uo + h) - /(uo)ll < g(uo + h) - g("uo). ce qui est
impossible. Nous pouvons donc conclure que pour tout u E )a, b[, Il!' (u) Il = g' (u).
2) On suppose, pour l'intérêt de la question, que f n'est pas une application constante, ce qui implique, puisque
= g(u) - g(a), que f (b) - f (a) # O. On sait que
g est croissante et que pour tout u E [a, b], llf ("u) - f (a) Il
pour tous x et y E E, 2(xly) = llxll 2 + llYll 2 - llx + yll 2 . Soit u E [a, b]. On utilise l'égalité précédente avec
x = f(b) - f(a) et y= f(u) - f(a). On obtient

2(!(b) -f(a) 1 f(u) -f(a)) = ll/(b)-/(a)ll 2 + llf(u)-f(a)ll 2 -11/(b)- /(u)ll 2


= (g(b) - g(a)) 2 + (g(u) - g(a)) 2 - (g(u) - g(b)) 2
= 2(g(b) - g(a)) (g(u) - g(a))
= 211/(b) - /(a)ll 11/(u) - /(a)ll ·
L'inégalité de Schwarz étant ici une égalité, les vecteurs f(b) - f(a) et f (u) - f (a) sont liés (voir par exemple
[T.X.2.2]); il existe donc k(u) E ~tel que f(u) - f(a) = k(u) (!(b) - f(a)). On en déduit alors, en utilisant
les égalités précédentes, que g( u) - g( a) = k( u) ( g( b) - g( a)). Comme g est croissante, k( u) E [O, 1] ce
quiprouveque/(u) E [f(a),f(b)].

Solution I.15.
1) Soit x et y E n. On étudie successivement les deux cas suivants:
- Si a <f. ]x, y[, alors [x, y] C net on peut appliquer le théorème des accroissements finis à f entre les points
x et y. On obtient
11/(x) - /(y)ll S sup 11/'(z)ll llx -yll S kllx - Yll ·
zE[x,y)

- Si a E ]x, y[, il existe alors>. < 0 tel que y - a = >.(x - a). La dimension de E étant, par hypothèse, au
moins égale à 2, il existez E E linéairement indépendant de x - a. Pour tout réel€ vérifiant 0 < € < r /llzll. on
a a+ €Z E n_ De plus, les segments [x, a+ êz] et [y, a+ êz] sont contenus dans n. En appliquant cette fois le
théorème des accroissements finis à f sur ces deux segments on obtient 11/(x)- f (a+êz) Il S kllx - (a+êz)ll
et 11/(y) - f(a + êz)ll S kllY - (a+ êz)ll, d'où encore,

11/(x) - /(y)ll S 11/(x) - f(a + êz)ll + 11/(y) - f(a + êz)ll


S kllx - (a+ êz)ll + kllY - (a+ êz)ll,

d'où, en faisant tendre € vers 0, 11/(x) - f(y)ll S k(llx - ail + llY - ail). Mais, puisque a E ]x, y[,
llx - Yll = llx - ail+ llY - ail. d'où 11/(x) - /(y)ll S kllx - Yll·
38 Chapitre premier. Applications différentiables

Finalement, quels que soient X et y E n. Il! (x) - f (y) Il ::::: kllx - Yll ( * ).
2) Soit (xn, n E N) une suite dans n convergeant vers a. Étant convergente, cette suite est de Cauchy.
L'inégalité(*) établie dans la question précédente montre que la suite (!(xn), n E N) est de Cauchy dans
l'espace complet F. Elle converge donc. Soit a sa limite. Si maintenant (xn) et (Yn) sont deux suites dans n
convergeant toutes deux vers a, l'inégalité ( *) appliquée, pour tout n E N, à Xn et Yn montre que les suites
(!(xn)) et (!(Yn)) ont la même limite. Ainsi a ne dépend pas du choix de la suite (xn)· On sait (voir par
exemple [T.Vl.1.4.c] que cela implique que fa pour limite a lorsque x tend vers a.
3) L'application h définie sur B(a,r) par h(x) = g(x) - l(x - a) est différentiable sur net pour
X E n, h'(x) = !'(x) - l. Exprimons quel = limx~a .f'(x); nous obtenons : pour tout E > 0, il
exister' vérifiant 0 < r' < r tel que, pour tout x E B(a,r') - {a}, llf'(x) - lll < E. Appliquons à h
le résultat de la question 1 en remplaçant n par n' = B( a, r') - {a}; nous voyons que pour tous x et y E n',
llh(x)-h(y)ll :S: Ellx-ylJ,c'est-à-dire,enrevenantàladéfinitiondeh, IJg(x)-g(y)--l(x-y)ll :S: EIJx-yll.
Les applications g et l étant continues en a, cette dernière inégalité se prolonge par continuité lorsque x = a ou
y= a. Finalement, pour tous x et y E B(a, r'), llg(x) - g(y) - l(x - y)ll :S: Ellx - Yll·
Le résultat précédent appliqué au cas ou y = a permet de dire que, pour tout E > 0, il existe r' vérifiant
0 < r' < r tel que, pour tout x E B(a, r'), llg(x) - g(a) - l(x - a) Il :S: Ellx - all. ce qui exprime que g est
différentiable en a et a pour différentielle en ce point g' (a) = l.

Solution 1.16.
1) Pour tout n E Net tout x E [O, 2n], lanrneinx 1 :S: llallrn. Or, puisque r E ]O, 1[, la série de terme général
llallrn converge. Ainsi, la suite d'éléments de C: x >-+ ln(a)(x) = I::;=O
aprPeipx, converge uniformément
sur [O, 2n], et sa limite l(a) est continue sur cet intervalle, c'est-à-dire est élément de C (voir par exemple
[T. VIIl.1.8)).
Les applications ln(a) sont dérivables en tout point de [O, 2n], de dérivée x >-+ l~ (a)(x) = I::;=O ipaprPeipx.
Mais pour tout n E Net tout x E [O, 2n], linanrneinxl :S: nlJallrn. De plus la série de terme général nllallrn
converge, ce qui prouve que la suite l~ (a) des dérivées des applications ln (a) converge uniformément sur [O, 2n]
vers l'application x >-+ I:::=o inanrneinx. L'espace IC étant complet, on peut appliquer le théorème 5.8 de
dérivation pour conclure quel( a) est continûment différentiable sur [O, 2n] et que sa dérivée au point x E [O, 2n]
a pour valeur
OO

l'(a)(x) = L inanrneinx.
n=O

2) L'application l est évidemment linéaire d'après les propriétés des opérations sur les séries numériques. De
plus, pour tous a E Set x E [O, 2n],

OO

ll(a)(x) 1 :S: L lanlrn :S: llall 1 ~ r,


n=O

donc lll(a)IJ :S: llall/(1 - r), ce qui montre quel est continue et que sa norme vérifie lllll :S: 1/(1 - r).
Soit maintenant a = (an) la suite dont tous les termes an valent 1. Alors ll(a)(O)I = 1/(1 - r), donc
IJl(a)ll ~ llall ( 1/(1 - r)), et lllll ~ 1/(1 - r). Finalement on obtient

11111 1- .
= -1-r

3) Pour n E N, l'application, définie sur C, f >-+ Cn (!) = -


1 127î f (x )e-inx
. dx, est linéaire par application
27r 0
immédiate des propriétés de l'intégrale. De plus, pour tout f E C, lcn(f)I :S: li/li. et en(!) 1 dans le cas =
particulier où f est la fonction f (x) =
einx. L'application en est donc continue de norme lien Il = 1. Le calcul
donne, pour a E S,
§ 7. Solutions 39

On a utilisé la convergence normale sur [O, 211"] de la série de terme général aprPei(p-n)x pour intervertir
intégration et sommation. On obtient la formule an= r-ncn o l(a) (*).
4) Soit (fp, p E N) une suite d'éléments de l(l3) qui converge, dans C, vers une limite f. Soit n E N. Puisque en
est linéaire continue de norme lien 11 = 1 on a, pourtoutp E N. lcn(fp)- cn(f)I = lcn (fp - J)I ::; Il!p - f 11.
Or la suite (fp, p EN) converge, dans C, vers f, donc la suite ( cn(fp), p EN) converge vers en(!).
Pour p E N, fp E l(l3). Il existe donc une suite aP = (a~, n E N) de 13 telle que fp = l(aP). On sait alors
d'après la question 3 que, pour n E N fixé, a~ = r-ncn(fp). et en faisant tendre p vers +oo, a~ converge
vers r-ncn(f). Or, puisque aP E 13, pour tous net p entiers, la~I ::; 1, donc encore, par passage à la limite
quand p-> oo, lr-ncn(f)I ::; 1.
Finalement, la suite a= (r-ncn(f), n E N) appartient à 13.
On pose ici an = r-ncn(f). On a alors la~ - anl = lr-ncn(fp - f)I ::; llfp - Jll. d'où encore,
llap - ail ::; llfp - fll. La suite (ap, p E N) converge donc vers a, et comme l est continue, la suite
(l(ap), p EN) converge vers l(a), soit encore la suite (f p, p E N) converge vers f = l(a), qui par suite est
élément de l(l3). On peut conclure que l(l3) est un fermé de C.
5) Soit a un élément de S. On pose f = l(a). La dérivée f' de f vérifie, pour tout x E [O, 211"],
lf'(x)I ::; L::=O laninrneinxl ::; llall L:::=O nrn, ce qui donne finalement
llf'll::; (l ~ r) 2 llall ·
Appliquons à f le théorème des accroissements finis entre deux points x et y de [O, 211"]. Nous obtenons
llf(x) - f(y)ll ::; (r/(1 - r)2) llall lx - YI·
Si on suppose de plus que a E 13, llf(x) - f(y)ll ::; (r/(1 - r) 2 ) lx - YI· Ce résultat est donc valable pour
tout élément f de l (13) et prouve que la famille des éléments de l (13) est uniformément équicontinue.
On vérifie également que l(l3) est borné car si f = l(a) E l(l3), on a 11/11 = Ill( a) li ::; 1/(1 - r). On voit
donc que l(l3) est une partie fermée, bornée, uniformément équicontinue de C, ce qui permet de conclure par
application du théorème d' Ascoli (voir par exemple [T.VIII.3.8)) que l(l3) est compact.
Chapitre Il
Fonctions inverses et fonctions implicites

Nous établissons dans le présent chapitre le très important théorème des fonctions inverses,
dont nous donnons deux formes, une locale (théorème d'inversion locale 2.4), et une
autre globale (corollaire 2.5). Nous en déduisons le théorème des fonctions implicites, lui
aussi très important. Ces théorèmes sont extrêmement employés, tant en Analyse qu'en
Géométrie différentielle.

1. Difféomorphismes de classe ci
1.1. Définition. - Soient E et F deux espaces vectoriels normés, U un ouvert de E
et f une application de U dans F. On dit que f est un difféomorphisme de U sur
un ouvert V de F, si I est différentiable sur U, est une bijection de U sur V, et
si l'application réciproque 1-i : V~ E est différentiable sur V. On dit que I est
un difféomorphisme de classe ci si I est un difféomorphisme, et si I et 1-i sont de
classe ci.

1.2. Remarques
a) J?ifféomorphismes et homéomorphismes. - Un difféomorphisme de U sur V est
évidemment un homéomorphisme de U sur V. Mais un homéomorphisme différentiable
d'un ouvert U de E sur un ouvert V de F n'est pas nécessairement un difféomorphisme.
Ainsi par exemple, l'application de IR sur lui-même x t--t I (x) = x 3 , qui est différentiable,
est un homéomorphisme. Cependant, lapplication réciproque y t--t 1- i (y) = y i/ 3 n'est
pas différentiable à l'origine.
b) Différentielle de l'inverse d'un difféomorphisme. - Soient E et F deux espaces de
Banach, et I un difféomorphisme d'un ouvert U de E sur un ouvert V de F. Nous avons
1-i o I = idu, Io 1-i = idv .
En différentiant ces relations, et en utilisant la règle de différentiation des applications
composées, nous voyons que pour tout point x E U,
u-i)'(f(x)) O l'(x) = idE, J'(x) O u-i)'(f(x)) = idF.
Ceci exprime que pour tout x E U, f' (x) est un isomorphisme de E sur F, dont l'inverse
est u-iy(f(x)).
Supposons de plus Ide classe ci, c'est-à-dire f' : U ~ L(E, F) continue. Alors 1-i
est aussi de classe ci, donc I est un difféomorphisme de classe ci. En effet, (f- i )' :
V ~ L(F, E) est composée des applications suivantes: l'application 1-i : V ~ U, qui
est continue; l'application I' : U ~ L(E, F), qui est continue puisque I est de classe
ci; l'application <I> : Isom(E, F) ~ Isom(F, E), cp t--t cp-i, qui est continue (voir par
exemple [T.IX.4.4]). Ceci montre que (f-i )'est continue.
§ 2. Le théorème des fonctions inverses 41

2. Le théorème des fonctions inverses


2.1. Généralités. - Le but essentiel de ce paragraphe est la démonstration du théorème
d'inversion locale (théorème 2.4 ci-après), selon lequel une application Ide classe ci d'un
ouvert U d'un espace de Banach E dans un autre espace de Banach F, dont la différentielle
en un point a de U est un isomorphisme de E sur F, est, lorsqu'on la restreint à un voisinage
ouvert convenablement choisi V de a, V c U, un difféomorphisme de classe ci de ce
voisinage sur son image W = l(V), qui est un ouvert de F. C'est un résultat de caractère
local, puisqu'il ne renseigne que sur la restriction de l'application considérée à un voisinage
du point a. La partie la plus difficile de la démonstration consiste à prouver qu'il existe
un voisinage ouvert V de a, V C U, tel que W = l(V) soit un ouvert de F et que la
restriction de I à V soit un homéomorphisme de V sur W. Elle sera présentée en dernier.
Nous commencerons par établir un résultat de nature plus globale (lemme 2.2 ci-après),
valable dans des hypothèses plus restrictives que le théorème d'inversion locale, puisqu'il
suppose que l(V) est un ouvert de F et que I est un homéomorphisme de V sur l(V).
Nous verrons plus loin (corollaire 2.5) que les conclusions du lemme 2.2 subsistent dans
des hypothèses moins restrictives (l'application I, de classe ci, étant supposée injective).

2.2. Lemme. - Soit I un homéomorphisme d'un ouvert V d'un espace de Banach E


sur un ouvert W = l(V) d'un espace de Banach F. On suppose I différentiable
en un point a E V, et on suppose également que sa différentielle f' (a) en ce
point est un isomorphisme de E sur F. Alors 1-i : W --t V est différentiable en
b = I (a) E W, et sa différentielle en ce point est (!' (a) ri.
Si de plus I est différentiable sur V (resp., est de classe ci sur V), et si sa
différentielle en tout point de V est un isomorphisme de E sur F, 1-i est
différentiable sur w (resp., est de classe ci sur w ).
Preuve: Soit x E V, y= l(x) E W. Nous avons
l(x) - l(a) - J'(a)(x - a)= llx - allcp(x - a), avec lim
x-+a,xEV
cp(x - a) = 0.
Nous en déduisons
x-a = (f'(a)ri(y-b)-llx-all'l/J(x-a), avec 'l/J(x-a) = (f'(a)ri (cp(x-a)).
(*)
Nous en tirons la majoration

llx - all(l - ll'l/J(x - a)ll) :S ll(f'(a)rill llY- bll ·


Mais lorsque x tend vers a, cp(x -a) tend vers zéro, donc 'l/J(x -a) tend aussi vers zéro. En
prenant llx-all assez petit, nous pouvons supposer 111/J(x -a)ll < 1. L'inégalité ci-dessus
peut alors s'écrire

llx-all:S ll(f'(a))-ill lly-bll·


1 - ll'!/J(x - a)ll

Nous tirons également de l'expression ( *) ci-dessus

d'où la majoration
42 Chapitre II. Fonctions inverses et fonctions implicites

Lorsque y tend vers b, x = 1-i(y) tend vers a, puisque 1-i est continue, 'lf;(x - a) tend
vers zéro, et l'expression
Il (f'(a)fill llw(x - a)ll
1 - llw(x - a)ll

tend également vers zéro. La dernière inégalité montre donc que 1- i est différentiable
en b et que sa différentielle en ce point est (f' (a)) - i.
Sil est différentiable sur V, le raisonnement appliqué ci-dessus au point a s'applique en
tout point de V, et montre que 1-i est différentiable sur W.
Sil est de classe ci sur V, la remarque 1.2.b montre que (f- i)' est continue.L'application
1-i est donc de classe ci sur W. o
2.3. Lemme. - Soit V un ouvert d'un espace de Banach E, g : V --+ F et
h : V --+ F deux applications de V dans un espace de Banach F, vérifiant les
propriétés suivantes :
(i) l'application g est un homéomorphisme de V sur un ouvert g(V) de F;
(ii) il existe un réel M > 0 tel que, pour tous x et y E V,
llg(x) - g(y) Il ~ Mllx - Yll ;
en d'autres termes, l'application g-i, inverse de g, est lipschitzienne de
rapport M-i;
(iii) l'application h est lipschitzienne de rapport k < M, c'est-à-dire vérifie,
pour tous x et y EV,

llh(x) - h(y) Il S kllx - Yll ·


Soit l = g + h. Alors l(V) est un ouvert de F, et l est un homéomorphisme de
V sur l'ouvert l(V) de F.

Preuve: L'application lest injective, puisqu'elle vérifie, pour tous x et y E V,

lll(x) - l(Y)ll = llg(x) - g(y) - h(x) + h(y)ll


~ llg(x) - g(y)ll - llh(x)- h(y)ll
~ (M-k)llx-yll,

avec M - k > O. Pour prouver que l(V) est un ouvert de E et que l est un
homéomorphisme de V sur l (V), il suffit de prouver quel est une application ouverte.
Mais pour cela, il suffit de montrer que pour tout point a de V, l'image par l de chaque
boule ouverte de centre a contenue dans V contient une boule ouverte de centre l (a).
Toute boule ouverte contenant une boule fermée de rayon non nul et de même centre, il
suffit aussi de montrer que pour tout point a de V et tout réel r > 0 tel que la boule fermée
B p (a, r), de centre a et de rayon r > 0, soit contenue dans V, l (B p (a, r)) contient une
boule ouverte de centre l (a).
Soit donc a E V, et r > 0 tel que BF(a, r) c V. Posons b = l(a) = g(a) + h(a).
Puisque g est un homéomorphisme, g(V) est un ouvert de F contenant g( a). Il existe donc
p > 0 tel que la boule fermée de centre g(a) et de rayon p soit contenue dans g(V).
Soit y E F vérifiant
11 Y - l (a) 11 S (M - k) inf ( ~ , r) .
§ 2. Le théorème des fonctions inverses 43

Pour tout xE U vérifiant llx - ail :::; inf ( ; , r), nous avons
llY - h(x) - g(a)ll:::; llY - h(a) - g(a)ll + llh(a) - h(x)ll
:::; (M - k) inf ( ; , r) + k inf ( ; , r)

:::; M inf ( 1~1 , r)


:::; p.
Par suite, y - h(x) E g(V), et nous pouvons considérer g-i (y - h(x)). Le domaine de
définition de l'application
x f-; cpy(x) = g-i(y- h(x))
contient donc la boule fermée Bp (a, inf ( ; , r)). Pour tout couple (xi, x2) d'éléments
de ce domaine de définition,
llcpy(xi) - cpy(.i:2)ll = llg:--i (y - h(xi)) - g-i (y - h(x2)) Il
1
:::; M llh(xi) - h(x2)ll
k
:::; M llxi - x2 li .
L'application cpy est donc lipschitzienne, de rapport k/ M < 1, indépendant de y. De plus,
elle applique la boule fermée B F (a, inf ( ; , r)) dans elle-même puisque, si xest un
point de cette boule,
llcpy(x) - ajl = llg-i (y - h(x)) - g-i (g(a)) Il
1
:::; M llY - h(x) - g(a)ll
:::; inf (;,r) .
La boule fermée Bp (a, inf ( ; , r)) est complète, puisque c'est une partie fermée de
l'espace de Banach E. Le théorème du point fixe (voir par exemple [T.VI.4.3]) montre
qu'il existe un point unique x de cette boule qui vérifie
cpy(x)=g-i(y-h(x)) =x,
c'est-à-dire
f(x) = g(x) + h(x) =y.
En d'autres termes, le point y appartient à l'image par f de la boule fermée de centre a et
de rayon inf ( ; , r), donc, a fortiori, à l'image par f de la boule fermée de centre a et
de rayon r. L'image par f de la boule fermée de centre a et de rayon r contient donc la
boule fermée de centre f (a) et de rayon ( M - k) inf ( ; , r), donc, a fortiori, la boule
ouverte de même centre et de même rayon. D
2.4. Théorème d'inversion locale. - Soit f : U --) F une application de classe ci
d'un ouvert U d'un espace de Banach E dans un espace de Banach F. On suppose
qu'en un point a E U, la différentielle f'(a) de l'application f est un isomorphisme
de E sur F. Alors il existe un voisinage ouvert V de a, V C U tel que W = f(V)
soit un ouvert de F et que la restriction de f à V soit un difféomorphisme de classe
ci de V sur W.
44 Chapitre II. Fonctions inverses et fonctions implicites

Preuve: Posons, pour tout x E E,


g(x) = f(a) + J'(a)(x - a),
et, pour tout x E U,
h(x) = f(x) - g(x).
L'application g, composée de la translation x r--+ x - a de E, de l'isomorphisme J'(a)
de E sur F et de la translation y r--+ y+ f(a) de F, est un homéomorphisme de E sur F,
dont l'inverse a pour expression
g- i (z) = a + (!' (a) r i (z - f (a)) ' z E F.
Nous avons, pour tous zi et z2 E F,

llg-i(zi) - g-i(z2)ll::; M-illzi - z2ll, avec M = ll(f'(a)riri.


D'autre part, h' (x) = f'(x) - f'(a) et, pour tous x et y E U tels que le segment [x, y] soit
entièrement contenu dans U, nous avons, d'après le théorème des accroissements finis,
llh(x) - h(y)ll ::; sup llJ'(z) - J'(a)ll llx - Yll.
zE[x,y]
Soit k un réel vérifiant 0 < k < M. Puisque f' est continue en a, et que U est un voisinage
de a, il existe p > 0 tel que la boule ouverte V = B (a, p) de centre a et de rayon p soit
contenue dans U et que, pour tout z E V,
llf'(z) - J'(a)ll ::; k.
Par suite (voir par exemple la démonstration de [T.VI.4.4]), f' (z) est inversible pour tout
z E V et, pour tous x et y E V,
llh(x) - h(y) Il ::; kllx - Yll.
Les restrictions à V des applications g eth vérifient les hypothèses du lemme 2.3. D'après
ce lemme, f (V) est un ouvert de F, et f = g + h est un homéomorphisme de V sur f(V).
Mais alors le lemme 2.2 montre que la restriction de f à V est un difféomorphisme de
classe ci de V surf (V). o
2.5. Corollaire [Forme globale du théorème des fonctions inverses]. - Soit f : U ---> F
une application de classe ci d'un ouvert U d'un espace de Banach E dans un
espace de Banach F. On suppose f injective et telle qu'en tout point x E U, sa
différentielle f'(x) soit un isomorphisme de E sur F. Alors f(U) est un ouvert
de F et f est un difféomorphisme de classe ci de U sur f(U).
Preuve : D'après le théorème 2.4, tout point a de U possède un voisinage ouvert Va contenu
dans U tel que f (Va) soit un ouvert de F et que f soit un difféomorphisme de classe ci de
Va sur son image. Par suite f (U), réunion des ouverts f(Va). a E U, est un ouvert de F.
L'application f, étant injective, est une bijection de U sur f(U). Puisque tout point a E U
possède un voisinage ouvert Va tel que la restriction de f à Va soit un difféomorphisme
de classe ci, f est un difféomorphisme de classe ci de U sur f(U). o
2.6. Remarques et exemples
a) Coordonnées polaires. - Soit f : IR 2 ---> IR 2 l'application
f: (r, 0) r--+ (x = rcosO, y= rsinO).
La différentielle de cette application, au point (r, 0), identifiée a sa matrice, a pour
expression
Df(r O) = (c?sO -rsinO)
' smO rcosO '
§ 3. Le théorème des fonctions implicites 45

de déterminant r( cos 2 0 + sin 2 0) = r. La différentielle D f (r, 0) est donc inversible en


tout point (r, 0) de JR 2 vérifiant r -=!= O. D'après le théorème d'inversion locale, tout point
(r 0 , 00 ) de JR 2 vérifiant r0 -=/= 0 possède un voisinage ouvert V tel que la restriction
de f à V soit un difféomorphisme de V sur un ouvert f (V) de JR 2 . II est facile de
donner des expressions explicites de V et de (f 1v) -i. Ainsi par exemple, si r0 > 0
et s'il existe k E Z tel que -7r /2 + 2k7r < 00 < 7r /2 + 2k7r, nous pouvons prendre
V= JO, +oo[ X l- 7r /2 + 2k7r, 7r /2 + 2k7r[, et Ulv ri a pour expression
(x, y) t--t (r = Jx 2 + y2 0 = arcsin
Jx2
y
+ y2
+ 2k7r) ,

en convenant de choisir la détermination de la fonction multivoque arcsin qui prend ses


valeurs dans lintervalle [-7r /2, 7r /2].
Nous laissons au lecteur le soin de déterminer les expressions de V et de (f 1v) - i dans
les autres cas (lorsque ro < 0, ou lorsque 00 appartient à un intervalle de la forme
[7r /2 + 2k7r, 37r /2 + 2k7r], ou encore lorsque 00 = ±7r /2 + 2k7r, avec k E Z).
b) Autre exemple. - L'exemple qui précède montre qu'il existe des applications de
classe ci dont la différentielle, en chaque point de leur domaine de définition, est un
isomorphisme, et qui ne sont pas des difféomorphismes car elles ne sont pas injectives.
Voici un autre exemple. L'application
f(x,y) = (x 2 -y 2 , 2xy)
a, en chaque point de JR 2 \ { (0, 0) }, une différentielle inversible puisque le déterminant
de la matrice jacobienne est 4( x 2 + y 2 ). Mais l'application f n'est pas injective : les deux
points (x, y) et (-x, -y) ont la même image (x 2 - y 2 , 2xy).
Le lecteur astucieux aura remarqué qu'en identifiant JR 2 à C grâce à l'application qui
associe, à chaque (x, y) E JR 2 , l'élément z = x + iy de C, l'application f considérée
ci-dessus n'est autre que lapplication z t--t z 2 .

3. Le théorème des fonctions implicites


3.1. Théorème des fonctions implicites. - Soient E, F et G trois espaces de
Banach, U un ouvert de E x F et f une application de classe ci de U dans G,
notée (x, y) t--t f(x, y), (x, y) EU. Soit (a, b) EU. On suppose que la différentielle
partielle f~ (a, b) de l'application f par rapport à sa seconde variable y E F, au
point (a, b), est un isomorphisme de F sur G. Alors il existe un voisinage ouvert
V de (a, b) dans E x F, V C U, un voisinage ouvert W de a dans E, et une
application h de classe ci de W dans F, tels que les assertions suivantes :
(i) le couple (x, y) est élément de V et f(x, y)= f(a, b),
(ii) le point x est élément de W et y= h(x),
soient équivalentes.
Preuve: Soit fi : U ~Ex G l'application
fi(x,y) = (x,f(x,y)).
Elle est de classe ci, puisque ses deux composantes le sont. Sa différentielle au point
(a, b) a pour expression
f{ (a, b)(u, v) = (u, f~(a, b)(u) + f~(a, b)(v)), (u, v) E Ex F.
C'est un isomorphisme de Ex F sur E x G, dont l'inverse a pour expression
(!{ (a, b) fi (u, w) = (u, (!~ (a, b)) -i (w - f~ (a, b) (u))) , (u, w) E E x G.
46 Chapitre II. Fonctions inverses et fonctions implicites

D'après le théorème d'inversion locale, il existe un voisinage ouvert V de (a, b) dans Ex F,


V c U, tel que Wi = fi (V) soit un ouvert de E x G et que fi soit un difféomorphisme
de classe ci de V sur Wi. Soit ki : Wi ---+ V le difféomorphisme inverse. Les assertions
suivantes sont donc équivalentes :
(a) lecouple(x,y)estélémentdeVetfi(x,y) = (xi,z),
(b) le couple (xi, z) est élément de Wi et ki (xi, z) = (x, y).
Mais, d'après la définition de fi,

fi (x, y)= (x, J(x, y)).


L'inverse ki de fi est donc nécessairement de la forme

ki(xi,z) = (xi,k(xi,z)), (xi,z) E Wi,


où k : Wi ---+ F est une application de classe ci. Les deux asse1tions équivalentes (a)
et (b) peuvent donc s'exprimer sous la forme
(c) le couple (x, y) est élément de V et f(x, y)= z,
(d) le couple (x, z) est élément de Wi et k(x, z) =y.
Posons
c = J(a,b), W = {x E E ; (x, c) E Wi},

et notons h la restriction à W de l'application k. Nous voyons que W est un voisinage


ouvert de a dans E, et que l'application h: W---+ Fest de classe ci. L'équivalence des
assertions (c) et (d) implique alors l'équivalence de
(i) le couple (x, y) est élément de V et J(x, y)= j(a, b),
et de
(ii) le point x est élément de W et y = h(x ). 0

3.2. Commentaires et remarques


a) Différentielle de l'application h. - Les hypothèses du théorème 3.1 impliquent

h(a) = b.
D'autre part, avec les notations employées dans la démonstration de ce théorème, en
utilisant le fait que fi : (X' y) f-t (X' f (X' y)) est un difféomorphisme de classe ci de V
sur Wi, nous voyons que pour tout x E W, f ~ ( x, h( x)) est un isomorphisme de F sur G.
Moyennant cette remarque, il est facile d'obtenir 1' expression de la différentielle h' ( x) de
l'application h en un point x E W; il suffit de différentier les deux membres de l'égalité

f(x,h(x)) = J(a,b).
Puisque le membre de droite est constant, nous obtenons

J~(x, h(x)) + J~(x, h(x)) o h'(x) = 0,


d'où
h'(x) = -(i~(x,h(x)))-i of~(x,h(x)).
§ 3. Le théorème des fonctions implicites 47

b) Justification de la terminologie. - Le nom donné au théorème 3.1 est justifié par les
considérations suivantes. Posons, comme ci-dessus, f (a, b) = c. Nous pouvons considérer
l'expression
f(x,y) = c
comme une équation, dans laquelle c E Gest fixé, y E F étant l'inconnue qu'on cherche
à déterminer, x E E étant un paramètre, auquel on pourra donner diverses valeurs.
Par hypothèse, lorsqu'on donne au paramètre x la valeur a, 1'équation ( *) possède une
solution y = b. Le théorème 3.1 indique que sous les hypothèses précisées dans l'énoncé,
l'équation ( *) possède, pour toute valeur du paramètre x prise dans un certain voisinage
ouvert W de a, une solution y = h(x ), fonction de classe C 1 du paramètre x, et que cette
solution est unique, si toutefois on impose à ( x, y) d'appartenir à un certain voisinage V
de (a,&). On dit que (*)est une équation implicite, et que l'application h : W --t Fest
implicitement déterminée par cette équation.
c) Cas d'une application de ~n+p dans ~P. - Dans le cas où E = ~n. F = G = ~P,
l'application fa p composantes
fi: (x1, ... ,Xn,Y1, ... ,yp) t-t fi(x1, ... ,Xn,Y1, ... ,yp), 1:::; i :::;p,
à valeurs réèlles, fonctions de classe C 1 des n + p variables réelles X1, ... 'Xn' YI' ... 'Yp.
La différentielle partielle f~(a, b) est l'application linéaire de ~P dans lui-même ayant
pour matrice
ââfi(a,b) ââfi (a, b) ~fi(a,b)
YI Y2 Yp
ââfz (a, b) ââfz (a, b) ââfz (a, b)
YI Y2 Yp

Posons, pour chaque i, 1 :::; i:::; p, ci = fi(a, b). Le théorème 3.1 exprime alors le résultat
suivant. Si le déterminant de la matrice ( **) ci-dessus est non nul, le système d'équations

possède, pour chaque valeur du paramètre x = (x 1 , ... , Xn) appartenant au voisinage


ouvert W de a dans ~n. une solution y= h(x) vérifiant (x, y) E V unique, s'exprimant
comme une fonction h = (h 1 , ... , hp), de classe C 1 , à valeurs dans ~P, du paramètre
x = (xi, ... , Xn) E W. Nous avons donc
fi (x1, ... , Xn 1 h1 (x1, ... , Xn), ... , hp(X1, ... , Xn)) = Ci,
d) Un exemple simple. - Soit f = ~3 --t ~ l'application
f(x, y, z) = x 2 + y2 + z2 .
Soit (xo, Yo, zo) un point de ~ 3 . Nous avons
f~(xo, Yo, zo) = 2zo.
Appliquons le théorème des fonctions implicites en identifiant~ 3 à~ 2 x~. (x, y) désignant
un point du premier facteur ~ 2 , et z un point du second facteur R Nous voyons que si
z0 =f. 0, il existe un voisinage ouvert V de (x 0 , y0 , z0 ) dans ~ 3 , un voisinage ouvert W
de (x 0 , y 0 ) dans ~ 2 et une application différentiable h de W dans ~ tels que les deux
assertions suivantes soient équivalentes :
(i) le point (x, y, z) est élément de V et x 2 + y 2 + z 2 = x6 + Y5 + z5,
48 Chapitre II. Fonctions inverses et fonctions implicites

(ii) le point (x, y) est élément de Wetz= h(x, y).


Il est facile de donner des expressions explicites de V, W eth. Nous pouvons prendre, par
exemple,
V= { (x,y,z) E IR 3 ; zoz > 0}, W = { (x,y) E IR 2 ; x2 +y 2 < x5+Y5+z5},
et pour application h,

h(x,y) =
Vxô + Y5 + z5 -
{ -J ~------
x2 - Y2 si z0 > 0,

x5 + Y5 + z5 - x2 - y2 si zo <O.
Cet exemple permet de mieux comprendre le rôle du voisinage V; si nous avions omis,
dans l'assertion (i), d'imposer à (x, y, z) d'être élément de V, c'est-à-dire si nous n'avions
pas imposé à z d'être de même signe que z0 , les assertions (i) et (ii) ne seraient plus
équivalentes. En effet, pour tout (x, y) E W, posons

Nous avons alors


x2 + y2 + zî = x5 + Yâ + zâ , et aussi x2 + y2 + z~ = x5 + Yâ + zâ .

4. Exercices
Avertissement. Parmi les exercices ci-dessous, certains utilisent les notions d'application
de classe CP ou de classe C 00 présentées dans le chapitre III. Nous les avons cependant
placés dans le présent chapitre, car ils illustrent principalement l'emploi des théorèmes
des fonctions inverses et des fonctions implicites. Le lecteur pourra se reporter au chapitre
III, et notamment au paragraphe 111.3.5, pour les quelques résultats nécessaires pour leur
résolution.
Exercice II. l. Soient E, F et G trois espaces de Banach, U un ouvert de E, f : U ---+ F
et g : U ---+ G deux applications de classe ci.
1) On suppose que pour tout x E U, f' (x) est un isomorphisme de E vers F. Montrer que
f (U) est un ouvert de F.
2) On suppose de plus qu'il existe une application </> : f(U) ---+ G telle que g = </>of.
Montrer que </>est de classe ci.
3) Application : Soit g : JO, +oo[ xIR ---+ IR une application de classe ci vérifiant, pour
tout r E ]O, +oo[ et tout 8 E IR, g(r, 8 + 27r) = g(r, 8). Montrer qu'il existe une
unique application </> : IR 2 - {(0, O)} ---+ IR vérifiant, pour tout r E JO, +oo[ et tout
8 E IR , g(r, 8) = </>(r cos 8, r sin 8). Montrer que </>est de classe ci.
Exercice II. 2. Soit Mn (IR) lespace des matrices réelles n x n, A un élément de cet
espace, I la matrice n x n unité, et À E R On pose F(À, A) = dét(.XI - A), polynôme
caractéristique de A. On définit ainsi une application F de IR x Mn (IR) dans R
1) Expliquer pourquoi F est de classe C 00 .
2) On rappelle que les valeurs propres réelles de A sont les réels À tels que F(.X, A) = O.
Une valeur propre réelle À de A est simple si et seulement si oF~; A) -::/=O.
Soit À une valeur propre réelle simple de A. Montrer qu'il existe un voisinage ouvert V de
A et une fonction</> : V __, IR de classe C 00 telle que </>(A) = À et que pour toute matrice
B E V, </>(B) soit une valeur propre rélle de B.
§ 4. Exercices 49

3) Soit U le sous-ensemble de Mn(IR) formé des matrices ayant n valeurs propres réelles
deux à deux distinctes. Montrer que U est un ouvert de Mn(IR).
4) Soit A E U, Ài(A), Àz(A), .. ., Àn(A) les n valeurs propres de A rangées par ordre
croissant: Ài (A) < Àz(A) < · · · < Àn (A). On définit ainsi n applications Ài de U dans
R Montrer que ces applications sont de classe C 00 sur U.
Exercice II.3. Soit E un .IR-espace vectoriel normé de dimension finie. On suppose que
la norme sur E est associée à un produit scalaire : ( x, y) t-t ( x IY). Soit f : E --+ E une
application de classe ci. On suppose qu'il existe un réel a > 0 tel que, pour tous h et
XE E, (J'(x) hlh) a(hlh).
;::=:
1) Montrer que, pour tous a et b E E, (J(b) - J(a)lb- a) ;::=: a(b- alb- a). [On pourra
introduire la fonction</> définie, pour t E .IR, par </>(t) = (J(a + t(b - a)) 1 b - a)]. En
déduire que f est une application fermée.
2) Montrer que, pour tout x E E, f'(x) est un isomorphisme de E. En déduire que f est
une application ouverte.
3) Montrer que J est un difféomorphisme de classe ci de E sur lui-même.
Exercice II.4. on· considère le système d'équations, d'inconnues (x, y, z, t) E .IR 4 :
x3 + y3 + z3 + t2 = 0 '
{ x2 + y2 + z2 + t = 2,
X + y + Z + t = 0.
Vérifier que le point (0, -1, 1, 0) est solution. Montrer que l'on peut résoudre ce système
par rapport à (x, y, z) au voisinage de ce point. Calculer la dérivée en 0 de l'application
t t-t (x(t), y(t), z(t)) ainsi définie.
Exercice II.5. Soit Mn(IR) l'espace des matrices réelles n x n, et 7r : Mn(.IR) x
Mn(IR)--+ Mn(.IR) l'application 7r(M, N) =MN.
1) Montrer que 7r est de classe ci et calculer sa différentielle.
2) Soit A un élément inversible de Mn(.IR). Montrer qu'il existe un voisinage ouvert n de
A dans Mn(.IR) ayant les propriétés suivantes:
- tout élément M de n est inversible,
- l'application</>: M--+ M-i est un ci-difféomorphisme den sur son image.
Donner l'expression de la différentielle de 7r au point A.
Exercice II.6.
1) Soit Mn(IR) l'espace des matrices réelles n x n, A un élément de cet espace et
f: .!Rn--+ IRn
l'application J(x) = Ax.
1 a) Montrer que, pour x E IRn et À E .IR tel que JÀI < 1/llAll fixés, l'équation
y = A(Ày + x), d'inconnue y E IRn, admet une et une seule solution. On désigne par
</>(À, x) cette solution. On définit ainsi une application</> de U =] - 1/llAIJ, 1/llAll [ x.IRn
dans IRn. Déterminer l'expression de</>.
1 b) Montrer que</> est de classe ci sur U. Calculer ses dérivées partielles et vérifier que,
pour tout couple (À, x) E U, </>~(À, x) = </>~(À, x) </>(À, x ).
2) Soit E un espace de Banach et f : E --+ E une application de classe ci. Soit a E E.
On pose b = J(a).
2 a) Montrer qu'il existe un voisinage ouvert U de (0, a) dans .IR x E, un voisinage ouvert
V de b dans E et une application </> : U --+ E de classe ci tels que, pour tout couple
(À,x) EU,
y EV et y= f(Ày + x) <====? y= </>(À, x).
50 Chapitre II. Fonctions inverses et fonctions implicites

2 b) Montrer que, pour tout (À, x) E U, </>vérifie la relation


c/>~(>.,x) = 4>~(.X,x)ef>(>.,x).
Exercice Il. 7. Soit E un espace de Banach. On note idE l'application identique de E, B
la boule ouverte B(idE, 1/3) de .C(E, E) de centre idE et de rayon 1/3, et f l'application
de B dans C(E, E), f(x) = x 3 .
1) On rappelle que C(E, E) est une algèbre non commutative. Montrer que f est
différentiable et calculer f' (x) h pour x E B et h E .C( E, E).
Montrer que f est de classe ci.
2) On note I l'application identique de C(E, E).
2 a) Montrer que, pour tout x E B, llf'(x) - 3Ijl ::=:; 6llx - idE 11+3llx - idE 1 2 . [Il sera
habile de poser x = idE +y].
2 b) En déduire que lapplication linéaire f' (x) est bijective.
3) On pose g(x) = f(x) - 3x.
3 a) Vérifier que l'application g est différentiable et montrer que, pour tous x et y E B,
7
llg(x) - g(y)ll ::S 3llx - Yll ·
3 b) Montrer que l'application f est injective. En déduire que f est un C 1 -difféomorphisme
de B surf (B).
Exercice Il.8. Soit F: Mn(IR) ___. Mn(IR) l'application F(A) = A 2 , où Mn(IR) est
l'espace des matrices réelles n x n.
1) Montrer que F est de classe ci et calculer sa différentielle.
2) On se place au point I (matrice n x n unité). Montrer qu'il existe une fonction
différentiable G, définie dans un voisinage V de I dans Mn(IR), à valeurs dans Mn(IR),
telle que, pour tout A E V, on ait G(A) 2 =A.
3) Dans cette question n = 2. On donne les matrices :

J =( ~1 ~) ' H = (~
Calculer F'(J) H. En déduire qu'il n'existe pas de fonction différentiable G, définie au
voisinage de I, telle que G(I) = Jet que G(A) 2 =A, pour A voisin de I.
Exercice II.9. Soit E l'espace vectoriel des fonctions y : [O, 1] ___. lR de classe C 2
telles que y(O) = y(l) =O. On désigne par 0 l'élément nul de E. On pose
llYll = sup ly(x)I, N(y) = jy'(O)j + llY"li
xE[O,i]

1) Montrer que N est une norme sur E et que, pour tout y E E, jjyjj ::=:; N(y). Montrer
que E, muni de la norme N, est un espace de Banach.
2) Soit F l'espace vectoriel des fonctions continues h : [ü, 1] ___. lR muni de la norme de
la convergence uniforme On munit l'espace Ede la norme N. Montrer que l'application
f: E ___. F, y r--+ f(y) = -y"+ y 3 , est de classe ci sur E. Déterminer sa différentielle
f'(y).
3 a) Montrer que f' (0) est inversible.
3 b) Montrer qu'il existe é > 0 tel que, pour tout élément g de F vérifiant 11911 < é, il
existe XE Etel que -X"+ X 3 = g.
§ 5. Solutions 51

Exercice II.10. L'espace E = C([O, 1]) des fonctions réelles continues sur [O, 1] est
muni de la norme de la convergence uniforme. On note B la boule ouverte de E de centre
0 et de rayon 1. Soit</> : E ---> E l'application

</J(J)(x) = 1x f 2 (t) dt, f E E, x E [ü, l].

1) Montrer que </J est de classe ci et déterminer </J' (J). Montrer que, pour tout f E E,

ll<P'(J)ll :S 211111.
2) On note I l'application identique de E et on pose 'l/; = I + (1/2)</J. Montrer que pour
tout (J,g) E Ex E, on a

ll'l/JU) - 'l/J(g)ll 2: ( 1 - ~(llfll + llgll)) Il! - gll ·


En déduire que la restriction de 'l/; à Best injective.
3) Montrer que la restriction de 'l/; à Best un ci-difféomorphisme de B sur 'l/;(B).
Exercice II.11. Soit E un espace de Banach. On note I l'application identique de E.
On désigne par Bo la boule ouverte de .C(E, E) de centre 0 et de rayon 1 et par Bi la boule
ouverte de cet espace de centre I et de rayon 1.
1) Soit A E Bi et g : .C(E, E) ---> .C(E, E) l'application
1
g(X) = '2(A o X+ X o A), XE .C(E, E).
Montrer que g est un élément inversible de .C(.C(E, E), .C(E, E)).
2) Soit f: .C(E, E)---> .C(E, E) l'application f(M) = M 2 . Montrer que f est de classe
ci sur .C( E, E). Vérifier que pour tout A E Bi, l'application linéaire f' (A) est inversible.
3) Soit :L:i=o a.ntn le développement en série entière de la fonction de variable réelle
t Vf+t. Pour tout XE Bo, on pose </J(X) = :L~o anXn. Montrer que l'on définit
1--+

ainsi une application <P de Bo dans Bi et que f (<P(X)) = I + X.


En déduire que <Pest un ci-difféomorphisme de Bo sur <P(B0 ).

5. Solutions

Solution II. l.
1) D'après le théorème d'inversion locale 2.4, tout point a de U possède un voisinage ouvert Va contenu dans
U tel que f (Va) soit un ouvert de F. Par suite, f (U) est réunion des ouverts f (Va). a E U, donc est un ouvert
deF.
2) Soit b E f(U) et a E U tel que f(a) = b. Toujours d'après le théorème d'inversion locale, f est un ci_
difféomorphisme de Va surf (Va). Désignons par J;; i sa bijection réciproque, et remarquons que J;; i est de
classe ci surf (Va). De l'égalité g = 4> of on déduit alors 4> = go J;; i. Comme la restriction de 4> à f(Va)
apparaît comme composée de deux applications de classe ci, elle est aussi de classe ci. Puisque tout point
b E f(U) possède un voisinage ouvert f(Va) sur lequel 4> est de classe ci, 4> est de classe ci sur f(U).
3) Soit f : U = ]O, +oo[ x!R--> IR l'application f(r, ()) = (r cos(), rsine). Cette application est de classe
. (cos() -r sin() )
C1 et, pour tout ( r, ()) E U, sa différentielle f' (r, ())
a pour matrice jacobienne . ()
sin r cos
() . Cette
matrice est inversible car r # 0 donc, pour tout (r, ()) E U, f' (r, ()) est un isomorphisme de IR:. 2 . On a
f(U) = IR 2 -{(0,0)}.Pourtout(x,y) E f(U),ilexiste(r,()) E Utelquex = rcos(), y= rsin().
De plus tout autre couple (r', ()')vérifiant ces relations est tel que r = r' et() - ()' = k 27f, où k E ·z, donc
g(r, ()) = g(r', ()').On peut alors poser f/>(x, y) = g(r, ()),ce qui définit une application 4> de f(U) vers IR.
52 Chapitre II. Fonctions inverses et fonctions implicites

Cette application vérifieg = ef>of soit, pour tout (r,B) E)O, +oo[ xIR, g(r, 8) = ef>(rcosB,rsinB). De plus,
en appliquant les résultats de la question précédente, on voit que 4> est de classe C 1.

Solution II.2.
1) On remarque que, pour A E Mn(IR) et.>. E IR, l'expression de F(.>., A) = dét(.>.I - A) est celle d'un
polynôme à n 2 + 1 variables (les n 2 coefficients de la matrice A et.>.). L'application Fest donc de classe C 00 •
2) Soit A E Mn(IR) fixé, et.>. une valeur propre réelle simple de A. L'application du théorème des fonctions
implicites (3.1 et 3.2) à la fonction F, au voisinage du point(.>., A), montre l'existence d'un voisinage ouvert
V de A et d'une fonction 4> : V _.... IR, de classe C 00 , telle que ef>( A) = .>. et que pour tout B E V,
F(ef>(B), B) = F(.>., A) = 0, ce qui exprime que ef>(B) est une valeur propre de B.
3) Soit A E U, .>.1 (A), .>.2(A), ... , Àn(A) les n valeurs propres deux à deux distinctes de A. On applique le
résultat de la question précédente à chacune de ces valeurs propres. Il existe donc, pour chaque i E { 1, 2, ... , n},
un voisinage ouvert Vide A et une fonction ef>i. de classe C 00 , définie sur V;. telle que ef>i(A) = Ài(A) et
que pour tout B E V;, 4>i(B) soit valeur propre de B. Les valeurs propres de A étant deux à deux distinctes,
elles possèdent des voisinages respectifs Wi disjoints. De plus, les applications ef>i étant continues en A, on peut
choisir les ouverts vi tels que ef>i(Vi) c Wi. L'ouvert V= n~=l vi est un voisinage de A, et pour tout BE V,
ef>i(B) est une valeur propre de B appartenant à Wi. Ainsi, B possède n valeurs propres deux à deux distinctes,
donc est élément de U.
On a montré que tout point A de U possède un voisinage ouvert V contenu dans U, ce qui prouve que U est un
ouvert de Mn(IR).
4) Pour tout A E U, indexons les valeurs propres Ài(A) de A suivant l'ordre croissant: .>.1 (A) < .>.2(A) <
... < Àn (A) . On peut supposer que les ouverts Wi définis à la question précédente sont des intervalles ouverts;
ilssontdeuxàdeuxdisjointset,pourtoutB E V,onaef>1(B) < 4>2(B) < ... < ef>n(B),puisqueef>i(B) E Wi.
Cela prouve que la restriction de chaque Ài au voisinage ouvert V de A est égale à ef>i. Les applications ef>i étant
de classe C 00 sur V, les applications Ài sont de classe C 00 sur U.

Solution II.3.
1) Soient a et b E E, et 4> la fonction de la variable t E IR, ef>(t) = (f(a + t(b- a)) 1 b - a). Elle est la
composée 4> = l o cp des applications cp: IR_.... E, cp(t) = f(a + t(b - a)). et l : E _....IR, l(x) = (xlb - a).
Ces deux applications sont différentiables en tout point: cp a pour dérivée cp 1 (t) = f'(a + t(b- a)) (b- a) et
l, étant linéaire continue, est différentiable de différentielle Dl(x) = l. Ainsi 4> est dérivable et sa dérivée, en
tout t E IR, est donnée par la formule de dérivation des fonctions composées,

4>' (t) = Dl (a+ t(b - a)) cp 1 (t) = (!'(a+ t(b - a))(b - a) 1 b - a) .

Mais, par hypothèse, pour tous h et x E E, nous avons (!' (x) hlh) 2: a( hlh). Ainsi, pour tout t E IR, 4>' (t) ~
a(b - alb - a). Appliquons aux fonctions t >--+ a(b - alb - a)t et t >--+ ef>, sur l'intervalle [O, 1), le théorème
des accroissements finis 1.5.1. Nous obtenons a(b - alb - a) :::; ( ef>(l) - ef>(O)), c'est-à-dire

(!(b)-f(a) 1b-a)2'.a(b-alb-a).

Soit maintenant U une partie fermée de E. Montrons que f (U) est aussi fermé. Soit (Yn, n E N) une suite
dans f (U) convergeant vers un élément y de E. On peut lui associer une suite (xn, n E N) dans Utelle que,
pour tout n E N, Yn = f (xn)· En appliquant le résultat précédent à deux termes quelconques Xn et Xp de
cette suite, on obtient odlxn - xpll 2 :::; (f(xn) - f(xp)lxn - Xp)· Mais, par l'inégalité de Cauchy-Schwarz,
(f(xn) - f(xp)lxn - Xp) :::'.'. llf(xn) - f(xp)llllxn - xpll. ce qui donne finalement

La suite (Yn). étant convergeante, est de Cauchy. L'inégalité ci-dessus montre que la suite (xn) est aussi de
Cauchy dans l'espace complet E; elle converge donc vers un élément x de E. Tous les termes de la suite
(xn) étant éléments du fermé U, la limite x de cette suite est élément de U. De plus, f est continue, donc
limn_,oo f(xn) = f(x) soit encore limn_,oo Yn = f(x) =y, donc y E f(U).
En définitive, pour toute partie fermée U de E. la partie f (U) est fermée, ce qui prouve que f est une application
fermée.
§ 5. Solutions 53

2) Soit x E E. Pour h E ker f'(x), f'(x) h =O. Mais l'inégalité (f'(x) hlh) 2: a(hlh) montre alors que
h = O. Cela prouve que f' (x) est un endomorphisme injectif de E. Comme nous avons supposé Ede dimension
finie, f' (x) est un isomorphisme de cet espace.
Soit maintenant U une partie ouverte de E, b E f(U) et a E U tel que f(a) = b. Appliquons à f le théorème
d'inversion locale, au point a, ce qui est possible car f est de classe ci et f' (a) un isomorphisme de E. Il existe
donc un voisinage ouvert V de a, V C U, tel qu'en particulier f (V) soit un ouvert de E contenant b et contenu
dans f (U). Cela prouve que f (U) est ouvert, car le b est un point quelconque de f (U). Ainsi, l'application f
est ouverte.
3) On a montré dans les questions précédentes que f est une application ouverte et fermée. En particulier, f(E)
est une partie ouverte et fermée de E. Mais E, comme tout espace vectoriel normé, est connexe non vide, donc
f (E) = E. D'autre part, le résultat obtenu en 1 montre que f est injective; c'est donc une bijection de classe
ci de E sur E telle que, pour tout x E E, f'(x) soit un isomorphisme. L'application de la forme globale
du théorème des fonctions inverses (corollaire 2.5) montre alors que f est un ci-difféomorphisme de E sur
lui-même.

Solution II.4. Soit cp : JR 3 x IR -+ JR 3 lapplication

cp : ( (x, y, z), t) >-+ (x 3 + y3 + z3 + t 2 , x2 + y2 + z2 + t - 2, x +y+ z + t).

On vérifier que cp( (0, -1, 1), 0) = (0, 0, 0) donc que (0, -1, 1, 0) est solution du système. L'application cp est
de classe ci et la matrice jacobienne de sa différentielle partielle cp~1 (M, t) par rapport à sa première variable
M = (x,y,z) est
3x2 3y2 3z2 )
( 2x 2y 2z .
1 1 1

En particulier cp~ ( (0, -1, 1), 0) est inversible car son déterminant est non nul. Appliquons alors le théorème des
fonctions implicites 3.1 à cp, au voisinage du point ( (0, -1, 1), 0) : il existe un intervalle ouvert Ide IR contenant
0, un voisinage ou vert U de (0, -1, 1) dans JR 3 , et une fonction de classe ci f : t >-+ f (t) = ( x(t), y(t), z(t)),
définie sur J, à valeurs dans JR 3 , tels que les conditions (i) et (ii) suivantes soient équivalentes :
(i) (M,t) EU x Jetcp(M,t) =0,
(ii) t E I et M = f(t).
Ceci signifie en particulier que le système donné admet une unique solution t >-+ f(t) au voisinage du point
(0, -1, 0, 0).
Écrivons qu'en tout point t, lapplication nulle t >-+ cp (! (
t), t) a une dérivée nulle. Nous obtenons ainsi la
relationcp~(f(tl},t) of'(t)+cp~(f(t),t) =0,soit ·

f'(t) = -(cp~(f(t), t>ri o cp~(f(t), t).


ce qui donne, en revenant aux matrices jacobiennes des différentielles concernées :

etenparticulier,f'(O) = (-1,1/4,-1/4).

Solution II.5.
1) L'application 7r est bilinéaire continue car définie sur un espace normé de dimension fine; elle est donc de
classe ci, et sa différentielle au point (M. N) est l'application linéaire D7r(M, N)(H, K) = H N + M K.
2) Soit A un élément inversible de Mn(IR). Soit HE Mn(IR) et M =A+ H. En désignant par I la matrice
unité, on peut écrire M = (I + H A-i)A. Pour llHll < llA-i11-i, la matrice I + H A-i est inversible
(voir par exemple [T.IX.4.3a]), donc M l'est aussi. Soit n la boule ouverte de Mn(IR), de centre A et de rayon
llA - i 11- i. Tout élément M den est donc inversible.
54 Chapitre II. Fonctions inverses et fonctions implicites

Appliquons à 7r le théorème des fonctions implicites au voisinage du point (A, A-i ), ce qui est possible car,
pour tout H E Mn(IR), 7r~ (A, A-i )(H) = AH, donc 7r~(A, A- 1 ) est bien un isomorphisme. Ce théorème
affirme l'existence d'un voisinage ouvert U de A dans !1 et d'une application cp, de classe ci, définie sur U, telle
que pour tout M E U, 7r ( M, cp( M)) = 7r( A, A - I) = I. On constate que dans ce cas <p est la restriction à U de
</>.L'application </>est donc différentiable au point A et sa différentielle s'obtient en écrivant que la différentielle de
l'application nulle M ,_. 7r(M, </>(M))-I est nulle. On obtient 7r~ (A, </>(A)) +7r~ (A, </>(A)) o D</>(A) = 0
d'où, pour tout HE Mn(IR),
H A-i + AD</>(A)(H) = 0,
et finalement,
D</>(A)(H) = -A-i H A-i.
On remarque lapplication A ,_. D</>( A) est continue car composée d'applications continues. L'application </>est
donc de classe ci, injective et sa différentielle en tout point A de !1 est un isomorphisme. Ainsi (corollaire 2.5),
on peut affirmer que</> est un ci difféomorphisme de !1 sur son image.

Solution II.6.
1 a) Considérons, pour x E !Rn et,\ E IR fixés, l'équation y = A(,\y + x ), d'inconnue y E !Rn. On désigne
par I la matrice n x n unité. L'équation précédente s'écrit encore (I - >.A) y - A x = O. Or, (voir par
exemple [T.IX.4.3a]), pour 1,\1 < 1/llAll, la matrice I - >.A est inversible. Ainsi pour tout (,\,x) E U =
)-1/llAll, 1/llAll [ x !Rn, l'équation donnée a pour unique solution</>(,\, x) = (I - ,\A)- 1 A x.
1 b) Montrons que</> est de classe ci sur U. Cette application est la composée</> = </>3 o </>2 o </>i des applications
suivantes : 1' application </>1 : (,\, x) ,_. (I - >.A, x ), définie sur U; l'application </>2 : ( M, x) ,_. ( M- 1 , x ),
définie sur GLn(IR) x !Rn, où GLn(IR) désigne l'espace vecctoriel des matrices réelles inversibles d'ordre n;
l'application </>3 : (M, X) 1-+ M.A.x, définie sur Mn(IR) X !Rn. Ces applications sont toutes de classe ci'
car chacune de leurs composantes est composée de fonctions usuelles de classe ci. Remarquons en effet que
les espaces normés considérés sont tous de dimension finie, donc toute application linéaire, affine ou bilinéaire
définie sur ces espaces est continue.
La première composante de </>i est une application affine de la variable ,\, sa deuxième composantes est linéaire.
Pour (a,h) E IR x !Rn,D</>1(,\,x)(a,h) = (-aA,h).
La différentielle de </>2 au point (M, x) est l'application linéaire de Mn(IR) x !Rn dans lui-même, (P, h) ,_.
D</>2(M, x) (P, h) = (-M- 1 P M-i, h) (voir l'exercice 5 pour le calcul de la différentielle de l'application
M ,_. M-i).
L'application </>3 est bilinéaire; sa différentielle en (M, x) est donc (P, h) ,_. D</>3(M, x) (P, h) =
PAx+M Ah.
On peut alors calculer la différentielle de </> par la formule de dérivation des fonctions composées, ce qui donne,
pour tout (a, h) E IR x !Rn,

D</>(,\, x)(a, h) = D</>3 ( (I - >.A)-i, x) o D</>2(! - ,\A, x) o D</>i (>., x) (a, h)


= a(I - ,\A)-i A (I - ,\A)-i Ax + (I - >.A)-i Ah.

Mais on sait que D</>(,\,x)(a,h) = a</>~(,\,x) + </>~(,\,x)h, où </>~(>.,x) désigne la dérivée partielle
de </> par rapport à la variable réelle À au sens usuel (voir 1.1.5), et </>~(>., x) sa différentielle partielle par
rapport à x. Par identification des deux formules, on obtient </>~ ( >., x) = (I - >.A)- i A (I - ,\A) - i A x et
</>~(,\,x)h = (I- ,\A)-i Ah.
Pourtoutcouple(,\,x) E U,onabien</>~(,\,x) = </>~(>.,x)<t>(>.,x).
2 a) L'application cp: IR x Ex E-+ E, (>., x, y),_. cp(>., x, y) =y - f(>.y + x), est de classe ci comme
composée d'applications de classe ci. Elle admet, en tout point(.>., x, y), une différentielle partielle par rapport à
la variable y ayant pour expression cp~(,\, x, y) = ide ->.f' (>.y+ x ). En particulier, on a <p~ (0, a, b) = ide,
donc cp~(O, a, b) est un isomorphisme de E. Le théorème des fonctions implicites s'applique donc à cp au
voisinage du point (0, a, b), et permet d'affirmer l'existence d'un voisinage U de (0, a), d'un voisinage V de b
et d'une application </> : U -+ E de classe C 1 tels que, pour tout couple ( ,\, x) E U,

y EV et y= f(>.y + x) ~ y=</>(>., x).


§ 5. Solutions 55

2 b) Pour tout ( .\ x) E U, on a <p ( >., x, 4>( >., x)) = O. On obtient, en calculant successivement la dérivée
partielle (au sens usuel) du premier membre par rapport à>., puis sa différentielle par rapport à x,

<p~ ( >., x, et>(>., x)) + <p~ ( >., x, et>(>., x)) o 4>~ (>., x) = 0,
<p~(>.,x,ct>(>.,x)) +ip~(>.,x,ct>(>.,x)) oct>~(>.,x) =0.

Mais en tout point(>., x, y) E IR. x Ex E, <p~ (>., x, y) =-!'(>.y+ x) y et <p~(>., x, y)= -f'(>.y + x).
On obtient donc :

4>>./ (>., x) = 'Py'( >., x, et>(>., x) )-1 of /(>.et>(>., x) + x).c/> (>., x),
<l>x'( >., x ) = 'Py'( >., x, et>(>., x) )-1 of /(>.<fJ(>., x) + x),

ce qui donne finalement :


4>~(>.,x) = 4>~(>.,x)ct>(>.,x).

Solution II. 7.
1) L'application f est la composée f = 1/; o <p des applications <p : x >-+ (x, x, x), définie sur 13, et
3
1/; : (x, y, z) >-+ x o y oz, définie sur (.C(E, E)) . L'application <p est linéaire continue; sa différentielle
en x est ip'(x) h = (h, h, h), avec h E .C(E, E). L'application 1/; est trilinéaire continue, de différentielle en
(x, y, z) est 'lj;'(x, y, z) (h, k, l) = hoy oz +x okoz +x oyol, avec (h, k, l) E (.c(E, E) ) 3 . Ceci montre
que f est différentiable en tout point x E l3 et que sa différentielle vérifie, pour tout h E .C( E),

f 1(X) h = 'lj; 1(X 1 X 1 X) 0 <p 1(X) h =h0 X 0 X +X 0 h 0 X +X 0 X 0 h.

De plus, f est de classe C 1 car les applications <p et 1/; le sont.


2 a) Pour x = idE +y E l3 eth E .C(E, E),
llh oX oX - hll = llh oY oY+ 2h oYll $ llhll(llYll 2 + 2llYll) ·
En faisant un calcul analogue pour chacun des termes de l'expression de Il!' (x) h - 3I hll, on trouve

11/'(x) h - 3I hll $ 3llhll(llx - idE 11 2 + 2llx - idE Il),


d'où llf'(x) - 3Ill $ 6llx - idE Il+ 3llx - idE 11 2 .
2 b) Puisque llx - idE Il < 1/3, on déduit du résultat précédent 11(1/3)!' (x) - Ill < 1. Ainsi (1/3)f' (x), et
par suite f' (x ), sont des éléments inversibles de .C(E, E).
3 a) L'application g : l3--+ .C(E, E), g(x) = f(x) - 3x, est de classe C 1 car somme d'applications de classe
C 1 ; pour tout x E 13, g 1 (x) = f' (x) - 3I. Appliquons à g le théorème des accroissements finis entre deux
points x et y de l3 en remarquant que

7
sup llg'(x)ll $ sup ( 6llx - idE Il+ 3llx - idE 11 2 ) $ - .
xEB xEB 3

Nous obtenons llg(x) - g(y) Il $ (7 /3) llx - Yll ·


3 b) D'après la question précédente, pour tous x et y E 13,

2
11/(x) - /(y)ll = llg(x) - g(y) + 3(x -y)ll? 3llx - Yll - llg(x) - g(y)ll? 3llx - Yll,
ce qui prouve que l'application f est injective.
Les propriétés qui viennent d'être établies permettent d'appliquer à fla forme globale du théorème des fonctions
inverses (corollaire 2.5). On peut donc conclure que f est un C 1 -difféomorphisme de l3 sur f(l3).

Solution II.8.
1) L'application F : Mn(IR.) --+ Mn(IR.), F(A) = A 2 , est composée des applications, toutes deux de classe
C 1 , A >-+ (A, A) définie sur Mn(IR.), et (A, B) >-+ AB définie sur Mn(IR.) x Mn(IR.). Ainsi Fest de
56 Chapitre II. Fonctions inverses et fonctions implicites

classe ci. En appliquant la formule donnant la différentielle d'une fonction composée on obtient, pour tout A
et HE Mn(lR), F'(A)H =AH+ HA.
2) En particulier, pour tout HE .Mn(lR), F'(I) H = 2H, ce qui montre que F'(I) est un isomorphisme de
Mn(lR). Appliquons alors à F le théorème d'inversion locale 2.4, au voisinage de I: il existe un voisinage
ouvert U de I tel que V = F(U) soit un ouvert de Mn(lR) et que F soit un ci-difféomorphisme de U sur V.
Nous remarquons que F(I) = I. Désignons par G la bijection réciproque de F. Ainsi V est un voisinage ouvert
de I et, pour tout A E V, F(G(A)) = G(A) 2 =A. De plus, Gest de classe ci sur V.
3) Le calcul donne F' (J) H = 0, ce qui prouve que le noyau de l'endomorphisme F' (J) contient H, donc que
F' ( J) n'est pas inversible. Supposons qu'il existe une application différentiable G, définie dans un voisinage V de
I,tellequeG(J) = JetquepourtoutA E V,G(A) 2 = A.Onauraitalors,pourtoutA E V,F(G(A)) =A.
En calculant la différentielle en A de l'application composée F o G, on obtiendrait F' ( G(A)) o G' (A) = I,
en notant I l'application identitique de M2 (JR). En faisant A = I, on aurait F' (J) o G' (I) = I. L'application
linéaire F' ( J) serait surjective, donc bijective car l'espace considéré M2 (JR) est de dimension finie. Or ceci est
impossible. Il n'existe donc pas d'application différentiable G définie au voisinage de I telle que G(J) = Jet
G(A) 2 =A, pour A voisin de J.

Solution Il.9.
1) L'application N: y,_. N(y) = IY'(O)I + llY"ll est une norme sur E. En effet si y E E vérifie N(y) = 0,
alors IY' (0) 1 = 0 et y" = 0, donc y' est l'application nulle; puisque par hypothèse y(O) = 0, l'application y
est nulle aussi. Les autres propriétés se vérifient facilement en remarquant que la dérivation est une opération
linéaire.
Comparons maintenant llYll et N(y). Nous avons, pour tout t E [O, 1],

y(t) = ty'(O) + 1t (1 5
y"(u)du) ds,

d'où ly(t)I::::; N(y) et finalement, !IYll::::; N(y) (*).


Montrons que E muni de la norme N est un espace de Banach. Soit (Yn , n E N) une suite dans E, de Cauchy
pour la norme N. Les !'inégalités IY' (0)1 ::::; N(y) et llY" Il ::::; N(y) montrent que la suite (y~ (0)) est de Cauchy
dans lR et que la suite (lly~ll) est de Cauchy dans l'espace F muni de la norme de la convergence uniforme.
Comme IR et F sont cmplets, ces deux suites convergent; soient a E IR et g E F leurs limites respectives.
Posons, pour tout t E [O, 1],

Nous définissons ainsi une fonction numérique y, de classe C 2 sur [O, 1], telle que

y(O) = 0, y'(O) =a, y"= g.

De plus, N(yn - y) = IY~ (0) - al + llY~ - gll. donc limn-+oo N (Yn - Y) = O. D'après l'inégalité ( *),
limn-+co llYn - Yll = 0, d'où en particulier limn-+oo Yn(l) = y(l) =O.
Nous avons ainsi montré que y E E et que la suite (yn) converge vers y dans E muni de la norme N, ce qui
prouve que cet espace est complet.
2) Soit f : E --> F l'application f(y) = -y"+ y 3 . L'application y ,_. -y" est linéaire continue, car
pour tout y E E, Il - y"ll ::::; N(y). L'application y ,_. y 3 est composée des applications différentiables
y ,_. (y, y, y) définie sur E, et ( x, y, z) ,_. x y z définie sur E 3 ; le calcul de sa différentielle en y se fait comme
dans l'exercice 7. Ces applications sont toutes de classe ci, donc f l'est aussi. On obtient, pour tout h E E,

!'(y) h = -h" + 3y 2 h.
3 a) L'application f'(O) a pour expression f'(O) h = -h", avec h E E. Supposons que f'(O) h =O. Alors
h" = 0, donc h' est constante eth est affine. Or h(O) = h( 1) = 0, donc h est nulle sur [O, 1]. Nous avons ainsi
prouvé que f'(O) est injective. Montrons maintenant que cette application linéaire est surjective. Soit h E F,
cherchons l E E telle que -h" = l. Il est facile de vérifier quel, définie, pour t E [O, 1], par

l(t) = -1t (1 5
h(u)du) ds-t->..t+µ,
§ S. Solutions 57

convient, à condition de choisir les constantes réelles À et µ de manière telle que les conditions l(O) = O et
!(1) = 0 soient satisfaites. On trouveµ= 0, puis À= j 01 ( j 08 h(u) du) ds. Cela donne l'expression del et,
simultanément, prouve son existence. Ainsi, f' (0) est inversible.
3 b) Il s'agit ici de montrer que, si 9 E Fest assez petit, en norme, l'équation différentielle f (y) = 9, d'inconnue
y E E, admet au moins une solution. Appliquons à la fonction f le théorème d'inversion locale 2.4 au voisinage
de 0 : il existe un voisinage V de 0 dans E tel que la restriction de f à V soit un C 1-difféomorphisme de V sur
le voisinage ouvert f(V) de f(O) = 0 dans F. Le voisinage f(V) de 0 contient une boule ouverte, centrée
sur ce point et de rayon i:: > O. Si l'élément 9 de F appartient à cette boule, c'est-à-dire s'il vérifie 11911 < i::, il
existe X dans Etel que J(X) = 9, c'est-à-dire -X" + X 3 = 9.

Solution Il.10.
1) Nous avons, pour tout f E E, <P(J) = <p(J, !), oil <p: Ex E-+ E est l'application

<p(J, 9)(x) = 1" f(t)9(t)dt.

L'application <p est donc composée de f ,_. (!,!),qui est une application linéaire continue (donc de classe C 1)
de E vers E x E, et de l'application <p, qui est une application bilinéaire de Ex E vers E. L'application <p est
continue, car pourtous (!, 9) E E x E, 11 'P(J, 9) Il ::; Il f 1111911 ; elle est donc de classe C 1. Par suite, <P est de
classe C 1 . Sa différentielle au point f est l'endomorphisme h >-> <P' (!) h de l'espace E, ayant pour expression

(<P'(J)h)(x) = 21" J(t)h(t)dt, x E [0, l].

Pour tout h E E et tout x E [O, 1], nous avons l'inégalité IW (!) hll ::; 211/ llllhll. donc IW (!)Il ::; 211/11.
2) Pour tous (J,9) E Ex Eetx E [O, 1], on a

1( 1/J(J) -1/;(9)) (x) 1 ~ IJ(x) - 9(x)I - 2 11" 0 IJ(t) - 9(t)l IJ(t) + 9(t)I dt

~ IJ(x) - 9(x)I - 2 11" 0 IJ(t) - 9(t)I (IJ(t)I + l9(t)I) dt


1
~ IJ(x) - 9(x)I - 2CllJll + ll9IDllJ- 911

d'où le résultat

111/J(J) -1/;(9)11 ~ ( 1- ~(llJll + 11911)) Il! - 911 ·


Supposons de plus f et 9 E 13, c'est-à-dire 11!11 < 1et11911 < 1. Dans ce cas, 1 - (ll!ll + 11911)/2 > 0, donc
111/J(J) -1/;(9)!1 = 0 entraîne Il! - 911 = 0, ce qui prouve que la restriction de 1/J à 13 est injective.
3) L'application 1/J = I + (1/2)</J est différentiable sur E et sa différentielle, en un élément f de E, est
1/J'(f) = I + (1/2)</J'(f). De plus, si f E 13, 11(1/2)</J'(J)ll < 1, donc 1/J'(f) est un élément inversible
de .C(E, E). L'application 1/J vérifie sur l'ouvert 13 toutes les hypothèses du corollaire 2.5 (forme glogale du
théorème d'inversion). La restriction de 1/J à 13 est donc un C 1-difféomorphisme de 13sur1/;(13).

Solution Il.11.
1) Notons I l'application identique de .C(E, E). Pour tout X E .C(E, E), nous avons

1 1
(9 - z) (X)= 2(I - A) 0 X+ 2x 0 (I - A).

En utilisant les propriétés des normes dans .C(E, E), nous en déduisons Il (9 - z) (X)ll ::; III - Ali llXll. Il
en résulte, puisque A E 131.
119 - Ill ::; III - Ali < 1,
58 Chapitre II. Fonctions inverses et fonctions implicites

ce qui prouve que g est un élément inversible de .c( .C(E, E), .C(E, E)).
2) On démontre comme dans les exercices 7 ou 8 que f : .C(E, E) ---+ .C(E, E), M >---> f (M) = M 2 , est de
classe C 1 et que sa différentielle au point M est f' (M) X = Mo X+ X o M. Soit alors A E B 1 . D'après
la question précédente, f' (A) est un élément inversible de .c(.C(E, E), .C(E, E)).
3) La série entière E:=o antn a pour rayon de convergence 1. Soit X E .C(E, E). La série E:=o anXn
est donc normalement convergente dès que llXll < 1 (voir par exemple [T.IX.4.2]), et sa somme est un élément
<f>(X) de .C(E, E). On définit ainsi une application</> de Bo dans .C(E, E).
Puisque ao = 1, 11</>(X) - Ill ~ E:=l lanl /IX/ln. La suite (an, n EN*) est alternée: pour tout n EN*,
lanl = (-l)n+lan, donc E:=l lanl /IXlln = - L~i (an)(-/IXll)n = 1- J1 - llXll < l. Ainsi
11</>(X) - Ill ~ 1, ce qui prouve que </>(X) E Bi.
Le calcul donne f (</>(X)) = (</>(X)) 2 = I + X. II suffit en effet de remarquer que pour tout t E J - 1, 1 [,
2
( E:=o antn) = 1 + t, et que chacun des termes de la série E:=o anXn commute avec tous les autres;
le calcul des coefficients de la série produit se fait dans les deux cas de la même manière.
Soit h : Bi ---+ Bo l'application h(M) = f(M)-I. On vérifie que ho<f> = id13 0 , où id13 0 désigne l'application
identique de Bo. Ceci montre que</> est une application injective.
On déduit des résultats de la question 2que l'application hestdeclasse C 1 et que, pour A E Bi, h' (A) = J' (A),
donc que h' (A) est inversible.
Soit B E Bo et A = <f>(B). L'application du théorème d'inversion locale 2.4 à h, au voisinage de A, permet
d'affirmer l'existence d'un voisinage U de A contenu dans Bi tel que h soit un C 1 -difféomorphisme de U
;ur l'ouvert f(U) de Bo. L'application réciproque h- 1 est donc égale à la restriction de</> à h(U), qui est un
voisinage ouvert de B dans Bo. Ainsi, l'application </>est de classe C 1 sur Bo. Mais on a vu précédemment
que</> est injective. Les propriétés établies permettent d'appliquer à</> la forme globale du théorème d'inversion
(corollaire 2.5) et de conclure que</> est un C 1 -difféomorphisme de Bo sur <f>(B0 ).
Chapitre 111
Différentielles d'ordre supérieur

Nous étudions dans ce chapitre les propriétés des différentielles d'ordre supérieur d'une
application, en particulier leurs symétries. Nous serons amenés à introduire la notion de
difféomorphisme de classe CP, et à compléter les énoncés des théorèmes d'inversion locale
et des fonctions implicites donnés dans le chapitre précédent. Nous présenterons plusieurs
formes de la formule de Taylor. Nous traiterons enfin de l'application du calcul différentiel
à la recherche des maxima ou minima relatifs d'une fonction différentiable, éventuellement
en présence de liaisons.

1. Définition et propriétés élémentaires


1.1. Lemme. - Soient E et F deux espaces vectoriels normés. On note F0 = F,
F1 = .C(E, F) (espace des applications linéaires continues de E dans F), et, pour
tout entier k 2: 1, Fk = .C(E, Fk-l) (espace des applications linéaires continues
de E dans Fk- 1 ). Pour tout entier k 2: 1, Fk s'identifie, par un isomorphisme
préservant la norme, à l'espace .C(Ek ; F) des applications k fois multilinéaires
continues de Ek =Ex · · · x E (k facteurs) dans F.
Preuve:Lapropriétéestvraiepourk = l,puisqueE 1 = E,.C(E 1 ; F) = .C(E,F) = F 1.
Supposons la vraie pour k = p, avec p entier 2: 1, et montrons qu'elle est vraie pour
k = p + 1. D'après l'hypothèse de récurrence, Fp s'identifie, par un isomorphisme
préservant la norme, à .C(EP ; F). L'espace Fp+l s'identifie donc, par un isomorphisme
préservant la norme, à .C(E,.C(EP; F)). Mais (voir par exemple [T.IX.3.6]) celui-ci
s'identifie, par un isomorphisme préservant la norme, à .C(EP+ 1 ; F). D
1.2. Remarque. - La définition de l'isomorphisme préservant la norme qui permet
d'identifier Fk à .C(Ek ; F) est simple et naturelle (voir par exemple [T.IX.3.6]). Pour
k = p + 1 (avec p entier 2'. 1), et en supposant Fp déjà identifié à .C(EP ; F), cet
isomorphisme associe à chaque élément cp de .C(E, .C(EP ; F)) l'application de EP+ 1
dans F: (x1, ... ,xp+1) 1--+ (cp(xi))(x2, ... ,Xp+i)·
1.3. Lemme. - Soient E et F deux espaces vectoriels normés, et k un entier
2'. 2. L'ensemble des applications k fois multilinéaires continues et entièrement
symétriques de Ek dans F, c'est-à-dire l'ensemble des éléments cp de .C(Ek ; F)
qui vérifient, pour tout (h 1 , ... , hk) E Ek et toute permutation T de { 1, 2, ... , k },
cp(hr(l)> · · ·, hr(k)) = cp(h1, ·. ·, hk),
est un sous-espace vectoriel fermé de .C(Ek ; F). On le notera .Cs(Ek ; F).
Preuve: Pour toute permutation T de { 1, 2, ... , k }, soit Xr : .C(Ek ; F) ~ .C(Ek ; F)
l'application définie par
(Xr(cp))(h1, · · ·, hk) = cp(hr(l)• · · ·, hr(k)) ·
60 Chapitre III. Différentielles d'ordre supérieur

Il est facile de vérifier que Xr est une isomorphisme préservant la norme de C(Ek ; F)
sur lui-même. Le noyau de l'application de C(Ek; F) dans lui-même, <p 1--+ <p - Xr(<p),
est donc un sous-espace vectoriel fermé de C( Ek ; F). Mais Cs (Ek ; F) n'est autre que
l'intersection de ces noyaux, lorsque T parcourt l'ensemble de toutes les permutations de
{ 1, 2, ... , k }. C'est donc un sous-espace vectoriel fermé de C(Ek ; F). O

1.4. Corollaire. - Soient E et F deux espaces vectoriels normés, F étant complet.


Pour tout entier k 2: 2, l'espace Cs(Ek ; F) des applications k fois multilinéaires
continues et entièrement symétriques de Ek dans F est complet.
Preuve : On sait en effet (voir par exemple [T.IX.3.7]) que C(Ek ; F) est complet, et que
tout sous-espace fermé d'un espace métrique complet est complet. D
1.5. Les différentielles d'ordre supérieur d'une application. - Soient E et F deux
espaces vectoriels normés, U un ouvert de E et f une application de U dans F. Supposons f
différentiable dans U, et notons f' sa différentielle. Avec les notations du lemme 1.1, f'
est une application de U dans F 1 = C(E, F). Si elle est différentiable en un point a E U,
sa différentielle (!')' (a) en ce point, appelée différentielle seconde de f au point a, est un
élément de F 2 = C(E, F 1 ); elle est notée J"(a) ou D 2 J(a).
Soit k un entier 2: 1. Supposons qu'en appliquant plusieurs fois Je raisonnement ci-dessus,
nous ayons défini, en tout point x d'un ouvert V de E, V c U, la différentielle d'ordre k
de f en x, notée j(k) (x ). La différentielle d'ordre k de f est l'application J(k) : V ~ Fk>
x 1--+ J(k) (x ). Si cette application est différentiable en un point a de V, sa différentielle en
ce point est, par définition, la différentielle d'ordre k + 1 de f au point a. C'est un élément
de J'espace Fk+l = C(E, Fk), noté J(k+l) (a), ou D(k+l) f(a).
Le lemme 1.1 permet d'identifier, pour tout entier k 2: 1, l'espace Fk avec l'espace
C(Ek ; F) des applications k fois multilinéaires continues de Ek dans F. Nous pouvons
donc considérer la différentielle J(k)(a) de f en un point a de U, si elle existe, comme
un élément de C(Ek ; F), et la différentielle J(k) de f, si elle existe en tout point de U,
comme une application de U dans C(Ek ; F).
Ces considérations sont formalisées dans les définitions suivantes.
1.6. Définitions. - Soient E et F deux espaces vectoriels normés, U un ouvert de E
et f une application de U dans F. On suppose que f est n - 1 fois différentiable
dans U, n étant un entier 2: 2, et on note J(n-l) : U ~ Fn-l = C(En-l ; F) sa
différentielle d'ordre n - l.
On dit que f est nfois différentiable en un point a de U si J(n-l) est différentiable
en a. La différentielle de j(n-l) en a est appelée différentielle d'ordre n de f en a, et
notée J(n)(a).
On dit que f est nfois différentiable dans U si elle est n fois différentiable en tout
point de U. Sa différentielle d'ordre n, notée J(n), est l'application qui associe à
chaque point x de U la différentielle d'ordre n de f en x, J(n)(x).
On dit que J est de classe en dans U si elle est n fois différentiable dans U et si
sa différentielle d'ordre n est continue dans U.
On dit que f est de classe C 00 dans U si, pour tout entier n 2: 1, elle est de classe
en dans u, c'est-à-dire si elle possède sur u des différentielles de tous ordres
continues.
1.7. Remarques. - Soient E et F deux espaces vectoriels normés, U un ouvert de E et
f une application de U dans F.
a) Par commodité, on pose f(o) = f, et on convient de dire que f est de classe e0 sur U
si elle est continue sur U.
§ 1. Définition et propriétés élémentaires 61

b) Si l'application f est n fois différentiable en un point a E U (avec n entier 2 2),


il existe nécessairement un voisinage ouvert V de a, V c U, tel que f soit n - 1 fois
différentiable dans V. En effet, J(n) (a) étant, par définition, la différentielle de J(n-l) en
a, son existence suppose celle de J(n-l) sur un voisinage ouvert de a.
c) Si f est n fois différentiable dans U (avec n entier 2 2), elle est de classe cn-l dans
U, car J(n-l), étant différentiable en tout point de U, est continue sur U. Si f est de classe
en dans U, elle est aussi de classe cm
dans U pour tout entier m vérifiant O ::; m ::; n.
d) Si f est m + n fois différentiable en un point a E U, met n étant des entiers tous deux
> 0, le point a possède un voisinage ouvert V c U tel que f soit n fois différentiable dans
V. La différentielle d'ordre n de f en a, J(n), est m fois différentiable au point a, et sa
différentielle d'ordre m, (j(n)) (m) (a), n'est autre que J(m+n)(a), différentielle d'ordre
m + n, de f au point a.
1.8. Quelques exemples
a) Applications constantes. - Toute application constante d'un ouvert U d'un espace
vectoriel normé E dans un espace vectoriel normé F est de classe C 00 , et ses différentielles
de tous ordres 2 1 sont identiquement nulles.
b) Applications linéaires. - Soient E et F deux espaces vectoriels normés. Toute
application linéaire continue f E .C(E, F) est de classe C 00 , et pour tout x E U,
f' (x) = f; la différentielle première f' de f étant constante, pour tout entier k 2 2,
sa différentielle d'ordre k, J(k), est identiquement nulle.
c) Applications bilinéaires et multilinéaires. - Soient Ei, E 2 et F trois espaces
vectoriels normés. Toute application bilinéaire continue f E .C(E1, E2 ; F) est de classe
C 00 • Sa différentielle première est l'application linéaire de E1 X E2 dans .C(E1 X E2, F)
(x1, x2) f---+ J' (x1, x2); avec J' (x1, x2) (h1, h2) = J(h1, x2) + J(x1, h2) ,
où (x 1 , x 2) et (h1, h2) sont éléments de E 1 x E 2 . La différentielle seconde de J est donc
constante, et a pour expression
J" (Xi, X2) ( (h1, h2), (ki, k2)) = f (h1, k2) + f (ki, h2) ·
Pour tout entier k 2 3, la différentielle d'ordre k de f est identiquement nulle.
Ces propriétés s'étendent aisément au cas d'une application p fois multilinéaire continue
(pétant un entier 2 1 quelconque).
1.9. Proposition. - Soient E et F deux espaces vectoriels normés, U un ouvert
de E et f une application de U dans F. Pour tout entier n 2 1, l'ensemble
des applications de U dans F n fois différentiables en un point a de U (resp.,
n fois différentiables sur U, resp., de classe en
sur U) est un espace vectoriel, et
l'application qui associe à une application élément de cet espace sa différentielle
d'ordre n au point a (resp., sa différentielle d'ordre n) est linéaire.
Preuve : Montrons que l'ensemble des applications de U dans F n fois différentiables en
un point a de U est un espace vectoriel et que l'application qui associe à un élément de
cet espace sa différentielle d'ordre n au point a est linéaire. Cette propriété est vraie pour
n = 1 (proposition 1.1.10). Supposons la vraie pour n ::; m - 1, avec m 2 2. Soient J et g
deux applications m fois différentiabes au point a, et À E OC un scalaire. Les applications
f et g sont m - 1 fois différentiables sur un voisinage du point a, et leurs différentielles
D f et Dg sont m - 1 fois différentiables au point a. Donc D(J + g) et D( Àj) existent
sur un voisinage du point a et vérifient
D(J+g)=DJ+Dg, D(ÀJ) = ÀDf.
62 Chapitre III. Différentielles d'ordre supérieur

D'après l'hypothèse de récurrence, D(J + g) et D(Àf) sont m - 1 fois différentiables au


point a, et
nm- 1 (D(J + g))(a) = nm- 1 (DJ)(a) + nm- 1 (Dg)(a),
nm- 1 (D(Àf))(a) = ÀDm- 1 (DJ)(a),
c'est-à-dire
Dm(!+ g)(a) = Dmf(a) + Dmg(a), Dm(Àf)(a) = ÀDm f(a),
ce qui prouve que la propriété que nous voulons prouver est vraie pour n = m.
Les propriétés analogues concernant les espaces des applications n fois différentiables sur
U, ou de classe ensur U, s'en déduisent immédiatement. o

2. Symétrie des différentielles d'ordre supérieur


2.1. Théorème. - Soient E et F deux espaces vectoriels normés, U un ouvert de E
et f une application de U dans F. On suppose f deux fois différentiable en un
point a EU. Sa différentielle seconde J"(a) au point a est élément de .Cs(E 2 ; .f),
c'est-à-dire est une application bilinéaire continue et symétrique de E 2 dans F.
Preuve : L'existence de f"(a) implique celle d'un réel r > 0 tel que la boule ouverte
B(a, r)soit contenue dans U et que f soit différentiable sur cette boule. Pour tous u et
v E E vérifiant llull < r /2, llvll < r /2, posons
A(u, v) = f(a + u + v) - f(a + u) - J(a + v) + J(a).
Nous pouvons écrire
A(u, v) - J"(a)(u, v) = f(a + u + v) - f(a + v) - J'(a + u)(v) + J'(a)(v)
- (f(a + u) - J(a))
+ (J'(a + u) - J'(a) - J"(a)(u)) (v).
Considérons momentanément u E B(O, r /2) comme fixé, et posons, pour tout élément x
de B(O, r /2),
H(x) = J(a + u + x) - J(a + x) - J'(a + u)(x) + J'(a)(x).
Nous pouvons alors écrire
A(u, v) - J"(a)(u, v) = H(v) - H(O) + (f'(a + u) - J'(a) - J"(a)(u)) (v),
donc, d'après Je théorème des accroissements finis,
llA(u,v) -J"(a)(u,v)ll
:S llH(v) - H(O)ll + llJ'(a + u) - J'(a) - J"(a)(u)llllvll
:::; ( sup llH'(Àv)ll + llJ'(a + u) - J'(a) - J"(a)(u)ll) llvll ·
099
Mais d'autre part
H'(x) = J'(a + u + x) - J'(a + x) - J'(a + u) + J'(a)
= J'(a + u + x) - J'(a) - J"(a)(u + x)
- (f'(a + x) - J'(a) - J"(a)(x))
- (f'(a + u) - J'(a) - J"(a)(u)),
donc
llH'(x)ll :::; llJ'(a + u + x) - J'(a) - J"(a)(u + x)ll
+ llJ'(a + x) - J'(a) - J"(a)(x)ll
+ llJ'(a + u) - J'(a) - J"(a)(u)ll ·
§ 2. Symétrie des différentielles d'ordre supérieur 63

Puisque f" (a) est la différentielle de f' au point a, pour tout é > 0, il existe rJ > 0 tel
que, pour tout z E U vérifiant llz - ail :S 'f),
llf'(z) - J'(a) - J"(a)(z - a)il :S éjjz - ail·
De plus, nous pouvons choisir rJ de telle sorte qu'il vérifie rJ < r. Imposons à u et x de
vérifier
llxll :Si·
Nous avons alors aussi
llu + xll :S 'fJ,
donc
llH'(x)ll :S é(liu + xll + llull + llxll) :S 2é(llull + llxll) ·
Nous avons aussi
llJ'(a + u) - J'(a) - J"(a)(u)ll :S éllull ·
Imposons maintenant à v de vérifier

llvll :S i·
Alors x = >.v, avec 0 :S >. :S 1, vérifie llxll :S rJ/2, donc
sup llH'(.Xv)ll :S 2é sup (iiull + 11.Xvll) = 2é(llull + llvll) ·
O~À~l O~À~l

Nous en déduisons
llA(u, v) - J"(a)(u, v)ll :S
é(3llull + 2llvll)llvll :S 2é(llull + llvli) 2 ·
Nous avons donc, pour tous u et v E E vérifiant llull :S rJ/2, llvll :S rJ/2,
llJ"(a)(u,v)- J"(a)(v,u)ll :S llJ"(a)(u,v)-A(u,v)ll + llA(u,v) - J"(a)(v,u)ll ·
Mais A vérifie évidemment
A(v, u) = A(u, v),
donc, en permutant les rôles de u et v,
llJ"(a)(u,v) - J"(a)(v,u)ll :S llJ"(a)(u,v) -A(u,v)ll + llA(v,u)- J"(a)(v,u)ll
:S 4é(liull + llvli) 2 .
Soient x et y deux éléments non nuls de E. Posons
'f} 'f}
u = 2llxllx, v = 2jjyjjy.
D'après leur définition, u et v sont de norme rJ/2. Nous pouvons écrire, puisque f" (a) est
bilinéaire,
llJ"(a)(x, y) - J"(a)(y, x)ll :S l6é llxll llYll ·
Mais é > 0 étant arbitrairement petit, cela implique, pour tout couple (x, y) d'éléments
non nuls de E,
J" (a)(x, y) = J" (a)(y, x).
Cette même égalité reste évidemment vérifiée si x = 0 ou si y = 0, puisque dans ce cas
ses deux membres sont nuls. D
64· Chapitre III. Différentielles d'ordre supérieur

2.2. Lemme. - Soient E et H deux espaces vectoriels normés, V un ouvert de E


et g une application de V dans H, On suppose que g est à valeurs dans un sous-
espace vectoriel fermé H 1 de H, et qu'elle est différentiable en un point a de V, Sa
différentielle g'(a) en ce point, qui est élément de L(E, H), applique en fait E dans
le sous-espace vectoriel H 1 de H. On peut donc la considérer comme un élément
de L(E, H1).
Preuve : Soit u E E. Considérons l'application, dont le domaine de définition contient un
intervalle ouvert I contenant l'origine,
t r---> g(a +tu).
D'après le théorème de différentiation des applications composées, cette application est
dérivable à l'origine, et sa dérivée en ce point est égale à g'(a)(u). Mais cette dérivée
s'exprime comme une limite:
'( )( )
g a u = .
11m g(a +tu) - g(a)
t-+0,t#O t
Pour tout t E J, l'expression dont nous cherchons la limite est élément du sous-espace
vectoriel fermé H 1 de H. La limite g' (a) (u) est donc nécessairement élément de H 1 . D
2.3. Théorème. - Soient E et F deux espaces vectoriels normés, U un ouvert
de E et f une application de U dans F. On suppose que f est n fois différentiable
en un point a de U (n entier 2: 2). Sa différentielle d'ordre n en ce point, J(n)(a),
est une application n fois multilinéaire continue, entièrement symétrique, de En
dans F.
Preuve : D'après le théorème 2.1, la propriété à établir est vraie pour n = 2. Supposons cette
propriété vraie pourtoutentier n vérifiant 2 :::; n :::; p, avec p entier 2: 2, et montrons qu'elle
est vraie pour n = p + 1. Par définition, f(P+ 1)(a) est la différentielle en a de f(P), qui
existe sur un voisinage ouvert V de a, V c U. D'après l'hypothèse de récurrence, f(P) est
à valeurs dans le sous-espace vectoriel Ls(EP; F) de L(EP; F), qui est fermé d'après
le lemme 1.3. Mais le lemme 2.2 montre alors que sa différentielle au point a, c'est-à-dire
j(p+l) (a), est élément de L( E, Ls(EP ; F)). En d'autres termes, f(P+l) (a), considérée
comme application p + 1 fois multilinéaire continue de EP+ 1 dans F, est symétrique en
ses p derniers arguments, c'est-à-dire vérifie, pour tout (h 1, ... , hp+ 1) E EP+ 1 et toute
permutation r de { 2, 3, ... ,p + 1 },
f(p+l)(h1, hr(2)> · · ·, hr(p+1)) = f(P+ 1\h1, hz, · · ·, hp+1) · (*)
D'autre part, J(p+l) (a) est la différentielle seconde au point a de f (p-1), définie sur le
voisinage V de a. Le théorème 2.1 montre que J(p+l)(a) est une application bilinéaire
symétrique continue de E 2 dans L(EP- 1 ; F). En d'autres termes, J(p+l) (a), considérée
comme application p + 1 fois multilinéaire continue de EP+ 1 dans F, est symétrique en
ses deux premiers arguments, c'est-à-dire vérifie, pour tout (h 1, ... , hp+ 1) E EP+1,
= f(p+l)(h1, h2, h3, ... , hp+1).
f(p+l)(h2, hi, h3, ... , hp+1) (**)
Soit a une permutation quelconque de { 1, 2, ... , p + 1 } . Nous allons montrer que, pour
tout (h1, ... ,hp+l) E EP+ 1,
J(p+l) (ha(l), ha(2)> · · ·, ha(p+l)) = J(p+l) (h1, h2, · · ·, hp+l) · (***)
Si a(l) = 1 nous avons, pour tout entier i vérifiant 2:::; i:::; p + 1, a(i) = r(i), où Test
une permutation de { 2, 3, ... , p+ 1 }. La propriété (***)résulte alors de (*).Si a(l) = i,
avec 2 :::; i :::; p + 1, considérons les permutations À etµ de { 1, 2, ... , p + 1 } définies par
>.(1) = 2, >.(j) = j pour 3:::; j :::; p + 1 ;
>.(2) = 1,
µ(2)=i, µ(i)=2, µ(k)=k pour kE{l, ... ,p+l}, k-::J2, k-::Ji.
§ 3. Propriétés des différentielles d'ordre supérieur 65

La permutation composée T = À o µ o Œ vérifie T(l) = 1; nous pouvons donc la considérer


comme une permutation de { 2, 3, ... , p + 1 }, et écrire
(]' = µ-l o À-l o T = µ O À O T.

En utilisant les propriétés (*)et (**) vérifiées, la première par les permutationsµ et T, la
seconde par la permutation À, nous voyons que Œ vérifie la propriété ( *** ). O
2.4. Application au cas où E est un espace produit. - Soit E = G x H un produit de
deux espaces vectoriels normés G et H, U un ouvert de E et f : U --; F une application de
U dans un autre espace vectoriel normé F. Notons cette application (x, y) 1----t J(x, y), avec
x E G, y E H, (x, y) E U. Supposons f différentiable dans U et deux fois différentiable
en un point (a, b) E U. La différentielle f' (x, y) de l'application f en un point ( x, y) E U
s'exprime, au moyen des différentielles partielles f~(x, y) et f~(x, y) de f en ce point
(proposition 1.3.2), par
J'(x, y)(h, k) = f~(x, y)(h) + f~(x, y)(k), (h, k) E E = G x H.
Les différentielles partielles f~ : U --; C( G, F) et f~ : U --; C(H, F) sont différentiables
au point (a, b), donc possèdent en ce point des différentielles partielles. Notons f::x (a, b) et
f~x (a, b) les différentielles partielles de f~ au point (a, b), respectivement par rapport à la
variable x E G, et par rapport à la variable y E H. De même, notons J::y (a, b) et f ~y (a, b)
les différentielles partielles de f ~ au point (a, b), respectivement par rapport à la variable
x E G, et par rapport à la variable y EH. D'après leurs définitions, f::x(a, b), f~x(a, b),
J::y (a, b) et f~y (a, b), appelées différentielles partielles secondes de f au point (a, b), sont
éléments, respectivement, des espaces C( G, C( G, F)), C(H, C( G, F)), C( G, C(H, F))
et C(H, C(H, F)). Bien entendu (voir par exemple [T.IX.3.6]), ces espaces s'identifient,
par des isomorphismes préservant la norme, respectivementàC(G, G; F), C(H, G; F),
[,( G, H ; F) et[,( H, H ; F). La différentielle seconde f" (a, b) de f au point (a, b), qui
par définition n'est autre que la différentielle de f' en ce point, s'exprime, au moyen des
différentielles secondes de f en (a, b), par
J"(a, b)((h1, k1), (h2, kz)) = r:-r;(a, b)(h1, h2) + 1:x(a, b)(k1, h2)
+ f~y(a, b)(h1, kz) + J:y(a, b)(k1, kz),
avec (h1, k1) et (h2, kz) E E = G x H.
La symétrie de la différentielle seconde f" (a, b) se traduit par les relations
f~x(a, b)(h1, h2) = f~x(a, b)(h2, h1), J;11 (a, b)(k1, kz) = f~'y(a, b)(k2, k1),
f:x(a, b)(k1, h2) = f~y(a, b)(h2, k1), f:x(a, b)(k2, h1) = f~y(a, b)(h1, kz).
Ces propriétés s'étendent sans difficulté aux différentielles d'ordre quelconque de f, et au
cas où l'espace E est un produit d'un nombre fini quelconque d'espaces vectoriels normés.
Dans le cas où U est un ouvert de JR 2 , les différentielles partielles secondes f::x(a,b),
gx(a, b), J:;y(a, b) et f~y(a, b) peuvent être considérées comme éléments de F, car
l'espace Fest isomorphe à C(JR, C(JR, F)), et les relations ci-dessus se réduisent à l'égalité
f~y(a, b) = f:x(a, b),
connue sous le nom de lemme de Schwarz.

3. Propriétés des différentielles d'ordre supérieur

3.1. Théorème. - Soient E, F et G trois espaces vectoriels normés, U un ouvert


de E, V un ouvert de F, f : U --; F une application de U dans F telle que
66 Chapitre III. Différentielles d'ordre supérieur

f(U) C V, et g : V ---+ G une application de V dans G. Pour tout entier n 2: 1,


si f est n fois différentiable en un point a E U et si g est n fois différentiable au
point b = f(a) E V (resp., si f est n fois différentiable sur U et si g est n fois
différentiable sur V, resp., si j est de classe en sur U et g de classe en sur V),
go f est n fois différentiable au point a (resp., n fois différentiable sur U, resp., de
classe en sur u).
Preuve : Nous traiterons par exemple le cas où f est n fois différentiable en a et où g
est n fois différentiable en b = f(a). Le cas où f et g sont de classe en
se démontre de
manière tout à fait analogue.
La propriété à établir est vraie pour n = 1 (proposition 1.1.8). Supposons la vraie pour
n = p, avec p entier 2: 1, et montrons qu'elle est vraie pour n = p + 1. Supposons donc
que f soit p + 1 fois différentiable en au point a de U, et que g soit p + 1 fois différentiable
au point b = f(a) de V. Les différentielles premières f' de f et g' de g existent donc,
respectivement, sur un voisinage ouvert U1 de a et un voisinage ouvert Vi de b. Afortiori, f
et g sont continues, respectivement sur U1 et Vi. donc U{ = U1 n1- 1 (Vi) est un voisinage
ouvert de a, tel que f (un c Vi. D'après la proposition 1.1.8, go f est différentiable en
tout point x E U{, et a pour différentielle
(go J)'(x) = g'(f(x)) o J'(x).
L'application (go!)' : U{ ---+ L,(E, G) est composée de:
- l'application (!, f') : U{ ---+ F x L,(E, F), qui est p fois différentiable en a, puisque
ses deux composantes le sont;
-l'application de V x L,(E, F) dans L,(F, G) x L,(E, F), (y, 'lj;) ~ (g'(y), 'l/J), qui est
p fois différentiable au point ( b, f' (b)), puisque g' est p fois différentiable en b, et que
l'application identique de L,(E, F) est p fois différentiable en tout point, en particulier au
point f' (b);
-l'application de L,(F, G) x L,(E, F) dans L,(E, G), (cp, '1/J) ~ cp o 'lj;, qui est bilinéaire
continue, donc de classe C 00 , et a fortiori p fois différentiable au point (g' (b), f' (a)).
L'hypothèse de récurrence montre alors que (g o !)' est p fois différentiable en a, donc
que g o f est p + 1 fois différentiable en a. D

3.2. Proposition. - Soient E et F deux espaces de Banach isomorphes, et


Isom(E, F) l'ensemble des isomorphismes de E sur F (applications linéaires
bijectives continues ainsi que leurs inverses). L'application cp : lsom(E, F) ---+
lsom(F, E), définie par
cp(u) = u- 1 ,

est de classe e 00 • Sa différentielle, en un pointu E Isom(E, F), a pour expression


cp'(u)(h) = -u- 1 oh o u- 1 .
(

Preuve : Nous savons (voir par exemple [T.IX.4.4]) que Isom(E, F) est un ouvert de
L,(E, F), et que cp est un homéomorphisme de Isom(E, F) sur lsom(F, E). Montrons
que cp est différentiable en u E lsom(E, F). Nous avons, pour tout h E L,(E, F) tel que
u + h E lsom(E, F),
cp(u + h) - cp(u) = (u + h)- 1 - u- 1
= (u+h)- 1 o (u-(u+h)) ou- 1
=-(u+h)- 1 ohou- 1 .
§ 3. Propriétés des différentielles d'ordre supérieur 67

Nous en déduisons
<p( u + h) - <p( u) + u- i 0 h 0 u- i = (u - i - (u + h )- i) 0 h 0 u -i )
donc
ll<p(u + h) - + u-i oh ou-ill :S llu-i - (u + h)-illllhllllu-ill ·
<p(u)
Puisque <p est continue en u, llu-i - (u + h)-ill tend vers 0 lorsque h tend vers O.
L'inégalité ci-dessus montre donc que <p est différentiable en u, et que sa différentielle a
pour expression
<p 1 ( u) (h) = -u - i 0 h 0 u - i .

Pour alléger l'écriture, posons E = .C(E, F), F = .C(F, E). L'application <p1 s'exprime
comme composée :
- de l'application <p : Isom( E, F) -> F, u r-t u- i .;
- de l'application de F dans F x F, v r-t ( v, v);
- de l'application de F x F dans .C(E, F), qui à (v, w) E F x F associe l'application
de E dans F: h r-t -v oh o w.
Nous voyons ainsi que <p 1 est continue, puisque composée d'applications continues. Nous
avons donc montré que <p est de classe ci.
Montrons, par récurrence, que <p est de classe c=, c'est-à-dire est de classe en,
pour tout
entier n 2: 1. On vient de voir que cette propriété est vraie pour-n = 1. Supposons la vraie
pour n = p, avec p entier 2: 1. L'expression de <p1 sous forme de composée de plusieurs
applications, indiquée ci-dessus, montre que <p1 est de classe CP, donc que <p est de classe
CP+l. 0

3.3. Définition. - Soient E et F deux espaces vectoriels normés. Un difféomorphisme


de classe en d'un ouvert U de E sur un ouvert V de F est une application bijective
1: U-> V, de classe en, et dont l'inverse 1-i : V-> U est également de classe
en.
= 1 (définition 11.1.1 ).
Cette définition avait déjà été indiquée dans le cas où n
3.4. Proposition. - Soit 1 : U -> V un difféomorphisme de classe ci d'un ouvert U
d'un espace de Banach E sur un ouvert V d'un espace de Banach F. On suppose I
de classe en, avec n entier 2: 1. Alors 1-i est également de classe en; en d'autres
termes, I est un difféomorphisme de classe en.
Preuve : Pour n = 1, la propriété est évidemment vraie, puisque I est un difféomorphisme
de classe ci. Supposons la vraie pour n = p (avec p entier 2: 1) et montrons qu'elle est
vraie pour n = p + 1. On sait (11.1.2) que l'expression de la différentielle de 1-i en un
point y E V est
u-i)'(y) = (tu-i(y)) )-i
L'application u-i )' : V-> .C(F, E) est donc composée de:
- l'application 1-i : V-> U qui, d'après l'hypothèse de récurrence, est de classe CP;
-1' application I' : U -> Isom( E, F), qui est de classe CP, puisque I est de classe CP+ i;
- l'application u r-t u-i de Isom(E, F) dans Isom(F, E), qui d'après 3.2 est de classe
c=' donc a fortiori de classe CP.
D'après 3.1, u-i )'est de classe CP, donc 1-i est de classe cp+i. 0
68 Chapitre III. Différentielles d'ordre supérieur

3.5. Quelques conséquences


a) Théorème d'inversion locale. - Reprenons les hypothèses et notations du théorème
d'inversion locale (11.2.4). Si, outre ces hypothèses, l'application f est de classe avec en,
n entier 2: 1, la restriction de f au voisinage ouvert V du point a est un difféomorphisme
de classe en
de V sur l'ouvert f(V) de F.
b) Théorème des fonctions inverses. - De même, dans les hypothèses du corollaire
11.2.5 (forme globale du théorème des fonctions inverses), si, outre ces hypothèses,
l'application f est de classe en,
n entier 2: 1, alors f est un difféomorphisme de classe
en.
c) Théorème des fonctions implicites. - De même encore, dans les hypothèses du
théorème des fonctions implicites (11.3.1), si en outre f est de classe avec n entier en,
2: 1, l'application h: W - t Fest de classe en.

4. La formule de Taylor
4.1. Hypothèses générales. - Dans tout ce paragraphe, f : U ---; F est une application
d'un ouvert U d'un espace vectoriel normé E dans un autre espace vectoriel normé F, et
a est un point de U. D'après la définition même de la différentielle d'une application,
lorsque f est différentiable au point a, elle est tangente en ce point, à l'ordre 1, à
l'application affine x ~ f(a) + f'(a)(x - a). Lorsque f est n fois différentiable en
a (n entier 2: 1), la formule de Taylor permet de préciser ce résultat, en montrant que f est
tangente en a à l'ordre n à une application polynomiale de degré n. Ce résultat est la forme
la plus simple de la formule de Taylor, appeléefonne asymptotique. Des hypothèses plus
fortes sur l'application f permettent de le préciser, et conduisent aux deux autres formes
de la formule de Taylor (avec reste de Lagrange, et avec reste intégral). Ces trois formes
de la formule de Taylor sont énoncées et démontrées ci-dessous.
4.2. Théorème [Formule de Taylor, forme asymptotique]. - On suppose que l'appli-
cation f est n fois différentiable en a (n entier 2: l). On a alors

f(a + h) - f(a) - t :,
k=l
f(k)(a)(hk) = o(llhlln).
On a posé
f(k)(a)(hk) = f(k)(a)(h, ... , h), nfacteurs h, h E E.

Preuve : Pour n = 1, cette propriété résulte de la définition même de la diff~rentielle.


Supposons la établie pour n = p- l, et montrons qu'elle est vraie pour n = p, avec p 2: 2.
Puisque l'application f est au moins 2 fois différentiable en a, elle est différentiable
en tout point d'un voisinage ouvert V de a, V c U. L'application f' : V ---; F est
p - 1 fois différentiable en a. D'après l'hypothèse de récurrence, nous pouvons écrire,
puisque (f')(kl(a) = J(k+ 1l(a),
p-1
J'(a + x) - J'(a) - L :,J(k+l)(a)(xk) = o(llxllp-l).
k=l
Donc pour tout E: > 0, il existe T/ > 0 tel que, pour tout x E E vérifiant a + x E V et
llxll :S TJ,
p-1
llJ'(a + x) - J'(a) - L :,J(k+ll(a)(xk)ll :S t:llxllp-l _
k=l
§ 4. La formule de Taylor 69

Choisissons T/ > 0 assez petit pour que la boule fermée de centre a et de rayon T/ soit
contenue dans V. Alors pour tout h E E vérifiant llhll '.S rt. et tout t E JR; vérifiant
0 '.S t '.S 1, nous avons a+ th E V, !lthil '.S T/. et
p-1 k
llf'(a +th) - J'(a) - L ~! J(k+l)(a)(hk)ll '.S êllhllp-ltp-l.
k=l
Posons, pour tout t E JR; vérifiant 0 '.S t '.S 1,
p tk
<p(t) = f(a +th) - L k! f(k)(a)(hk).
k=l
L'application <p est continue sur [O, 1], dérivable sur JO, 1 [, et sa dérivée vérifie
p-1 k
<p'(t) = J'(a + th)(h) -J'(a)(h) - L ~! f(k+l)(a)(hk+ 1 ),

k=l
donc
p-1 k
L
~! f(k+l)(a)(hk)ll iihll '.S EjjhiiPtP-l.
ll<p'(t)il '.S ll!'(a +th) - J'(a) -
k=l
Nous en déduisons (théorème des accroissements finis 1.5 .1)

jj<p(l) - <p(O)!I '.S EjjhjjP r1 tp-1 dt= êjjhljP'


lo P
c'est-à-dire

ce qui établit le résultat annoncé. D

4.3. Lemme. - On suppose que l'application f est n + 1 fois différentiable dans U


(avec n entier 2: 1). Soit h E E, et I un intervalle ouvert de JR; tel que pour tout
t E /, a+ th soit élément de U. L'application 'If; : I---+ F définie par

'lf;(t) = f(a +th)+ Ln

k=l
(1
:! t)k
j(k)(a + th)(hk)

est différentiable dans I et a pour dérivée

'lf;'(t) = (1 - t)n J(n+l)(a + th)(hn+l).


n!

Preuve: Il suffit de dériver terme à terme l'expression de 'If;. Nous avons en effet, pour tout
entier k vérifiant 1 '.S k '.S n,

!!_ ((1 - t)k J<k>(a + th)(hk)) = (1 - t)k f(k+l)(a + th)(hk+l)


dt k! k!
- (1 - t)k-1 f(k)(a + th)(hk).
(k - 1)!
D
70 Chapitre III. Différentielles d'ordre supérieur

4.4. Théorème [Formule de Taylor avec reste de Lagrange]. - On suppose que l'ap-
plication f est n + 1 fois différentiable dans U. Soit h E E tel que le segment
[a, a+ h] soit entièrement contenu dans U. Alors
n 1 llhlln+l
llf(a + h) - f(a) - L:-J(k)(a)(hk)ll ~ sup llf(n+l)(a + th)ll ·
k=l k! (n + 1)! O<t<l
- -

Preuve: La fonction 'l/J : [O, 1] -t F, définie par


(l t)k
= f(a +th)+ L
n
'l/J(t) ~! f(k)(a + th)(hk),
k=l
est continue sur [O, l ], et dérivable sur JO, 1[. D'après le lemme 4.3, elle a pour dérivée, en
tout point t E]O, l],

d'où l'inégalité

11'1/J'(t)ll ~ (l - t)n sup llJ(n+l)(a + ,\h)llllhlln+l ·


n! 09:9
En appliquant le théorème des accroissements finis, nous obtenons

11'1/J(l) - 'l/J(O)ll ~ llhlln+l [1 (l - t)n dt sup llJ(n+l)(a + ,\h)ll-


Jo n! 099
En remarquant que

'l/J(l) - 'l/J(O) = f(a + h) - f(a) - t ~!f(k)(a)(hk),


k=l
nous obtenons la formule indiquée. 0

4.5. Théorème [Formule de Taylor avec reste intégral]. -On suppose l'application
f de classe cn+l dans U, et l'espace vectoriel normé F complet. Soit h E E tel
que le segment [a, a+ h] soit entièrement contenu dans U. Alors

Preuve : Les notations utilisées sont les mêmes que dans la démonstration du théorème
précédent. Puisque j<n+l) est continue sur U, la dérivée 'l/J' de 'l/J est continue sur ]O, l[.
Nous avons donc (voir rappel sur l'intégration des fonctions vectorielles au chapitre V,
paragraphe V.2.4),

'l/J(l) - 'l/J(O) = fo 1 'l/J'(t) dt,


d'où la formule indiquée. 0
§ 5. Maxima et minima relatifs 71

4.6. Remarque. - Supposons l'application f de classe C 00 • Nous pouvons alors


considérer la série
f(a) + f
k==l
~! f(k)(a)(hk).
Elle est appelée développement de Taylor de l'application f au point a. Sa convergence
ne peut être affirmée a priori. Lorsque cette série converge, il n'est pas posible d'affirmer
a priori que sa somme est égale à f(a + h).
Supposons E et F complets. L'application f est dite analytique dans U, ou de classe cw
dans U, si pour tout point a E U, il existe r > 0 tel que, pour tout h E E vérifiant
a+ h E U et llhll < r, le développement de Taylor de f au point a soit absolument
sommable, et de somme égale à f (a+ h). Les applications analytiques sont beaucoup plus
particulières que les applications de classe C 00 , et possèdent de remarquables propriétés.

5. Maxima et minima relatifs


5.1. Description du problème et notations. - Dans ce paragraphe, nous considérons
une fonction f définie sur une partie A d'un espace vectoriel normé E, à valeurs réelles.
Nous nous intéressons aux points de A où la fonction f présente un maximum relatif, ou un
minimum relatif (la définition précise de ces notions est indiquée ci-dessous). La formule
de Taylor établie dans le paragraphe précédent va donner, sous certaines hypothèses, des
méthodes permettant la détermination de ces points.
5.2. Définition. - On dit que la fonction f admet un minimum relatif (resp., un
minimum relatif strict) en un point a E A, s'il existe un voisinage V de a dans E
tel que, pour tout X E V n A, f(x) ~ f(a) (resp., pour tout X E V n A, X i- a,
f(x) > f(a)).
On dit que f admet un maximum relatif (resp., un maximum relatif strict) au point a
si la fonction - f admet un minimum relatif (resp., un minimum relatif strict) au
point a.
5.3. Théorème. - Si la fonction f admet en un point a intérieur à A un minimum
relatif, ou un maximum relatif, et si f est différentiable en a, sa différentielle en
ce point est nulle.
Preuve : Supposons f' (a) i- O. Il existe donc un élément v de E tel que f' (a) (v) i- O. En
remplaçant si nécessaire v par -v, nous pouvons nous ramener au cas où f' (a) (v) > O.
Posons w = v/llvll, et M = f'(a)(w). Nous avons évidemment M >O.
D'après la définition de la différentielle,
f(a + x) - f(a) - J'(a)(x) = o(llxll).
Il existe donc 'T/ > 0 tel que, pour tout x E E vérifiant llxll '.S 'TJ et tel que a +x soit
intérieur à A,
M
IJ(a + x) - f(a) - J'(a)(x)I '.S 2llxll,
donc
J'(a)(x) - ~ llxll '.S f(a + x) - f(a) '.S J'(a)(x) + ~ llxll ·
Soit V un voisinage de a dans E. Le point a étant intérieur à A, il existe e > 0 tel que
e,
pour tout réel t vérifiant ltl :S a+ tw soit intérieur à A et élément de An V. Imposons
de plus e :::; ry. Nous avons alors, dans les mêmes conditions, lltwll = ltl :S 'TJ et, d'après
72 Chapitre III. Différentielles d'ordre supérieur

la double inégalité précédente (dans laquelle nous faisons x = tw),

M(t-1~1) ~f(a+tw)-f(a)~M(t+ l~I),


ce qui prouve que f(a+tw)- f(a) est de même signe que t. Le point a+tw étant élément
de V n A, ceci prouve que f n' admet en a ni minimum relatif, ni maximum relatif. 0
Le théorème ci-dessus donne, sous certaines hypothèses, une condition nécessaire pour
que la fonction f admette un maximum relatif ou un minimum relatif en un point a.
Moyennant des hypothèses de différentiabilité de la fonction considérée plus fortes, nous
allons pouvoir formuler une condition nécessaire plus précise, et aussi des conditions
suffisantes. Pour cela, nous allons rappeler quelques notions sur les formes quadratiques.
5.4. Notions sur les formes quadratiques. - Soit E un espace vectoriel réel, et <p une
forme bilinéaire sur E. Nous supposons <p symétrique, c'est-à-dire telle que, pour tous x
et y E E,
(p(x, y) = <p(y, x).
a) Forme quadratique associée. - On appelle forme quadratique associée à cp
1' application cp : E --+ IR définie par
cp(x) = <p(x,x).
La connaissance de cp détermine <p puisque, pour tous x et y E E,
<p(x, y) = ~ (cp(x +y) - cp(x) - cp(y)) .
b) Forme quadratique positive. -- On dit que la forme quadratique cp est positive si
cp(x) 2: 0 pour tout x E E.
Par abus de langage, on dit aussi que la forme bilinéaire symétrique <p est positive si la
forme quadratique associée cp est positive.
c) Forme quadratique négative. - On dit que la forme quadratique cp est négative (ou,
par abus de langage, que la forme bilinéaire associée <p est négative) si la forme quadratique
-cp est positive.
d) Forme quadratique coercive. - On dit que la forme quadratique cp est coercive s'il
existe .À > 0 tel que, pour tout x E E,
cp(x) 2: .Àllxll 2 .
Par abus de langage, on dit aussi que la forme bilinéaire symétrique <p est coercive si la
forme quadratique associée cp est coercive.
Une forme quadratique coercive est évidemment positive.
e) Forme quadratique non dégénérée. - Considérons maintenant le cas où E est
un espace de Banach et où la forme bilinéaire symétrique <p est continue. Il existe
alors (voir par exemple [T.IX.3.6]) un isomorphisme préservant la norme de .C(E2 ; IR)
sur .C(E, .C(E, IR), associant à <p l'application linéaire continue <p de E dans son dual
topologique E' = .C(E, IR) définie par
(<f(x))(y) = (p(x,y).
On dit que la forme quadratique cp est non dégénérée, ou que la forme bilinéaire symétrique
associée <p est non dégénérée, si l'application linéaire <p: E--+ E' qui lui est associée est
injective, c'est-à-dire si pour tout x E E, x f- 0, il existe y E Etel que <p(x, y) f- O.
On dit que cp est fortement non dégénérée, ou que la forme bilinéaire symétrique associée
<p estfortement non dégénérée, si l'application linéaire continue <p: E --+ E' qui lui est
associée est un isomorphisme de E sur son dual, c'est-à-dire est bijective et d'inverse
continue.
Une forme quadratique coercive est évidemment non dégénérée.
§ S. Maxima et minima relatifs 73

S.S. Théorème [Inégalité de Schwarz]. - Soit cp une forme quadratique positive sur
l'espace vectoriel réel E, et ép la forme bilinéaire symétrique associée. On a, pour
tous x et y E E,
lép(x, Y)l 2 S cp(x)cp(y).

Preuve : Puisque cp est positive, cp(x + ty) ~ 0 pour tous x et y E E et tout t E R Or,
d'après la bilinéarité de ép,
cp(x + ty) = cp(y)t 2 + 2ép(x,y)t + cp(x). (*)
L'expression ci-dessus doit être ~ 0 pour tout t E R Supposons x et y E E fixés.
Si cp(y) = 0, nous devons avoir ép(x,y) = 0, et l'inégalité de Schwarz est vérifiée. Si
cp(y) =J 0, le membre de droite de ( *) est un trinôme du second degré en t, dont la valeur
est ~ 0 pour tout t E R En exprimant que le discriminant de ce trinôme est s
0, nous
obtenons l'inégalité de Schwarz. D
S.6. Théorème. - Les hypothèses et notations sont celles de 5.1. Si la fonction f
admet en un point a intérieur à A un minimum relatif (resp., un maximum
relatif), et si f est deux fois différentiable en a, la forme quadratique associée
à sa différentielle seconde au point a est positive (resp., négative).
Preuve : Supposons par exemple que f admette en a un minimum relatif, et que f" (a) ne
soit pas positive. Il existe alors v E Etel que f"(a)(v, v) <O. On pose w = v/llvll, et on
a llwll = 1, f"(a)(w, w) = -M <O. D'autre part, d'après 5.3, la différentielle f'(a) de
f au point a est nulle. La forme asymptotique de la formule de Tay !or au point a à l'ordre 2
s'écrit
J(a + x) - J(a) - ~J"(a)(x, x) = o(jjxjj 2 ).
Il existe donc TJ > 0 tel que, pour tout x E E vérifiant llxll s TJ et tel que a + x soit
intérieur à A,
1 M
IJ(a + x) - f(a) - 2J"(a)(x,x)I S 411xll 2 ,
donc
1 M
f(a + x) - f(a) S 2J"(a)(x, x) + 4 llxll 2 .
e
Soit V un voisinage de a dans E. Le point a étant intérieur à A, il existe > 0 tel que pour
tout réel t vérifiant ltis e,
a+ tw soit intérieur à A et élément de An V. Imposons de
plus es ry. Dans les mêmes conditions, nous avons litwil = itl s
TJ et, d'après l'inégalité
précédente (dans laquelle nous faisons x = tw ),

f (a + tw) - f (a) S ( ~ - ~) itl 2 ,


ce qui prouve que pour 0 < ltl s e, f(a + tw) - J(a) est strictement négatif. Le point
a + tw étant élément de V n A, ceci contredit l'hypothèse selon laquelle f admet un
minimum relatif en a. D

Les théorèmes 5.3 et 5.6 donnent, dans le cas où a est intérieur à A et f une fois ou deux
fois différentiable en a, des conditions nécessaires pour que f admette en a un minimum
relatif (ou un maximum relatif). Le théorème suivant donne une condition suffisante pour
que f admette en a un minimum relatif strict.
74 Chapitre III. Différentielles d'ordre supérieur

S.7. Théorème. - Les hypothèses et notations sont celles de 5.1. Si la fonction f


est deux fois différentiable en un point a intérieur à A, si sa différentielle première
en ce point est nulle et si sa différentielle seconde en ce point est coercive, f admet
en a un minimum relatif strict.
Preuve : La différentielle seconde J" (a) de f au point a étant coercive, il existe À > 0 tel
que, pour tout x E E,
J"(a)(x, x) 2: .XJlxll 2 •
La forme asymptotique de la formule de Taylor à l'ordre 2 en a nous permet d'écrire
1
f(a + x) - f(a) - 2J"(a)(x, x) = o(Jlxll 2 ).
Il existe donc 'f/ > 0 tel que, pour tout x E E vérifiant llxll ~ 'f} et tel que a +x soit
intérieur à A,
1 À
IJ(a + x) - J(a) - 2J"(a)(x, x)I ~ 411xll 2 ,
donc
1 À
f(a + x) - f(a) 2: 2J"(a)(x,x) - 411xll 2
2: ( À 2 - 4À) llxll 2 ·
Ceci prouve que pour tout x E E vérifiant 0 < llxll < 'f} et tel que a+ x soit intérieur à A,
f (a + x) - J (a) > 0, donc que f admet en a un minimum relatif strict. D

La proposition suivante indique des conditions dans lesquelles on peut affirmer que f" (a)
est coercive.
S.8. Proposition. - Soit E un espace de Banach réel, 0 une forme bilinéaire
continue et symétrique sur E, <p la forme quadratique associée. On note ip: E ~ E'
l'application linéaire continue de E dans son dual topologique E' qui associe à
chaque élément x de Ela forme linéaire ip(x) sur E défi.nie par
ip(x)(y) = ép(x, y), y E E.
Si <p est positive et si ip est un isomorphisme de E sur son dual, <p est coercive.
Preuve : Soit x E E, x #- O. La norme M- 1 de <p- 1 est strictement positive, puisque
ip: E ~ E' est un isomorphisme, c'est-à-dire est linéaire, bijective, continue et d'inverse
continue. Nous avons donc
110(x)ll 2:: MJJxll ·
D'après la définition de la norme d'une application linéaire, il existe y E E vérifiant
llYll = 1 tel que
Jip(x)(y)J = 10(x, Y)I 2:: ~ llxll ·
Compte tenu de l'inégalité de Schwarz, nous en déduisons
M2
<p(x)<p(y) 2:: 4llxll 2 ·
Mais la norme k de 0 est strictement positive et, puisque <p est positive et que llYll = 1,
<p(y) = cp(y, y) ~'. kJJyJJ 2 = k ·
Par suite,

ce qui prouve que <p est coercive. D


§ 5. Maxima et minima relatifs 75

5.9. Corollaire. - Sur un espace vectoriel normé réel E de dimension fi.nie, une
forme quadratique est coercive si et seulement si elle est positive et non dégénérée.
Preuve : Puisque E est de dimension finie, il est complet, et toute forme bilinéaire
symétrique (donc aussi toute forme quadratique) sur cet espace est continue. Soit cp une
forme quadratique sur E, ép la forme bilinéaire symétrique associée, et rp l'application
linéaire de E dans son dual associée à ép. Si cp est coercive, rp est injective puisque pour
tout x E E, x f. 0,
(rp(x)) (x) = ép(x, x) = cp(x) 2: kllxll 2 > 0.
Réciproquement, si cp est positive et non dégénérée, rp est injective. Puisque E et son dual
sont de même dimension, rp est un isomorphisme. La proposition précédente montre alors
que cp est coercive. D
5.10. Application. - Soit f une fonction définie sur une partie A de IR 2 . Nous noterons f
comme une fonction de deux variables réelles x et y, (x, y) t-t f (x, y). Soit (a, b) un point
intérieur à A.
Supposons f différentiable au point (a, b). Sa différentielle en ce point est nulle si et
seulement si ses dérivées partielles en ce point sont toutes les deux nulles :
J~(a,b) = 0, f~(a,b)=O. (1)
Le théorème 5.3 s'exprime donc ainsi, dans le cas particulier considéré : si la fonction f,
supposée différentiable au point (a, b) intérieur à son domaine de définition, admet en ce
point un minimum relatif ou un maximum relatif, ses dérivées partielles en ce point sont
nulles (égalités (1) ci-dessus).
Supposons f deux fois différentiable au point (a, b). Soient J:;x(a, b), f~x(a, b), J:;y(a, b)
et f~y(a, b) ses dérivées partielles secondes au point (a, b). Nous savons d'ailleurs que
f~x (a, b) = J:;y (a, b). La différentielle seconde de f au point (a, b) est la forme bilinéaire
symétrique ép = f" (a, b) sur JR 2 définie par
J"(a,b)((u1,v1), (u2,v2)) = f~x(a,b)u1u2 + f;x(a,b)v1u2
+ f~y(a, b)u1v2 + J;y(a, b)v1v2.
Il lui est associé l'application linéaire rp de JR 2 dans son dual qui, à tout élément
(u 1, v1) de JR 2, fait correspondre l'application linéaire de IR 2 dans IR : (u 2, v2) t-t
J"(a,b)((u 1,v 1),(u2,v 2)). L'espace IR 2 étant identifié avec son dual de la manière
habituelle (pour laquelle un élément (h, k) de IR 2 est identifié à la forme linéaire
(u, v) t-t hu + kv sur IR 2 ), l'application linéaire rp a pour matrice, dans la base usuelle de
JR2,
(2)

La forme quadratique cp sur IR 2 associée à f"(a, b) a pour expression, compte tenu de


f~x(a, b) = J:;y(a, b),
cp(u, v) = f~x(a, b)u 2 + 2f~y(a, b)uv + J;y(a, b)v 2 .
Elle est positive si et seulement si le discriminant du trinôme associé est négatif ou nul et
les coefficients des termes en u 2 et en v 2 sont positifs ou nuls, ce qui se traduit par

f~x(a,b) 2: 0, J;y(a,b) 2: 0, (f~y(a,b)) 2 :::; f~x(a,b)J;y(a,b). (3)


Le théorème 5.6 s'exprime donc ainsi, dans le cas particulier considéré: si la fonction f,
supposée deux fois différentiable au point (a, b) intérieur à son domaine de définition,
76 Chapitre III. Différentielles d'ordre supérieur

admet en ce point un minimum relatif, ses dérivées partielles secondes en ce point vérifient
les inégalités (3) ci-dessus.
Nous voyons de même que si la fonction f admet au point (a, b) un maximum relatif,
les autres hypothèses étant inchangées, ses dérivées partielles secondes au point (a, b)
vérifient les inégalités
i;x(a, b) ~ 0' tiy(a, b) ~ 0' u;y(a, b)) 2 ~ J;x(a, b)fiy(a, b). (4)
L'application linéaire ép est un isomorphisme de IR sur lui-même (identifié à son dual) si
2

et seulement si sa matrice (2) a un déterminant non nul, c'est-à-dire si et seulement si

J;x(a, b)fiy(a, b) - u;y(a, b)) 2 i= 0.


Compte tenu du corollaire 5.9, nous voyons donc que f" (a, b) est coercive si et seulement
si les dérivées partielles secondes de f au point (a, b) vérifient

J::x(a, b) > 0, fiy(a, b) > 0, (f;y(a, b)) 2 < J;x(a, b)fiy(a, b). (5)
Le théorème 5. 7 s'exprime donc ainsi, dans le cas particulier considéré : la fonction f étant
supposée deux fois différentiable au point (a, b) intérieur à son domaine de définition, si,
en ce point, ses deux dérivées partielles premières sont nulles et si ses dérivées partielles
secondes vérifient les inégalités (5), f admet en (a, b) un minimum relatif strict.
De même, si les dérivées partielles secondes de f au point (a, b) vérifient les inégalités

J;x(a, b) < 0' tiy(a, b) < 0' u;y(a, b)) 2 < J;x(a, b)fiy(a, b)' (6)
les autres hypothèses étant inchangées, f admet au point (a, b) un maximum relatif strict.

6. Maxima et minima relatifs liés


6.1. Le problème étudié. - Soit U un ouvert d'un espace de Banach réel E, et g : U - F
une application différentiable de classe CP (p ;::: 1) de U dans un autre espace de Banach
F. Soit A la partie de U
A= g- 1 (0) = { x EU ; g(x) = 0}.
Soit d'autre part f : U - IR une fonction définie sur U, à valeurs réelles. Nous nous
intéressons aux points de A où la fonction flA (restriction de f à A) présente un
minimum relatif ou un maximum relatif, au sens de la définition 5.2. Ces points sont
traditionnellement appelés maxima ou minima liés de la fonction f, car la condition
g ( x) = 0, exprim~mt que les points x de U auxquels on s'intéresse doivent appartenir à
l'ensemble A, est souvent appelée une liaison.
Nous nous bornerons, dans la suite de ce paragraphe, à établir une condition nécessaire pour
qu'en un point a de A la fonction f IA admette un minimum relatif ou un maximum relatif.
Cette condition est l'analogue de celle donnée, en l'absence de liaison, par le théorème 5.3.
Il est possible aussi de formuler, pour les maxima et minima liés, des conditions suffisantes
analogues à celles données par le théorème 5.7, mais nous ne le ferons pas dans cet ouvrage.
6.2. Théorème. - Les hypothèses étant celles précisées en 6.1, soit a un point
de A où la fonction flA admet un minimum relatif ou un maximum relatif On
suppose que les trois conditions suivantes sont satisfaites :
(i) la différentielle g' (a) de g au point a est surjective;
(ii) il existe un sous-espace vectoriel fermé G de E supplémentaire de ker g' (a) ;
(iii) la fonction f est différentiable au point a.
Alors on a l'inclusion ker g' (a) C ker f' (a).
§ 6. Maxima et minima relatifs liés 77

Preuve : Posons, pour alléger l'écriture, K = ker g' (a). C'est un sous-espace vectoriel
fermé de E, donc un espace de Banach. Par hypothèse, il existe un autre sous-espace
vectoriel fermé G de E supplémentaire de K. L'application de K x G dans E, (x, y) t--t
x + y, avec x E K et y E G, est linéaire, continue et bijective. D'après le théorème
de Banach (voir par exemple [T.IX.5.7]), son inverse est continue. Nous pouvons donc
identifier, au moyen de cette application, l'espace Eau produit K x G, donc considérer
U comme un ouvert de K x G, et A= g- 1 (0) comme une partie de U, donc de K x G.
Le point a de A s'écrit donc a= (aK, aa), avec aK E K, aa E G.
L'application g: U-> F s'écrit comme une fonction de deux variables, (x, y) t--t g(x, y),
avec x E K, y E G. Ses différentielles partielles g~(aK, aa) et g~(aK, aa) sont les
restrictions de g' (a), respectivement à K et à G; cela résulte en effet del' identification que
nous avons faite de E avec K x G. Comme K est le noyau de g' (a), la différentielle partielle
g~(aK, aa) est nulle. L'autre différentielle partielle, g~(aK, aa) est une application
linéaire continue et bijective de G sur F. D'après le théorème de Banach, son inverse
est continue, et nous pouvons affirmer que g~ (a K, aa) est un isomorphisme de G sur
F. Le théorème des fonctions implicites (11.3.1) nous permet d'affirmer qu'il existe un
voisinage ouvert V de (aK, aa) dans K x G, V c U, un voisinage ouvert W de aK dans
K et une application différentiable h, de classe CP, de W dans G, tels que les assertions
suivantes:
(a) le couple (x, y) est élément de V et g(x, y) = 0,
(b) le point x est élément de W et y = h( x),
soient équivalentes.
Nous voyons ainsi que V n A = V n g- 1 ( 0) est le graphe de l'application h :
V n A= { (x, y) E K X G ; XE w' y= h(x)}.
L'application x t--t ( x, h( x)) est un homéomorphisme de 1' ouvert W de K sur 1' ouvert
V n A de A. La fonction f admettant au point a de V n A un minimum relatif ou un
maximum relatif, sa composée f o (idw, h) avec l'homéomorphisme (idw, h) admet au
point aK de W un maximum relatif ou un minimum relatif. Mais la fonction f o (idw, h)
est différentiable au point aK. Le théorème 5.3 nous permet d'affirmer que sa différentielle
en ce point est nulle. Nous devons donc avoir, pour tout u E K,
D(f o (idw,h))(aK)(u) =O.
Mais en utilisant la règle de différentiation des applications composées, nous obtenons
D(f o (idw, h))(aK )(u) = J'(a)(u, h'(aK )(u)).
Calculons h'(aK ). Nous avons, pour tout x E W,
g(x., h(x)) = 0.
En différentiant cette expression au point aK, nous obtenons, pour tout u E K,
g~(aK, aa)(u) + g~(aK, aa)(h'(aK )(u)) = 0.
Puisque g~ (aK, aa) est un isomorphisme et que g~ (aK, aa) est nulle, cette égalité prouve
que

La condition (*),compte tenu de ( **) et de ( ***),équivaut donc à


Vu E ker g' (a) , J' (a)( u) = 0.
D
78 Chapitre III. Différentielles d'ordre supérieur

6.3. Remarque. - Si l'espace Fest de dimension finie, et si la condition (i) du théorème


6.2 est vérifiée, alors la condition (ii) l'est aussi. Soit en effet (f 1, ... , f m) une base de F.
Puisque g' (a) est surjective il existe des éléments e 1 , ... , em de E tels que g' (a) (ei) = k
(1 :::; i :::; p). Le sous-espace vectoriel G de E engendré par les éléments e 1 , ... , em est
fermé puisque de dimension finie, et c'est un supplémentaire de ker g'(a).
En particulier, si l'espace E est de dimension finie et si la condition (i) est vérifiée, Fest
aussi de dimension finie et la condition (ii) est automatiquement satisfaite.

Le théorème 6.2 donne (sous certaines hypothèses) une condition nécessaire pour que f IA
admette, en un point de A, un minimum ou un maximum relatifs : on doit avoir, pour tout
u E ker g' (a), J' (a) (u) = O. La proposition suivante va nous permettre de donner à cette
condition une autre forme équivalente, souvent d'emploi plus commode.
6.4. Proposition. - Soient E et F deux espaces de Banach sur le corps OC = IR
ou C, 1 E .C(E, F) une application linéaire continue et surjective de E sur F, et
cp un élément du dual E' de E, c'est-à-dire une forme linéaire continue sur E.
On suppose qu'il existe un sous-espace vectoriel fermé G de E supplémentaire de
ker1. Les deux conditions suivantes sont équivalentes:
1. On a l'inclusion ker 1 C ker cp.
2. Il existe un élément À du dual F' de F, c'est-à-dire une forme linéaire continue
sur F, telle que cp =À o I·
Lorsque ces conditions sont satisfaites, la forme linéaire À est unique.
Preuve : La condition 2 implique évidemment 1. Réciproquement, supposons la condition
l satisfaite. Pour tout y E F, i- 1 (y) est un sous-espace affine fermé de E, non vide
puisque 1 est surjective; de plus, cp prend sur ce sous-espace une valeur constante; en
effet, si x et x' en sont deux éléments, x - x' est élément de ker 1, qui par hypothèse est
contenu dans ker cp. Il existe donc une unique application À : F ~ OC dont la valeur, en
chaque point y de F, est égale à la valeur (constante) de cp sur 1- 1 (y). L'application À
vérifie, par construction, cp = À o 1, et c'est la seule application de F dans OC ayant cette
propriété. Il ne reste plus qu'à vérifier qu'elle est linéaire et continue. La vérification de sa
linéarité est immédiate. Celle de sa continuité est un peu plus délicate. Rappelons que, par
hypothèse, il existe un sous-espace vectoriel fermé G de E supplémentaire de ker 1. La
restriction de 1 à Gest linéaire, continue et bijective de G sur F. D'après le théorème de
Banach (déjà utilisé dans la démonstrations de 6.2), ile est un isomorphisme d'espaces
de Banach. Le noyau de À est, par construction, 1(ker cp ). Mais nous avons
1(ker cp) = 1le (G n ker cp).
C'est l'image, par un isomorphisme d'espaces de Banach, du sous-espace vectoriel fermé
G n ker cp de J'espace de Banach G. Il est donc fermé dans F. Or on sait (voir par exemple
[T.IX.6], exercice 9) qu'une forme linéaire sur un espace de Banach est continue si et
seulement si son noyau est un sous-espace vectoriel fermé. Nous avons ainsi prouvé que
À est continue. D

Nous pouvons maintenant reformuler le théorème 6.2 comme suit.


6.5. Théorème. - Les hypothèses étant celles précisées en 6.1, soit a un point
de A où la fonction JIA admet un minimum relatif ou un maximum relatif. On
suppose que les trois conditions suivantes sont satisfaites :
(i) la différentielle g' (a) de g au point a est surjective;
§ 6. Maxima et minima relatifs liés 79

(ii) il existe un sous-espace vectoriel fermé G de E supplémentaire de ker g' (a) ;


(iii) la fonction f est différentiable au point a.
Alors il existe un élément unique À du dual F' de F tel que la différentielle de
f - À o g au point a soit nulle.

Preuve : D'après le théorème 6.2, nous avons 1' inclusion ker g' (a) c ker f' (a). Les
conditions d'application de la proposition 6.4 (avec cp = f' (a), 'Y = g' (a)) sont satisfaites
et nous pouvons affirmer qu'il existe un élément unique À de F' tel que f' (a) = À o g' (a).
Mais >. étant linéaire, cela équivaut à la nullité de la différentielle de f - >. o g au point
a. D
6.6. Commentaires
a) Interprétation de la condition. - D'après le théorème 5.3, la nullité de la
différentielle de f - À o g au point a est nécessaire pour que la fonction f - À o g
admette au point a un minimum ou un maximum relatifs. Nous pouvons donc dire que
la recherche des minima ou maxima relatifs liés de f, pour la liaison g = 0, se ramène
à la recherche des minima ou maxima relatifs, au sens usuel (sans liaison) de f - À o g
(où>. est un élément de F') contenus dans g- 1 (0). Il faut toutefois remarquer que>. n'est
pas connu d'avance : il sera déterminé, en même temps que le point a cherché, grâce à la
résolution des équations
(J - >. o g)'(a) = 0,
{
g(a) = 0.
b) Cas où les espaces E et F sont de dimension finie. - Voyons comment les
conditions obtenues ci-dessus s'explicitent lorsque les espaces E et F sont de dimension
finie. Moyennant le choix de bases dans ces espaces, nous pouvons identifier E à IRn et F à
IRm. L'application g, définie sur un ouvert U de IRn, am composantes 91, ... , Qm, chacune
de ces composantes étant une fonction des n variables réelles x 1 , ... , Xn. La fonction f,
définie sur U, est elle aussi fonction des n variables réelles x1, ... , Xn·
Les énoncés 6.2 et 6.5 prennent alors la forme suivante. Supposons qu'en un point
a = (a 1 , ... , an) de U, la restriction de f à g- 1 ( 0) admette un maximum ou un minimum
relatif. Supposons aussi que la différentielle de g au point a soit surjective, c'est-à-dire que
la matrice ( ~!~) (1 :::; i :::; n, 1 :::; j :::; m) soit de rang m au point a. Pour cela, nous
devons bien sûr avoir m :S n. D'après la remarque 6.3, nous n'avons pas à nous occuper
de la condition (ii) des énoncés 6.2 et 6.5, car elle est automatiquement satisfaite. Alors,
les deux conditions équivalentes suivantes sont satisfaites :
1. Pour tout élément (v 1 , ... , Vm) de IRm qui vérifie, pour tout j (l :S j :S n ),
..ç-.. &gj(X1, ... 'Xn) 1 vi = 0'
~
i=l
ax·i x=a
on a aussi

2. Il existe un élément >. = (>. 1 , ... , Àm) de IRm (identifié à son dual) tel que, pour chaque
i (1 :S i :S n),
f) m
âx· (!(x1, ... ,Xn)- LÀjgj(X1, ... ,xn))lx=a =0.
i j=l
Les Àj (l :S j :S m) sont appelés multiplicateurs de Lagrange.
80 Chapitre III. Différentielles d'ordre supérieur

c) Cas où la différentielle de g n'est pas smjective. --- Nous supposons, comme ci-
dessus, que E et F, de dimensions finies, sont identifiés, respectivement, à !Rn et !Rm,
avec m ::::; n. Les théorèmes 6.2 et 6.5 ne donnent aucun renseignement sur les points de
A = g-i (0) où la différentielle de g n'est pas surjective. C'est pourquoi il est parfois utile
de déterminer ces points, afin de vérifier si en un de ces points la fonction fi A admet un
minimum ou un maximum relatifs.
Il est facile de voir qu •en un point a = (ai, ... , an) de g- i ( 0). la différentielle de g n •est
pas surjective si et seulement s'il existe un élément non nul À= (.Xi, ... , Àm) de !Rm tel
que, pour tout i (1 ::::; i ::::; n),
a m
-8 . (LÀJ9J(xi, ... ,xn))I _ =0.
Xi
j=i
x-a
Nous voyons qu'on peut, en une seule opération, déterminer à la fois les points de g-i(o)
qui satisfont la condition nécessaire du théorème 6.5 et ceux où la différentielle de g n •est
pas surjective. Il suffit d'écrire qu'il existe un élément non nul À = (.\ 0 , Ài, ... , Àm) de
JRm+i tel que, pour tout i (1 ::::; i ::::; n),
a m
axi ( Àof(xi, ... 'Xn) +L Àjgj(Xi, ... 'Xn)) lx=a = 0.
J=i

On ajoutera bien sûr à ces n équations, les m équations (1 ::::; j ::::; m)


9J(ai, ... ,arn) =0.
Nous avons n + m équations pour les n + m + 1 inconnues ai, ... , an et Ào, ... , Àm.
mais on voit que ces équations déterminent (.\ 0 , ... , Àrn) à un facteur multiplicatif non
nul près. Les solutions de ce système pour lesquelles Ào -:/= 0 nous donnent des points
de g-i(o) qui satisfont la condition nécessaire du théorème 6.5, et celles pour lesquelles
Ào = 0 nous donnent des points de g- i ( 0) où la différentielle de g n •est pas surjective.

7. Exercices

Exercice III. l. Soient E et F deux espaces de Banach, f : E ----+ F une application de


classe C2telle que, pour tous t E IR et XE E. f(tx) = t 2 f(x).
Montrer que, pour tout x E E, D 2 f(O) (x, x) = 2f(x).
Exercice III.2. Trouver les applications F : IR. 2 ----+ IR de classe C 2 solutions de
l'équation aux dérivées partielles :
a2 F a2 F
ax2 - 8y2 =O.
[On pourra poser <p(u, v) = ((u + v)/2, (u - v)/2) et G = F o <p.]

Exercice III. 3. On munit !Rn de son produit scalaire usuel, noté ( x, y) r-+ ( x IY), et de
la norme associée. Soit f : !Rn ----+ !Rn une application de classe ci.
l)Onpose,pourtousxety E IR.n,g(x,y) = llf(x)-f(y)ll 2 .Montrerqueladifférentielle
partiel le seconde g~ Y ( x, y) existe et la déterminer.
2) On suppose désormais que, pour tous x eth E !Rn. llf'(x) hll = llhll· Montrer que pour
tous x et y E IRn. llf(x) - f(y)il ::::; llx - Yll·
3) Soit a E !Rn. Montrer qu'il existe un voisinage ouvert Ua de a tel que la restriction
de f à ce voisinage soit un ci-difféomorphisme de Ua sur f (Ua). En déduire qu'il
§ 7. Exercices 81

existe un voisinage ouvert Va de a tel que Va C Ua et que, pour tous x et y E Va,


llf(x) - f(y)ll = llx -yll.
4) Etablir que, pour tous x et y E Va, h et k E !Rn, (!' (x )(h) 1 f' (y )(k)) = (hlk ).
5) Calculer, pour x et y E Va eth E !Rn, llJ'(x)(h) - f'(y)(h)ll. En déduire que pour
tous x et y E Va. f' (x) = f' (y), puis que f' est constante sur !Rn.
6) Établir qu'il existe un élément A de .C(IRn, !Rn) et un élément b de !Rn tels que, pour
tout x E !Rn, f(x) = A(x) + b et que pour tout h E !Rn, llA(h)ll = llhll.
Exercice III.4. Soit E un espace de Banach, I =] - a, a[ (avec a > 0) un intervalle
de IR et f une application de I vers E. Soit y E JO, a[.
1) On suppose que f est de classe C 2 et qu'il existe deux constantes positives A et B telle
que, pour tout x E J, llf(x)ll :::; A, llf'(x)ll :::; B. Montrer, en utilisant la formule de
Taylor, que six E [-y, y], llf'(x)ll :::; A/y+ By.
2) On suppose que f est de classe c= et qu'il existe deux constantes positives M et K
tellesque,pourtoutn E Nettoutx E J, 1if< 2nl(x)ll:::; M(2n)!Kn.
2 a) Pour n EN et x E [-y, y], majorer llJ< 2n+ll(x)ll.
2 b) Montrer que si y2 K < 1, la série 2:::~= 0 (n!)- 1 J(n) (O)(x, · · ·, x) converge sur [-y, y]
et a pour somme f(x).

Exercice III.5. Soit E un espace vectoriel normé, [a, b] un intervalle fermé borné de
IR et f : [a, b] ---+ E une application continue. On suppose que f(a) = f(b) = 0, que
f est deux fois dérivable sur ]a, b[ et qu'il existe k > 0 tel que pour tout x E ]a, b[,
llf"(x)ll :S k.
1) Montrer que, pour tout t E ]a, b[, Il! (:~t~) Il :S ~·
2) Montrer que, si E est complet, l'application g : ]a, b[---+ E, g(t)
f (t)
(t - a)(t - b)'
admet un prolongement continu sur [a, b].

Exercice III.6. Soit U un ouvert convexe d'un espace vectoriel normé E et f : U ---+ IR
une application. On dit que f est convexe sur U si, pour tout (x, y) E U x U et tout
t E [O, l],
J((l - t)x + ty) :::; (1 - t)f(x) + tf(y).
1) On suppose f différentiable sur U. Montrer que f est convexe sur U si et seulement si,
pour tout (x, y) EU x U, f(x) + f'(x)(y - x) :::; J(y).
2) On suppose que f est deux fois différentiable dans U.
2 a) Montrer que si f est convexe dans U, pour tout x E U et tout h E E, f" (x) (h, h) 2: O.
2 b) On suppose que E est un espace de Banach. Montrer réciproquement que si f est de
classe C 2 sur U et si elle vérifie, pour tout x E U et tout h E E, f" (x) (h, h) 2: 0, alors f
est convexe sur U.
3) On suppose f convexe et différentiable sur U. Soit a E U tel que J'(a) =O. Montrer
que f a un minimum absolu en a.
4) Application. Soit A E Mn(IR) une matrice réelle n x n symétrique et B E IRn. Soit
f : IRn ---+ IR l'application
J(X) = ~(AXIX) - (EIX).
82 Chapitre III. Différentielles d'ordre supérieur

Montrer que f est convexe si et seulement si A est positive, c'est-à-dire vérifie, pour tout
XE !Rn, (AX/X) 2 O.
Exercice III. 7. Soit J : IR 2 ---+ IR une application de classe C 3 telle que :
J(O) = 0, J'(O) = 0, J{'i(O) = !~'2 (0) = 0, f{~(O) = 1.
On a noté 0 l'origine (0, 0) de IR 2 . On munit IR 2 de la norme euclidienne /IX /1 = /1 (x, y) /1 =
Jx2 + y2.
1) Écrire les développements de Taylor-Young en 0 au plus grand ordre possible pour les
applications f et f'. En déduire

2f(X)- J'(X)X + ~J"'(O) (X,X,X) = o(/IX/1 3 ), XE JR 2 . (*)

2) Pour (x, y) E IR 2 , on pose

~(x, y) - xy
si (x, y) = (0, 0),
e(x, y) = {
si (x, y) -f (0, 0).
x2 + y2
Calculer f" (0) ( ( x, y), (x, y)). Montrer que e est une fonction continue sur IR 2 .
3) On considère l'application g : IR 2 ---+IR,
t si X= Ü,
g(x, t) = { J(x, xt) -'-
six r O.
x2
3 a) Montrer que g est une fonction continue sur IR 2 . [Utiliser l'application e].
3 b) Expliquer pourquoi l'ensemble U = { (x, t) E IR 2 ; x -f 0} est un ouvert de IR 2 , et
montrer que l'application g est de classe ci sur U.
3 c) Pour ( x, t) E U, calculer g~ ( x, t) en fonction de f ~. Écrire la condition exprimant que
f~ est différentiable au point 0 et en déduire que, pour tout réel b,

lim g~(x, t) = 1.
(x,t)->(O,b), (x,t)EU

3 d) Pour (x, t) E U, calculer g~ (x, t) en fonction de f et de ses dérivées partielles. En


utilisant la relation (*),montrer que lim(x,t)->(O,b), (x,t)EU g~ (x, t) est un polynôme P(b)
en la variable b que lon exprimera au moyen de !'" (0).
4) Pour (h, k) E IR 2 , on pose
fb(h, k) = hP(b) + k, 'lf;(h, k) = g(h, b + k) - g(O, b) - fb(h, k).
4 a) Vérifier que 'lf;(O, k) = O. Calculer lim(h,k)->(O,O), (h,k)fo(O,o) 'If;' (h, k ).
4 b) En appliquant, pour h -f 0, le théorème des accroissements finis à la fonction
À ---+ 'lj;(.Xh, .Xk) sur l'intervalle [O, 1], montrer que lim
(h,k)->(0,0) (h,k)fo(O,O)
,t~h,k~~/
,
= O.
En déduire que g est de classe ci dans IR 2 .
5) En utilisant le théorème des fonctions implicites pour l'application g en 0, montrer qu'il
existe une constante r > 0 et une fonction cp : ] - r, r[---+ IR, de classe ci, telle que les
conditions (i) et (ii) ci-dessous soient équivalentes :
(i) J(x, y) = 0, x E] - r, r[, /y/ < r/x/,
(ii) x E] - r,r[, y= xcp(x).
Décrire l'allure de la courbe de niveau 0 de f (ensemble des points (x, y) E IR 2 qui vérifient
f (x, y) = 0) au voisinage de l'origine de IR 2 .
§ 7. Exercices 83

Exercice III.8. Soit f: ]O, +oo[ x JO, +oo[ ---7 IR. l'application
xy
f(x, y) = (x + l)(y + l)(x +y) ·
Montrer que f admet un maximum absolu et le déterminer.
Exercice III.9. Soit f : JR.+ ---7 lR. et cp : IR. 3 ---7 lR. les deux applications
f(u) = (u - 1) 2(u + 1), cp(x, y, z) = x 2 + y 2 + z 2 + xy - xz.
1) Soit u 2 O. Montrer que f' (u) = 0 si et seulement si u = 1.
2) Montrer que cp est une forme quadratique définie positive. En déduire les points de JR. 3
où cp s'annule.
3) Soit F = f ~ cp. Montrer qu'un élément a de JR. 3 est un point critique de F (c'est-à-dire
vérifie F'(a) = 0) si et seulement si a= (0, 0, 0) ou cp(a) = 1.
4) Déterminer la matrice hessienne de F en a = (0, 0, 0), c'est-à-dire la matrice de
l'application bilinéaire symétrique F" (a). En déduire la nature de ce point critique.
5) Montrer que pour tout a E IR. 3 , F( a) 2 O. En déduire que tout point critique non nul de
F est un point où F admet un minimum absolu.
Exercice III.10. Soient F : JR. 3 ---7 1R. une application de classe C 2 , 0 un ouvert
---7 JR. une application de classe C 2 telle que, pour tout (X, y) E 0,
de JR. 2 et cp : 0
F(x,y,cp(x,y)) =O.
1) Exprimer, au moyen des dérivées partielles premières et secondes de F et de cp, les
dérivées partielles premières et secondes de l'application (x, y, z) 1---> F(x, y, cp(x, y)).
En déduire cinq égalités, les deux premières liant les dérivées partielles premières de F et
de cp, les trois dernières liant les dérivées partielles premières et secondes de F et de cp.
2) On suppose que (a, b) E 0 est un extremum relatif de cp et on pose c = cp(a, b).
Démontrer les relations
F(a, b, c) = F~(a, b, c) = F~(a, b, c) = 0,

F~'2 (a, b, c) F~i (a, b, c) - ( F~y(a, b, c) r 2 0.

3) Pour (x, y, z) E IR. 3 , on pose


F(x, y, z) = 2x 2 + 2y 2 + z 2 + 8xz - z + 8.
En appliquant le théorème des fonctions implicites, montrer qu'il existe deux ouverts 0 1
et 02 de IR. 2 et deux fonctions de classe C 2' cp1 : 01 ---7 lR. et cp2 : 02 ---7 IR., ayant chacune
un extremum relatif dans leur domaine de définition, telles que, pour tout (x, y) E Oi, on
ait, pour i = 1 et pour i = 2,
F (x, y, cpi(x, y)) = 0.
Déterminer ces extrema relatifs.
Exercice III.11. Soit a un réel strictement positif, et g : IR. 2 ---7 lR. la fonction
g(x,y) = x2 +y2 - ~ (Jx2 +y2 +x).

1) Montrer que g est de classe C 1 sur IR. 2 - {(O, 0) }.


2) Soit C l'ensemble des points (x, y) de IR. 2 qui vérifient g(x, y) = O. Déterminer les
points (x, y) de C où la coordonnée x admet un extremum relatif.
84 Chapitre III. Différentielles d'ordre supérieur

3) Donner une interprétation géométrique des résultats. [On pourra déterminer l'équation
de la courbe C en coordonnées polaires].
Exercice III.12. On munit JR.n de son produit scalaire euclidien usuel, noté (x, y) t--t
(xly). Soit A E .C(lR.n,lR.n) un endomorphisme symétrique de JR.n, c'est-à-dire tel que
pour tous x et y E lR.n, (Axly) = (xlAy). Pour tout x E lR.n, on pose f(x) = (Axlx).
1) On note S la sphère unité, ensemble des points x E lR.n tels que (xlx) = 1. Montrer
que les points de S où la fonction f admet un extremum relatif sont des vecteurs propres
de A. Réciproquement, que peut-on dire des vecteurs propres de A?
2) On suppose l'application linéaire symétrique A définie positive, c'est-à-dire telle que,
pour tout x E lR.n - {O}, f(x) = (Axlx) >O. Soit Q l'ensemble des points x de JR.n tels
que f(x) = 1, et z un élément non nul de JR.n. Déterminer les points de Q où la forme
linéaire x t--t ( zlx) admet un extremum relatif. Donner une interprétation géométrique du
résultat. [Voir exercice 7 du chapitre I].
Exercice III.13. On muni JR. 3 de la distance associée à la norme euclidienne. Soit A
l'ensemble des points (x, y, z) de JR. 3 qui vérifient z 2 + xy = 0 et x 2 + y 2 = 1. Déterminer
les points de A les plus proches de (0, 0, 0).

8. Solutions
Solution III.1. Soit x E E et fx : IR -+ F l'application fx(t) =
f(tx). On introduit l'application
cp: IR-+ E, cp(t) = tx. L'application f x est l'application composée fx = f o cp. L'application cp est linéaire
continue, donc de classe C 2 , par suite fx l'est aussi. Calculons la dérivée première de fx ·en un point t E IR
à laide du théorème de dérivation des fonctions composées (la dérivée calculée ici est la dérivée au sens usuel
puisque la fonction considérée est définie sur IR) :

f ~ (t) = D f ( cp (t)) ( cp' (t)) = D f (tx) (x) .


Calculons la dérivée seconde (au sens usuel) de f x au point t, en remarquant que f~ ho Df o cp, où
h: C(E, F) -+Fest l'application linéaire continue h(l) = l(x). On obtient

J:;(t) =Dh(f(tx)) oD 2 f(tx)(cp'(t)) =D 2 f(tx)(x,x).

Soit, toujours pour x E E fixé, 9x : IR -+ F l'application 9x(t) = t 2 f(x). Calculons successivement les
dérivées première puis seconde de 9x en un point t E R On remarque que 9x est la composée des applications
t >--> t 2 et u >--> uf(x), définies et différentiables sur R On obtient alors g~(t) = 2tf(x). L'application g~
étant alors composée des applications différentiables t >--> 2t et u >--> uf(x), lc calcul donne g~(t) = 2f(x).
Or pour x E E fixé, l'application f est telle que, pour tout t E IR, f(tx) = t 2 f(x). Les calculs précédents
montrent alors que pour tout t E IR, D 2 f(tx)(x, x) = 2f(x). Ce résultat est en particulier vrai lorsque t = 0
etonobtientD 2 f(O)(x,x) = 2f(x).
Solution III.2. L'application cp est linéaire, bijective d'inverse cp- 1 = cp, c'estdonc un C 00 -difféomorphisme
deIR 2 surIR 2 .
Si F : IR 2 -+ IR est de classe C 2 , l'application G = F o cp l'est aussi. De plus, F = G o cp. La
différentielle de Fen (x, y) E IR 2 s'obtient alors par la formule de dérivation des fonctions composées :
DF(x, y) = DG ( cp(x, y)) o Dcp(x, y), soit en revenant aux matrices jacobiennes des applications linéaires
concernées:

On obtient
aF i(ac ac )
ax (x,y) = 2 au ocp(x,y) +av ocp(x,y) '

aF i(ac ac )
ay (x, y) = 2 au 0 cp(x, y) - av 0 cp(x, y) '
§ 8. Solutions 85

soit, en définitive,

aF =~(ac+ ac) oip, aF =~(ac_ ac) oip.


ôx 2au av ay 2au av
On déduit l'expression des dérivées partielles secondes de Fen fonction de celles de C, les dérivées partielles
aF . aF
par rapport à x et y de ax, respectivement, de ay, s'obtenant en remplaçant, dans les formules précédentes,
aF . aF
F par ax , respectivement, par ay . Le calcul donne

a F = -1 (a--
--
2
ax2 4 au2
c a c
+2--
auav
2 a
+ --
av2
2 2a) otp,
a2 F i(a2 c a2 c a2 c)
ay2 =4 au 2 - 2 auav + av2 ° 'P'
d'où finalement
a2 F 2F a2 c
-----=--otp.
a
ax 2 ay 2 auav

a2 F a2 F ac 2
L'équation - -2 - --
2 = 0 est donc équivalente à l'équation - - o 'P = 0, soit encore à
ax ay auav

a2 c
--=O.
au av
Les solutions de classe C 2 de cette équation sont les fonctions de la forme C(u, v) = f(u) + g(v), où f et g
sont des fonctions de classe C 2 définies sur IR.
Les fonctions F solutions de l'équation initiale, vérifiant F = C o tp, sont donc les fonctions de la forme
F(x,y) = f((x+y)/2) +g((x-y)/2).
Solution III.3.
1) Soit x E !Rn fixé. On considère l'application 9x : y ,_. g(x, y) = llf(x) - f(y)ll 2 . Elle est composée
de l'application y ,___. (f(x) - f(y),f(x) - f(y)). de classe ci, et de l'application bilinéaire continue
(u,v) ,_. (ulv), définie sur !Rn x !Rn, qui est de classe C 00 • La différentielle partielle g~(x,y), étant la
différentielle de 9x au point y, est donnée par la formule de dérivation des fonctions composées. Pour tout

g~(x,y) (k) = -2(f(x) -f(y) 1 f'(y)(k)).

Soit maintenant y E !Rn fixé. L'application x ,_. g~(x, y) est la composée de l'application x ,_. f(x) - f(y),
de classe ci, et de l'application f, qui, à u E !Rn, associe l'endomorphisme f.(u) E .C(!Rn, !Rn), ayant pour
expression k ,_. f.(u)(k) =
-2(u 1 f'(y)(k)). On vérifie que f, est linéaire, donc continue et de classe
C 00 puisqu'elle est définie sur un espace de dimension finie. L'application g admet donc une différentielle
partielle seconde g~ y(x, y), qui est la différentielle au point x de l'application x ,_. g~(x, y). Appliquée à
(h, k) E !Rn x !Rn, elle a pour expression

g~ y(x, y)(h, k) = -2(! (x)(h) 1 1 f' (y)(k)) .

En particulier, en prenant pour fl'application identique de IR. 2 , on voit que l'application 'P : (x, y) ,_. llx -yll 2 ,
définie sur !Rn x !Rn, admet en tout point une différentielle partielle seconde 'P~ y(x, y), ayant pour expression

'P~ y(x, y)(h, k) = -2(hlk).

2) Puisque, pour tout x E !Rn et tout h E !Rn, llf'(x)(h)ll = llhll. pour tout x E !Rn, llf'(x)ll = 1. En
appliquant le théorème des accroissements finis à f entre deux points x et y E !Rn (voir I.5.3), on obtient
llf(x) - f(y)ll ~ llx -yll.
3) D'après l'hypothèse faite surf, pour tout x E !Rn, f'(x) est injective, donc est un isomorphisme de
!Rn. On peut alors appliquer à f le théorème d'inversion locale II.2.4, au voisinage d'un point a E !Rn.
Il existe donc un voisinage ouvert Ua de a tel que f soit un ci-difféomorphisme de Ua sur f (Ua). De
86 Chapitre III. Différentielles d'ordre supérieur

plus f(Ua). étant un voisinage ouvert de f(a), contient une boule ouverte Ba de centre f(a). L'ensemble
Va = Ua n 1- 1 (Ba) est un ouvert contenant a, tel que Va C Ua et que f soit un C 1 --difféomorphisme de
Va sur Ba. On désigne par 1- 1 sa bijection réciproque, qui est donc ici définie sur Ba. On sait que, pour tout
u E Ba. (f- 1 )'(u) = (!' (!- 1 (u)) )- 1 • ce qui entraîne 11(!- 1 )'(u)ll = llf'(f- 1 (u))ll = 1.
Soient maintenant x et y E Va. Les points u = f(x) et v = f(y) sont deux points de l'ouvert convexe Ba.
L'application du théorème des accroissement finis à 1- 1 entre u et v donne alors Il!- 1 ( u )- 1- 1 ( v) Il ::; JI u-v 11.
ce qui s'écrit encore llx - Yll S llf(x) - f(y)ll.
Finalement, pour tous x et y E Va. llf(x) - f(y)ll = llx - Yll·
4) Pour tous x et y E Va. on a donc llf(x) - f(y)ll 2 = llx - Yll 2 . Les applications g et <p introduites dans la
question 1 coïncident sur Va X Va. donc pour tous x et y E Va. g~ y(x, y) = <p~ y(x, y). Ceci entraîne que
pourtousxety E Vaettoushetk E !Rn, (!'(x)h 1 f'(y)k) = (hlk).

5) Soient x et y E Va. h E !Rn. On développe l'expression de llf'(x) h - f'(y) hll 2 en utilisant la bilinéarité
du produit scalaire et la propriété établie dans la question 4. On obtient llf'(x) h - f'(y) hll 2 = 0, soit
f'(x) h = f'(y) h. Donc, pour x et y E Va. f'(x) =!'(y).
Soit a E !Rn et n = { x E !Rn ; f'(x) = f'(a) }. L'ensemble n n'est pas vide car il contient a; il est ouvert
car si x E n, il existe un voisinage ouvert Vx de x tel qu'en tout point y E Vx, f' (y) = f' ( x) = f' (a), ce qui
entraîne Vx C n; il est fermé, puisqu'il est image réciproque du fermé { f' (a)} par lapplication continue f'.
L'espace !Rn étant connexe, on a nécessairement n =!Rn, autrement dit, f' est constante sur !Rn.
6) D'après la question 5, la différentielle de l'application x ,_. f(x) - f'(O)(x) est identiquement nulle.
Cette application est donc constante sur !Rn, sa valeur en tout point est égale à sa valeur à l'origine O. Ainsi,
pour tout x E !Rn, f(x) = f'(O)(x) + f(O). On a donc bien, pour tout x E !Rn, f(x) = A(x) + b, avec
A = f' (0) E .C(!Rn, !Rn) et b = f (0) E !Rn, et pourtout h E !Rn, llA(h)ll = llhll·
Solution III.4.
1) Soit x E [-y, y]. Utilisons la formule de Taylor-Lagrange à l'ordre 2 entre x et y, puis entre x et -y. Nous
obtenons
Jlf(y) - f(x) - J'(x)(y- x)ll S ~ B(y - x) 2 ,

11!(-y) - f(x) + !'(x)(y + x)ll S ~ B(y + x) 2 ,


d'où

llf(y) - !(-y) - 2f'(x)(y)ll S llf(y) - f(x) - J'(x)(y - x)ll + 11!(-y) - f(x) + !'(x)(y + x)ll
1
S 2 B((y-x)2 +(y+ x)2) S B(y2 +x2)'

soit encore 211!' (x)(y)ll S Il! (y) - f (-y)ll + B(y 2 + x 2 ) S 2A + 2By 2. Mais Il!' (x)(y) 11 = Yllf' (x) 11
car f' (x) est linéaire et y > O. On obtient finalement, après division par y de l'inégalité obtenue : pour tout
x E [-y, yJ, llf'(x)ll SA/y+ By.
2 a) Soit n E N et x E [-y, y]. Appliquons à la fonction f <2 nl les résultats de 1. Pour tout x E [-y, y], on a

2 b) On suppose que y vérifie y 2 K < 1. Pour n EN et x E [-y, y], on a

Les séries de terme général (y 2 K)n et (n + l)(y 2 K)n+l étant convergentes, la série
OO

"""'.!_ f(n)(O)(x, .. .,x)


L..t n!
n=O
§ 8. Solutions 87

est normalement convergente pour x E [-y, y]; comme elle est à valeurs dans l'espace complet E, elle converge
dans E. Il reste à montrer qu'elle a pour somme f (x ). La formule de Taylor-Lagrange appliquée à f à l'ordre p
donne
p

Il f(x) _"""' _.!._


~ k! f
(k) 0
( )(x, · · · 'x)
Il <- { M(y
M(y 2 K)"
2 K)n + 2M(n + l)(y 2 K)n+l
si p = 2n - 1,
si p = 2n.
k=O

Dans tous les cas, le second membre a pour limite 0 quand p-> oo donc, pour tout x E [-y, y].
OO

"""'~ f(n)(O)(x, ... ,x) = f(x) ·


~n!
n=O

Solution III.5.
1) L'application t >----> f(t)/(t - a) est définie et différentiable sur ]a, b[. Sa dérivée (au sens usuel) se calcule
en remarquant que cette application est la composée des applications t >----> (f (t), 1/(t- a)), définie sur ]a, b[,
et (x, u) >----> ux, bilinéaire continue, définie sur Ex R On obtient

d ( f(t)) f(t) f'(t)


dt t - a =- (t - a)2 + (t - a) ·

D'autre part, la formule de Taylor-Lagrange appliquée à f entre deux points u et t de ]a, b[ donne

llJ(u) -f(t) - (u- t)f'(t)ll S (u- t) 2 sup llJ'(z)ll S (u- t) 2 k.


2 zE(u,t) 2

L'application f est continue en a, et f(a) = O; on obtient alors, par passage à la limite lorsque u-> a,
11-f(t)-(a-t)f'(t)ll S (a~t)2 k,
soit en divisant les deux membres de cette inégalité par ( t - a ) 2 ,

2) Montrons que les applications cp : t >----> f(t)/(t - a) et 1/J : t >----> f(t)/(t - b), admettent une limite,
respectivement en a et en b. En appliquant à cp le théorème des accroissements finis entre deux points u et v de
]a, b[ on obtient, compte tenu du résultat de 1,

llcp(u) - cp(v)ll S ~ llu - vil,

ce qui prouve que cp est lipschitzienne sur ]a, b[. Toute suite (un, n E N) de points de ]a, b[ qui converge
vers a est de Cauchy. L'inégalité ( *) montre que la suite ( cp( Un)) est aussi de Cauchy. Prenant ses valeurs dans
l'espace complet E, elle converge donc. De plus, si deux suites (un, n E N) et (vn, n E N) ont pour limite
a, l'inégalité ( *) montre que les suites ( cp(un)) et ( cp(vn)) ont la même limite. On peut donc prolonger par
continuité l'application cp au point a en posant cp(a) = limn_,+ 00 cp(un). où (un) est une suite quelconque de
points de ]a, b[ qui converge vers a. Le même raisonnement permet de prolonger par continuité l'application 1/J
au point b. Ainsi, l'application g : ]a, b[-> E, g(t) = f(t)/ ( (t - a)(t - b)), admet un prolongement continu
sur [a, b].

Solution III.6.
1) Supposons f convexe sur l'ouvert convexe U. Soient x, y E U. On sait alors que pour tout t E [O, l],

f(x + t(y- x)) S f(x) + t(f(y) -f(x)).

Mais f est différentiable au point x, donc il existe une application E définie au voisinage de 0, continue en ce
point, telle que e(O) = 0 et que

f(x + t(y- x)) = f(x) + tf'(x)(y-x) + tl!y -xlle(t).


88 Chapitre III. Différentielles d'ordre supérieur

On obtient alors, pour t voisin de 0,

tf'(x)(y - x) + tllY - xjjé(t) $ t{J(y) - f(x)),

soit, après division par t et en faisant tendre t vers 0, avec t > 0,


f'(x)(y - x) $ f(y) - f(x).

Réciproquement, supposons que pour tout (x, y) E U x U,

f(x) + f'(x)(y- x) $ f(y).

Soit (x,y) E U x U fixé. Pour tout t E [O, lj, l'inégalité(*) donne (remplacer dans(*) y par x et x par
x+t(y-x)),
tf'(x + t(y- x))(y- x) 2 f(x + t(y-x)) -f(x).

Introduisons l'application <.p : [O, 1] -> IR, ip(t) = f ( x + t(y - x)) - f(x). Cette application est dérivable
sur [ü, lj etapourdérivéeip'(t) = f'(x + t(y -x))(y- x). L'inégalité(**) s'écrit alors tip'(t) 2 ip(t), ce
qui montre qu'en tout t E ]0, 1[, la dérivée de l'application t ,_. ip(t)/t est 2 0, donc que cette application est
croissante sur JO, 1[. Cela permet d'écrire, pour tout t E [O, l], ip(t) $ t<.p(l), ou encore

f(x + t(y-x)) - f(x) $ t{J(y)-f(x)).

Finalement on a bien prouvé que f est convexe dans U si et seulement si, pour tout (x, y) E U x U, l'inégalité
( *) est vérifiée.
2 a) Soit x E U eth E E. Il existe un intervalle ouvert Ide IR contenant 0 tel que, pour tout t E I, x +th E U.
L'application f étant deux fois différentiable sur U, la forme asymptotique de la formule de Taylor à l'ordre 2
au point x permet d'écrire, pour t E /,

t2
f(x +th) - f(x) - tf'(x)(h) =- f"(x)(h, h) + o(lt1 2 ).
2
Mais d'après 1, f(x +th) - f(x) 2 f'(x)(th), donc (t 2 /2)f 11 (x)(h,h) + o(jtj 2 ) 2 O. Divisons, pour
t E I, t =P 0, les deux menbres de cette inégalité par t 2 , puis faisons tendre t vers 0, en remarquant que
limt_,O,t;éO t- 2 o(lt1 2 ) =O. Nous obtenons f" (x)(h, h) 2 O.
Ainsi, pour tout x E U et tout h E E, f" (x)(h, h) 2 O.
2b) Soient x et y E U. Appliquons à fla formule de Taylor avec reste intégral à l'ordre 2:

f(y) - f(x) - J'(x)(y - :c) = 1 1


(1 - t)f" (x + t(y - x)) (y - x, y - x) dt.

Mais on sait que pour tout x E U et tout h E E, f" (x) ( h, h) 2 0, ce qui entraîne en particulier que
J0 (1 - t)f" (x + t(y - x)) (y - x, y - x) dt 2 0, donc que J(y) - f(x) 2 f'(x)(y - x). Ainsi, f est
1

convexe sur U.
3) Soit a E U tel que f'(a) = O. L'application f étant convexe sur U on a, pour tout x E U,
f(x) 2 f(a) - f'(a)(x - a), ce qui sécrit aussi f(x) 2 f(a). Donc f admet un minimum absolu en
a.
4) L'application f : !Rn -> IR, f (X) = (1/2)(AXIX) - (BIX), est différentiable sur !Rn car les applications
X,_. (AXIX) et X,_. (BIX) le sont: la seconde est linéaire, la première est composée de X,_. (AX, X),
définie sur !Rn, qui est linéaire, et de (X, Y) ,_. (XIY), définie sur !Rn x !Rn, qui est bilinéaire. On calcule la
différentielle de f en un point X à laide de la formule de dérivation des fonctions composées et on obtient, pour
tout HE !Rn,
f'(X)(H) = ~2 (AXIH) + ~2 (AHIX) - (BIH) = (AX - BIH),

car A étant symétrique, (AXIH) = (AHIX). Or f est convexe sur !Rn si et seulement si, pour tous X et
Y E !Rn, f(Y) - f(X) - f'(X)(Y - X) 2 0, soit encore, si et seulement si, pour tous X et Y E !Rn,

~ (AYIY) - (BIY) - ~(AXIX) + (BIX) - (AX - BIY - X) 2 o.


§ 8. Solutions 89

Cette dernière condition s'écrit aussi, compte tenu de la bilinéarité du produit scalaire et de la symétrie de A,
(1/2(A(Y - X) 1 Y - x)
2 O. Mais tout élément Z E IRn peut s'écrire sous la forme Z =Y - X, où
X et Y E IRn. Finalement, f est convexe si et seulement si pour tout Z E IRn, (AZIZ) 2 0, c'est-à-dire si et
seulement si la matrice symétrique A est positive.

Solution III. 7.
1) En écrivant les fonnules de Taylor-Young à! 'ordre 3 pour f et à l'ordre 2 pour f' on obtient, compte tenu des
hypothèses,
f(X) = ! !" (O)(X, X)+! !"'(O)(X, X, X)+ o(JJXll 3 ),
2 6
f'(X) = f"(O)X + ! !'"(O)(X, X)+ o(JJXIJ 2 ).
2
Cette dernière égalité devient

f'(X)X = f"(O)(X, X)+!2 f"'(O)(X, X, X)+ o(llXJJ 2 )X.


Par combinaison linéaire des égalités précédentes et en remarquant que o(llXll 2 )X est de la forme o(llXJl 3 ),
on obtient
2/(X) - J'(X)X = _!6 J'"(O).(X, X, X)+ o(JJXJJ 3 ).

2) Pour X = (x, y) E IR. 2 , on a f" (0) ( (x, y), (x, y))= 2xy. La fonction
0 si (x, y) = (0, 0),
e(x,y) ={ f(x,y) -xy
2 2
. (X y ) r__,_(OO) ,
SI 1 1
X +y

est continue en tout point (x, y) =P (0, 0), comme quotient de deux fonctions continues.
La formule de Taylor appliquée à f à l'ordre 2 donne

f(X) = !2 !" (O)(X, X)+ o(llXJJ 2 ),


soit f(x, y) = xy + (x 2 + y 2 )ê(x, y), où ê est une fonction définie sur IR. 2 ayant pour limite 0 en (0, 0). Donc
e(x, y) = ê(x, y), ce qui prouve la continuité de e en (0, 0).
3 a) L'application g est continue en tout point (x, t) tel que x =P 0, comme composée de fonctions continues.
0 n remarque que s1. x -r-
__,_ 0 ( )
, e x, xt = (
f(x, xt) t . Soit. to E "'·
Tlll 0 • à . .,d
na, grace 1a contmutte e e,
2) 2 - - - 2
l+t X l+t
lim{x,t)->{O,to) e(x, xt) = lim(x,y)->(O,O) e(x, y) = 0, donc
.
11m f (x, xt) to .
11m f(x, xt)
-- et finalement - - - =to,
{x, t )-> {O, to) (1 + t 2 )x 2 1+ t5 ' (x,t)->(O,to) x2

ce qui prouve la continuité de g en (0, to).


3 b) La partie U = { (x, t)E IR. 2 ; x =P 0} est ouverte car c'est l'image réciproque de l'ouvert IR* de IR par
la première projection (x, t) 1--> x, qui est continue. De plus, g est de classe ci sur U, car elle est composée
d'applications de classe ci.
3 c) En appliquant à/~ la formule de Taylor à l'ordre 1 en (0, 0) on obtient, pour tout (x, t) EU,

f~(x, t) = f~(O, 0) + xff~(O, 0) + tf~~(O, 0) + o(ll(x, t)ii) = x + o(ll(x, t)ii) ·


Donc g~(x, t) = x-i f~(x, xt) = 1 + o(Jxl). On en déduit que pour tout b E IR,
lim g~(x, t) =1
(x,t)->(O,b), (x,t)EU

3 d) Pour (x, t) EU,

'( ) - 1 ( '( ) '( )) 2f(x,xt) _ f'(x,xt)(x,xt)-2f(x,xt)


9i x, t - 2 fi x, xt +th x, xt - 3 - 3 ,
X X X
90 Chapitre III. Différentielles d'ordre supérieur

soit, en tenant compte de ( *),

g~ (x, t) = ~
6x
!'" (0) ( (x, xt), (x, xt), (x, xt)) + ~ o(IJ(x, t)11 3 )
X
.

Mais limcx,t)->(O,b), (x,t)EU x- 3 o(ll(x, t)ll 3 ) = 0, donc

P(b) = lim g~ (x, t) = ~ J"'(O) ((1, b), (1, b), (1, b)) .
(x,t)->(O,b) 6

4 a) Pour (h, k) E JR 2 , on pose C0(h, k) = hP(b) + k et 1/J(h, k) = g(h, b + k) - g(O, b) - Cb(h, k). On a
donc 1/;(0, k) = g(O, b + k) - g(O, b) - k =O. Soit h =f. O. L'application Cb est linéaire, donc différentiable
en tout point. L'application g est différentiable en (h, k) EU. L'application 'If; est donc différentiable en (h, k)
et, pour (a, ,6) E JR 2 ,

1/; 1 (h, k)(a, ,6) = g'(h, b + k)(a, ,6) - Cb(a, ,6) = ag~ (h, b + k) + ,6g~(h, b + k) - Cb(a, ,6),

ce qui donne lim(h,k)->O, (h,k)f.O 'If;' (h, k)(a, ,6) = aP(b) + ,6 - Cb(Œ, ,6) = 0, d'où

lim 1/J'(h,k)= lim g'(h,b+k)-Cb=O.


(h,k) ->O,(h,k)f.O (h,k) ->0,(h,k)f.O

4 b) On suppose h =f. O. Soit() la fonction, définie sur l'intervalle [O, l], O(À) = 1/J(Àh, Àk). L'application() est
dérivable sur JO, 1[, de dérivée()' (À) = 'If;' (Àh, Àk) (h, k ). En appliquant à() le théorème des accroissements
finis entre 0 et 1, on obtient

111/J(h,k)-1/J(O,O)ll :S sup 111/J'(Àh,Àk)llll(h,k)ll,


.XE ]0,1[

d'où
lim 'lf;(h,k) =0.
(h,k)->O, (h,k)f.O IJ(h, k)ll

4 c) Le résultat précédent s'écrit encore

.
1IID g(h, b + k) - g(O, b) - Cb(h, k)
=Ü,
(h,k)->0, (h,k)f.O IJ(h, k)ll

ce qui prouve que g est différentiable en (0, b) et a pour différentielle g1 (0, b) = Cb. De plus, d'après 4 a, g1 est
continue en (0, b), donc g est de classe C 1 sur IR 2 .
5) L'application g étant de classe C 1 sur IR 2 et g~ (0, 0) étant =f. 0, donc inversible, on peut appliquer à g le
théorème des fonctions implicites au voisinage de (0, 0). Il exister > 0 et une application <p : J - r, r[---+ IR,
de classe C 1 • tels que les propriétés suivantes soient équivalentes :
(i) (t,x) E]-r,r[x]-r,r[ etg(t,x) = 0,
(ii) x E] - r,r[ et t = ip(x).
Soit, en posant y = tx,
(i) x E] - r,r[, IYI < rlxl et f(x,y) = 0,
(ii) x E J - r, r[ et y= xip(x).
Dans ce cas, la tangente au graphe de l'application x ,__, x<p(x) au point 0 a pour pente ip(O) =O.
La même étude peut être faite en échangeant les rôles de x et de y.
La courbe de niveau 0 de f est constituée de deux arcs de courbe passant par l'origine et tangents en ce point,
respectivement, à chacun des axes de coordonnées.

Solution III.8. L'application f est différentiable sur l'ouvert U = ]O, +oo[ x ]O, +oo[. Si elle admet en un
point (a, b) de U un maximun absolu, alors f'(a, b) = 0 (on désigne par 0 l'application nulle). Recherchons
donc les points ( x, y) E U où f ~ ( x, y) = f ~ (x, y) = 0, soit encore après calcul de ces dérivées partielles, les
points (x, y) E U tels que y(y - x 2 ) = x(x - y 2 ) =O. Le seul point convenant est le point (a, b) = (1, 1)
et en ce point, f(l, 1) = 1/8. Montrons donc maintenant que pour tout (x, y) E U, f(x, y) :S 1/8.
§ 8. Solutions 91

On peut remarquer que pour tout (x, y) E U, f(x, y) < (x + y)- 1 , donc si de plus x + y 2 8,alors
f(x +y) < 1/8.
L'application f peut être prolongée en une fonction continue g : [O, +oo[ x [O, +oo[---> IR en posant

g(x,y) = f(x,y) si xy # 0, g(x, y) = 0 six= 0 ou y= 0.

Considérons alors K = { (x, y) E IR 2 ; x 2 0, y 2 0, x +y s:; 8 }. C'est une partie de IR 2 fermée


bornée, donc compacte. L'application g est continue sur K, il existe donc un point (a, /3) de K tel que pour tout
(x, y) E K, g(x, y) s:; g(a, /3). Mais (1, 1) E K, donc g(a, /3) 2 1/8, ce qui prouve que (a, /3) appartient à
0
l'intérieur K de K. Comme g est différentiable sur cet ouvert, les dérivées partielles de g ail point (a, /3) sont
0
nulles. Mais f et g coïncident sur K, donc (a, /3) = (1, 1).
0
Si maintenant (x, y) E U et (x, y) EK donc g(x, y) s:; g(l, 1), soit encore f(x, y) s:; 1/8.
< 8, alors (x, y)
L'application f admet 1/8 pour maximum absolu et l'unique point (x, y) E U tel que f (x, y) = 1/8 est le
point (1, 1).

Solution III.9.
1) Le calcul donne f'(u) = (u - 1)(3u + 1). On a donc u 2 0 et f'(u) = 0 si et seulement si u = 1.

2) La matrice M 'P associée à la fonne quadratique <p possède trois valeurs propres strictement positives deux à
deux distinctes. La fonne quadratique <p est donc définie positive: pour tout (x, y, z) E IR 3 , cp(x, y, z) 2 0, et
cp(x, y, z) = 0 si et seulement si (x, y, z) = (0, 0, 0).
3) Soit a E IR 3 . On sait que F' (a) = D f ( cp(a)) o Dcp(a) = f' ( c.p(a)) Dcp(a), en désignant par f' la dérivée
de f au sens usuel. Les conditions suivantes sont alors équivalentes :
- a est un point critique de F = f o <p, c'est-à-dire un point tel que F' (a) = 0,
- f' ( cp(a)) = 0 ou Dcp(a) = 0 (on désigne par 0 l'élément nul de .L'.(IR 3 , IR)),
- cp(a) = 1 ou a= (0,0,0).
En effet, d'une part cp(a) 2 0 donc, d'après la question 1, f'(cp(a)) = 0 si et seulement si cp(a) = 1;
d'autre part, Dcp(x, y, z) = 0 si et seulement si les trois dérivées partielles cp~. cp~ et <p~ de <p s'annulent au
point (x, y, z); la matrice du système linéaire obtenu en écrivant que ces trois dérivées partielles s'annulent
est 2M'P; comme cette forme quadratique est définie positive, l'unique solution de ce système linéaire est
(x, y, z) = (0, 0, O); donc Dcp(x, y, z) = 0 si et seulement si (x, y, z) = (0, 0, 0).
4) En tout point m = (x, y, z) E IR 3 , on a F' (m) = f' ( cp(m)) Dcp(m), ce qui donne, en faisant intervenir
les dérivées partielles (au sens usuel) des fonctions F et <p: Ff(m) = f' ( cp(m)) cp~(m), i E {1, 2, 3}. Les
dérivées partielles secondes de F en m ont alors pour valeur

i, j E {1,2,3}.

Pour m = a = (0, 0, 0), f' (cp(a)) = f' (0) = -1 et, pour i E { 1, 2, 3}, <p~ (0) = O. La matrice hessienne
de Fen a = (0, 0, 0) est donc la matrice

C'est la matrice assaciée à une forme bilinéaire symétrique négative et non dégénérée. L'application F admet
donc en a un maximum relatif strict (voir corollaire 5.9 puis théorème 5.7).
5) Soit m E IR 3 . On a vu en 2 que cp(m) 2 O. Pour tout x 2 0, f (x) 2 0, donc en particulier f o cp(m) 2 0,
soit F(m) 2 O. Si a est un point critique non nul de F, d'après 3, cp(a) = 1, donc F(a) = f(l) = O; comme
pour tout m E IR 3 , F( m) 2 0, on conclut que F admet en a un minimun absolu.

Solution III.10.
l)SoitG: !1---> IRl'applicationG(x,y) = F(x,y,cp(x,y)).C'estlacomposéeG = Fo'l/Jdel'applications
'l/J : (x, y) >--> ( x, y, cp( x, y)), définie sur n, et de l'application F. Ces deux applications étant de classe
0 2, Gest de classe 0 2 . Sa différentielle DG(x,y) au point (x,y) E n se calcule à l'aide de la formule
92 Chapitre III. Différentielles d'ordre supérieur

DG(x, y)= DF( 'l/;(x, y)) o D'l/;(x, y), ce qui donne, en utilisant les matrices jacobiennes des différentielles
des fonctions concernées :

(G~(x,y) G~(x,y)) = (F~o'l/;(x,y) F~o'l/;(x,y) F;o'l/;(x,y)) ( ~ ~ )


<p~(x,y) <p~(x,y)

d'où finalement les égalités fonctionnelles

(1) (2)

Les dérivées partielles secondes de G s'obtiennent en dérivant par rapport à x puis par rapport y les formules
précédentes, la dérivée d'un produit ou d'une somme s'obtenant par les formules usuelles de dérivation d'un
produit ou d'une somme de deux fonctions numériques, la dérivée d'une composée s'obtenant en réutilisant les
formules (1) ou (2); par exemple, la dérivée partielle par rapprort à x de la composée F; o '!/;s'obtenant en
remplaçant F par F; dans la formule (1). On obtient ainsi les formules:

G~x = F~'x o '!/; + 2(F/:z o 'l/;)<p~ + (F~~ o 'l/;)(<p~) 2 + (F~ o 'l/;)<p~x, (3)
G~y = F~~ o '!/; + 2(F~'z o 'l/;)<p~ + (F~~ o 'l/;)(<p~) 2 + (F~ o 'l/;)<p~y, (4)
G~y = F~'v o '!/; + (F/:z o ·l/J)<p~ + (F~z o 'l/;)<p~ + (F~~ o 'l/;)<p~<p~ + (F~ o 'l/;)<p~y. (5)

La fonction G est supposée nulle sur n; ses dérivées partielles premières et secondes sont donc nulles en tout
point de n. Les égalités cherchées s'obtiennent tout simplement en écrivant que les membres de droite des
égalités (1), (2), (3), ( 4) et (5) sont nuls.
2) Soit (a, b) E n un extremum relatif de <p. On pose c = <p( a, b). On sait alors (théorème 5.2 et application 5. IO)
2
que Dcp( a, b) = 0 et que ( <p~Y (a, b)) 2 - <p~x (a, b)<p~ (a, b) ::; O. Mais en écrivant que les membres de
droite de (3), ( 4) et (5) sont nuls, on a les égalités

F~'x(a, b, c) + <p~x(a, b)F~(a, b, c) = 0, (3')


F~~(a, b, c) + <p~y(a, b)F~(a, b, c) = 0, (4')
F~'y(a, b, c) + <p~y(a, b)F;(a, b, c) = 0, (5')

ce qui entraîne :

On obtient donc finalement :

F(a, b, c) = F~(a, b, c) = F~(a, b, c) = 0,

3) Les solutions du système d'équations F(x,y,z) = F~(x,y,z) = F~(x,y,z) = 0 sont les points
M1 = (-2,0,l)etM2 = (16/7,0,-8/7).Posons(a1,b1) = (-2,0),(a2,b2) = (16/7,0),ci = 1,
c2 = -8 /7. On vérifie que pour i = 1 ou i = 2, F; (ai, bi, c;) i= O. On peut donc appliquer le théorème des
fonctions implicites à F au voisinage de chacun des points Mi : il existe un voisinage ouvert ni de (ai, bi) dans
IR 2 et une fonction <pi : ni --> IR, de classe C 2, telle que pour tout (x, y) E ni, F ( x, y, <pi (x, y)) = O.
Vérifions maintenant que <pi présente au point (ai, bi) un extremum relatif. En utilisant les formules ( 1) et (2),
nous obtenons

ce qui entraîne, puisque F~(ai, bi, ci)= F~(ai, bi, ci)= 0 et F;(ai, bi, ci) i= 0,
<p~ x (ai, bi) = <p~ Y (a; , bi) = 0.

De plus, les formules (3'), (4') et (5') permettent le calcul des dérivées partielles secondes de <pi au point
(ai,bi).Ona,pourtout(x,y,z) E IR 3 ,

F~'y(x, y, z) = 0, F~~(x, y, z) = 4.
§ 8. Solutions 93

Pour i = 1, F~(ai, bi, ci)= -15, d'où cp7 xx(ai, bi) = 4/15, cp7 xy(ai, bi) = 0, cp7 yy(ai, bi) = 4/15,
donc ( cp7 xy (ai, bi)) 2 < cp7 xx (ai, bi) cp7 YY (ai, bi ), ce qui prouve que cpi présente en (ai, bi) un minimum
local strict.
Pour i = 2, F~(a2, b2, c2) = 105/7, d'où cp~ xx(a2, b2) = -28/105, cp~ xy(a2, b2) = 0, cp~ yy(a2, b2) =
-28 /105, donc ( cp~ xy ( a2, b2)) 2 < cp~ xx (a2, b2) cp~ YY ( a2, b2 ), ce qui prouve que cp2 présente en ( a2, b2)
un maximum local strict.

Solution Ill.Il.
1) La fonction g est continue sur IR 2 et admet, en tout point (x, y) de IR 2 - {(0,0)}, des dérivées partielles
ayant pour expressions

8g(x, y) = 2x _ !!:. x a 8g(x,y) = 2y- !!:. y


ax 2 J x2 + y2 - 2' 8y 2 y'x2 + y2 ·

On voit aisément que ces deux dérivées partielles sont continues sur JR 2 - { (0, 0)}; la fonction g est donc de
classe ci sur cet ouvert. On remarque aussi que g n'est pas différentiable au point (0, 0).
2) Appliquons la méthode des multiplicateurs de Lagrange. Si la coordonnée x admet, en un point (a, (3) de
C, un extremum local, et si en ce point la différentielle de g existe et est non nulle, il existe À E IR tel que la
différentielle de l'application (x, y),__. x - Àg(x, y) soit nulle au point (a, (3). Nous obtenons ainsi

8g 8g
l+À-(a,(3)=0, À- (a,(3) =O.
ax 8y

La première équation montre que À =I 0, et la seconde implique (3 ( 4 - a(a 2 + (3 2 )-i/ 2 ) = 0, en supposant


(a, (3) =I (0, 0). Cette condition est satisfaite si nous avons, soit (3 = 0, soit 4 - a(a 2
+ (3 2 )-i/ 2 = O. De
plus, nous devons avoir aussi g( a, (3) = O.
Examinons d'abord la première possibilité, (3 =O. En exprimant que g(a, (3) = 0, nous voyons que a doit être
égal soit à 0, soit à a. Nous obtenons donc deux points susceptibles de convenir, l'origine (0, 0) et le point (a, 0).
Remarquons cependant qu'une des hypothèses nécessaires à l'application de la méthode des multiplicateurs de
Lagrange n'est pas satisfaite au point (0, 0) : en ce point, g n'est pas différentiable.
Examinons maintenant la seconde possibilité, 4 - a(a 2 + (3 2 )-i/ 2 = O. En exprimant que g(a, (3) = 0, on
trouve a = -a/8 et (3 = ±av'3/8.
Nous avons au total quatre points où la coordonnée x peut éventuellement avoir un extremum relatif sur la courbe
C: l'origine (0, 0), et les points (a, 0), (-a/8, -av'3/8) et (-a/8, av'3/8).
Afin de voir si effectivement x admet sur la courbe C, en chacun de ces points, un extremum relatif, nous voyons
qu'en posant y'x2 + y2 = p, l'équation g(x, y) = O s'écrit

2 2
x=-p -p.
a

Le membre de droite de cette expression atteint son minimum pour p = a/4. Les points de C correspondants
sont (-a/8, -av'3/8) et (-a/8, av'3/8). En ces points, x atteint donc son minimum absolu sur C.
Puisque p 2 0 la relation ( *) montre aussi que pour p non nul assez petit, on a x < O. La coordonnée x admet
donc, à l'origine (0, 0), un maximum relatif strict sur C.
D'autre part, puisque lxl ~ p, l'expression ( *) montre qu'en tout point de la courbe C, on a x ~ a. La
coordonnée x atteint donc, sur C, son maximum absolu au point (a, 0).
3) En coordonnées polaires, l'équation de la courbe C est p = (a/2)(1+cos0). Cette courbe est une cardioïde
admettant l'axe des abscisses pour axe de symétrie et l'origine pour point de rebroussement. Les points de cette
courbe où la coordonnée x admet un extremum relatif sont, d'une part les points où la tangente à la courbe C est
parallèle à l'axe des ordonnées (ce sont ces points que l'on trouve par application de la méthode des multiplicateurs
de Lagrange), d'autre part le point de rebroussement (0, 0), où la la fonction g n'est pas différentiable.

Solution IIl.12.
1) Remarquons d'abord que la différentielle de la fonction x ,_. (xlx) ne s'annule pas sur la sphère S. D'après
le théorème des multiplicateurs de Lagrange 6.5, si en un point a E S, la fonction f admet sur la sphère S un
94 Chapitre III. Différentielles d'ordre supérieur

extremum relatif, il existe À E IR tel que la différentielle de la fonction x ,_. f (x) - À(xlx) s'annule au point
a. Or compte tenu de la symétrie de A, cette différentielle est lapplication linéaire y ,_. D f (a)(y) - 2À( aly ),
ou encore y,_. 2(Aa - Àaly). Par suite, Aa = Àa, ce qui exprime que a est vecteur propre de A associé à la
valeur propre À.
Réciproquement, si a est vecteur propre de A associé à la valeur propre réelle À, le même calcul que ci-dessus
montre que la différentielle, au point a, de la fonction x ,_. f (x) - À(xlx) est nulle.
2) Étant définie positive, l'application linéaire A est un isomorphisme. Par suite, la différentielle de l'application
x ,_. f(x) = (Axlx) ne s'annule pas sur Q. D'après le théorème des multiplicateurs de Lagrange 6.5, si en un
point a E Q, laforme linéairex ,_. (zlx) admetsurQ un extremum relatif, il existe À E IR tel que la différentielle
de la fonction x ,_. (zlx) - Àf(x) s'annule au point a. Or compte tenu de la symétrie de A, cette différentielle
est l'application linéaire y,_. (zly) - ÀDf(a)(y), ou encore y,_. (z - 2ÀAaly). Nous devons donc avoir
2ÀAa = z. Comme nous avons supposé z =f- 0, le multiplicateur À doit être non nul, et a = A- 1 ( z/(2À)).
En écrivant que a E Q, nous obtenons (zlA- 1z) = 4À 2 , d'où nous tirons À= ±(1/2)y'(z!A- 1z). Nous
obtenons donc deux points de Q où la forme linéaire x ,_. (zlx) peut éventuellement avoir un extremum relatif:
les points ±(zlA- 1z)- 1/2 A-Iz.
La partie Q de IRn est fermée et bornée, donc compacte. Par suite, la forme linéaire x ,_. (zlx) atteint sur Q
son maximum et son minimum. Cela prouve que les deux points de Q trouvés ci-dessus sont effectivement les
points où cette forme linéaire atteint son maximum et son minimum sur Q.
L'interprétation géométrique de ces résultats est très simple : la partie Q de IRn est une quadrique compacte
(ellipsoïde de dimension n - 1) admettant l'origine pour centre de symétrie. Les points de cette quadrique où la
forme linéaire x ,_. (zlx) admet un extremum sont les points où l'hyperplan affine tangent à la quadrique Q est
parallèle au noyau de cette forme linéaire.

Solution III.13. Il s'agit ici de déterminer les points de A où la fonction f : IR 3 --> IR, f (x, y, z) =
x + y + z , admet un minimum absolu. La partie A de IR 3 est l'image réciproque de (0, 0) par l'application
2 2 2

g = (g1,g2): IR 3 --> IR 2, g1(x,y,z) = z 2 + xy, g2(x,y,z) = x 2 + y 2 - 1. Le théorème 6.5 et son


application 6.6 au cas d'espaces de dimension finie permettent d'affirmer qu'en tout point m = (a, b, c) E A
où la restriction de f à la partie A admet un minimun absolu et où la différentielle de g est surjective, il existe
deux réels À etµ tels que la différentielle, en ce point, de l'application f - Àg1 - µg2, soit nulle; autrement
dit, en ce point, les trois dérivées partielles de cette application doivent être simultanément nulles. On est donc
amené à résoudre le système de cinq équations à cinq inconnues x, y, z, À,µ suivant,

2x - Ày - 2µx = 0, 2y - Àx - 2µy = 0, z - Àz = 0, z 2 + xy = 0, x 2 + y2 - 1 = 0,

dans lequel x et y jouent des rôles symétriques. La troisième équation donnez = 0 ou À = 1. D'autre part, on
vérifie que (x, y) # (0, 0) en tout point (x, y, z) de A; le système formé des deux premières équations n'admet
donc de solution dans A que si son déterminant est nul. On obtient la condition 4(1 - µ 2 ) - ). 2 = 0, ce qui
donne À= ±2(1 - µ).
Examinons le cas z = O. On a dans ce cas, d'après la quatrième équation, xy = O. Examinons le cas x = O;
on obtient alors y 2 = 1, À = 0, µ = 1. On obtient ainsi les points m1 = (0, 1, 0) et m2 = (0, -1, 0). En
échangeant les rôles de x et de y, on obtient aussi les points ma = (1, 0, 0) et m4 = (-1, 0, 0).
Dans le cas ou À = 1, on trouveµ = 1/2 ouµ = 3/2. Lorsqueµ = 1/2, pour déterminer x et y il reste donc
à résoudre le système x - y = 0, z 2 + xy = 0, x 2 + y 2 = 1, qui n'admet pas de solution. Lorsqueµ= 3/2,
x et y sont solution du système x + y = 0, z 2 + xy = 0, x 2 + y 2 = 1, qui admet pour solutions les points
ni= (1/2, -1/2, 1/2), n2 = (1/2, -1/2,-1/2), na= (-1/2, 1/2, 1/2), n4=(-1/2,1/2, 1/2).
La matrice jacobienne de la différentielle de g au point ( x, y, z) est ( Y x 2 z) ; elle est de rang 2 en
2x 2y 0
chacun des points mi et ni trouvés; la différentielle de g en ces points est bien surjective.
Nous avons donc trouvé huit points ou la restriction de f à A peut être minimum. Nous contatons que
f (mi) = 1, i E { 1, 2, 3, 4} et f(nj) = 3/4, j E { 1, 2, 3, 4}. Les points nj sont situés à l'intérieur de
la boule fermée Bp(O, 1) de IR 3 de centre l'origine et de rayon 1. L'application g étant continue, A est une
partie fermée de IR 3 et An Bp(O, 1) est un compact de cet espace. La restriction de l'application continue f à
An Bp(O, 1) atteint son minimum. De plus si (x, y, z) <f- Bp(O, 1), f(x, y, z) > 1. Ainsi, on peut affirmer
que les points de A les plus proches de (0, 0, 0) sont les points nj, j E { 1, 2, 3, 4}.
Chapitre IV

Équations différentielles; généralités

Les équations différentielles constituent un des principaux développements du cal-


cul différentiel. D'une grande imp01tance en mathématiques pures, elles sont aussi
extrêmement utilisées dans les applications aux autres sciences, par exemple en Mécanique
et en Physique, pour décrire!' évolution d'un système au cours du temps. En raison de leur
importance, plusieurs chapitres du présent livre leur sont dédiés.
Dans le présent chapitre, après quelques généralités, nous allons décrire diverses trans-
formations applicables aux équations différentielles. Nous verrons notamment comment
ramener une équation différentielle au premier ordre, comment la mettre sous forme d'une
équation autonome, ou encore comment la transformer par difféomorphisme ou change-
ment de temps.

1. Équations différentielles sous forme canonique


1.1. Notations et conventions. - Dans tout ce paragraphe E est un espace vectoriel réel
normé. Comme d'habitude, nous identifierons les espaces .C(IR, E), .C(IR, .C(IR, E)), etc ... ,
à E. Une application cp d'un intervalle ouvert Ide IR dans E étant donnée, nous noterons
cp', cp", .. ., cp(n) ses dérivées première, seconde, .. ., d'ordre n, lorsqu'elles existent. Nous
. . Il d' . , dcp d2cp dncp 1 .
noterons aussi occas10nne ement ces envees dt, dt 2 , .. ., dtn orsque ces notations
seront plus commodes. En supposant que cp soit n fois différentiable sur!, rappelons que cp',
cp", .. ., cp(n) sont des applications de!, respectivement, dans .C(IR, E) .C (IR, .C(IR, E)), .. .,
.C (IR, .C (IR, .C( ... E) ... ) ) . Mais compte tenu des identifications mentionnées ci-dessus,
nous pouvons considérer toutes les dérivées cp', cp", .. ., cp(n) de l'application cp comme
étant à valeurs dans E.
1.2. Définitions
(i) Une équation différentielle du premier ordre, sous forme canonique, dans l'espace
E, est une relation de la forme
cp'(t) = f(t,cp(t)) (1)
où f est une application d'une partie 0 de IR x E dans E. Une solution de cette
équation différentielle est une application différentiable cp d'un intervalle ouvert
I de IR dans E, telle que pour tout t E !, (t, cp(t)) soit élément de 0, et que
(t,cp(t),cp'(t)) vérifie la relation (1).
(ii) Une équation différentielle d'ordre n (n entier 2: 1), sous forme canonique, dans
l'espace E, est une relation de la forme
cp(n)(t) = J(t, cp(t), cp'(t), ... , cp(n-l)(t)) (2)
96 Chapitre IV. Équations différentielles; généralités

où f est une application d'une partie n de JR.xEx · · · xE (n facteurs E) dans E. Une


solution de cette équation est une application n fois différentiable <p d'un intervalle
ouvert Ide lR. dans E, telle que pour tout t E J, (t, <p(t), <p'(t), ... , <p(n- 1l(t)) soit
élément den, et que (t, <p(t), <p1 (t), ... '<p(nl(t)) vérifi.e la relation (2).
1.3. Équations différentielles scalaires et systèmes. - Si E = JR., l'équation
différentielle (1) (resp., (2)), est dite équation différentielle scalaire du premier ordre
(resp., d'ordre n). Si E est de dimension finie p > 1, il s'identifie (moyennant le choix
d'une base) à JR.P. L'équation différentielle (1) s'écrit, en explicitant ses composantes,
<p~(t) = fi(t,<p1(t), ... ,<pp(t))'
<p~ (t) = fi (t' <p1 (t)' ... ' <pp (t)) '
(3)

<p~(t) = f~(t, <p1(t), ... '<pp(t))'


où <p 1, <pz, ... , <pp sont les composantes de l'application <p de I dans JR.P, et fi, fz, ... , fp
celles de l'application f de n dans JR.P. Le système d'équations (3) est appelé système
différentiel du premier ordre, de rang p.
Dans les mêmes hypothèses, en explicitant les composantes de l'équation différentielle (2)
d'ordre n, nous obtenons un système différentiel d'ordre n, de rang p.
1.4. Retour au premier ordre. - Une équation différentielle d'ordre n dans l'espace E
peut toujours être ramenée à une équation du premier ordre dans l'espace En. Soit en effet
<p une solution de l'équation (2). Désignons par 'ljJ = (1/Jo, 1/J1, ... , 1/Jn-1) l'application de
I dans En = E x E x · · · x E (n facteurs E),
t ~ (<p(t),<p'(t), ... ,<p(n-ll(t)).
En d'autres termes, posons
1/Jo = <p' 1/J1 = <p'' 1/Jn-1 = <p(n-1).
D'autre part, désignons par F = (Fo, F1, ... , Fn_ 1) l'application den (partie de lR. x En)
dans En
(t,xo, ... ,Xn-1) ~ (x1, ... ,Xn-1,f(t,xo, ... ,xn-1)).
En d'autres termes,
Fo(t, xo, ... , Xn-1) = x1,

Fn-2(t, Xo, · · ·, Xn-1) = Xn-1,


Fn-1 (t, Xo, ... , Xn-1) = f(t, Xo, ... , Xn-1).
Nous voyons alors que 'ljJ vérifie l'équation différentielle du premier ordre
1/J' (t) = F (t, 'ljJ (t)) , (4)
qui s'écrit, en explicitant ses composantes,
1/Jb(t) = 1/J1 (t)'
1/J~ (t) = 1/Jz(t),

1/J~_z(t) = 1/Jn-1(t),
1/J~-l (t) = f (t, 1/Jo(t), ... , 1/Jn-1(t)).
Réciproquement, si 'ljJ est une solution de (4), sa première composante 1/Jo est solution de
(2), et ses autres composantes sont les dérivées de 1/Jo d'ordre 1, 2, ... , n - 1.
§ 2. Équations différentielles autonomes 97

2. Équations différentielles autonomes

2.1. Définition. - Une équation différentielle autonome du premier ordre, sous forme
canonique, dans l'espace E, est une relation de la forme
c.p'(t) = X(c.p(t)), (5)
où X est un champ de vecteurs sur une partie U de E, c'est-à-dire une application
de U dans E. Une solution de cette équation différentielle est une application
différentiable c.p d'un intervalle ouvert I de lR dans E, telle que pour tout t E I,
c.p(t) soit élément de U, et que (c.p(t), c.p'(t)) vérifie la relation (5).

En d'autres termes, une équation différentielle du premier ordre, sous forme canonique,
de la forme (1), est autonome si la partie n de lR x E sur laquelle l'application f est
définie est de la forme lR x U, où U est une partie de E, et si la fonction f est de la forme
f(t, x) = X(x), où X est une application de U dans E. Autrement dit, f est constante
sur chaque partie lR x {x} de lR x U, (x E U). On dit alors que f ne dépend pas de sa
première variable t E R
La proposition suivante indique une importante propriété de l'ensemble des solutions d'une
équation autonome.
2.2. Proposition. - Soit c.p : I ---+ E une solution de l'équation différentielle
autonome (5), et soit to E JR. Désignons par Tt 0 : lR---+ lR la translation t ~ t - t 0 .
Alors l'application c.p o Tt 0 du translaté I + t 0 de l'intervalle I dans E est aussi
solution de l'équation autonome (5).
Preuve : L'application Tt 0 : I + to ---+ I, qui a pour expression s ~ s - t 0 , est
différentiable en tout point de I +t0 , et a pour différentielle l'application identique de JR; en
d'autres termes, sa dérivée est constante, et égale à 1. Posons '1jJ = c.p o Tt 0 • L'application
'1jJ est différentiable sur I + t 0 , comme composée d'applications différentiables, et sa
différentielle, en chaque points E I + t 0 , est (proposition 1.1.8)
D'lj;(s) = Dc.p(Tt 0 (s)) o DTt 0 (s) = Dc.p(s - to) o idJR = Dc.p(s - to).
En d'autres termes, et avec d'autres notations, '1jJ est dérivable en tout points de I + t0 , et
'1/; s) = c.p' (s - to) .
1(

Mais comme c.p est solution de (5), nous avons


'l/J'(s) = c.p'(s - to) = X(c.p(s - to)) = X('l/J(s)),
ce qui prouve que '1jJ est aussi solution de (5). D

2.3. Commentaires
a) Translation temporelle et ongme du temps. - Dans les applications, notam-
ment à la Mécanique céleste, les équations différentielles sont utilisées pour décrire
mathématiquement l'évolution d'un système (constitué, par exemple, par un certain nom-
bre d'étoiles et de planètes). Le paramètre réel t, parcourant un intervalle ouvert I, est
interprété comme Je temps, une orientation du temps (distinction entre passé et futur), une
origine et une unité de temps étant supposées choisies. L'état du système à un instant t
est représenté mathématiquement par un élément c.p(t) d'un espace vectoriel normé E;
l'application c.p : I ---+ E représente donc l'évolution du système, pendant l'intervalle
de temps I. Lorsque l'évolution du système est régie par une équation différentielle non
autonome, de Ja_forme (1), l'évolution infinitésimale du système à l'instant t, c'est-à-
dire la dérivée c.p'(t), est égale à f(t, c.p(t)) : elle dépend, à la fois, de l'état instantané
98 Chapitre IV. Équations différentielles; généralités

du système <p(t), et du temps t lui-même. Par contre, lorsque l'évolution du système est
régie par une équation différentielle autonome de la forme (5), <p'(t) ne dépend que de
l'état instantané du système <p(t) : le temps n'intervient pas directement; il n'intervient
qu'à travers la valeur instantanée de <p, c'est-à-dire à travers l'état instantané du système.
La dénomination "équation autonome" traduit le fait qu'à chaque instant, l'évolution in-
finitésimale de l'état du système est entièrement déterminée par l'état instantané de ce
système, et ne fait intervenir aucun élément extérieur au système. La proposition 2.2 traduit
une propriété remarquable, mais assez évidente intuitivement, des sytèmes régis par des
équations différentielles autonomes, qui peut d'ailleurs être interprétée de deux façons
différentes, indiquées ci-dessous. Bien entendu, ces interprétations sortent quelque peu du
domaine strict des mathématiques, puisqu'elles concernent l'utilisation des mathématiques
pour la description de phénomènes physiques.
La première interprétation est l'invariance par translation temporelle. Supposons que
pendant un intervalle de temps I = ]t 1 , t 2 [, l'évolution du système soit décrite par
l'application <p : I --t E. Notons l'état <p(a) du système à un instant particulier a E J.
Supposons qu'on étudie le système à une autre époque, pendant un intervalle de temps
]t 1 + t 0 , t 2 + t 0[ (bien entendu, t 0 pouvant être positif ou négatif). Supposons aussi qu'à
l'instant a+ t 0 , le système soit dans l'état 1/J(a + t 0 ) = <p(a). Alors on doit s'attendre à ce
que l'évolution du système, pendant l'intervalle de temps ]t1 + t 0 , t2 + to[, soit la même
que pendant l'intervalle de temps ]t1, t2 [,c'est-à-dire qu'elle soit décrite par 1' application
1/J: s f--71/J(s) = <p(s - ta).
La seconde interprétation est l'invariance par changement de l'origine du temps. La
représentation d'un instant particulier du temps par un nombre réel t suppose le choix d'une
origine du temps, c'est-à-dire d'un instant qui correspondra au réel t = O. Elle suppose
aussi le choix d'une unité de temps, et d'une orientation du temps, mais nous n'examinerons
pas ici les questions soulevées par ces choix. Considérons un système autonome, c'est-à-
dire un système dont 1'évolution infinitésimale, à un instant donné, ne dépend que de l'état
instantané de ce système. Choisissons une origine du temps (ainsi qu'une unité de temps et
une orientation), afin de pouvoir repérer le temps par un paramètre réel t, et supposons que
pour ce choix, l'évolution du système soit régie par un équation différentielle du premier
ordre, sous forme canonique. Cette équation est autonome, de la forme (5); cela traduit
en effet l'autonomie du système. Nous devons nous demander comment cette équation
est modifiée lorsqu'on change d'origine du temps. La réponse est très simple: l'équation
n'est pas modifiée. En effet, cette équation exprime simplement la manière dont l'évolution
infinitésimale du système <p1 ( t ), à un instant t, dépend de létat instantané <p( t) du système
à cet instant; cette dépendance est exprimée par l'application f. Cette application, qui
met en relation état instantané du système et évolution infinitésimale instantanée, ne doit
pas dépendre du choix d'une origine du temps. Soit <p : I --t E une solution de cette
équation qui représente l'évolution du système pour un choix particulier de l'origine du
temps. Prenons comme nouvelle origine du temps linstant repéré (avec l'ancienne origine
du temps) par le réel -t0 . La même évolution du système est maintenant représentée par
l'application'lj; = c.poTt 0 : I+to --t E,1/J(s) = c.p(s-t0 ).Commel'équationdifférentielle
n'a pas été modifiée par le changement d'origine du temps, l'application 1/J doit être elle
aussi solution de l'équation (5).
b) Retour à une équation autonome. - La recherche des solutions d'une équation
différentielle non autonome dans l'espace E, de forme (1), peut se ramener à celle des
solutions d'une équation autonome dans l'espace F = lR x E. Soit en effet <p : I --t E
une solution de ( 1). Désignons par x l'application de I dans F :
t f--7 x(t) = (t, c.p(t)).
§ 2. Équations différentielles autonomes 99

En d'autres termes, les deux composantes XI et x2 de x ont pour expressions


XI(t)=t, x2(t) = cp(t).
Désignons par g = (gI, g2) l'application de la partie 0 de F = lR x E dans F :
(t,x) g(t,x) = (l,f(t,x)),
i--;

c'est-à-dire
gI(t,x)=l, g2(t, x) = f(t, x).
Nous voyons alors que x est solution de l'équation différentielle autonome
x'(t) = g(x(t)), (6)
qui s'écrit, en explicitant ses composantes,

{ X~ (t) = 1, (7)
x~(t) = f(xI(t),x2(t)).
Réciproquement, soit x = (XI, x2 ) une solution de (6). La première équation (7) montre
que XI a pour expression
XI (t) = t + to,
où t 0 est une constante réelle. Grâce à la proposition 2.2, en composant x avec la translation
Tt 0 , nous pouvons nous ramener au cas où
XI(t)=t.
Nous voyons alors immédiatement que la seconde composante x2 de x est solution de
l'équation différentielle non autonome (1).
c) Équations autonomes d'ordre supérieur. - Par souci de simplicité, nous avons
défini les équations différentielles autonomes du premier ordre. La définition s'étend sans
difficulté aux ordres supérieurs : une équation différentielle autonome d'ordre n, dans
l'espace vectoriel réel normé E, est une relation de la forme
<p (n) ( t) = X ( <p ( t) , <p t), ... , <p (n - I) ( t))
1( (8)
où X est une application d'une partie U de E x · · · x E (n facteurs E) dans E. Une
solution de cette équation est une application n fois différentiable cp d'un intervalle ouvert
Ide lR dans E, telle que pour tout t E J, (cp(t), cp'(t), ... , cp<n-Il(t)) soit élément de U,
et que (cp(t),cp'(t), .. .,cp<nl(t)) vérifie la relation (8).
La proposition 2.2 s'applique aux solutions d'équations différentielles autonomes d'ordre
n; il suffit, pour s'en convaincre, d'utiliser la méthode indiquée en 1.4 pour ramener ces
équations à des équations autonomes du premier ordre.
2.4. Interprétation géométrique et mécanique. - Considérons l'équation différentielle
autonome (5). Rappelons que l'application X, qui à tout point x de la partie U de E
fait correspondre l'élément X (x) de E, est appelée champ de vecteurs sur U. Soit cp
une application d'un intervalle ouvert Ide lR dans E. L'application <p est appelée courbe
paramétrée dans E. Si <p est différentiable, sa dérivée cp' (t) en chaque point t de I est un
élément de E. En mécanique, la variable t E I représente souvent le temps, et l'application
<p le mouvement d'un point mobile dans l'espace E en fonction du temps. Le vecteur cp' (t)
représente alors la vitesse de ce point mobile à l'instant t. Dire que <p est solution de
l'équation différentielle autonome ( 5) équivaut à dire que <p applique I dans U et que pour
tout t E J, le vecteur vitesse cp'(t) du point mobile à l'instant test précisément égal à la,...
valeur du champ de vecteurs X au point cp(t) (qui est la position dans l'espace E du poi9!~·,·
mobile considéré à l'instant t). f
100 Chapitre IV. Équations différentielles; généralités

De même, considérons l'équation différentielle non autonome ( 1). L'application f est


appelée champ de vecteurs dépendant du temps : pour tout t E IR fixé, f associe en effet
à tout point x de Ut= { x E E ; (t,x) En} un élément f(t,x) de E; nous avons
donc bien sur Ut un champ de vecteurs, qui dépend, ainsi d'ailleurs que son domaine
de définition Ut. du paramètre t. Dire qu'une application différentiable 'P de l'intervalle
ouvert Ide IR dans E est solution de l'équation différentielle non autonome (1) équivaut
à dire que pour tout t E I, cp(t) est élément du domaine de définition Ut de f à l'instant
t, et que Je vecteur vitesse cp' (t) à cet instant est précisément égal à la valeur du champ de
vitesses dépendant du temps f, à l'instant t et au point cp( t) qu'occupe le mobile considéré
à l'instant t.
La méthode exposée au paragraphe 2.3.b, qui a permis de ramener la recherche des solutions
d'une équation non autonome à celle des solutions d'une équation autonome, consiste à
associer au champ de vecteurs dépendant du temps f sur la partie n de F = IR x E, un
champ de vecteurs au sens usuel sur n, associant au point (t, x) de n l'élément ( 1, f (t, x))
deF =IR x E.

3. Équations différentielles sous forme non canonique

3.1. Définition. -Soit E un espace vectoriel réel normé, et g une application d'une
partie n de IR x E x · · · x E (n + 1 facteurs E) dans un autre espace vectoriel réel
normé F. On considère la relation
g(t, cp(t), cp'(t),. . ., 'P(n)(t)) = 0. (9)
On dit que c'est une équation différentielle d'ordre n, sous/orme implicite. Une solution
de cette équation est une application n fois différentiable 'P d'un intervalle ouvert
I de IR dans E, telle que pour tout t E I, (t, cp(t), cp'(t), ... , cp(n)(t)) soit élément
den et vérifie (9).

3.2. Mise sous forme canonique. - Nous considèrerons ici seulement le cas où E
et F sont complets et isomorphes. Nous supposerons de plus que n est un ouvert de
IR x En+i et que g est une application différentiable de classe Ck (k ;:::: 1) de n
dans F. Soit (t 0 , ao, ai, ... , an) un point den tel que g(t0 , a0 , ai, ... , an) = O. Si la
différentielle partielle g~n (to, ao, ai, ... , an) est un isomorphisme de E sur F, le théorème
des fonctions implicites montre qu'il existe un voisinage ouvert ni de (t 0 , a0 , ai, ... , an)
dans IR X En+i, ni c n, un voisinage ouvert w de (to, ao, ai, ... ' an-i) dans IR X En'
et une application différentiable h de classe Ck de W dans E telle que l'on ait
(t, Xo, Xi, ... , Xn) E Oi et g(t, Xo, Xi, ... , Xn) =Ü
si et seulement si
(t, xo, Xi, ... ' Xn-i) E w et Xn = h(t, Xo, X1, ... 'Xn-i).
Soit alors 'P : I -4 E une solution de (9) telle que t 0 E I et que cp(t0 ) = a0 ,
cp'(t0 ) =ai, .. ., cp(n)(t0 ) =an. En restreignant si nécessaire I nous pouvons supposer
que pour tout t E l, (t, cp(t), cp'(t), .. ., 'P(n)(t)) E Oi. Mais alors pour tout t E l,
( t, cp(t), cp' (t), ... , cp<n-I) (t)) est élément de W, et
'P(n)(t) = h(t, cp(t), cp'(t), ... , 'P(n-i)(t)). (10)
Nous voyons donc que 'P est solution de l'équation différentielle (10), qui est une
équation d'ordre n sous forme canonique. Réciproquement, soit 'P : I -4 E une solution
§ 4. Intégrales premières 101

de (10) telle que to E I et que <p( to) = ao, <p 1 ( to) = ai, ... , <p(n) ( to) = an.
En restreignant éventuellement I, nous pouvons faire en sorte que pour tout t E I,
( t, <p( t), <p 1 ( t), ... , <p(n-l) ( t)) soit élément de W. Alors <p est solution de (9). Nous voyons
ainsi que le théorème des fonctions implicites permet, au moins localement, lorsqu'il est
applicable, de ramener la recherche de solutions de l'équation différentielle (9), sous
forme implicite, à la recherche de solutions d'une équation différentielle (10) sous forme
canonique. Il importe toutefois de remarquer que d'un point de vue global, les équations
(9) et (10) ne sont pas équivalentes.

4. Intégrales premières

4.1. Définition. - Soit E un espace de Banach et n un ouvert de lR x E. On


considère l'équation différentielle
<p1 (t) = f(t,<p(t))' (11)
où f est une application de n dans E. On appelle intégrale première de cette
équation une fonction g : n --t lR telle que, pour toute solution <p : I --t E de
l'équation différentielle (11), la fonction composée t 1-t g(t, <p(t)) soit une fonction
constante sur I.

4.2. Commentaires
a) Intégrales premières à valeurs vectorielles. - Par souci de rester à un niveau
élémentaire, nous avons défini ci-dessus les intégrales premières à valeurs réelles d'une
équation différentielle. On définit de même, de manière évidente, les intégrales premières
à valeurs dans !Rn, ou dans un espace vectoriel normé quelconque. Bien entendu, chaque
composante d'une intégrale première à valeurs dans !Rn est une intégrale première à valeurs
réelles, au sens de la définition précédente.
Des intégrales premières à valeurs vectorielles apparaissent, de manière naturelle, dans
de nombreux problèmes. Ainsi par exemple, l'étude de certaines équations différentielles
admettant un groupe de symétries conduit très naturellement à considérer des intégrales
premières à valeurs dans le dual d'une algèbre de Lie de dimension finie. Le lecteur ayant
quelques notions de Mécanique se souviendra peut-être de la quantité de mouvement
(appelée aussi impulsion) et du moment cinétique d'un système mécanique par rapport à
un point. Sous des hypothèses convenables, ce sont des intégrales premières de l'équation
différentielle qui régit l'évolution du système. Chacune d'elles est à valeurs dans un espace
vectoriel de dimension 3. Ensemble, elles constituent une intégrale première à valeurs dans
le dual de l'algèbre de Lie (de dimension 6) du groupe des déplacements euclidiens de
l'espace. En considérant les composantes de ces intégrales premières dans une base de
lespace vectoriel dans lequel elles prennent leurs valeurs, on peut bien sûr faire en sorte
de n'avoir à considérer que des intégrales premières à valeurs réelles. Mais en procédant
ainsi, on oublie la nature géométrique de ces intégrales premières; par le choix d'une
base arbitraire, on introduit des éléments étrangers au problème étudié, et on perd une
information importante.
b) Intégrales premières indépendantes du temps. - Supposons l'ouvert n de lR XE
sur lequel est définie l'équation différentielle considérée de la forme n = lR x U, où U est
un ouvert de E. C'est le cas, notamment, lorsque cette équation différentielle est autonome.
Il est alors naturel de s'intéresser en priorité aux intégrales premières g : 1R, x U --t lR qui
ne dépendent pas de la première variable t E IR, et sont donc en fait définies sur louvert
U de E. On dit que ces intégrales premières ne dépendent pas du temps.
102 Chapitre IV. Équations différentielles; généralités

c) Intégrales premières différentiables. -- Les intégrales premières utilisées en pratique


sont le plus souvent différentiables.
4.3. Proposition. - Les hypothèses et notations étant celles de la définition 4.1,
soit g : 0 ~ IR une fonction différentiable.
1. Supposons que pour tout (t, X) E n, la fonction g vérine
8g(t, x)
at + Dxg(t,x)(f(t,x)) = 0, (12)

où 89 ~~x) et Dxg(t,x) désignent, respectivement, la dérivée partielle de g (au


sens usuel) par rapport à sa première variable t, et la différentielle partielle de
g par rapport à sa seconde variable, au point (t, x). Alors, la fonction g est une
intégrale première de l'équation différentielle ( 11).
2. Réciproquement, supposons que g soit une intégrale première del 'équation (11).
S'il existe une solution <p : I ~ E de l'équation différentielle (11), alors l'égalité
(12) est vérifiée en tout point (t 0 , x 0 = <p(t 0 )) du graphe de <p.
Preuve : Soit <p : I ~ E une solution de l'équation différentielle (11). La fonction
t r-t g( t, <p(t)) est différentiable sur I, car composée de deux applications différentiables:
l'application t r-t ( t, <p( t)), et l'application g. Sa dérivée, en t E J, s'obtient par application
de la formule de dérivation des applications composées,

:t g(t, <p(t)) = Dg(t, <p(t)) (1, <p'(t))


= Dtg(t,<p(t))(l) + Dxg(t,<p(t))(<p'(t))
= 8g(t,x)
a j +Dxg(t,x) j ( f(t,<p(t)) ) .
t x=cp(t) x=cp(t)
Supposons la relation (12) vérifiée pour tout (t, x) E O. Pour toute solution <p : I ~ E
de l'équation différentielle (11), l'application t r-t g(t, <p(t)) est constante sur I, car sa
dérivée est identiquement nulle. La fonction g est bien une intégrale première de l'équation
(11).
Réciproquement, supposons que g soit une intégrale première de l'équation (11), et que
cette équation admette une solution <p : I ~ E. Soit t 0 E J. L'application t r-t g( t, <p(t))
est constante sur I. En exprimant que sa dérivée au point t 0 est nulle, nous voyons que
l'égalité (12) est vérifiée au point (t 0 , x 0 = <p(t0 )). D
4.4. Commentaires
a) Équation aux dérivées partielles associée. - L'égalité (12) de la proposition
précédente exprime une relation vérifiée par la différentielle de la fonction g. On dit
que c'est une équation aux dérivées partielles, pour la fonction inconnue g. Cette équation
est dite du premier ordre, car elle ne fait intervenir que la différentielle première de g. Elle
est dite aussi linéaire et homogène, car elle exprime une relation linéaire vérifiée par la
différentielle de g.
L'équation aux dérivées partielles (12) est dite associée à l'équation différentielle (11).
Supposons que pour tout (t 0 , x 0 ) E n, il existe une solution <p : I ~ Ede l'équation
différentielle ( 11) vérifiant t 0 E I et <p( t 0 ) = x 0 . Nous verrons, dans le prochain chapitre,
que cette propriété est notamment vérifiée lorsque l'équation différentielle considérée
satisfait les hypothèses du théorème de Cauchy-Lipschitz. Une fonction différentiable
définie sur n est alors une intégrale première de cette équation si et seulement si elle est
solution de l'équation aux dérivées partielles (12).
§ 5. Effets de quelques transformations 103

b) Dérivée de Lie. - Nous supposons maintenant que l'équation différentielle considérée


est autonome, de la forme
ip' (t) = X ( <p ( t)) , (13)
où X est un champ de vecteurs défini sur une partie U de l'espace E. Nous nous intéressons
particulièrement aux intégrales premières g : U ---+ lR de l'équation (13) qui ne dépendent
pas du temps.
Soit g : U ---+ lR une fonction différentiable. On appelle dérivée de Lie de la fonction g
relativement au champ de vecteurs X, et on note C(X)g (ou parfois Cxg), la fonction,
définie sur U,
x 1-t C(X)g(x) = Dg(x)(X(x)).
C'est la fonction dont la valeur, en chaque point x E U, est la dérivée directionnelle de g
au point x dans la direction du vecteur X (x) (voir I.1.6.a).
L'équation aux dérivées partielles du premier ordre associée à l'équation différentielle
autonome (13) s'écrit maintenant
C(X)g = 0. (14)
Nous verrons dans le prochain paragraphe que la connaissance d'une intégrale première
d'une équation différentielle permet de diminuer d'une unité la dimension de l'espace dans
lequel les solutions cherchées prennent leurs valeurs.

5. Effets de quelques transformations


Nous étudions dans ce paragraphe quelques transformations qui permettent, dans certains
cas, de ramener la recherche des solutions d'une équation différentielle à celle des solutions
d'une autre équation que l'on sait résoudre.
5.1. Transformation par un difféomorphisme local. Considérons l'équation
différentielle autonome
ip'(t) = X(ip(t)), (15)
où X est un champ de vecteurs défini sur une partie U de l'espace de Banach E. Soit
Vi un ouvert d'un autre espace de banach E 1 , et k : Vi ---+ E un difféomorphisme local
de classe CP, p ~ 1, c'est-à-dire une application différentiable de classe CP de l'ouvert
Vi de E 1 dans E, dont la différentielle Dk(y), en chaque point y de Vi. est un élément
inversible de ,C(E1 , E). Le théorème d'inversion locale nous permet alors d'affirmer que
tout point y de Vi possède un voisinage Wy C Vi, tel que k(Wy) soit un ouvert de E, et
que la restriction de k à Wy soit un difféomorphisme de classe CP de Wy sur k(Wy)·
k Mais attention : l'application k, n'étant pas nécessairement injective, n'est peut-être
Y pas elle-même un difféomorphisme. Remarquons toutefois que c'est une application
ouverte, donc que k(Vi) est un ouvert de E.
Par exemple, l'application de JO, +oo[ xlR dans JR 2 \ { (0, 0)} :
(r,e) 1-t (x = rcose,y = rsine),
est un difféomorphisme local bien connu: c'est l'emploi de coordonnées polaires dans le
plan privé de !'origine.
Nous supposerons désormais que k(Vi) =:> U. Posons U1 = k- 1(U) et, pour tout y E U1,
X1(Y) = (Dk(y))- 1( X(k(y))).
L'application X 1 : U1 ---+ E 1 ainsi définie est un champ de vecteurs sur U1, appelé image
réciproque du champ de vecteurs X par le difféomorphisme local k. Il est souvent noté
X1 = k* X.
104 Chapitre IV. Équations différentielles; généralités

Considérons l'équation différentielle


î/J' (t) = X 1 ( î/J (t)) . (16)
Elle est appelée image réciproque de l'équation différentielle (15) par le difféomorphisme
local k.
En utilisant la règle de différentiation des applications composées, on vérifie aisément que
si 'ljJ : I - t E 1 est une solution de l'équation (16), alors c.p = k o 'ljJ : I - t E est une
solution de l'équation (15).
Réciproquement, soit c.p : I - t E une solution de (15). Soit t 0 un point de !. Posons
x 0 = c.p(to) et soit Yo un point de U1 tel que k(yo) = xo. Soit Wy 0 un voisinage ouvert de
y 0 contenu dans Vi. tel que la restriction de k àce voisinage soit un difféomorphisme de Wy 0
sur son image k(Wy 0 ). Notons k- 1 l'inverse de ce difféomorphisme. Soit li le plus grand
intervalle ou vert contenant t 0 et contenu dans I tel que, pour tout élément t de cet intervalle,
c.p(t) soit élément de k(Wy 0 ). Soit î/J : li - t E 1 l'applicationt1---t 'ljJ(t) = k- 1 o c.p(t). Il
est facile de vérifier que î/J est une solution de l'équation différentielle (16).
Nous pouvons donc dire que les équations différentielles (15) et (16) sont localement
équivalentes.
Les mêmes considérations s'appliquent sans changement aux équations différentielles non
autonomes.
5.2. Transformation par un difféomorphisme. - Dans les hypothèses du paragraphe
précédent, supposons de plus que k soit un difféomorphisme de l'ouvert Vi de E 1 sur son
image k(Vi). Il est alors facile de voir que les équations différentielles (15) et (16) sont
équivalentes, non seulement localement, mais globalement : une application c.p : I - t E
est solution de (15) si et seulement si 'ljJ = k- 1 o c.p est solution de (16). On dit dans
ce cas que le champ de vecteurs X est image directe du champ de vecteurs X 1 par le
difféomorphisme k, ou que X 1 est image directe de X par le difféomorphisme k- 1 , et on
écrit

Un difféomorphisme d'un ouvert d'un espace vectoriel normé sur un autre ne conserve
évidemment pas la structure vectorielle de ces espaces. Cette remarque devrait permettre
au lecteur perspicace de sentir qu'il existe un cadre mieux adapté à l'étude des équations
différentielles que celui formé par les ouverts d'espaces vectoriels normés : c'est celui
formé par les variétés différentiables. Ce sujet pourra éventuellement être développé dans
un prochain ouvrage de la même collection.
5.3. Application: emploi d'une intégrale première. - Pour simplifier l'exposé, nous
supposons maintenant que E = !Rn, et que le champ de vecteurs X est défini sur un ouvert
U de cet espace. L'équation différentielle autonome (15) s'écrit

~ t,. . .,Xn( t )) ,
dxi(t) = Xi( X 1() (17)

Nous avons noté t 1---t xi(t) les composantes d'une solution c.p, et Xi les composantes du
champ de vecteurs X.
Supposons que l'on connaisse une intégrale première g : U - t lR de l'équation (17),
différentiable de classe Ck (k ~ 1), ne dépendant pas du temps. Supposons aussi que
pour tout point x de U, il existe une solution c.p : I - t !Rn de l'équation (17) vérifiant
0 E I et c.p(O) = x. Cette condition est notamment vérifiée lorsque l'équation (17) satisfait
les hypothèses du théorème de Cauchy-Lipschitz, étudié dans le prochain chapitre. Nous
savons alors (4.4.a et b) que g est solution de l'équation aux dérivées partielles L(X)g = 0,
§ 5. Effets de quelques transformations 105

qui s'écrit
Ln Xi( 1
X, ... ,X
n) âg(xl,. .. 'xn) -- 0
axi. .
i=l

Soit a = (a 1 , ... , an) un point de U tel que Dg( a) -:/= O. Il existe donc une des coordonnées
xi (1 ~ i ~ n) telle que ::i (a 1 , ... , an) -:/= O. Supposons, par exemple, que ce soit x 1 .
Au voisinage du point a, l'application
(xl' ... 'xn) t-+ (yl = g(x1, ... 'Xn), y2 = X2, ... ' yn = xn)
est un difféomorphisme local. La restriction de cette application à un voisinage ouvert
convenablement choisi V du point a (V c U) est donc un difféomorphisme h de V sur
un ouvert h(V) de !Rn. L'iinage directe Y= h*X du champ de vecteurs X (restreint à V)
par le difféomorphisme h a pour composantes
Y 1 (y1, ... , yn) = 0, et pour 2 ~ i ~ n, Yi(y 1 , ... , yn) = Xi(x 1 , ... , xn),
où (x1, ... ,xn) = h- 1((y 1, ... ,yn)). L'équation différentielle (17), restreinte à V,
transformée par le difféomorphisme h, devient donc
dy 1 (t)
~ =
Ü
, et pour 2
.yi( y 1( t ) , ... , y n( t )) .
~ i ~ n, dyi(t)
~ =

La première composante de cette équation a pour solutions y 1 (t) = c, où c est une


constante réelle. En portant cette valeur de y 1 dans les autres composantes de l'équation,
nous obtenons une équation différentielle dans !Rn- 1 ,
dyi(t)
~ t , ... , y n( t )) ,
= yi( c, y 2() 2 ~ i ~ n.
Ainsi, la connaissance de l'intégrale première g a permis de diminuer d'une unité la
dimension de l'espace dans lequel on doit chercher les solutions de l'équation différentielle
étudiée.
5.4. Changement de temps. - Considérons l'équation différentielle, dans l'espace de
Banach E,
<p 1 (t) = f (t, <p(t)), (18)
où f est une application d'un ouvert 0 de lR x E dans E. Effectuer un changement de
temps dans cette équation consiste à paramétrer les solutions non plus au moyen de la
variable t, mais au moyen d'une autre variable s, qui sera déterminée en fonction de t en
même temps que la solution cherchée.
a) Premier type de changement de temps. - Le type le plus simple (mais le moins
utile) de changement de temps consiste à prendre une application T : lR ---> IR, différentiable
de classe Ck, avec k 2: 1, dont la dérivée est partout strictement positive. L'application T
est donc strictement croissante, et c'est un difféomorphisme de lR sur un intervalle ouvert
r(JR). Nous supposerons dans la suite que 0 c r(IR) x E.
Soit <p : I ---> E une solution de l'équation différentielle (18). Puisque T est un
difféomorphisme, J = r- 1 (!) est un intervalle ouvert, et l'application composée
'ljJ = <p o T : J ---> E est différentiable. Elle a pour dérivée, en un points E J,
'lj/(s) = d~~s) = D<p(r(s)) (r'(s)) = r'(s)f (r(s), <p(r(s))).
L'application 'ljJ est donc solution de léquation différentielle
'l/J'(s) = r'(s)f(r(s),'l/;(s)). (19)
Réciproquement, si 'ljJ : J ---> E est solution de (19), <p = 'ljJ
o r- 1
est solution de (18).
Les équations différentielles (18) et (19) sont donc équivalentes. On dit que (19) est la
transformée de (18) par le changement de temps t 1-+ s, ou que (18) est la transformée de
(19) par le changement de temps s 1-+ t.
106 Chapitre IV. Équations différentielles; généralités

b) Deuxième type de changement de temps. - En Mécanique céleste, on utilise


souvement des changements de temps un peu plus subtils, pour lesquels la relation qui
permet d'exprimer l'ancien paramètre t en fonction du nouveau s est elle-même solution
d'une équation différentielle. Ce type de changement de temps consiste à prendre une
fonction différentiable() : n - t JR, partout strictement positive, et à imposer à l'ancien
paramètre t, exprimé en fonction du nouveau s, de vérifier, au point ( t, x) de n,
dt
ds = O(t, x).
Cette équation différentielle ne peut pas être traitée isolément, car elle fait intervenir
l'élément x de E. Mais soit cp : I - t E une solution de l'équation (18). Posons
'ljJ (s) = cp (t( s)), et calculons sa dérivée. Comme précédemment, nous obtenons

7/J'(s) = ~!J(t(s),'l/;(s)) = O(t(s),'l/;(s))f(t(s),'l/;(s)).


Ainsi, l'application s f--+ ( t( s), 'I/;( s)) est solution de!' équation différentielle, dans lR x E,

d~~) = (} (t (s) , 'ljJ (s)) ,


{ (20)
d~~s) = O(t(s),'l/;(s))f(t(s),'l/;(s)).
Réciproquement, on vérifie aisément que sis f--+ ( t( s), 'ljJ (s)) est solution de cette équation,
l'application s f--+ t(s) est inversible, et que si nous notons t f--+ s(t) son inverse,
l'application t f--+ cp(t) = 7/J(s(t)) est solution de l'équation différentielle (19).
Le lecteur trouvera un exemple de ce type de changement de temps dans l'exercice IV.3.

6. Exercices

Exercice IV.l. {Intégrale première de l'énergie]. Soit U un ouvert de ]Rn et


V : U - t lR une fonction différentiable de classe C 00 • Soient m 1 , .. ., mn des constantes
strictement positives. On considère l'équation différentielle du second ordre
d2 xi(t) âV
mi dt 2 =âxi(x1(t), ... ,xn(t)), l:'.Si:'.Sn.

1) En posant dx~it) = vi(t), ramener cette équation au premier ordre.


2)0npose,pourtout(x,v) = ((x1,. . .,xn), (v1,. . .,vn)) EU xlRn,
1 n
H(x, v) = 2L mivf - V(x).
i=l
Montrer que H est une intégrale première de l'équation différentielle considérée.
Exercice IV.2. {Équation de Hamilton]. On convient d'identifier JR 2 n à ]Rn x ]Rn,
et de noter (x, y) = ((x1, . .. , xn), (yi, ... , Yn)) un point courant de cet espace. Soit U
un ouvert de JR 2 n et H: U - t lR une application de classe C 00 • On considère l'équation
différentielle sur U, appelée équation de Hamilton,
dxi(t) âH
~ = âyi (x(t), y(t)),
{ (*)
dyi(t) = _ âH.(x(t), y
(t)).
dt â xi
§ 6. Exercices 107

1) Montrer que H est une intégrale première de cette équation. Montrer que l'équation
différentielle étudiée dans l'exercice précédent peut se mettre sous la forme (*);déterminer
un choix possible pour les variables xi et Yi· et la fonction H correspondantes.
2) À tout couple (!, g) de fonctions différentiables C 00 sur JR 2n, on associe la fonction,
appelée crochet de Poisson de f et de g et notée {!, g },

{f }(
'g x, Y
) =Ln (8f(x,
a
y) 8g(x, y) _ 8J(x, y) 8g(x, y))
a· a· a ·
i=l Yi . xi xi y·
i

Montre rque la crochet de Poisson vérifie les deux propriétés suivantes :


- il est antisymétrique, {g, J} = -{!, g};
- i l vérifie, pour tout triplet(!, g, h) de fonctions C 00 sur JR 2 n, l'identité suivante, appelée
identité de Jacobi,
{f, {g, h}} + {g, {h, J}} + { h, {!, g}} = 0.
3) Anticipant sur les résultats du chapitre suivant, on admettra que pour tout point
(a, b) E U, il existe une solution t ~ (x( t), y( t)) de léquation de Hamilton ( *) qui prend,
pour un certain élément t 0 de son intervalle de définition, la valeur (a, b). Montrer qu'une
fonction différentiable f, de classe C 00 sur U, est une intégrale première de l'équation de
Hamilton (*)si et seulement si { H, J} = O. Montrer aussi que si f et g sont deux intégrales
premières différentiables de classe C 00 de cette équation, leur crochet de Poisson {!, g}
est aussi une intégrale première.
Exercice IV.3. [La régularisation de Levi-Civita du problème de Kepler}. Le
mouvement plan d'un point matériel de masse m > 0, dans un champ attractif newtonien,
est régi par l'équation différentielle du second ordre suivante, appelée équation de Kepler,
définie sur l'ouvert U = JR. 2 - { (0, O)} de JR. 2 ,
d 2 xi (t) kmxi (t)
m dt2 = - llx(t)113 , i = 1 ou 2'
où k est une constante strictement positive. Nous avons noté llxll = (xf + x~) 1 1 2 la norme
euclidienne usuelle de JR. 2 .
1) Ramener cette équation au premier ordre en posant vi(t) = dx~y), i = 1 ou 2.
On identifie (x 1 , x 2 ) E JR. 2 - {(O, O)} à z = x 1 + ix 2 EC - {O}; de même, on identifie
à p = mv 1 + imv 2 E C; on rappelle que la constante m > 0 est la
(mv 1 , mv 2 ) E JR. 2
masse du point matériel. Écrire l'équation obtenue comme une équation différentielle dans
(C - {0}) x C. On remarquera que la variable indépendante t étant réelle, les dérivées
qui figurent dans l'équation finalement obtenue sont des JR-dérivées.
2) Montrer que la fonction H, définie sur (C - {O}) x Cet à valeurs réelles,
1
H(z,p) = -pp -
km(z-z)- 112 ,
2m
est une intégrale première de l'équation différentielle obtenue à la question précédente.
On a noté z = x 1 - ix 2 et p = mv 1 - imv 2 les complexes conjugués de z et de p,
respectivement.
3) Soit e une constante strictement positive. On considère l'application k de (C- {O}) x C
dans lui-même,
108 Chapitre IV. Équations différentielles; généralités

Montrer que c'est un IR-difféomorphisme local (nous voulons dire par là que la structure
d'espace vectoriel de <C 2 que l'on doit considérer pour étudier la différentiabilité de k est
sa structure d'espace vectoriel réel de dimension 4, et non sa structure d'espace vectoriel
complexe de dimension 2). Déterminer l'équation différentielle sur (<C- {O}) x <C obtenue
en transformant l'équation différentielle trouvée en 1 par le difféomorphisme local k,
comme indiqué paragraphe 5.1.
4) On pose I;e = H- 1 (-e), et Se = k- 1 (I;e)· Déterminer l'équation de Se, et en
déduire sa nature géométrique. Montrer que si une solution t f--t ( Z (t), W (t)) de
l'équation différentielle obtenue à la question précédente vérifie, pour un élément ta
particulier de son intervalle de définition, ( Z (ta), W (ta)) E Se, alors cette solution vérifie
( Z(t), W(t)) E Se pour tout élément t de son intervalle de définition.
En déduire que les solutions particulières de l'équation différentielle trouvée en 3 qui
prennent leurs valeurs dans Se sont aussi solutions de l'équation différentielle plus simple,
dZ(t) _ ~ {2e 1 W(t)
[ dt - 4 Y-;; Z(t)Z(t) '
dW(t) = -~ {2e 1 Z(t)
dt 4 Y-;; Z(t)Z(t) .
5) On effectue le changement de temps (du type étudié paragraphe 5.4.b),
dt= 4 zz. /m
ds 2e' Y
Montrer que l'équation différentielle déduite de celle de la question précédente par ce
changement de temps a une forme très simple, qu'elle est définie sur <C 2 entier, et déterminer
toutes ses solutions.
6) Quelle correspondance existe-t-il entre les solutions de l'équation différentielle de la
question 5, et certaines solutions de l'équation de Kepler (**)?Examiner en particulier à
quoi correspondent les solutions s f--t ( Z ( s), W (s)) de 1' équation obtenue à la question 5
pour lesquelles Z(s) s'annule pour certaines valeurs de la variable indépendantes.

7. Solutions

Solution IV.l. {Intégrale première de l'énergie}.


1) Ramenée au premier ordre, l'équation différentielle étudiée s'écrit

dxi(t) =vi(t),
{ dt
dvi(t) -1 àV
- - =m. -(x1(t),. .. ,xn(t)).
dt ' àxi

2) Soit t ,_. ( x(t), v(t)) une solution de l'équation précédente. Nous avons

-d H ( x(t), v(t) ) =
dt
Ln
dvi(t) -
mivi(t)--
dt
L n
-8àV ( x(t) ) -
Xi
dxi(t)
- = 0,
dt
i=l i=l

compte tenu de l'équation différentielle elle-même. La fonction H est bien une intégrale première.
Solution IV.2. {Équation de Hamilton].
1) Soit t ,_. ( x( t), y( t)) une solution de l'équation (*).Nous avons

! H(x(t),y(t)) = L:(:;
n

i=l
(x(t),y(t))
.

dx~;t) + ~~ (x(t),y(t)) dy~;t)).


§ 7. Solutions 109

Compte tenu de l'équation (*),nous obtenons

dt '°"' (
d H(x(t),y(t) ) = ~ 8xi
n
8H ( x(t),y(t) ) 8H
Byi (x(t),y(t)) - 8H
Byi (x(t),y(t)) 8H
8xi (x(t),y(t)) ) =O.
i=l

La fonction H est bien une intégrale première.


L'équation étudiée dans l'exercice précédent peut se mettre sous forme hamiltonienne en posant Yi = mivi et
H(x, y) = (1/2) 2:: 1 Yf /mi - V(x).
2) La propriété d'antisymétrie {g, f} = -{!, g} est immédiatement visible. Pour prouver l'identité de Jacobi
calculons, pour un triplet(!, g, h) de fonctions différentiables sur R 2 n, le terme { f, {g, h} }. C'est la somme,
pour i et k prenant les valeurs 1, 2, ... , n, des termes

Développons, en groupant les termes contenant des dérivées partielles secondes de g et ceux contenant des
dérivées partielles secondes de h. Nous obtenons,
- termes contenant des dérivées partielles secondes de g :

at ah a2 g at ah a2 g
----+--------------
af ah a2 9 af ah fl2 9
8yi 8xk 8xi8yk 8xi 8yk 8yi8xk 8xi 8xk 8yi8Yk 8yi 8yk 8xi8xk ·

- termes contenant des dérivées partielles secondes de h :

a1 -
- ag -a-h +af-ag
2
-- a h- -at-a- 9 -
2a- h -af- ag
-- a- h 2 2

8yi 8yk 8xi8xk 8xi 8xk 8yi8Yk âxi 8yk 8yi8xk 8yi 8xk 8xi8yk ·

Nous remarquons que les termes en dérivées partielles secondes par rapport à deux variables x, ainsi que ceux
en dérivées partielles secondes par rapport à deux variables y, apparaissent avec le signe + pour la fonction h
et avec le signe - pour la fonction g. De même, les termes en dérivées partielles secondes par rapport à une
variable x et une variable y apparaissent avec le signe + pour h et avec le signe - pour g.
Pourobtenir les expressions de { g, {h, f} }. puis de { h, {!, g} }. il suffit de permuter circulairement f, g eth.
Ajoutons ces trois expressions, et regardons, par exemple, les termes contenant des dérivées partielles secondes
de f. Les termes contenant des dérivées partielles secondes de f par rapport à deux variables x ou par rapport à
deux variables y apparaissent avec le signe + dans { g, { h, f}} et avec le signe - dans { h, {!, g}}, et ne sont
pas présents dans { f, {g, h}}. Quant aux termes contenant des dérivées partielles secondes de f par rapport
à une variable x et une variable y, ils apparaissent avec le signe - dans { g, { h, f}} et avec le signe +dans
{ h, {!, g}}; ils ne sont pas présents dans { f, {g, h} }.
Compte tenu de ces remarques, de la symétrie des dérivées partielles secondes et du fait que nous devons ajouter
tous les termes obtenus en donnant aux indices i et k toutes les valeurs allant de 1 à n, nous voyons que dans la
somme { f, {g, h}} + { g, {h, f}} + { h, { f, g}}, les termes contenant des dérivées partielles secondes de
f s'éliminent deux par deux. Pour les mêmes raisons, les termes contenant des dérivées partielles secondes de
g, ou de h, s'éliminent aussi. Finalement, l'identité de Jacobi est démontrée.
3) La relation { H, f} = 0 n'est autre que l'équation aux dérivées partielles associée à l'équation différentielle
de Hamilton ( * ), au sens du paragraphe 4.4.a. Puisque nous avons admis que pour tout point de U x Rn, il
existe une solution de l'équation de Hamilton qui passe par ce point, la proposition 4.3 nous permet d'affirmer
qu'une fonction différentiable est intégrale première de l'équation différentielle de Hamilton si et seulement si
elle vérifie {H, f} =O.
Soient f et g deux intégrales premières différentiables del' équation de Hamilton (*).D'après l'identité de Jacobi
et l'antisymétrie du crochet de Poisson, nous avons

{H,{f,g}} = {{H,f},g} + {J,{H,gl} =0,

puisque { H, f} et { H, g} sont nuls. La fonction {!, g} est donc intégrale première de l'équation de Hamilton.

Solution IV.3. {La régularisation de Levi-Civita du problème de Kepler].


110 Chapitre IV. Équations différentielles; généralités

1) On obtient immédiatement

dxi(t) = v;(t),
dt
{
dvi(t) _ kxi(t)
i = 1ou2. (1)
---;u- - - llx(t)113 .
Cette équation est de la forme de l'équation de Hamilton étudiée dans l'exercice précédent, avec Yi = mvi et
1
H(x, y) = - llYll 2 - kmllxll- 1 .
2m
En posant z = x1 + ix2, p = mv1 + imv2, nous pouvons mettre cette équation sous la fonne
dz(t) _ ( ) dp(t) kmz(t)
- - = m 1 pt, (2)
dt dt - lz(t)l 3 .

2) La fonction H n'est autre que la fonction de Hamilton, notée H(x,y) dans la question précédente, mais
exprimée maintenant au moyen des complexes z et p, puisque llYll 2 =pp et que llxll = lzl = (Z:Z) 112 . Ainsi
qu'on l'a vu dans l'exercice précédent, c'est une intégrale première de l'équation différentielle considérée.
3) Considérons chaque composante de l'application k. La première, (Z, W) ,_.. z = 2Z 2 , ne dépend pas de
la variable W. Or l'application Z ,_.. z = 2Z 2 est un (>difféomorphisme local de C - {O} sur lui-même,
puisque sa différentielle au point Z E C - {O} est l'application C-linéaire de C dans lui-même X ,_.. 4ZX.
Donc, a fortiori, Z ,_.. z = 2Z 2 est un IR-difféomorphisme local; on voit que chaque point z E C - { 0} a deux
antécédents, les deux déterminations de (z/2) 112 . Nous pouvons déjà affirmer que la première composante de
l'application k est IR-différentiable de classe C 00 • L'expression de la seconde composante de l'application k,
(Z, W) ,_.. p = v'2riWW (z) - l , au moyen des parties réelles et imaginaires de Z et de W, fait intervenir
des fractions dont le numérateur et le dénominateur sont des expressions polynômiales ou des racines carrées
d'expressions polynômiales strictement positives; de plus, les dénominateurs de ces fractions ne s'annulent
pas. Nous pouvons affinner que la seconde composante de k est IR-différentiable de classe C 00 • Nous avons
prouvé que k est IR-différentiable, de classe C 00 • Pour montrer que c'est un IR-difféomorphisme local, il suffit
de remarquer qu'on peut localement l'inverser, et que son inverse local est IR-différentiable de classe C 00 • Soit
(zo, Po) un point de (C - {O}) x C. Choisissons, au voisinage du point zo de C - {O}, une détermination de
la fonction multivoque z ,_.. (z/2) 112 . Il lui correspond un inverse local de k, au voisinage de (zo,p 0 ), ayant
pour expression
(z,p)1--+ ( Z= ( -z)l/2 , W= ~zl/2p
1 - )
.
2 v4me
Pour les mêmes raisons que ci-dessus, cet inverse local de k est IR-différentiable de classe C 00 . Nous avons ainsi
prouvé que k est un IR-difféomorphisme local, de classe C 00 •
Soit t ,_.. ( Z(t), W(t)) une application différentiable dont la composée avec k est solution de l'équation
différentielle (2). En exprimant que cette équation différentielle est satisfaite, on obtient

dZ(t) = ~ (2; W(t) ' dW(t) 1 (2; W(t)'W(t) k fm 1


dt 4 V:;;;: Z(t)Z(t) -;tt = 4 V:;;;: Z(t)Z(t) 2 - 4 V 2e Z(t)Z(t) 2 . (
3)

C'est la transformée, par le difféomorphisme local k, de l'équation différentielle (2).


4) L'application k est définie sur (C - {O}) x C, et Ho ka pour expression

WW km
Ho k(Z, W) = e-=- - --=.
ZZ 2ZZ
Nous en déduisons
e
Hok(Z, W)+e=--= ( WW+
- ZZ-
- -km) .
ZZ 2e
Par suite, Se = (Ho k)- 1 (-e) n'est autre que

Se = { (Z, W) E (C - {O}) x C - - -km} .


WW+ZZ=
2e
§ 7. Solutions 111

En identifiant C 2 à IR 4, et en notant Z1 et W1 les parties réelles, Z2 et W2 les parties imaginaires de Z et de


W, on peut aussi écrire

Se= { (Z1,Z2,W1,W2) EIR 4 ; Z 12 +Z22 +W12 +W22 =km


- , Z 12 +z22 =/:-0 } .
2e

On voit ainsi que Se est une sphère de dimension 3, centrée sur l'origine de IR 4 , de rayon ( km/(2e)) 112 , privée
d'un grand cercle, l'ensemble des points (Z1, Z2, W1, W2) de cette sphère pour lesquels Z1 = Z2 =O.
Soit t >--> cp(t) = ( Z(t), W(t)) une solution de l'équation différentielle (3), telle que pour un élément t 0 de
son intervalle de définition, on ait cp( to) E Se. On sait alors que k o cp est solution de léquation différentielle
(2), et que H ( k o cp( to)) = -e. Comme H est intégrale première de (2), on a alors, pour tout élément t de
l'intervalle de définition de cp, H ( k o cp( t)) = -e, c'est-à-dire cp( t) E Se.
Pour tout (Z, W) E Se. on a WW = -ZZ - km/(2e). Les solutions cp de l'équation différentielle (3) qui
prennent leurs valeurs dans Se sont aussi solutions de l'équation différentielle, déduite de (3) en remplaçant,
dans la seconde composante de cette équation, WW par -ZZ - km/(2e),

dZ(t) = .!_ fi; 1 W(t) dW(t) = _.!_ fi; 1 Z(t). (4)


dt 4 V-:;; Z(t)Z(t) 1

dt 4 V-:;; Z(t)Z(t)
5) Effectuer dans ( 4) le changement de temps indiqué revient à écrire
dZ dZ dt dW dW dt
----, -=--,
ds dt ds ds dt ds
d'où léquation différentielle

dZ(s) = W(s), dW(s) = -Z(s). (5)


ds ds
On voit immédiatement que cette équation différentielle est définie sur C 2 , alors que léquation ( 4) n'était définie
que sur (C - {O}) x C. C'est une équation linéaire à coefficients constants. L'étude générale des équations de
ce type sera faite au chapitre VII. Mais il est facile de voir que toutes les solutions de cette équation sont de la
forme
Z(s) = aei• + be-i•, W(s) = iaei• - ibe-i•, (6)
où a et b sont deux constantes complexes. Nous voyons ainsi que dans C 2 , toutes les solutions de (5), autres que
la solution nulle, sont des cercles, parcourus (en fonction du paramètres) à vitesse constante.
6) Comme nous nous intéressons aux solutions de (2) qui prennent leurs valeurs dans Ee, nous devons considérer
les solutions de (5) qui prennent leurs valeurs dans Se ou, plus exactement, dans l'adhérence de Se, c'est-à-dire
dans la sphère de C 2 (identifié à IR 4 ) centrée sur l'origine et de rayon y'km/(2e). En effet, il n'y a plus lieu
d'imposer à Z d'être non nul, puisque l'équation différentielle (5) est définie sur C 2 . Nous considérons donc les
solutions données par (6), en imposant aux constantes complexes a et b de vérifier la+bl 2 + la-bl 2 = km/ (2e ),
c'est-à-dire (identité du parallélogramme) 2(lal 2 + lbl 2 ) = km/(2e). Toutes ces solutions sont périodiques de
même période 27l' en la variable indépendantes. Parmi ces solutions, celles pour lesquelles Z(s) ne s'annule
jamais sont celles pour lesquelle lal =/:- lbl. Par composition avec le difféomorphisme k, il leur correspond des
solutions périodiques de l'équation (2), de période 7l' en la variable indépendantes, car l'image réciproque de
chaque point de Ee par l'application k est formée de deux points de Se symétriques l'un de l'autre par rappmt à
l'origine. On vérifie aisément que ces solutions sont périodiques aussi lorsqu'elles sont paramétrées part, toutes
de même période, et que les courbes t >--> z (t) sont des ellipses admettant lorigine pour foyer.
Considérons maintenant une solution de (5), de la forme (6), avec lal = lbl = y'km/(8e). On voit alors que
Z(t) s'annule pour les valeurs des de la forme so + n1l', avec n E Z. En composant avec le difféomorphisme
k la restriction de cette solution à un intervalle de la forme )so + n1l', so + (n + l)7r[, puis en revenant au
paramètre t, on obtient une solution de l'équation (2) dans laquelle le point z(t) parcourt un segment de droite
dont une des extrémités est l'origine; ce segment est parcouru deux fois, le point z(t) partant de l'origine, allant
jusqu'à l'autre extrémité du segment de droite, puis revenant à l'origine. En d'autres termes, le point matériel
dont on étudie le mouvement est expulsé du centre attractif à un certain instant, parcourt un segment de droite,
puis revient au centre attractif, avec lequel il entre en collision au bout d'un temps fini. On peut dire que le
difféomorphisme local k, découvert par Levi-Civita, a pour effet de régulariser les collisions du point matériel
avec le centre attractif.
Chapitre V
Équations différentielles; le problème de Cauchy

Nous allons voir, dans le présent chapitre, que moyennant certaines hypothèses de
régularité, une équation différentielle admet en général une infinité de solutions. Pour
sélectionner l'une de ces solutions, on peut lui imposer de prendre une valeur spécifiée x 0 ,
pour une valeur spécifiée t 0 de la variable indépendante t. Le couple (t 0 , x 0 ) constitue une
donnée de Cauchy. La recherche d'une solution vérifiant une donnée de Cauchy spécifiée
constitue le problème de Cauchy. La solution du problème de Cauchy, lorsqu'elle existe,
n'est pas unique car en restreignant l'intervalle sur lequel elle est définie (tout en imposant
à cet intervalle de contenir le réel t 0 faisant partie de la donnée de Cauchy), on obtient une
autre solution, qui bien sûr ne donne aucune information supplémentaire. C'est pourquoi
nous nous intéresserons plus particulièrement aux solutions dites maximales, qui ne sont
pas restriction d'une autre solution définie sur un intervalle strictement plus grand. Nous
verrons alors que moyennant des hypothèses de régularité souvent satisfaites dans les
applications, le problème de Cauchy admet, pour toute donnée de Cauchy, une unique
solution maximale (théorème 2.10, forme globale du théorème de Cauchy-Lipschitz). Sous
des hypothèses différentes (un peu moins restrictives du point de vue de la régularité, mais
en supposant l'espace considéré de dimension finie), nous établirons un autre théorème
(théorème de Peano 3.4), affirmant, pour toute donnée de Cauchy, l'existence d'une
solution maximale du problème de Cauchy, mais non son unicité. L'étude des bouts d'une
solution maximale, dans le dernier paragraphe, permettra de mieux comprendre les raisons
pour lesquelles les solutions maximales d'une équation différentielle ne sont pas toujours
définies sur IR entier.

1. Solutions maximales, unicité locale et unicité globale


Soit E un espace vectoriel normé réel et f une application d'une partie n de IR x E dans
E. On considère l'équation différentielle
ip'(t) = f(t, ip(t)). (1)
1.1. Définition. - Une solution 'P : 1 --t E de l'équation différentielle (1) est dite
maximale si toute solution de (1) dont l'intervalle de définition contient 1 et dont
la restriction à 1 coïncide avec cp est égale à cp.
1.2. Remarque. - La restriction cp 1 d'une solution cp : 1 --t Ede l'équation (1) à
un sous-intervalle ouvert 11 de I est évidemment aussi solution de cette équation. D'une
manière générale, nous dirons qu'une solution cp : I --t Ede l'équation (1) prolonge
une autre solution cp1 : li --t E si li C I et si cp1 = cp 111 . Il est facile de vérifier
que la relation ainsi définie est une relation d'ordre sur l'ensemble des solutions de ( 1).
Les éléments maximaux de cet ensemble, pour cette relation d'ordre, sont les solutions
maximales définies en 1.1.
§ 1. Solutions maximales, unicité locale et unicité globale 113

1.3. Proposition. - Toute solution de l'équation différentielle (1) est restriction


d'une solution maximale à un sous-intervalle.
Preuve : Soit rp : I - t E une solution de l'équation différentielle ( 1). Soit E l'ensemble des
solutions de (1) qui prolongent la solution rp. L'ensemble E est non vide, puisqu'il contient
r.p. Il est muni d'une relation d'ordre, la relation "la solution 'tf; 1 prolonge la solution 'lj; 2 ".
Soit P = {'t/Ja : la - t E ; a E A} une partie non vide totalement ordonnée de f. Nous
avons noté A un ensemble d'indices. Posons l = UaEA la. La partiel de lR est ouverte,
puisque réunion des ouverts la. Montrons que c'est un intervalle, c'est-à-dire que si t 1 et
t 2 sont deux éléments del, tout réel t compris entre t 1 et t 2 est aussi élément del. Puisque
t 1 E l, il existe a 1 E A tel que t 1 E la 1 • De même, il existe a 2 E A tel que t 2 E la 2 •
L'ensemble Pétant totalement ordonné, des deux solutions de (1), 't/Ja 1 : la 1 - t E et
't/Ja 2 : la 2 - t E, l'une prolonge l'autre; supposons par exemple que 'lj; 1 prolonge 'tf; 2 . Mais
alors Ja 1 ~ Ja 2 , donc t 1 et t 2 sont deux éléments de l'intervalle la 1 , contenu dans l, de
sorte que tout réel t compris entre t 1 et t 2 est élément de la 1 , donc del. Nous avons ainsi
prouvé que J est un intervalle ouvert de R
Pour tout t E l, posons
'tf;(t) = 't/Ja(t) si t Ela.
Cela définit effectivement une application 'if; : l - t E, car pour tout t E J, il existe au
moins un a E A tel que t E la; d'autre part, si a 1 et a2 sont deux éléments de A tels
que t E la 1 n la 2 , alors 't/Ja 1 (t) = 't/Ja 2 (t), puisque l'une des deux solutions 't/Ja 1 ou 't/Ja 2
prolonge l'autre.
L'application 'if; : l - t E est différentiable et c'est une solution de l'équation (1) qui
prolonge chacune des solutions 't/Jw a E A. En effet, la différentiabilité est une propriété
locale, et la restriction de 'if; à chaque intervalle ouvert la. a E A, est différentiable et
solution de (1). Nous avons donc prouvé que 'if;: l - t E est un élément de E qui majore
la partie totalement ordonnée P de f. En d'autres termes, nous avons prouvé que l'ordre
dont est muni l'ensemble E est inductif. Le lemme de Zorn (voir par exemple [T.0.2.11])
nous permet d'affirmer l'existence d'un élément maximal de f, c'est-à-dire d'une solution
maximale de 1' équation différentielle ( 1) dont la solution r.p est une restriction. D
1.4. Définitions. - Une donnée de Cauchy pour l'équation différentielle (1) est un
point (t 0 , x 0 ) de la partie n de lR x E sur laquelle est défi.nie cette équation. On
dit qu'une solution r.p: I - t Ede l'équation (1) satisfait la donnée de Cauchy (to, xo)
si to E I et r.p(to) = xo.
On appelle problème de Cauchy la recherche d'une solution de l'équation (1)
satisfaisant une donnée de Cauchy spécifiée (t 0 , xo).

1.5. Remarque. - Dans la définition ci-dessus, si une telle solution existe, elle est, d'après
la proposition 1.3, restriction d'une solution maximale, qui satisfait la même donnée de
Cauchy.
1.6. Définition. - Un élément (to, xo) de n est dit point d'unicité globale pour le
problème de Cauchy s'il existe au plus une solution maximale de (1) qui satisfait la
donnée de Cauchy (t 0 , x 0 ). Le point (t 0 , x 0 ) est dit point d'unicité locale s'il possède
un voisinage V dans lR x E tel que ce point soit point d'unicité globale pour le
problème de Cauchy relatif à la restriction de l'équation (1) à V n n.
1.7. Lemme. - Soient r.p : I - t E et 'if; : l - t E deux solutions maximales
distinctes de l'équation différentielle (1), telles que InJ i' 0. Alors les restrictions
de r.p et de 'if; à I n l sont distinctes.
114 Chapitre V. Équations différentielles; le problème de Cauchy

Preuve : Supposons les restrictions de <p et de 'ljJ à I n J égales. Puisque I n J -/:- 0, la


réunion I U J est un intervalle ouvert de R
Les deux inclusions I C I U Jet J C I U J sont strictes; en effet, si par exemple nous
avions I = I U J, nous aurions J c I; la solution 'ljJ : J --> E, distincte de <p : I --> E
par hypothèse, ne serait pas maximale puisque <p la prolongerait strictement.
Posons, pour tout t E I U J,
1n(t) si t E I,
x(t) = { r
'ljJ(t) si t E J, t ~ I.
Remarquons que pour tout t E J, x(t) = 7/J(t), car si t E In J, nous avons par hypothèse
<p(t) = 'ljJ(t). En raisonnant comme dans la démonstration de 1.3, nous voyons que x est
une solution de ( 1) qui prolonge strictement à la fois <p et 7/J, ce qui contredit la maximalité
de ces solutions. D
1.8. Proposition. - Soit <p : I --> E une solution maximale de l'équation
différentielle (1). Si pour tout t E I, (t,<p(t)) est point d'unicité locale pour le
problème de Cauchy, alors pour tout t E I, (t, <p(t)) est aussi point d'unicité
globale pour ce problème.
Preuve: Supposons qu'il existe t 0 E I tel que ( t 0 , x 0 = <p(t0 )) ne soit pas point d'unicité
globale.Ilexistealorsunesolutionmaximale'ljJ: J--> Ede l'équation (1), vérifiantt 0 E J
et 7/J(to) = <p(to) = xo, distincte de la solution <p. D'après le lemme 1.7, les restrictions
de <pet de 'ljJ à In J sont distinctes. Il existe donc t 1 E In J tel que 7jJ(t 1 ) -1- <p(t 1 ).
Nécessairement, t 1 -1- t 0 puisque 7jJ(t0 ) = <p(t0 ). Supposons par exemple t 1 > t 0 (le
raisonnement serait analogue si t 1 < t 0 ), et posons
tM = sup{ t E In J ; t ~ to, \;/() E [t0 , t], 'ljJ(O) = <p(O) } .
Nous pouvons affirmer que tM existe, car c'est la borne supérieure d'une partie de IR non
vide (elle contient t 0 ) et majorée par t 1 . De plus, t 0 ~ tM < t 1 , donc tM E In J. Les
applications <pet 'ljJ étant continues, nous avons 'ljJ(tM) = <p(tM ). Mais d'après la définition
même de tM, pour tout€> 0, il existe t E ]tM, tM + ê[nI n J tel que 7/J(t) -1- <p(t). Par
suite, ( tM, <p(tM)) n'est pas point d'unicité locale, contrairement à l'hypothèse. D
1.9. Corollaire. - Si tout élément (t, x) den est point d'unicité locale pour le
problème de Cauchy, tout élément (t, x) den est aussi point d'unicité globale pour
ce problème.
Preuve: Soit (t0 , x 0 ) E n une donnée de Cauchy. S'il n'existe pas de solution maximale
de (1) satisfaisant cette donnée, (t 0 , x 0 ) est trivialement un point d'unicité globale. S'il
existe une solution maximale <p: I--> E telle que t 0 E I et <p(t 0 ) = x 0 , la proposition 1.8
montre que c'est l'unique solution maximale de (1) satisfaisant la donnée de Cauchy
(t 0 , x 0 ). Ainsi, dans tous les cas, (t 0 , x 0 ) est point d'unicité globale. D

2. Solution du problème de Cauchy : cas lipschitzien


On considère toujours l'équation différentielle (1).
2.1. Définition. - Soit (t0 , x 0 ) E n. On appelle tonneau de sécurité ouvert (resp.,
fermé) de centre (t0 , x 0 ) une partie de IR x E de la forme Io x B 0 , où Io est un
intervalle ouvert (resp., fermé) de centre t 0 , de longueur 2l > 0, et B 0 une boule
ouverte (resp., fermée) de centre x 0 , de rayon r > 0, telle que
r
Io x Bo C f2 et sup llf(t,x)ll < -l ·
(t,x}Elo x Bo
§ 2. Solution du problème de Cauchy: cas lipschitzien 115

2.2. Remarques
a) Cas où f est localement bornée. - Si f est localement bornée sur n, et en particulier
si f est continue sur n, tout point intérieur à n est centre d'un tonneau de sécurité. Soit
0

en effet (t 0 , x 0 ) E n. Puisque f est localement bornée, il existe un voisinage W de


(t 0 , x 0 ) dans n sur lequel f est bornée; il existe donc un réel M > 0 tel que, pour tout
(t,x) E W, jjJ(t,x)jj < M.Puisque(t0 ,x 0 )estintérieuràD, Westvoisinagede(t 0 ,x 0 )
dans lR x E. L'ensemble des parties de lR x Ede la forme [t 0 - l, t 0 + l] x BF(x 0 , lM),
avec l > 0, est un système fondamental de voisinages de (t 0 , x 0 ) dans E (nous avons
noté Bp(x 0 , lM) la boule fermée de E, de centre x 0 et de rayon lM > 0). Pour l > 0
assez petit, nous avons donc [to - l, t 0 + l] x Bp(x 0 , lM) c W, et nous voyons que
[to - l, to + l] x Bp(xo, lM) est un tonneau de sécurité fermé centré sur le point (t 0 , x 0 ).
Bien entendu, ]to - l, t 0 + l[xB(x 0 , lM), où B(x 0 , lM) désigne la boule ouverte de E
de centre x 0 et de rayon lM, est un tonneau de sécurité ouvert de centre (t0 , x 0 ).
b) Homothétique d'un tonneau de sécurité. - Soit Io x Bo un tonneau de sécurité (par
exemple fermé) de centre (to, xo); on a Io= [to - l, to + l], Bo= Bp(xo, r), avec l > 0,
r > O. Tout point (ti, xi) de D intérieur à Io x Bo, c'est-à-dire vérifiant lti - toi < l
et llxi - xo Il < r, est aussi centre d'un tonneau de sécurité li x Bi. Il suffit de prendre
li= [ti -li,ti +li] x Bp(xi,ri),enchoisissantli et ri vérifiant
ri r
li l' O<li:S:l-lti-tol, O<ri:S:r-llxi-xoll·
Ces conditions impliquent en effet li X Bi c Io X Bo c n. donc
sup
(t,x)E/1 xB1
l!J(t,x)lj::; sup
(t,x)E/oxBo
lif(t,x)ji <y= ~i.
i

Cette remarque sera souvent utilisée dans la suite.


c) Intérêt des tonneaux de sécurité. - Soit cp : I ----+ E une solution de l'équation
différentielle (1) satisfaisant la donnée de Cauchy (t 0 ,x 0 ). L'existence d'un tonneau de
sécurité I 0 x Bo de centre (t 0 , x 0 ) E E permet de montrer que Je graphe de la restriction
de cp à In Io est contenu dans ce tonneau de sécurité. C'est ce qui résulte du lemme suivant,
et c'est là le principal intérêt de la notion de tonneau de sécurité.
2.3. Lemme. - Soit cp : I ----+ E une solution de l'équation différentielle (1)
satisfaisant la donnée de Cauchy (t0 , x 0 ). S'il existe un tonneau de sécurité Io x Bo
de centre (t 0 , x 0 ), la solution cp vérifie, pour tout t E In I 0 ,
licp(t) - cp(to)ll < r,
où r > 0 est le rayon de la boule B 0 . Cela exprime que le graphe de la restriction
de cp à In I 0 est contenu dans Io x B 0 .
Preuve: Soit 2l > 0 la longueur de l'intervalle I 0 . D'après la définition d'un tonneau de
sécurité, nous avons
r
sup llJ(t,x)ll = M <y·
(t,x)Elo x Bo

Supposons qu'il existe ti E In Io tel que licp(t) - cp(t0 ) 11 2: r. Nécessairement, ti -1- to;
supposons par exemple ti > to. Posons
tM = sup{ t E In Io ; t 2: to, W E [to, t], llcp(B) - cp(to)li < r}.
Le réel tM existe, car c'est la borne supérieure d'une partie de lR non vide (elle contient t 0 )
et majorée parti. Il appartient à l'intervalle [t 0 , ti], donc à In I 0 . Puisque cp est continue,
nous avons
116 Chapitre V. Équations différentielles; le problème de Cauchy

D'autre part, d'après la définition même de tM, pour tout t E [t0 , tM[. (t, cp(t)) est élément
de 10 x B 0 , donc
llcp'(t)li = llJ(t,cp(t))ll s; M <y·
Mais alors, d'après le théorème des accroissements finis,
llcp(tM) - cp(to) Il s; MltM - toi s; Ml < r,
ce qui contredit ( *). 0
2.4. Intégration de fonctions vectorielles. - Le lecteur est sans doute familiarisé avec
)'intégrale de Riemann d'une fonction continue, définie sur un intervalle de lR et à valeurs
réelles. Nous allons avoir besoin de quelques résultats portant sur l'intégrale de Riemann
d'une fonction prenant ses valeurs dans un espace de Banach réel, et non plus dans R
Lorsque l'espace dans lequel la fonction considérée prend ses valeurs est de dimension
finie, le choix d'une base de cet espace permet de calculer son intégrale composante
par composante, en n'utilisant que la théorie de l'intégrale de fonctions à valeurs réelles.
Mais certaines inégalités vérifiées par l'intégrale (par exemple l'inégalité 2.4.d ci-dessous)
s'obtiennent beaucoup plus aisément en développant directement une théorie de l'intégrale
de Riemann des fonctions à valeurs dans un espace de Banach. Cette théorie est d'autre
part indispensable lorsque l'espace dans lequel les fonctions prennent leurs valeurs n'est
pas de dimension finie. Nous en indiquons très brièvement ci-dessous les grandes lignes
et les principaux résultats.
Dans toute la suite de ce paragraphe, f désigne une application continue d'un intervalle I
de lR dans un espace de Banach E.
a) Définition de l'intégrale. - Soient a et b deux points de I, vérifiant a s; b. Pour
définir l'intégrale de f sur l'intervalle [a, b], on introduit d'abord la notion de subdivison
de cet intervalle et de somme de Cauchy-Riemann associée à une subdivision.
Une subdivision de [a, b] est une suite finie a = (x 0 , x 1 , ... , xn) de points de cet intervalle
vérifiant x 0 =as; x 1 s; · · · s; Xn = b. On appelle.finesse de la subdivision a le réel
ry(a) = sup lxi+l - xil.
O:Si:Sn-1
Soit a = (x 0 , x 1 , ... , Xn) une subdivision de [a, b]. Pour chaque i E { 0, 1, ... , n - 1 },
soit Yi un élément de f([xi,XH1J). On appelle somme de Cauchy-Riemann de f sur
l'intervalle [a, b], pour la subdivision a le choix spécifié des Yi·
n-l
su, a, (yi)) = I)xi+l - xi)yi.
i=O
En utilisant le critère de Cauchy et la continuité uniforme de f sur l'intervalle compact
[a, b], on montre (voir par exemple [12]) que les sommes de Cauchy-Riemann de f sur
l'intervalle [a, b] associées à toutes les subdivisions possibles de cet intervalle, et à tous les
choix possibles des Yi· convergent, lorsque la finesse des subdivisons considérées tend vers
0, vers un élément l de E. De manière précise, cela signifie que pour tout ê > 0, il existe
1/ > 0 telle que pour toute subdivision a = ( x 0 , ... , xn) de [a, b] de finesse ry( a) s; ry, et
tout choix des Yi E f ([xi, XH1J), on ait
llS(f, a, (Yi)) - lll s; ê.
Cet élément l de E est appelé intégrale de la fonction f sur l'intervalle [a, b], et noté
1: J(t)= dt.
Si a b, l'intégrale de f sur [a, b] est nulle.
Si f est constante sur [a, b], et a sur cet intervalle pour valeur Ç E E, son intégrale sur
[a, b] est (b - a)Ç.
§ 2. Solution du problème de Cauchy: cas lipschitzien 117

b) Linéarité del 'intégrale. - Soient a et b deux points de I vérifiant a ~ b. L'application,


qui à chaque fonction continue f : I--> E, associe son intégrale
[a, b], est linéaire.
l:
f(t) dt sur l'intervalle

c) Positivité de l'intégrale. - Soient h: I--> IR une application continue de l'intervalle


I dans IR, a et b deux points de I vérifiant a ~ b. Si, pour tout t E [a, b], h(t) 2: 0, alors
l: h(t) dt 2: O. Si de plus a< b et si h, toujours supposée continue, est non identiquement
nulle et à valeurs 2: 0 sur [a, b], alors l: h(t) dt> O.
Soient hi : I --> IR et h 2 : I --> IR deux applications continues de l'intervalle I dans
IR, a et b deux points de I vérifiant a~ b. Si, pour tout t E [a, b], hi(t) ~ h 2 (t), alors
l: hi(t) dt~ l: h2(t) dt. Si de plus a< betsien un point particulier de [a, b], la valeur de
hi est strictement inférieure à celle de h2 (les applications hi et h2 étant bien sûr toujours
supposées continues), alors l: hi(t) dt< l: h2(t) dt.
d) Inégalité fondamentale. - Soient a et b deux points del vérifiant a ~ b. Nous avons
défini ci-dessus l'intégrale l: J(t) dt de l'application continue f : l--> E sur l'intervalle
[a, b]. L'application t f-+ llf(t)!!, à valeurs réelles, étant continue, nous pouvons aussi
définir son intégrale
inégalité
l: Il! (t) Il dt sur l'intervalle [a, b]. Nous avons alors la très importante

1b J(t) dt ~ 1b llJ(t)ll dt.

e) Relation de Chasles. - Soient a et b deux points de 1. Si a > b, posons par convention

1b J (t) dt= - la J(t) dt.

Avec cette convention nous avons, pour tout triplet (a, b, c) de points de 1, la relation de
Chasles,
1b J(t) dt= 1c J(t) dt+ lb J(t) dt.

t) Composition avec une application linéaire. - Soit F un autre espace de Banach,


et A un élément de .C(E, F), c'est-à-dire une application linéaire continue de A dans F.
Pour tous a et b E 1, nous avons

g) Intégrale et dérivée. - Soit a un poit de E. Posons, pour tout x E 1,

F(x) = 1x J(t) dt.

L'application F : l--> E est continue sur 1, et dérivable en tout point x intérieur à 1, et a


pour dérivée en un tel point
F' (X) = f (X) .

On appelle primitive de la fonction f, une application G : l --> E, continue sur l et


dérivable en tout point x intérieur à 1, dont la dérivée en un tel point est G' (x) = f (x ). La
fonction F: x f-+ F(x) = l: J(t) dt, est donc une primitive de f. Toute autre primitive
G de f est de la forme G = F + C, où CEE est une constante.
118 Chapitre V. Équations différentielles; le problème de Cauchy

h) Cas de fonctions discontinues. - Une légère généralisation des résultats ci-dessus


nous sera utile dans la suite. Nous supposons maintenant l'application f : I ---+ E continue,
non plus sur I entier, mais sur le complémentaire dans I d'une partie finie D. Nous
supposons aussi que pour tout s E D, les limites
lim J(t) et lim J(t)
t->s, t-:=;s t-.s, t?_s
existent (le points est alors appelé point de discontinuité simple).
Soient a et b deux points de I, a :::; b, et soient s 1 , s 2 , ... , sp les éléments de D n [a, b],
rangés par ordre croissant. Nous définissons l'intégrale de f sur [a, b] en posant

lba
J(t) dt= 1a
81
J(t) dt+ I: 1s;+i
i=l s;
J(t) dt+ lb
Sp
J(t) dt.

Nous posons aussi

la J(t) dt= -1b J (t) dt.

Nous avons ainsi étendu la définition de l'intégrale aux fonctions vectorielles pouvant
avoir un nombre fini de points de discontinuité simples. Il est facile de vérifier que toutes
les propriétés de l'intégrale indiquées ci-dessus, en particulier la relation de Chasles,
subsistent. La dernière propriété concernant les relations entre intégrale et dérivée nécessite
le léger ajustement suivant.
Soit a El. Posons, pour tout x E I,

F(x) = 1x J(t) dt.


La fonction F : I ---+ E est continue sur I, et dérivable en tout point x de I - D, sa dérivée
en un tel point étant
F'(x) = J(x).
Toute primitive de f, c'est-à-dire toute application G : I ---+ E, continue sur I, dérivable
en tout point x du complémentaire dans I d'une partie finie et dont la dérivée en un tel
point est G'(x) = f(x), est nécessairement de la forme G = F + C, où CE E est une
constante.
i) Continuité et dérivabilité par rapport à un paramètre. - Soit A un espace
topologique, I un intervalle de ffit, a et b deux points de I vérifiant a :::; b, et f : I x A ---+ E
une application, à valeurs dans l'espace de Banach E. Supposons l'application f continue.
Pour chaque À E A, l'application t i--+ f (t, À) est continue; nous pouvons donc définir son
intégrale sur [a, b], notée J:f(t, À) dt. Posons

g(À) = 1b J(t, À) dt.


Alors l'application g : A ---+ E est continue.
Supposons que A soit un ouvert d'un espace vectoriel normé G, et que l'application
f : I x A ---+ E soit continue et ait, en tout point (t, À) de [a, b] x A, une différentielle
partielle par rapport à sa seconde variable À, notée Dd (t, À). Supposons aussi l'application
de [a, b] x A dans C(G, E), (t, À) i--+ D2f(t, À), continue. Alors l'application g: A---+ E
est de classe C 1 et sa différentielle, en chaque point À E A, est

Dg( À) = 1b D2f(t, À) dt.


Ces dernières propriétés seront utilisées au chapitre VIII, et leur démonstration est
d'ailleurs donnée dans ce chapitre (VIll.2.1 ).
§ 2. Solution du problème de Cauchy: cas lipschitzien 119

2.5. Proposition. - Soit E un espace de Banach (espace vectoriel normé complet)


réel, et f: 0 ~ E une application continue d'une partie 0 de~ x E dans E. Soit
(t0 , x 0 ) E O. Une application continue <p d'un intervalle ouvert I de~ contenant
to dans E, dont le graphe est contenu dans n, est une solution de l'équation
différentielle
<p1 (t) = f(t, <p(t)) (1)
et satisfait la donnée de Cauchy (t0 , x 0 ) si et seulement si elle vérifie, pour tout
t E I,
<p(t) = xo + ltto
f(B, <p(B)) d().

Preuve : Supposons <p solution de l'équation (1) et satisfaisant <p(to) = xo. Pour tout
t E I, nous avons alors <p'(t) = f (t, <p(t)). L'application <p 1 : I ~ E est donc continue,
puisque composée de t r-+ ( t, <p( t)) (qui est continue car ses deux composantes le sont), et
de l'application f (continue par hypothèse). Nous savons alors (2.4.g) que pour tout t E I,

<p(t) = <p(to) + lt
to
<p'(B) d() = xo + lt
to
f(B, <p(B)) d().
Réciproquement, supposons que pour tout t E I, l'application <p vérifie

<p(t) = xo + ltto
f (e, <p(B)) dB.
L'application <pétant continue, nous voyons comme ci-dessus que t r-+ 'lj;(t) = f (t, <p(t))
est une application continue dont <p est une primitive. Mais alors nous pouvons affirmer
que pour tout t E I, <p'(t) = 'lf;(t), c'est-à-dire que <p est solution de l'équation (1). De
plus, en faisant t = t 0 , nous voyons immédiatement que <p satisfait la donnée de Cauchy
(to, xo). 0
2.6. Définition. - Soit E un espace vectoriel normé, A un ensemble, 0 une partie
de A x E et f une application de 0 dans un autre espace vectoriel normé F. On
dit que f est lipschitzienne relativement à sa seconde variable x E E s'il existe un
réel k ;::: 0 tel que, pour tous a E A, X1 et X2 E E tels que (a, x1) et (a, x2) En,
llJ(a, Il
x2) - f(a, x1) :S kllx2 - X1 Il·
Le réel k est appelé rapport de l'application f. On dit aussi application k-
lipschitzienne pour dire application lipschitzienne de rapport k.
On suppose l'ensemble A muni d'une topologie. L'application f est dite localement
lipschitzienne relativement à sa seconde variable x E E si tout point (a, x) E n
possède un voisinage W c A x E tel que la restriction de f à n n W soit
lipschitzienne relativement à sa seconde variable (Je rapport k pouvant dépendre
du point (a, x) E 0 considéré).
2.7. Théorème de Cauchy-Lipschitz. - Soit E un espace de Banach (espace
vectoriel normé complet) réel, et f : n ~ E une application d'une partie n de
~ x E dans E. On considère l'équation différentielle
<p'(t) = f(t,<p(t)). (1)
Soit (to, xo) E n une donnée de Cauchy, qu'on suppose centre d'un tonneau
de sécurité fermé Io x Bo contenu dans 0 (avec Io = [to - l, to + l], l > 0,
Bo = Bp(x 0 , r), boule fermée de centre x 0 et de rayon r > 0). On suppose aussi
la restriction de f à Io x Bo continue, et lipschitzienne relativement à sa seconde
variable. Il existe alors une solution de l'équation différentielle (1) satisfaisant la
donnée de Cauchy (t 0 , x 0 ), défi.nie sur l'intervalle ouvert ]to - l, to + l[, unique.
120 Chapitre V. Équations différentielles; le problème de Cauchy

Preuve : Puisque Io est compact, toute application continue de Io dans E est bornée. Nous
pouvons donc munir l'espace C(Io, E) des applications continues de Io dans Ede la norme
de la convergence unifonne
ll'Pll = sup llcp(t)ll ·
tE/o

Nous savons (voir par exemple [T. VIII.!. 9] et [T. VIII.1.11]) que muni de cette norme, cet
espace est complet. Soit Fla partie de C(I0 , E) formée par les éléments <p de cet espace
dont le graphe est contenu dans Io x B 0 . Pour tout s E Io, soit Às : C(Io, E) --> E
l'application <p t-t À 8 (cp) = cp(s). C'est évidemment une application linéaire, qui vérifie

llÀs('P)ll = ll<p(s)ll ~ supll<p(t)ll = ll'Pll,


tElo
ce qui prouve que À 8 est continue et de norme ~ 1. Puisque Bo est une partie fermée de
E et que chaque À 8 est continue, chaque \; 1(B0 ) est un fermé de C(I0 , E). L'ensemble
F, qui n'est autre que nsEio \; 1(Bo), est donc une partie fermée (comme intersection de
fermés) de l'espace complet C(I0 , E), donc est complet.
Pour tout élément <p de F et tout t E I 0 , posons

Tcp(t) = xo + t
}to
f(e,cp(e)) de.

L'application Tep: I 0 --> E est continue sur I0 , car c'est une primitive d'une application
continue. Elle est dérivable en tout point t intérieur à I 0 , et a pour dérivée
(Tcp)'(t) = f (t, cp(t)).
D'après le théorème des accroissements finis, elle vérifie, pour tout t E I 0 ,
r
llTcp(t) -Tcp(to)ll ~ sup ll(Tcp)'(e)ll lt - toi~ yl = r.
llE[to,t]

Cela prouve que le graphe de Tep est contenu dans Io x B 0 , donc que T applique F dans
lui-même.
Soient <p1 et <p 2 deux éléments de F. Pour tout t E Io,

T<p1(t) -T<p2(t) = t
lto
(1(e,<p1(e)) - f(e, <p2(e))) de.

Par hypothèse, la restriction de f à Io x Bo est lipschitzienne relativement à sa seconde


variable. Soit k son rapport. En utilisant les propriétés de l'intégrale (2.4), nous déduisons
de l'égalité ci-dessus les inégalités

llT<p1 (t) - Tcp2(t)ll ~ 11: llJ(e, cp1(e)) - J (e, cp2(e)) Il del

~ 11: kll<p1(e) - <p2(e)JJ del (*)

~ 11: kll'P1 - 'P2ll del

~kit - toi ll'P1 - 'P2ll · (**)


Posons T 1 =Tet, pour tout entier n > 1, Tn = T o rn- 1. Pour tout entier n 2:'.: 1, Tn
applique l'ensemble F dans lui-même. Nous allons montrer que cette application vérifie,
pour tout couple ( <p 1 , cp 2) d'éléments de F et tout t E I 0 ,

JJTn<p1(t) -Tn<p2(t)JJ ~ knlt ~tain ll'P1 - 'P2ll · (***)


n.
§ 2. Solution du problème de Cauchy: cas lipschitzien 121

Pour n = 1, l'inégalité ( ***) se réduit à ( **),déjà démontrée. Supposons la vraie pour tout
entier n vérifiant 1 ::; n ::; m, et montrons qu'elle est vraie pour n = m + 1. L'inégalité ( *)
établie ci-dessus étant vraie pour tout couple (cp 1, cp 2) d'éléments de F, est vraie lorsqu'on
remplace cp1 par Tmcp1 et cp2 par Tmcp2. Nous avons donc

llTm+1cp1(t) - rm+1cp2(t)ll ::; 11: kllTmcp1(0) - Tmcp2(0)ll dOI .


Mais d'après l'hypothèse de récurrence,
llTmcp1(0) -Tmcp2(0)//::; kmlO-, tolm llcp1 - 'P2ll,
m.
et par suite

l/Tm+1cp1(t) -Tm+1cp2(t)I/ ::; 11: km+1 IO ~!olm ll'P1 - cp2ll dOI


km+llt - tolm+l
::; (m + l)! llcp1 - cp21i,
ce qui montre que l'inégalité (***)est vraie pour n = m + 1. Nous avons donc prouvé par
récurrence que cette inégalité est vraie pour tout entier n 2 1. Puisque, pour tout t E I,
it - to 1 ::; l, nous en déduisons
llTncp1 -Tncp2ll = supllTncp1(t) -Tncp2(t)ll::; kn~n ll'P1 - 'P2ll ·
tElo n.
Mais ( kn zn) / n! tend vers 0 lorsque n tend vers +oo, donc pour n assez grand, ( kn zn) / n! est
strictement inférieur à 1, et l'inégalité ci-dessus exprime que l'application rn
de l'espace
métrique complet F dans lui-même est contractante. D'après le théorème du point fixe,
nous pouvons affirmer que rn admet dans Fun point fixe unique, qui est aussi l'unique
point fixe dans F de l'application T (voir par exemple [T.Vl.4.3] et [T.Vl.4.4]). Ce point
fixe est un élément cp de F qui vérifie Tep = cp, c'est-à-dire une application continue
cp : Io ---> E, dont le graphe est contenu dans Io x B 0 , qui vérifie, pour tout t E Io,
cp(t) = xo + 1tta
f (e, cp(O)) dO.
D'après la proposition 2.5, la restriction de cp à l'intérieur ]ta - l, to + l[ de Io est une
solution de l'équation différentielle ( 1) satisfaisant la donnée de Cauchy (t 0 , x 0 ).
Montrons maintenant l'unicité. Soit 7/J une solution de (1), définie sur l'intervalle ouvert
]to - l, t0 + l[, satisfaisant la donnée de Cauchy (t 0 , x 0 ). D'après le lemme 2.3, le graphe
de 7/J est contenu dans Io x B 0 . La dérivée de 7/J est bornée en norme sur ]to - l, to + l[ par
/If
sup(t,x)Elo xBo (t, x) // < r /l. Les limites de 'ljl(t) lorsque t tend vers ta -l ou vers ta +l,
en restant dans ]to - l, t 0 + l[, existent donc (exercice V.1), et nous pouvons prolonger 'ljJ
par continuité en une application continue, encore notée 'ljl, de Io = [ta - l, to + l] dans
E. Le graphe de 'ljJ ainsi prolongée est contenu dans Io x B 0 , aussi 'ljJ est-elle élément de
F. Nous voyons alors que 7/J est un point fixe de T; elle est donc nécessairement égale à
cp. D
2.8. Remarques et compléments
a) Extrémités de l'intervalle. - Lors de la démonstration du théorème précédent, nous
avons prouvé l'existence d'une application cp: Io ---> E dont la restriction à l'intérieur de
Io est solution de l'équation différentielle ( 1) et satisfait la donnée de Cauchy (to, xo). Il
est utile de remarquer que cp est définie aussi aux extrémités t 0 - l et to + l de l'intervalle
Io et qu'elle admet, en ces points, respectivement une dérivée à droite et une dérivée à
gauche qui vérifient l'équation différentielle (1), c'est-à-dire qui satisfont
cp~(to - l) = f (to - l, cp(to - l)), cp~(to + l) = f(to + l, cp(to + l)).
122 Chapitre V. Équations différentielles; le problème de Cauchy

b) Dépendance d'un paramètre. - Le théorème de Cauchy-Lipschitz 2.7 peut facile-


ment être adapté au cas d'une équation différentielle dépendant d'un paramètre. Cette
généralisation, qui sera utilisée dans le prochain chapitre (où nous ferons une étude un peu
plus poussée des équations différentielles avec paramètre), est présentée ci-dessous.
2.9. Théorème de Cauchy-Lipschitz avec paramètre. - Soit E un espace de
Banach réel, A un espace topologique, n une partie de ~ X E X A, et f : n ----+ E
une application. On considère l'équation différentielle, dépendant d'un paramètre
>. E A,
<p1 ( t) = f (t' <p( t)' >.) . (2)

Soient (t 0 , x 0 ,) E ~ x E, Io = [to - l, to + l] (avec l > 0) un intervalle fermé de


centre t 0 , Bo= Bp(x 0 , r) la boule fermée de Ede centre xo et de rayon r >O. On
suppose les conditions suivantes satisfaites :
(i) la partie Io x Box A de~ x Ex A est contenue dans n, et la restriction de f à
cette partie est continue, et lipschitzienne relativement à sa seconde variable;
(ii) pour tout >. E A, Io x Bo est un tonneau de sécurité pour l'équation
différentielle (2), dans laquelle le paramètre >. est considéré comme fixé.
Alors pour tout >. E A, il existe une application continue 'P>. : Io ----+ E unique,
dont la restriction à l'intérieur de Io est l'unique solution de l'équation (2) (dans
laquelle >. est fixé) définie sur cet intervalle et satisfaisant la donnée de Cauchy
(to, xo).
De plus, l'application>.~ <p>., de l'espace topologique A dans l'espace C(I0 , E) des
applications continues de Io dans E muni de la norme de la convergence uniforme,
est continue. Cela implique, en particulier, que l'application de Io x A dans E,
(t, >.) ~ 'P>.(t), est continue.
Preuve: Elle est essentiellement la même que celle du théorème de Cauchy-Lipschitz 2.7.
Il suffit, à la fin de cette démonstration, d'utiliser le théorème de continuité du point fixe
par rapport au paramètre (voir par exemple [T.VI.4.5]). 0
2.10. Théorème d'existence et d'unicité globales. - Soit E un espace de Banach
réel, et f: n----+ E une application d'un ouvert n de~ XE dans E. On suppose f
continue sur n, et localement lipschitzienne par rapport à sa seconde variable. On
considère l'équation différentielle
<p1 (t) = f(t,<p(t)). (1)
Pour toute donnée de Cauchy (t 0 , x 0 ) E n il existe
une solution maximale unique
de l'équation différentielle (1) satisfaisant cette donnée de Cauchy.
Preuve : Soit (to, xo) E 0. Puisque 0 est ouvert et f continue et localement lipschitzienne
par rapport à sa seconde variable, il existe un tonneau de sécurité fermé 10 x B 0 , de
centre (t 0 , x 0 ), contenu dans n, satisfaisant les hypothèses du théorème 2.7. Appliquant ce
théorème, nous voyons qu'il existe une solution cp de l'équation (1), définie sur l'intérieur
de Io et sati faisant la donnée de Cauchy (t 0 , x 0 ). D'après la proposition 1.3, cette solution
est restriction d'une solution maximale <p de l'équation (1), qui satisfait aussi la donnée
de Cauchy (t 0 , x 0 ). Soit 'l/; une autre solution de (1), définie sur un intervalle ouvert J
contenant x 0 , et satisfaisant la donnée de Cauchy (t 0 , x 0 ). En remplaçant si nécessaire Io
par un intervalle fermé de centre t 0 , contenu dans 10 n J, et en appliquant à nouveau le
théorème 2.7, nous voyons que les solutions <pet 'l/; de l'équation (1) sont égales sur un
intervalle de centre t 0 . Autrement dit, nous avons prouvé que (t 0 , x 0 ) est point d'unicité
§ 3. Solution du problème de Cauchy: cas continu 123

locale pour le problème de Cauchy. Mais le corollaire 1.9 nous permet d'affirmer que c'est
un point d'unicité globale pour ce problème, donc que ép est l'unique solution maximale
de (1) satisfaisant la donnée de Cauchy (t 0 , x 0 ). D
2.11. Le problème de Cauchy pour les équations d'ordre supérieur
Soit E un espace de Banach réel. Considérons l'équation différentielle d'ordre n (n > 1):
<p(n)(t) = J (t, <p(t), <p1 (t), ... , <p(n-l)(t)),
où f est une application d'une partie n de lR x En dans l'espace vectoriel normé E.
Une donnée de Cauchy est un point (to, Xo, X1, ... 'Xn-1) den. Résoudre le problème de
Cauchy pour cette donnée, c'est trouver une solution <p : I ~ Ede l'équation telle que
to E I et que <p(to) = Xo, cp'(to) =xi, ... , <p(n-l)(to) = Xn-1·
Nous avons vu comment ramener la recherche des solutions de cette équation à celle des
solutions d'une équation du premier ordre. Cela permet de traduire, pour le cas d'une
équation d'ordre n, les théorèmes d'existence et d'unicité 2.7 et 2.10 de la solution
maximale du problème de Cauchy établis ci-dessus dans le cas d'une équation du premier
ordre. Nous laissons au lecteur le soin de le faire.

3. Solution du problème de Cauchy : cas continu


Soient E un espace de Banach réel et f est une application continue d'un ouvert n de
lR x E dans E. Considérons l'équation différentielle de la forme
<p1 (t) = f(t,<p(t)). (1)
Nous ne supposons plus l'application f localement lipschitzienne relativement à sa seconde
variable x E E. Le théorème de Cauchy-Lipschitz 2.7 n'est donc plus applicable.
Nous allons voir cependant que lorsque l'espace vectoriel E est de dimension finie,
et l'application f continue, un théorème (dû à Peano) permet d'affirmer l'existence de
solutions du problème de Cauchy, pour toute donnée de Cauchy (to, xo) E O. Mais il
n'y a en général plus unicité de la solution maximale satisfaisant une donnée de Cauchy
spécifiée.
La démonstration de ce théorème repose sur la notion de solution approchée d'une équation
différentielle, introduite ci-dessous.
3.1. Définition. - Soit E un espace de Banach réel, et f une application continue
d'un ouvert n de lR x E dans E. On considère l'équation différentielle
cp'(t) = f(t,<p(t)). (1)
Soit un réel é > O. On dit qu'une application <p d'un intervalle non vide I de lR
dans E est une solution €-approchée de l'équation (1) si <p est continue, a son graphe
contenu dans n, est différentiable en tout point du complémentaire dans I d'une
partie finie D de I, et vérifie les deux propriétés suivantes :
(i) pour tout t ED, les limites
lim <p1 ( B) et lim <p1 ( B)
8-+t, 8El-D, 8<t 8->t, 8El-D, 8>t
existent;
(ii) pour tout t E I - D, on a
ll<p'(t) - J(t, <p(t)) 11 ::; é.

3.2. Lemme. - Dans les hypothèses de la définition 3.1, soit (t 0 , x 0 ) E n une


donnée de Cauchy et ! 0 x Bo un tonneau de sécurité fermé de centre (to, xo) (on
sait qu'un tel tonneau de sécurité existe d'après 2.2.a). On pose
M = sup llJ(t, x) Il·
(t,x)E/o X Bo
124 Chapitre V. Équations différentielles; le problème de Cauchy

Pour tout c > 0, il existe une solution E-approchée de l'équation différentielle (1),
notée cp, définie sur l'intervalle I 0 , dont le graphe est contenu dans Io x Bo, vérifiant
cp(t0 ) = x 0 . De plus, cp est lipschitzienne de rapport M.
Preuve: Soit 2l la longueur del' intervalle Io. Nous allons construire la solution c-approchée
cp sur l'intervalle [t0 , t 0 + l] (la construction serait analogue sur [t0 - l 1t 0 ]). Pour cela, nous
allons construire une suite finie (t 11 ... 1tk) de réels vérifiant to < tl < · · · < tk = to + l.
Nous définirons cp, de proche en proche, sur chaque intervalle [ti 1ti+ 1], 0 :::; i :::; k - 1,
en posant

Ce procédé est en fait un moyen de construction de solutions approchées d'une équation


différentielle, appelé méthode d'Euler.
Nous devons choisir successivement t 1, t 2 , ... , tk, afin que cp soit solution c-approchée de
l'équation ( 1). Pour cela, posons
tl = sup{ t E [toi to + l] ; WJ E [toit] 1 Il! (81 xo + (0 - to)fo) - foll :::; c} 1
où nous avons noté, pour abréger, fo = f(to 1xo).
Puis, si t 1 < t 0 + l, posons
= sup{ t E [t11 to + l] j ve E [t11 t],
t2 Il! (el X1 + (0 - tl)fi) - fi Il :::; é} 1
avec X1 = xo + (t1 - to)fo, fi = f(t11 x1).
De manière générale, en supposant les ti définis pour 1 :::; i :::; k - 1, et tk-l < t 0 + l,
posons
tk = sup{ t E [tk-11 to + l] ;
VOE [tk-11t]1 llJ(B1Xk-1+(B-tk_i)fk-i)-fk-1ll ::;c}1 (*)
avec Xk-1 = Xk-2 + (tk-1 - tk-2)fk-2. fk-1 = f(tk-11 Xk-1). Nous allons montrer
que pour un certain entier k 2: 1, le réel tk défini par la formule ( *) est égal à t 0 + l.
Supposons que tel ne soit pas le cas. La construction décrite ci-dessus nous donne alors
une suite infinie (tn , n E N), strictement croissante, majorée par t 0 + l. Cette suite a donc
une limites E [to, to + l]. La suite (xn 1 n E N) est de Cauchy dans Bo, car pour tout
n EN,

Elle a donc une limite y E B 0 . L'application f étant continue au point (s 1y), il existe
rt > 0 et p > 0 tels que pour tout (t 1x) E Io x Bo vérifiant lt - si :::; rt et llx - Yll :::; p,
nous ayons llJ(t 1x) - f(s 1y)ll:::; c/2.
Posons

Puisque la suite ( (tn 1Xn), n E N) converge vers (s 1y), il existe un entier m EN tel que

Ü < S - tm < ( 1

Maisalors,pourtoutOvérifianttm:::; e:::; inf(to+l1 tm+(),nousavons IB-sl:::; (:::; Tf,


et
llxm + (0 - tm)fm - Yll :::; llxm - Yll +IO - tml llfmll :::; ~ + M(

< ~ + Mp <
-2 2(M+l)_p,
§ 3. Solution du problème de Cauchy: cas continu 125

et par suite
Il! (e, Xm + (e - tm)fm) - fm Il : :; Il! (e, Xm + (e - tm)fm) - f(s, y) Il
+ llJ(s, Y) - fmll
€ €
<-+-=€.
- 2 2
Cela prouve que tm+l 2: inf(to + l, tm + () 2: s, ce qui contredit le fait que pour tout
n EN, tn < s.
II existe donc bien un entier k 2: 1 tel que tk = t 0 + l. L'application <p : [t 0 ,t0 + l] -+ E que
nous avons définie ci-dessus est alors, par construction même, une solution €-approchée
de l'équation (1).
Enfin, pour tous t 1 et t 2 E Io nous avons (en utilisant les propriétés 2.4.d et 2.4.h)

llcp(t1) - cp(t2)1i :::; li 1


t
2
llcp'(e)ll del:::; Mlt1 - t21,

ce qui prouve que <p est lipschitzienne sur Io de rapport M. D

3.3. Lemme. - Dans les hypothèses du lemme 3.2, soit (E:n , n E N) une suite
décroissante de réels > 0 convergeant vers 0 et, pour tout n E N, 'Pn : Io -+ Bo
une solution E:n-approchée de l'équation différentielle (1) vérifiant 'Pn(t 0 ) = x 0 ,
lipschitzienne de rapport M. Si la suite ('Pn , n E N) converge uniformément sur
Io vers une application <p : Io -+ Bo, la restriction de cette application à l'intérieur
de Io est une vraie solution de l'équation différentielle (1) qui satisfait la donnée
de Cauchy (to, xo).
Preuve: Soit t E I 0 . Supposons par exemple t 2: t 0 • Pour tout n EN, nous avons

'Pn(t) - 'Pn(to) = 'Pn(t) - Xo = t <p~(e) de.


lto
L'intégrale figurant dans cette expression a en effet un sens, d'après2.4.h, bien que <p~ ne
soit peut-être pas définie en un nombre fini de points de de l'intervalle [t0 , t]. Nous en
déduisons

'Pn(t) - xo - t f (e, 'Pn(e)) de= t ( 'P~.(e) - f (e, 'Pn(e))) de.


lto lto
Puisque 'Pn est une solution én-approchée de l'équation (1), nous obtenons la majoration

ll'Pn(t)- Xo -1: f(e,cpn(e)) dell:::; €nit- toi·

Nous allons montrer que

lim {tf(e,cpn(e))de= tf(e,cp(e))de.


n->+= lto lto
Remarquons qu'une fois ce résultat acquis, la démonstration sera terminée car en faisant
tendre n vers +oo dans ( *), le membre de droite de cette inégalité tendant vers 0, tandis
que dans le membre de gauche 'Pn converge uniformément vers <p, nous obtiendrons

cp(t) = x 0 + t f(e,cp(e)) de,


}to
et la proposition 2.5 prouvera que <p est une solution del' équation différentielle ( 1) vérifiant
la donnée de Cauchy (to, xo).
126 Chapitre V. Équations différentielles; le problème de Cauchy

La propriété (**) que nous devons démontrer est une conséquence immédiate du théorème
de convergence dominée de Lebesgue (voir par exemple [12]), et sa démonstration
au moyen de ce théorème n'utilise pas l'hypothèse selon laquelle les applications cpn
sont lipschitziennes de rapport M. Cependant, pour les lecteurs n'ayant pas encore
une connaissance approfondie de la théorie de l'intégration, nous allons en donner une
démonstration élémentaire utilisant cette hypothèse, mais pas de propriétés de l'intégrale
autres que celles rappelées en 2.4.
Soit é > O. Les applications cpn étant lipschitziennes de rapport M et fonnant une suite
qui converge uniformément vers cp, l'application cp est elle aussi lipschitzienne de rapport
M, et a fortiori continue. L'application
(s, y)~ g(s, y)= f (s, cp(s)) - f(s, y)
est continue comme composée d'applications continues. En particulier, pour touts E [t0 , t]
cette application est continue au point ( s, cp( s)). Il existe donc des réels T/s > 0 et r s > 0
telsque,pourtoutO E [to,t]vérifiantlB-sl ~ TJ 5 ettouty E Bovérifiantlly-cp(s)ll ~ r 8 ,
nous ayons
llg(O, y) - g(s, cp(s)) Il = llf(e, cp(O)) - f(e, y)ll ~ é. (***)
Nous pouvons de plus imposer à T/s de vérifier
rs
< 2(M + 1)
O < T/s
Lorsque s parcourt l'intervalle compact [to, t], les intervalles J = ]s -
5 TJ 8 , s + TJs[
en forment un recouvrement ouvert, dont nous pouvons extraire un recouvrement fini
{ Js 1 , J 52 , ••• , Jsv }. Soit r = inf(r 81 , ••• , r 8 v).
Puisque (cpn , n E N) converge unifonnément vers cp, il existe N E N tel que, pour tout
n;::: Net toute E [t 0 , t], nous ayons
llcpn(B) - cp(B)ll <~·
Soit donc n un entier;::: N, et eun élément de [t0 , t]. Il existe un indice i, 1 ~ i ~ p, tel
que esoit élément de l'intervalle ouvert Js;. Nous avons alors IB - sil < Tfsu et
llcpn(B) - cp(sdll ~ llcpn(B) - cp(B)ll + llcp(O) - cp(si)ll ~~+MIO - Sil
r Mr 5 .
-<-+
2 2(M +' 1) -<r s;'
ce qui nous pennet d'utiliser l'inégalité (*** ), dans laquelle nous faisons y
Nous obtenons ainsi
llf(O,cp(O)) -f(B,cpn(B))I ~ é.
Nous en déduisons

111: f(e, cp(O)) de -1: f(e, cpn(B)) dell ~ l)1(e, cp(B)) - f(e, cpn(B)) JI de

~ élt - toi·
Le réel é > 0 pouvant être arbitrairement petit, nous avons prouvé ( ** ). D

3.4. Théorème de Peano. - Soit E un espace vectoriel réel de dimension finie, et


f une application continue d'un ouvert n de IR x E dans E. Pour toute donnée
de Cauchy (t0 , xo) E n, il existe au moins une solution maximale cp : I ---> E de
l'équation différentielle
cp'(t) = f(t,cp(t))' (1)
satisfaisant la donnée de Cauchy (to, x 0 ).
§ 4. Bouts d'une solution maximale 127

Preuve: D'après 2.2.a, (to, xo) est centre d'un tonneau de sécurété fermé Io x B 0 . Soit
M = sup llf(t, x)ll ·
(t,x)EloxBo
Grâce au lemme 3.2, nous pouvons construire une suite (En, n E N) de réels strictement
positifs convergeant vers 0 et une suite (<fJn , n E N) d'applications continues de Io dans
E, chaque application <pn vérifiant <fJn(t0 ) = x 0 , étant lipschitzienne de rapport M, et
étant une solution En-approchée de l'équation différentielle (1). Pour tous t et t' E I 0 , et
tout n E N, nous avons
ll<fJn(t') - <fJn(t)ll :S Mit' - tl ·
Cela prouve que la suite (<pn, n E N) est équicontinue (voir par exemple [T.VIII.3.1]).
D'autre part, pour tout t E Io et tout n E N, <fJn(t) est élément de la boule fermée de E
de centre x 0 et de rayon Mit - t 0 1, qui est compacte car E est de dimension finie. Le
théorème d' Ascoli (voir par exemple [T.VIII.3.8]) montre alors que la suite (<fJn, n E N)
est contenue dans une partie relativement compacte (c'est-à-dire d'adhérence compacte)
de l'espace C(I0 , E) des applications continues de Io dans E, muni de la norme de la
convergence uniforme. Nous pouvons donc en extraire une suite ('l/Jn = <fJa(n) , n E N) (a
désignant une application strictement croissante de N dans lui-même) qui converge. Soit
<p sa limite. Les <fJn prenant toutes leurs valeurs dans B 0 , il en est de même de <p, et d'après
0

le lemme 3.3, la restriction de <p à Io est une solution de l'équation différentielle (1) qui
satisfait la donnée de Cauchy (t 0 , x 0 ). D'après la proposition 1.3, il existe une solution
0
maximale (encore notée <p ), définie sur un intervalle ouvert I contenant I 0 , qui satisfait
aussi la donnée de Cauchy (t 0 , x 0 ). D
3.5. Exemple de non unicité. - L'équation différentielle
<p1 (t) = 3(<p(t)) 213
admet une infinité de solutions satisfaisant la donnée de Cauchy (t 0 = 0, x 0 = 0), ayant
pour expression
(t-À) 3 pourt:SÀ
<p(t)= { 0 pourÀ:St:Sµ
(t - µ) 3 pour µ :S t ,
où À et µ sont deux réels vérifiant À :S t 0 :S µ.
3.6. Cas d'une équation différentielle d'ordre n. - Le théorème d'existence 3 .4 s'adapte
sans difficulté au cas d'une équation différentielle d'ordre n > 1, de la forme
<p(n)(t) = J(t, <p(t), <p'(t), .. ., <p(n-l)(t))'
où E est un espace vectoriel de dimension finie et f une application continue d'un ouvert
n de IR X En dans E. Pour toute donnée de Cauchy (to, Xo, X1, ... 'Xn-1) E n, il existe
une solution maximale <p : I ~ E de cette équation qui satisfait cette donnée de Cauchy,
c'est-à-dire qui satisfait t 0 E I, x 0 = <p(t 0 ) et, pour tout entier k (l :S k :S n - 1),
<p(k)(to) = Xk.

4. Bouts d'une solution maximale


Nous considérons dans ce paragraphe l'équation différentielle, sur l'espace vectoriel normé
E,
<p 1 (t) = f(t,<p(t)), (1)
où f est une application d'une partie n de IR x E dans E. Les hypothèses sur E et f seront
précisées en temps utile.
128 Chapitre V. Équations différentielles; le problème de Cauchy

4.1. Définition. - Soit cp une solution maximale de l'équation différentielle (1),


]a, b[ son intervalle de définition (a pouvant être fini ou égal à -oo, et b fini ou
égal à +oo). On appelle bout droit (resp., bout gauche) de cette solution maximale
l'ensemble des valeurs d'adhérence, lorsque t ----t b (resp., lorsque t ----t a), de
l'application de Ja,b[ dans lR x E: t H (t,cp(t)).

4.2. Commentaire
a) Projection des bouts sur le facteur IR. -- Il importe de remarquer que le bout droit
(resp., gauche) de la solution cp est une partie de lR x E, qui peut éventuellement être vide.
Si cette partie est non vide, sa projection sur le facteur lR est nécessairement le singleton
{ b} (resp., le singleton {a}); en effet, b (resp., a) est la limite, donc l'unique valeur
d'adhérence, de l'injection canonique de ]a, b[ dans IR, t t--t t, lorsque t ----t b (resp.,
lorsque t ----t a).
Nous voyons donc que si b = +oo (resp., si a= -oo), le bout droit (resp., gauche) de la
solution cp est vide.
b) Ensembles limites. - Supposons l'intervalle de définition de la solution maximale cp
non borné à droite (resp., à gauche), c'est-à-dire de la forme ]a, +oo[ (resp., de la forme
J - oo, b[ ). Le bout droit (resp., gauche) de la solution cp est alors vide. Afin d'étudier le
comportement de cp(t) lorsque t ----t +oo (resp., lorsque t ----t -oo), il est utile d'introduire
la notion d'ensemble w-limite (resp., d'ensemble a-limite) de cp : c'est, par définition,
l'ensemble des valeurs d'adhérence de l'application t H cp(t) lorsque t ----t +oo (resp.,
lorsque t ----t -oo). Les ensembles w-limite et a-limite de cp sont des parties de E, qui
peuvent éventuellement être vides. L'étude de leurs propriétés est très intéressante, mais
moins élémentaire que celle des bouts; elle ne sera pas abordée dans ce livre.
4.3. Théorème. - On se place dans les hypothèses du théorème d'existence et
d'unicité globale 2.10 : l'espace E est de Banach, n est un ouvert de lR X E,
l'application f est continue sur n et localement lipschitzienne relativement à sa
seconde variable. Les bouts d'une solution maximale cp : ]a, b[ ----t E de l'équation
différentielle (1) ont les propriétés suivantes.
(i) Si un bout (droit ou gauche) de cp est non vide, il est contenu dans la frontière
den.
(ii) Si b < +oo et s'il existe é > 0 tel que t H llcp' (t) Il soit bornée sur Jb - é, b[, la
limite
lim cp(t)
t-+b, tE]a,b[

existe, et le bout droit de la solution cp est le singleton { (b, limt-+b, tE Ja,b[ cp( t)) }.
De même, si -oo < a et s'il existe é > 0 tel que t H llcp'(t)ll soit bornée sur
]a, a + é[, la limite
lim cp(t)
t-+a, tE Ja,b[

existe, et le bout gauche de la solution <p est le singleton { (a, limt-+a, tE Ja,b[ cp( t)) } .
(iii) Si b < +oo et si le bout droit de cp est vide (resp., si -oo < a et si le bout
gauche de cp est vide), pour toute partie compacte K de E, il existe é > 0 tel que
pour tout t E ]a, b[ vérifiant b - t < é (resp., vérifiant t - a < E), cp(t) n'est pas
élément de K.
Preuve : Nous établirons ces propriétés pour le bout droit (le cas du bout gauche étant bien
sûr tout à fait analogue).
§ 4. Bouts d'une solution maximale 129

(i) Soit (b, y) un élément du bout droit de cp. C'est une valeur d'adhérence de l'application
t ~ (t, cp(t) ), qui prend ses valeurs dans n. Par suite, (b, y) E n. Supposons (b, y) E n.
Il existe alors un tonneau de sécurité fermé [b - l, b + l] x Bp(y, r), centré sur (b, y),
contenu dans n, avec l > 0, r > O. Considérons le tonneau fermé de même centre (b, y),
homothétique du précédent dans le rapport 1/3, c'est-à-dire [b-l/3, b+l/3] x Bp(y, r /3).
C'est un voisinage de (b, y); comme (b, y) est valeur d'adhérence de t 1-7 ( t, cp( t)), il existe
s E]a,b[ telque(s,cp(s)) E [b-l/3,b+l/3]xBp(y,r/3).Autrementdit,O < b-s:::; l/3
et llcp(s) - Yll :::; r/3. Mais alors [s - 2l/3, s + 2l/3] x Bp(cp(s), 2l/3) est un tonneau
de sécurité fermé, de centre (s, cp(s)) (remarque 2.2.b). Le théorème d'existence 2.7 nous
permet alors d'affirmer que la solution maximale de (1) qui satisfait la donnée de Cauchy
(s, cp(s)) est définie sur un intervalle qui contient ]s - 2l/3, s + 2l/3[. Mais cette solution
n'est autre que cp, et puisque b- s :::; l/3, s + 2l/3 2: b + l/3 > b. Nous avons ainsi prouvé
que b n'est pas l'extrémité droite de l'intervalle de définition de la solution maximale cp,
contrairement à la définition même de b. Notre hypothèse de départ, selon laquelle ( b, y)
appartient à n, est donc fausse. Le point (b, y), élément de l'adhérence den mais pas de
n, est nécessairement élément de la frontière de n.
(ii) Soit (tn, n EN) une suite croissante de points de l'intervalle [b- €, b[, qui converge
vers b. D'après le théorème des accroissements finis, pour tous pet q E N,
llcp(tp) - cp(tq)ll :::; sup llcp'(t)ll itp - tql :::; M ltp - tql,
tE(b-e,b(
où nous avons noté Mun majorant de llcp'(t)ll pour t E ]b - €, b[. Cette inégalité montre
que la suite (cp(tn), n EN) est de Cauchy dans E complet, donc converge vers un élément
Ç de cet espace. L'élément Ç ne dépend pas du choix de la suite (tn). car avec deux suites
croissantes (tn) et (t~) dans [b-é, b[ convergeant vers b, on peut, en considérant la réunion
des termes de ces deux suites et en l'ordonnant selon l'ordre croissant, former une nouvelle
suite croissante (sn). convergeant vers b, dont les suites (tn) et (t~) sont extraites; la
convergence de la suite (cp( sn)) montre que les deux suites ( cp( tn)) et ( cp( t~)), qui en sont
extraites, ont la même limite. Nous pouvons alors affirmer (voir par exemple [T.VI.1.4.c])
que l'application t 1-7 cp(t) a pour limite Ç lorsque t ~ b, t E ]a, b[. Aussi, lorsque t ~ b,
l'application t 1-7 ( t, cp(t)) converge vers (b, Ç), et a donc ce point de IR. x E pourunique
valeur d'adhérence.
(iii) Si la propriété annoncé était fausse, il existerait une partie compacte K de E ayant
la propriété suivante : pour tout entier n E N*, il existe un réel tn E [b - ( 1/ n), b[ tel
que cp( tn) E K. La suite ( cp( tn) , n E N), contenue dans un compact, aurait une valeur
d'adhérence Ç E K. Le point (b, Ç) de IR. x E serait alors élément du bout droit de cp, en
contradiction avec l'hypothèse selon laquelle ce bout droit est vide. 0
4.4. Commentaires
a) Équations déB.nies sur IR. X E. - Si le domaine de définition n de la fonction f est
IR. x E entier, la frontière de n est vide. Le théorème 4.3 montre alors que les bouts droit
et gauche de toute solution maximale de ( 1) sont vides.
b) Explosions. - Considérons, pour simplifier, une équation différentielle autonome,
satisfaisant les hypothèses du théorème d'existence et d'unicité globales 2.10. La partie n
de IR. x E est alors de la forme IR. x U, où U est un ouvert de l'espace de Banach E. Soit
cp : ]a, b[ ~ E une solution maximale de cette équation, pour laquelle b < +oo (le cas
-oo < a donnerait lieu à un raisonnement analogue). Pourquoi ne peut-on pas prolonger
cette solution au delà de b? Le théorème 4.3 donne des éléments de réponse :
- ou bien le bout droit de la solution est non vide, et il est contenu dans la frontière
de n = IR. x U; comme la frontière du facteur IR. est vide, le bout droit de cp est
130 Chapitre V. Équations différentielles; le problème de Cauchy

nécessairement contenu dans { b} x Fr(U), où Fr(U) désigne la frontière de l'ouvert


U de E; la solution <p ne peut être prolongée au delà de b car elle a atteint la frontière
du domaine de définition de l'équation;
- ou.bien le bout droit de la solution <p est vide; dans ce cas, pour toute partie compacte
K de E, la valeur <p(t) de la solution "sort de K" (c'est-à-dire n'est plus dans K)
lorsque t ---+ b; en un certain sens (précisé ci-dessous) ou peut dire que la solution
"part à l'infini", ou "explose", lorsque t ---+ b.
Le lecteur remarquera que lorsque E est de dimension finie, ses parties compactes sont ses
parties fermées et bornées. Il est alors tout à fait légitime de dire que <p(t) "part à l'infini"
lorsque t---+ b pour dire que, pour toute partie compacte K de E, <p(t) sort de K. Lorsque
E est de dimension infinie, il existe des parties fermées et bornées de E non compactes, et
<p(t) peut sortir de tout compact lorsque t---+ b tout en restant bornée. On peut cependant
di:'e que 1.p(t) "part à l'infini" dans l'infinité des dimensions de E.

5. Exercices
Exercice V.l. Soit E un IR-espace de Banach.
1) Soit ]a, b[ un intervalle ouvert de IR, et M > 0 un réel. Soit <p : ]a, b[---+ E une
application lipschitzienne de rapport M. Montrer que si b est fini, <p peut se prolonger par
continuité en ce point.
2) Soit f : lR x E ---+ E une application continue. On suppose que f est bornée et localement
lipschitzienne par rapport à sa deuxième variable. On pose M = SUP(t,x)E!RxE llf(t, x)ll·
2 a) Montrer que toute solution de l'équation différentielle x'(t) = f(t,x(t)) est
lipschitzienne de rapport M sur son intervalle de définition.
2 b) En déduire que les solutions maximales de cette équation sont définies sur R
Exercice V.2. Soit f : IR 2---+ lR l'application
4t 3 x
f(t,x) = 4 2 si (t,x) -::f. (0,0), f(O,O) =O.
t +x
l) Montrer que f est continue sur IR 2 , puis que f n'est pas lipschitzienne par rapport à sa
seconde variable x au voisinage de (0, 0).
2) Montrer que l'équation différentielle x' (t) = f (t, x(t)) possède une infinité de solutions
satisfaisant la donnée de Cauchy (0, 0). [On pourra faire le changement de variable
X= t 2 y].

Exercice V.3. Soit E un IR-espace de Banach. On note idE l'application identique de


E et .C(E, E) l'ensemble des endomorphismes continus de E. Soit A E .C(E, E). On
considère l'équation différentielle, dans l'espace .C(E, E), X'= -X o A o X.
1) Montrer que cette équation possède une unique solution maximale <p satisfaisant la
donnée de Cauchy (0, idE).
2) Montrer que l'intervalle de définition de <p contient Io= ]-1/(4llAll), 1/(4llAll) [.
3) Donner l'expression de <p sur I 0 . [On pourra étudier l'application 'l/J de Io dans .C(E, E),
'lj!(t) = (idE +tA) o <p(t) - idE]. , .
Exercice V.4. Soient E et F deux IR-espaces de Banach et f une application de classe
C 1 de EX F dans .C(E, F).
1) On pose g(x, y) = fUx, y)+ f~(x, y) of (x, y). Montrer que g(x, y) est une application
bilinéaire. Expliquer pourquoi l'application g est continue. -
§ 5. Exercices 131

2) On suppose que pour chaque point (a, b) E Ex F, il existe une application cp, définie
sur un voisinage ouvert U de a dans E, à valeurs dans F, différentiable sur U, telle que,
pour tout x E U, on ait
cp'(x) = f (x, cp(x)), cp(a) = b. (1)
2 a) Montrer que cp est de classe C 2 . En déduire que l'application bilinéaire g(a, b) est
symétrique.
2 b) On suppose U convexe. Soit x E U. On pose
'l/J(t) = cp(t(x - a)+ a).
Montrer que la fonction 'l/J est définie sur un intervalle ouvert contenant [O, l]. Écrire
l'équation différentielle dont 'l/J est solution. Montrer qu'il existe au plus une fonction cp
vérifiant la condition (1 ).
2 c) On suppose U connexe. Montrer qu'il existe au plus une fonction cp vérifiant la
condition (1).
Exercice V.5.
1) On note n l'ensemble des points ( x, y) E lR 2 tels que ( x - y )y + 1 > O. Montrer que
n est un ouvert que ]'on décrira.
2) Soit (a, b) E n. On considère l'équation différentielle (dans laquelle X désigne la
variable indépendante, et x f-+ y(x) la fonction inconnue),

y'(x) = j(x -y(x))y(x) + 1-1.

2 a) Montrer qu'il existe une unique solution maximale cp de l'équation ( *) qui vérifie
cp( a) = b. On note I =]a, .B[ son intervalle de définition.
2 b) Trouver, lorsque b = 0, la fonction cp et l'intervalle I.
2 c) On suppose b >O. Montrer que, pour tout x E J, on a cp(x) >O.
2 d) Trouver la solution 'l/J del' équation différentielle ( *) telle que 'l/J( -a) = -b, et préciser
son intervalle de définition.
3) On suppose 0 < b <a.
3 a) Montrer qu'il existe un point t de l'intervalle ]a, a[ tel que cp(t) = t.
3 b) Calculer cp'(t) et en déduire que l'équation cp(t) =ta une unique solution.
3 c) Montrer que la fonction cp est décroissante au voisinage de a et que a > -oo.
4) On suppose que a < b et 0 < b.
4 a) Montrer qu'il existe un point t de l'intervalle ]a, .B[ tel que cp(t) = t.
4 b) Montrer que .B = +oo, puis que limx-++oo cp(x) = +oo.
Exercice V.6. On se propose d'étudier l'équation différentielle:
cp"' - cpcp" = 0 ,
où cp est une application trois fois dérivable, définie sur un intervalle ouvert de IR, à valeurs
dans!R.
1 a) Mettre cette équation différentielle sous la forme canonique
<P'(t) = f(t,</J(t)),
où f est une application que l'on déterminera.
132 Chapitre V. Équations différentielles; le problème de Cauchy

1 b) Soient a, A, B et C des réels. Montrer qu'il existe une unique solution maximale <p
de l'équation ( *) qui satisfasse les conditions initiales :
<p(a)=A, <p 1 (a)=B, <p 11 (a)=C. (**)
2) Soit <p une solution maximale de ( *). Calculer la dérivée de la fonction :

t ~ <p 11 (t) exp(- lt <p(u) du).

En déduire que la fonction <p est soit convexe, soit concave sur son intervalle de définition.
Déterminer <p dans le cas où <p 11 (a) = O.
3) Soient <pet 'ljJ deux solutions maximales de ( *) qui vérifient
'lj,1(a) :::; <p( a) , 'l/J' (a) :::; <p 1 (a) , 0 :::; 'l/J" (a) :::; <p 11 (a) .

3 a) Montrer qu'il existe b > a tel que <pet ·lf; soient définies sur [a, b[.
3 b) On suppose que 'ljJ"(a) =O. Montrer que pour tout t E [a, b[, 'ljJ(t) :::; <p(t).
4) On suppose dans cette question que 'l/J"(a) > 0 et on pose
c = sup{ t E [a, b[ ; Vu E [a, t], 'l/J(u):::; <p(u)},

4 a) Montrer que la fonction ()est définie et croissante sur l'intervalle [a, c[. En déduire
que l'on a, pour tout t E [a, c[, 'l/J"(t) :::; <p"(t), 'ljJ'(t) :::; <p'(t) et 'ljJ(t) :::; <p(t).
4 b) Établir que c = b. [On supposera d'abord que a < c < b, et on montrera
que <p(c) = 'l/J(c), puis que <p = 'l/J. On supposera ensuite que c = a et on établira
successivement que <p(a) = 'ljJ(a), <p'(a) = 'l/J'(a), <p"(a) = 'l/J"(a)].
5 a) Soit a un réel. Vérifier que sur chacun des deux intervalles ] - oo, a[ et ]a, +oo[,
l'application t ~ 3(a - t)-i est solution de l'équation différentielle ( *).
5 b) Soient A, B et C trois réels strictement positifs. Soit <p la solution maximale de ( *)
satisfaisant les conditions initiales ( ** ). Montrer que l'extrémité droite de l'intervalle de
définition de <p est un réel b < +oo et que limt_,b <p(t) = +oo.
Exercice V. 7. L'espace vectoriel E des applications continues de [O, 1J vers IR est muni
de la norme de la convergence uniforme x ~ llxll = suptE[o,iilx(t)I. Soit Ei le sous
espace de E des applications de classe ci sur [ü, 1] (au sens de la définition 1.1 du chapitre
VIII) nulles en O. On pose, pour tout x E Ei. N(x) = suptE[O,i] lx' (t) I·
1) Vérifier que N est une norme sur Ei et que cet espace est complet pour cette norme.
2) Soit <p : Ei - t E l'application <p( X) = x' + x 2 . Montrer que <p est de classe ci et
déterminer sa différentielle D<p.
3) Soit y E E. Montrer que si llYll est assez petit, l'équation différentielle
x'(t) + x 2 (t) = y(t) (*)
admet une et une seule solution appartenant à Ei.
4)SoitK E]ü,1[ etg: Ei - t Ei I'applicationg(x) = (D<p(O)fi(y-<p(x)) +x.
On désigne par Bi la boule fermée de Ei de centre l'origine et de rayon K/2. Montrer
que g est une application contractante de Bi dans elle-même. Montrer que lorsque llYll :::;
(1/2)K(l - K), l'équation(*) a une unique solution x E Ei vérifiant N(x) < K/2.
5) Soit a > O. On considère l'équation différentielle
x'(t) + x 2 (t) = -a 2 .
§ 6. Solutions 133

Montrer qu'il existe des valeurs de a pour lesquelles cette équation n'a aucune solution
appartenant à Ei.
Exercice V.8. Soient a, Net C des constantes réelles telles que a > 0, 0 < C < N.
Soit F : lR x 1Rn ~ 1Rn une application continue, satisfaisant aux conditions suivantes :
(i) pour tout t E JR, llF(t, 0)11 ~ ae-Nt,
(ii) pour tout t E lR et tout (X, Y) E ]Rn x ]Rn ,

llF(t,X) - F(t, Y)ll ~ c11x - Yll ·


On considère l'équation différentielle
X'(t) = F(t,X(t)). (E)
On définit une suite (Xk, k E N) d'applications de lR vers JRn en posant X 0 = 0 et, pour
tout entier k 2 0,

1) Montrer que la suite (Xk) est bien définie et qu'il existe une suite de réels (ck, k E N)
telle que, pour tout réel t, llXk+i(t) - Xk(t)ll ~ cke-Nt.
2) Montrer que la suite(Xk) converge uniformément sur tout intervalle compact de lR vers
une limite X, solution sur lR de (E) telle que l'application t r-t eNt X (t) soit bornée.
3) Montrer que cette solution est l'unique solution X de (E) telle que t r-t eNt X(t) soit
bornée.
4) L'équation (E) peut-elle avoir une solution Y, distincte de X, telle que Y(t) ait pour
limite 0 lorsque t tend vers +oo?

6. Solutions

Solution V.l.
1) Soit (tn, n E N) une suite de points de ]a, b[ de limite b. Étant convergente, cette suite est de Cauchy.
L'application cp étant lipschizienne nous avons, pour tous net p E !'\!, Jlcp(tn) - cp(tv)ll ::; Mltn - tvl;
ainsi la suite ( cp(tn), n E N) est aussi de Cauchy, dans l'espace complet E; elle converge donc. De plus, si
(tn, n E N) et (t~, n E N) sont deux suites de points de ]a, b[ de même limite b, on a pour tout n E !'\!,
llcp(tn)-cp(t~)ll::; Mltn-t~l.Lorsquen--+ +oo, les suites (cp(tn)) et (cp(t~)) convergent et l'inégalité
précédente prouve qu'elles ont la même limite. Ainsi, il existe f. E Etel que, pour toute suite (tn) de points
de ]a, b[ de limite b, la suite ( cp( tn)) converge vers f.. L'application cp se prolonge par continuité au point ben
posant cp(b) = f..
2 a) On peut appliquer à l'équation différentielle x'(t) = f (t, x(t)) le théorème 2.10: pour toute donnée de
Cauchy (to, x 0 ) E IR x E, il existe une unique solution maximale de cette équation satisfaisant cette donnée de
Cauchy. Soit cp une solution maximale de cette équation différentielle, I son intervalle de définition. Pour tout
t E J, cp'(t) = f (t, cp(t) ), donc suptEJ llcp'(t)ll ::; M. En appliquant le théorème des accroissements finis
entre deux points t et t' E I , on voit que cp est lipschitzienne de rapport M sur J.
2 b) Posons I =]a, b[ et supposons b fini (le raisonnement serait analogue au point a). D'après 1, on peut
prolonger cp par continuité au point b. L'élément (b, cp(b)) de IR x E appartient au bout droit de la solution cp.
L'équation différentielle considérée étant définie sur IR x E, le bout droit de toute solution est vide (théorème 4.3,
ou commentaire 4.4.a). Ayant abouti à une contradiction, nous concluons que b = +oo.

Solution V.2.
1) L'application f est de façon évidente continuesurIR 2 -{ (0, 0) }. En remarquant que t 4 +x 2 ::; 2t 2 lxl, on voit
que pour tout (t, x) # (0, 0), lf(t, x)I ::; 2lt1, ce qui prouve que f est continue au point (0, 0). L'application
f est donc continue sur IR 2 .
134 Chapitre V. Équations différentielles; le problème de Cauchy

Supposons f lipschitzienne par rapport à sa seconde variable x au voisinage de (0, 0). Il existe alors k > 0 et
r vérifiant 0 < r < 1 tels que, dès que /x/ < r, /y/ < r et /t/ < r, alors /J(t, x) - f(t, y)/ < k/x - y/. En
particulier, pourO < /t/ < r, x = t 2 ety = -t 2,onaurait l/f(t, t 2 )-f(t, -t 2 )1/ = 4/t/:::; 2kt 2, soit encore
2 :::; k/t/, ce qui est impossible.
2) Soit cp une solution de l'équation différentielle

x'(t) = f(t,x(t)),
définie sur un intervalle I ne contenant pas O. Soit'!/; l'application définie sur Iparla relation cp(t) = t 2'1/;(t).
En écrivant que cp est solution de ( *) on obtient après quelques calculs, pour tout t E J,

2y(l - y 2 )
'l/;1 (t) = g(t,'l/;(t))' avec g(t, y) = t(l + y2) ' (t,y) E 0 = lR* x lR.

Ainsi'!/; est solution de l'équation différentielle ( ** ).


Réciproquement, si'!/; est une solution de l'équation différentielle (**)définie sur un intervalle J, cet intervalle
ne contient pas 0 et l'application cp telle que, pour t E J, cp(t) = t 2'1/;(t) est une solution, définie sur I, de
l'équation différentielle ( *).
n
Résolvons l'équation ( **).L'application g vérifie sur son domaine de définition les conditions d'application
de la forme globale 2.10 du théorème de Cauchy-Lipschitz. On vérifie immédiatement que les applications
constantes'!/; telles que 'l/;(t) = a, avec a = 0, a = 1 ou a = -1, sont solutions maximales sur chacun des
intervalles J - oo, 0( et JO, +oo(. Toute autre solution maximale '!/; : I -+ lR est donc telle que '!/;, '!/; - 1 et
'!/; + 1 ne s'annulent en aucun point de I et, par continuité, gardent un signe constant sur I. Ainsi, 'l/; 1 ne s'annule
pas et garde un signe constant sur I, donc la fonction'!/; est strictement monotone sur son intervalle de définition
I. Aussi on peut considérer son inverse 'l/;- 1. Cette remarque justifie l'emploi de la méthode de résolution de
l'équation(**) consistant à considérer y comme la variable indépendante et 'l/;- 1 : y >--+ 'l/;- 1 (y) comme
la fonction inconnue. Cette méthode convient pour la résolution des équations différentielles dites à variables
séparées, comme l'équation ( **).On peut écrire cette équation sous la forme

dy 2y(l - y 2 )
ou encore 1 + Y2 dy = ~ dt .
dt = t(l + y2) ' 2y(l - y 2 ) t

Dans cette dernière expression le membre de gauche ne contient que y et sa différentielle dy, et le membre de
droite ne contient que t et sa différentielle dt; on dit qu'on a séparé les variables y et t. En supposant que y ne
prend jamais les valeurs 0, 1 ou -1, on peut aisément résondre cette équation par quadratures. Après calcul, on
trouve que les solutions maximales y>--+ t(y) sont les fonctions définie par la relation kt 2 (y) = y/(y 2 - 1),
où k est une constante réelle non nulle. Les solutions maximales '!/; : I -+ lR recherchées vérifient donc
1);
kt 2 = 'l/;(t)/ ( 'l/; 2 (t) - en résolvant une équation du second degré, on obtient leurs expressions explicites:

·'· (t) = 1 + v11 + 4k2t4 1 - v1+4k2t4


o/l 2kt2 • 'l/;2(t) = 2kt2

Les fonctions 'l/;1 et 'l/;2 définies par ces expressions sur les intervalles I = J - oo, O[ et J =JO, +oo[ sont les
solutions maximales de l'équation différentielle (**)autres que les solutions constantes déja trouvées.
On en déduit que les fonctions cp1 et cp2,

1 + v1 + 4k2t4 1 - v11+4k2t4
'Pl (t ) = ------ cp2(t) = 2k '
2k
sont solutions, sur les intervalles I = J - oo, O[ et J =JO, +oo[, de l'équation différentielle ( * ).
On remarque que limt_,o cp2 (t) = limt_,o cp~ (t) = O. Pour chaque constante réelle k non nulle, la fonction

cp(t) 1- v1+4k2t4
= ___ 2_k_ __

est donc une solution de l'équation (*),maximale puisque définie sur IR entier, satisfaisant la donnée de Cauchy
(0, 0).
Solution V.3.
§ 6. Solutions 135

1) L'application F : IR X .C(E, E) -+ .C(E, E), F(t, X) = -X o A o X, est la composée de la projection p


de IR x .C(E, E) sur son second facteur et de l'application f, définie sur .C(E, E), f(X) = -X o A o X.
e
L'application f est différentiable de classe 00 car composée des applications X >--+ (X, X), linéaire continue
sur .C(E, E), et (X, Y)>--+ -X o A o Y, définie sur .C(E) x .C(E), bilinéaire continue.
L'application F est donc continue, et même différentiable de classe e 00 . La proposition VI.4.2 montre que
l'équation différentielle
X' (t) = -X(t) o A o X(t)
satisfait les hypothèses du théorème de Cauchy-Lipschitz (forme globale 2. IO). Il existe donc une solution
maximale unique de cette équation satisfaisant la donnée de Cauchy (0, idE)·
2) Soit T > 0 et Bp(idE, T) la boule fermée de .C(E, E) de centre idE et de rayon T. Pour tout
(t,X) E IR x Bp(idE,T), llX - idE Il :ST, ce qui entraîne llXll :S 1 + T, et par suite llF(X,t)ll :S
llAll llXll 2 :S llAll(l + T) 2 . Posons l(r) = llAll(; + r) 2 , et choisissons un réel 1 tel que 0 < 1 < l(r).
On remarque que [-1, 1] x Bp(idE, T) est un tonneau de sécurité fermé de centre (0, idE ). Le théorème de
Cauchy-Lipschitz 2.7 permet d'affirmer que la solution maximale <p définie en 1 est au définie sur l'intervalle
] - 1, 1[; ce résultat étant vrai pour tout 1 tel que 0 < 1 < l( r ), <p est définie sur ] - f( T), l( T)[. Or le réel 1' > 0
a été choisi de façon arbitraire. L'étude des variations de la fonction f lorsque r E] 0, +oo[ montre que cette
fonction atteint son maximum pour 1' = 1, et vaut alors l(l) = 4 ll~ll. L'intervalle de définition de <p contient
donc l'intervalle Io = ]- 4 ll~ll, 411 ~ 1 [.
3) Soit 'l/J l'application, définie sur Io, 'l/J(t) = (idE +tA) o <p(t) - idE. Cette application est dérivable sur
Io et a pour dérivée, en tout point t E Io, 'l/J'(t) =A o <p(t) + (idE +tA) o <p 1 (t). Compte tenu de l'égalité
t.p 1 (t) = -<p(t) o A ot.p(t), on obtient 'l/.1 1 (t) = -'l/J(t) o A o <p(t). De plus, 'l/J(O) = 0, élément nul de .C(E, E).
Considérons alors l'équation différentielle dans .C(E, E),

X'(t) = X(t) o A o <p(t).


Elle est de la forme X'(t) = G(t, X), où l'application G, définie sur l'ouvert n Io x .C(E, E) de
IR x .C(E, E), a pour expression G(t, X) = X o A o <p(t). L'application G vérifie les hypothèses d'application
du théorème de Cauchy-Lipschitz (forme globale 2. IO), aussi 'l/J est l'unique solution maximale de ( **) vérifiant
la donnée de Cauchy (0, 0). Mais on constate que l'application nulle est également solution sur Io de ( **) et
vérifie la donnée de Cauchy (0, 0). C'est poourquoi 'l/J est nulle sur Io.
Finalement, pour tout t E Io, (idE -tA) o <p(t) = idE. D'autre part, pour tout t E Io, lltAll < 1/4, donc
idE -tA est inversible dans .C(E, E). Ainsi, sur Io, on a <p(t) = (idE -tA)- 1 .

Solution V.4.
1) Puisque f est une application de E x F dans .C(E, F), pour (x, y) E E X F, f(x, y) est élément de
.C(E, F) et les différentielles partielles de f en ce point, Jf (x, y) et f~(x, y), appartiennent respectivement aux
espaces .C ( E, .C(E, F)) et .C ( F, .C(E, F)). Ainsi g(x, y) = Jf (x, y) + f~ (x, y) of (x, y) est élément de
.c( E, .C(E, F)), soitencore(voirremarqueIII.1.2) g(x, y) estélémentde.C( E 2 ; F)), espace des applications
bilinéaires continues de E 2 dans F.
D'autre part, g est somme de Jf et de (x, y) >--+ f~(x, y) of (x, y). Son premier terme, Jf, est une application
continue, puisque f est de classe et. Quant à l'application (x, y) >--+ f~(x, y) o f(x, y), c'est la composée
de de (x, y) >--+ (!~(x, y), f (x, y)), qui est continue car ses deux composantes le sont, et de l'application de
.c(F, .C(E, F)) x .C(E, F) dans .c(E,.C(E, F)), (X, Y)>--+ X o Y, bilinéaire continue. L'applicationgest
donc continue.
2 a) Soit (a, b) E E x F, U un voisinage ouvert de a dans E et <p : U -+ F une application différentiable sur
Utelle que, pour tout x E U,
<p 1 (x) = f(x,<p(x)), t.p(a) = b. ( 1)

Les applications x >--+ ( x, t.p( x)) et f sont continues. L'application <p 1 est leur composée, elle est donc continue;
par suite <p est de classe et sur U. Mais alors, t.p 1 etant composée d'applications de classe et, est également
136 Chapitre V. Équations différentielles; le problème de Cauchy

de classe C 1, de sorte que t.p est de classe C 2 sur U. En calculant la différentielle des deux membres de ( 1) au
point x E U, on obtient
t.p 11 (x) = ff(x, t.p(x)) + tH x, <p(x)) o t.p 1 (x),
ce qui donne, pour x = a, t.p11 (a) = g( a, b). Mais <p 11 (a) E .Cs ( E 2 ; F)), espacee des applications bilinéaires
symétriques continues de E 2 dans F. L'application bilinéaire g(a, b) est donc symétrique.
2 b) Soit x E U fixé et J = { t E lR ; t(x - a)+ a E U }. L'application t ,_. t(x - a)+ a, définie sur lR et à
valeurs dans E, est continue; elle applique l'intervalle [0, 1] sur le segment de droite [a, x]. L'image réciproque
I de l'ouvert U par cette application est un ouvert de lR contenant [O, 1]. De plus, U étant convexe, I est un
intervalle.
L'application t ,_. 1/J( t) = t.p ( t( x - a) +
a) est donc définie sur J, intervalle ouvert contenant [O, 1]. Elle est
dérivable sur J, car composée d'applications différentiables, et a pour dérivée

1/! 1 (t) = t.p 1 (t(x - a)+ a)(x - a)= f(t(x - a)+ a,1/!(t))(x - a).

L'application hx : I x F ---> F, hx (t, y) = f ( t(x - a) +a, y) (x - a), est donc telle que pour tout t E J,
1/! 1 ( t) = hx ( t, 1/J( t)). De plus 1/J(O) = t.p( a) = b. Remarquons également que l'application hx est de classe
C 1 car composée de telles applications. L'application 1/J est donc la solution maximale (puisque définie sur J) de
l'équation différentielle y' ( t) = hx ( t, y( t)) vérifiant la donnée de Cauchy (0, a). L'unicité d'une telle solution
maximale résulte du théorème d'existence et d'unicité 2.10. Or 1/J(l) = t.p(x ). Ceci prouve l'existence d'au plus
une application <p vérifiant les conditions (1).
2 c) Supposons qu'il existe deux applications <p1 et <p2, définies sur U, qui vérifient les conditions (1 ). L'ensemble
V= { x E U ; <p1 (x) = <p2(x)} n'est pas vide car il contient a. Il est fermé car c'est l'image réciproque du
fermé {O} de IR par l'application continue <p1 - <p2. Il est également ouvert car si a E V alors a E U et il existe
un voisinage ouvert convexe n de a, n C U. En raisonnant comme dans 2 b en remplaçant a par a et U par n,
on montre l'existence, pour chaque x En, d'une unique application 1/Jx telle que 1/Jx(l) = <p1(x) = <p2(x),
ce qui prouve que n c V. L'ouvert U étant connexe, on a nécessairement V= U, donc <p1 = <p2. On conclut
qu'il existe au plus une application <p vérifiant les conditions (1).

Solution V.5.
1) Soit f : JR 2 ---> lR l'application f(x, y) = (x - y)y + 1. L'application f est continue sur IR 2 et
n = 1- 1 (JO, +oo[), donc n est unouvertdelR 2 . Lafrontièredenestlacourbedupland'équation f(x, y) =O.
C'est une hyperbole ayant pour asymptotes les droites d'équations y = 0 et y = x. L'ouvert n est la partie de
IR 2 compris entre les deux branches de cette hyperbole.
2 a) L'équation différentielle

y'(x) = J (x - y(x) )y(x) +1 - 1

est de la forme y'(x) = F(x, y(x) ). où F : n ---> IR est l'application F(x, y) y'(x - y)y + 1 - 1.
L'application F est de classe C 00 sur n; elle vérifie les hypothèses théorème de Cauchy-Lipschitz 2.10. Pour
toute donnée de Cauchy (a, b) E n, il existe donc une unique solution maximale <p de ( *) satisfaisant cette
donnée. Notons l =]a, ,B[ son intervalle de définition.
2 b) On remarque que la fonction nulle, définie sur lR entier, est solution de (*).Pour tout a E IR, c'est l'unique
solution maximale de (*)satisfaisant la donnée de Cauchy (a, 0).
2 c) On suppose b > O. D'après le théorème 2.10, le graphe de la solution maximale t.p vérifiant la donnée de
Cauchy (a, O) et le graphe de la solution nulle n'ont aucun point commun; donc pour tout x E J, t.p(x) i= O.
Mais <p est continue et t.p( a) = b > 0 donc, pour tout x E J, on a t.p(x) > O.
2 d) On remarque que, pour tout (x, y) E n, (-x, -y) E net F(x, y) = F(-x, -y). On désigne toujours
par <p la solution maximale de ( *) telle que t.p( a) = b et par I =]a, ,B[ son intervalle de définition. Soit
J =]-,6,-a[ et'l/J: J--> IRlafonction'l/J(x) = -<p(-x).Ona,1/!(-a) = -bet,pourtoutx E J,

1/J'(x) = t.p (-x)


1 = F(-x,<p(-x)) = F(-x,-1/J(x)) = F(x,1/J(x)),

ce qui prouve que 1/J est solution de ( *) sur J. De plus cette solution est maximale; si ce n'était pas le cas, elle
pourrait être prolongée en une application 1/!1 définie sur un intervalle Ji =] - /31, -a1 [ contenant J, et un
§ 6. Solutions 137

calcul analogue au précédent montrerait que la solution <p pourrait être prolongée à l'intervalle li = ]a 1 , {31 [ et
ne serait plus maximale. L'application 'l/J est donc la solution maximale de l'équation différentielle (*)telle que
'l/J(-a) = -b. On peut remarquer que les graphes de <pet de 'l/J sont symétriques par rapport à l'origine.
3 a) Par hypothèse, 0 < b < a. Supposons que pour tout x E ]a, a[, on ait <p(x) :/; x. L'application
x ,_. <p( x) - x est continue sur ]a, a], ne s'annule pas sur cet intervalle et vérifie <p( a) - a = b - a < O; donc,
pourtoutx E]a,a],<p(x) < x.Legraphede<pestcontenudansn+ = nn { (x,y) E IR 2 ; y> 0 }.Pour
tout (x,y) En+, on a F(x,y) > 0 si X> y, F(x,y) = 0 si X= y et F(x,y) < 0 si X< y. Ainsi, pour
tout x E Ja, a], <p1 ( x) = F ( x, <p( x)) > O. L'application <p est donc croissante sur ]a, a] et minorée par 0; elle
admet alors une limite l lorsque x tend vers a. Le bout gauche de <p est le singleton (a, l) et on a 0 ::; l ::; a.
Le théorème 4.3 montre que (a, l) est élément de la frontière de n, c'est-à dire vérifie (a - l)l + 1 = 0, ce
qui est impossible.
Nous concluons qu'il existe un point t de l'intervalle ]a, a[ tel que <p(t) = t. De plus, puisque <p(t) > 0, nous
avons nécessairement t > O.
3 b) On sait que <p1 (t) = F( t, <p(t)) = F(t, t) =O. Cette propriété se traduit géométriquement en disant que
la tangente au graphe de <p au point d' abcisse t est parallèle à laxe des abscisses. Le graphe de <p traverse la
droite d'équation y= x au point d'abcisse t; en effet, la dérivée de l'application x >-+ <p(x) - x est strictement
négative (égale à -1) au point x = t. Cette fonction est donc strictement décroissante au voisinage du point
x = t. Ainsi, pour x voisin de t, on a <p(x) > x six< t et <p(x) < x six> t.
Supposons que l'équation <p(x) = x ait deux solutions. Soient ti et t2 E I tels que ti < t2, <p(t1) = ti et
1.p(t2) = t2. La partie A= { t E [t1, t2] ; \:lx E [t1, t], <p(x) ::; x} de IR est un intervalle non vide: il
contient, d'après ce qui précède, un intervalle de la forme [t1, ti + ë], avec ë > O; il est majoré par t2; il admet
doncunebomesupérieurecvérifiantt1 < c::; t2.Alorspourtoutx E [t1,c],<p(x)::; x.Sionavait<p(c) < c,
la continuité de <p entraînerait l'existence de c' vérifiant c < c' ::; t2 tel que, pour x E [c, c'J, <p(x) < x, ce
qui contredirait la définition de c. Donc <p( c) = c. Or on sait que, pour x voisin de c, <p( x) - x etc - x sont de
même signe, soit <p(x) > x pour x < cassez voisin de c, ce qui est impossible.
Nous concluons que léquation <p(x) = x a une unique solution t > 0, et que <p vérifie : <p( x) > x si x E ]a, t[,
et <p(x) < x six E]t,/3[.
3 c) Le raisonnement fait en 3 a montre que <p est décroissante sur ]a, t[ et croissante sur Jt, /3[. Pour tout
x E ]a, t[ on a donc <p(x) > t. Le graphe de <p appartient à nt = n n { (x, y) E IR 2 ; y ~ t }. La droite
d'équation y = t rencontre la frontière den au point ( a1, t) tel que ( a1 - t)t + 1 = 0 et, pour tout (x, y) E nt.
on a x > a1. Ceci implique que a ~ a1, donc que a > -oo.
Désignons par Yo: l'ordonnée positive du point d'intersection de la droite d'équation x = a avec la frontière
de n. L'application <p étant décroissante sur ]a, t[ et son graphe étant contenu dans n, on a, pour tout
x E ]a, t[, <p(x) < Yo:· Par suite, donc <p a une limite lorsque x tend vers a. Désignons par <p(a) cette
limite. Le bout gauche de <p est donc le singleton (a,<p(a)), et il est contenu dans la frontière den; de
plus, <p(a > O. On a donc <p(a) = Yo:· Mais, pour tout x E /, <p 1 (x) = F(x,<p(x)). On obtient alors
lim., ...... o: <p 1 (x) = F (a, <p( a)) = 1. Ainsi, <p est décroissante au voisinage de a.
4 a) Par hypothèse, a < b et 0 < b. On montre comme en 3 a et 3 b qu'il existe un unique point t > 0 de
l'intervalle ]a, /3[ tel que <p(t) = t et que de plus,
- sur l'intervalle ]a, t[, l'application <p est décroissante et vérifie <p(x) > x,
- sur l'intervalle Jt, /3[, l'application <p est croissante et vérifie <p(x) < x.
4 b) Supposons f3 fini. Pour tout x E Jt, /3[, on a alors 0 < <p(x) < /3; l'application <p étant croissante et
majorée, elle admet, lorsque x --+ /3, une limite notée <p(/3), et on a 0 < <p(/3) ::; /3. Le bout droit de <p est le
singleton (/3, 1.p(/3)), ce qui est impossible car un tel point ne peut pas appartenir à la frontière den. On conclut
que/3 = +oo.
Supposons maintenant que sur ]t, +oo[, l'application <p soit majorée par M > O. Étant croissante, cette
application admet une limite lorsque x --+ +oo. Dans ce cas, lim., ...... +oo <p 1 (x) = lim., ...... +oo F( x, <p(x)) =
+oo, ce qui entraîne lim., ...... + 00 <p(x) = +oo. Ceci contredit l'hypothèse de départ. L'application <p n'est donc
pas majorée; comme elle est croissante, lim., ...... +oo <p(x) = +oo.

Solution V.6.
138 Chapitre V. Équations différentielles; le problème de Cauchy

1 a) Associons à l'équation différentielle d'ordre 3 dans lR

<p/11 - <p<p" =0,


une équation différentielle d'ordre 1 à valeurs dans JR 3 . Soit f : lR x JR 3 --> JR 3 lapplication f (t, (x, y, z)) =
(y, z, xz). Soit I un intervalle ouvert de lR et <p : I --> lR une application trois fois dérivable sur I. On lui associe
l'application cjJ : I --> JR 3 , cfl( t) = ( <p(t), <p 1 ( t), <p 11 ( t)). On sait alors (voir IV.1.4) que <p est solution sur Ide
l'équation (*)si et seulement si c/J est solution sur Ide l'équation du premier ordre

cfl' (t) = f (t, cfl( t)) . (E)

1 b) L'application f étant de classe C 00 sur lR x JR 3 , elle vérifie les hypothèses du théorème d'existence et
d'unicité globales 2.10; on peut donc affirmer l'existence et l'unicité d'une solution maximale c/J : I --> JR 3 de
léquation ( E) qui vérifie la donnée de Cauchy efJ( a) = (A, B, C). Il existe donc une unique solution maximale
<p : I --> lR de l'équation(*) qui satisfait les conditions initiales:

c,o(a) =A, <p1 (a) = B, <p 11 (a) = C.


2) Soit (J, c,o) une solution maximale de (*).Elle vérifie, pour tout t E J, <p 111 ( t)-<p( t)<p 11 ( t) = O. L'application

produit de deux applications dérivables, est dérivable sur I et a pour dérivée au point t

Elle est donc constante sur I et a pour valeur <p 11 (a), ce qui entraîne que, pour tout t E J,

Si <p 11 (a) > 0, <p 11 reste positive sur I, donc c,o est convexe.
Si c,o" (a) < 0, <p 11 reste négative sur I, donc <p est concave.
Si c,o"(a) = 0, l'application <p définie par <p(t) = c,o'(a)(t - a)+ <p(a) est solution de l'équation(*); elle est
définie sur IR, donc maximale.
3 a) Chacune des applications c,o et 1/J étant définie sur un intervalle ouvert contenant a, il esiste b > a tel que <p
et 1/J soient définies sur [a, b[.
3 b) Puisque 1/J" (a) = 0, l'application 1/J est, d'après 2, définie sur lR par 1/J( t) = 1/J' (a) (t - a) + 1/J( a). Ainsi
1/J" =o.
Si <p 11 (a) = 0 on a aussi, pour t E IR, c,o(t) = <p 1 (a)(t - a)+ <p(a) et, compte tenu des hypothèses, pour tout
t 2: a, 1/J'(a)(t - a)+ 1/J(a):::; <p 1 (a)(t - a)+ <p(a), soit encore <p(t):::; 1/J(t).
Si c,o" (a) of. 0, alors <p 11 (a) > 0 et, en utilisant 2, pour tout t E (a, b[, <p 11 ( t) > 0, ce qui entraîne, par deux
intégrations successives, que pour tout t E · [a, b[, <p( t) - <p 1 (a) (t - a) - <p( a) > O. On obtient alors, toujours
pourtout t E [a, b[, 1/J(t) = 1/J'(a)(t - a)+ 1/J(a):::; <p 1 (a)(t - a)+ <p(a) < <p(t).
On a établi que pourtout t E (a, b[, <p( t) 2: 1/J( t ).
4) Avec les hypothèses faites, l'ensemble K = {t E [a, b[ ; Vu E [a, t], 1/J(u):::; <p(u)} est un intervalle de
lR non vide (il contient a), majoré par b. Il admet donc une borne supérieure c = sup K qui vérifie a :::; c :::; b.
4 a) Les hypothèses précédentes et les résultats de 2 entraînent que 1/J" > 0 et que <p 11 > 0 sur [a, b[ . L'application
Il

8 = 'f_ est donc bien définie sur cet intervalle. Elle est dérivable et on a
1/J"

8' = ip'" 1/J" - 1/J"' <p" <p" ( <p - 1/J)


(1/J" )2 1/J"
§ 6. Solutions 139

donc 8' est du signe de cp - 1/J. Or, si t E [a, c(, cp( t) ?:: 1/J( t); l'application 8 est donc croissante sur [a, c( ; en
particulier, pour t E [a, c(, 1 S 8( a) S 8( t ), ce qui entraîne 1/J" (t) S cp" (t). On obtient alors successivement,
pour tout t E (a, c(,

1/J'(t) = 1/J'(a) + 1t 1/J"(u) du S cp'(a) + 1t cp"(u) du= cp'(t),

1/J(t) = 1/J(a) + 1t 1/J'(u) du S cp(a) + 1t cp'(u) du= cp(t).

4 b) Supposons d'abord que a < c < b. Les applications cp et 1/J sont continues en cet vérifient, pour tout
s
t E [a, c(, 1/J(t) cp(t). Cette inégalité est donc conservée par passage à la limite quand t tend vers c, t < c,
ce qui donne 1/J(c) s
cp(c). Si on avait 1/J(c) < cp(c), la continuité de cp et 1/J en c entraînerait l'existence d'un
réel€ > 0 tel que c + € E (a, b[ et, pour tout t E (c, c + i;], 1/J(t) S cp(t). On aurait alors c + i; E K, en
contradiction avec la définition de c. Donc cp(c) = 1/J(c).
En utilisant l'inégalité, démontrée en 4 a, 1/J'(t) S cp'(t) pour tout t E (a, c(. on obtient, dans les mêmes
conditions,

1/J(c) - 1/J(t) =le 1/J'(u) du S le cp 1 (u) du= cp(c) - cp(t),

ce qui entraîne 1/J(t) ?:: cp(t) et donc finalement 1/J(t) = cp(t). Les applications (1/J, 1/J', 1/J") et (cp, cp', cp") sont
deux solutions maximales de l'équation différentielles (E) qui coïncident sur l'intervalle non vide [a, c(, elles
sont donc égales (voir 2.10) et par suite, cp =
1/J, ce qui contredit l'hypothèse a < c < b.
Supposons maintenant que c = a. On sait, par hypothèse, que 1/J(a) S cp(a). On montre, comme dans le cas
précédent, en utilisant la continuité des applications 1/J et cp, que 1/J(a) = cp(a). La formule de Taylor à l'ordre
2 donne, pour t E (a, b[,

(t a) 2
1/J(t) - cp(t) = (t- a)('l/J'(a) - cp'(a)) + -2 (1/J"(a) - cp"(a)) + o((t- a) 2 ).
On sait que 1/J'(a) s cp'(a). Si l'on avait 1/J'(a) < cp'(a), 1/J(t) - cp(t) serait, pour t E [a, b[ assez voisin de a,
du signe de (t-a) ('1µ 1(a)-cp'(a)); il existerait donc un réel e > 0 tel que a+e E [a, b[ et, pourt E (a, a+ê].
s
1/J(t) cp(t); on aurait alors a+ e E K, ce qui contredirait la définition de c. Donc 1/J' (a) = cp' (a).
On montre de la même manière que 1/J" (a) = cp" (a).
Les applications ( 1/J, 1/J', 1/J") et ( cp, cp', cp") sont deux solutions maximales de l'équation différentielle ( E) qui
prennent la même valeur au point a; elles sont donc égales (voir 2.10) et par suite, cp = 1/J, ce qui contredit
l'hypothèse a = c.
On obtient en définitive c = b
5 a) L'application t >--+ 1/J(t) = 3(a - t)- 1 est définie sur la réunion des intervalles] ~ oo, a( et ]a, +oo[.
En calculant ses dérivées, on vérifie que sa restriction à chacun de ces intervalles est solution de l'équation
différentielle ( *).
5 b) On désigne par {3 la borne supérieure, finie ou infinie, de l'intervalle de définition de cp. On désigne encore par
1/J l'application, définie sur ]-oo, a(, 1/J(t) = 3(a-t)- 1 , où a est une constante choisie de telle sorte que a < a,
1/J(a) SA, 1/J'(a) S B, 1/J"(a) SC. Autrement dit, a> sup{ a+ 3/A, a+ 3/ B 1 12 , a+ 6/C3 12 }.
On pose b = inf( a, f3). Les applications 1/J et cp sont deux solutions maximales de l'équation ( *) qui vérifient
les conditions 1/J(a) S cp(a), 1/J'(a) S cp'(a), 0 < 1/J"(a) S cp"(a). D'après 4, pour tout t E (a,b(,
1/J"(t) s cp"(t), 1/J'(t) s cp'(t), 1/J(t) s cp(t).
Si on avait b = a < {3, alors a E (a, !3[ et limt->oc, t<oc 1/J(t) S limt_.oc, t<oc cp(t) = cp(a), ce qui
entraînerait cp(a) = =
+oo. On a donc b f3 Sa et b < +oo.
Les applications 1/J, 1/J' et 1/J" étant strictement positives sur [a, b[, les applications cp, cp' et cp" le sont également.
De plus cp"' = cpcp", ce qui prouve que cp"' est aussi strictement positive. Les applications cp, cp' et cp" sont
donc strictement croissantes.
Supposons que cp 11 soit majorée sur [a,b[ par un réel M. Alors pour tout t E (a,b(, cp'(t) = cp'(a) +
J: cp" (u) du S B + M(b- a), ce qui prouve que cp' est majorée sur [a, b[. Un raisonnement analogue prouve
que cp est majorée sur (a, b[. Ces trois applications étant croissantes et majorées, elles ont une limite en b. La
140 Chapitre V. Équations différentielles; le problème de Cauchy

solution maximale <jJ = (cp, cp', cp") de l'équation (E) a donc elle aussi une limite en b = /3, et le bout droit de
<jJ n'est pas vide. Ce bout droit devrait être contenu dans la frontière du domaine de définition de l'application
f introduite en 1 a (voir théorème 4.1 ), qui est vide. Ceci prouve que cp" n'est pas majorée sur [a, b[ donc que
limt-.b cp(t) = +oo.
Solution V. 7.
1) L'application N est une norme sur E1. En effet, six E E1 vérifie N(x) = 0, alors x' est nulle sur [O, 1), donc
x est constante et pour tout t E [O, 1), x(t) = x(O) =O. L'application x est donc nulle. Les autres propriétés
d'une norme se déduisent immédiatement des propriétés de la valeur absolue.
Soit (xn, n E N) une suite dans (E1 ), de Cauchy pour la norme N. La suite (x~, n E N) est alors, par
définition de la norme N, une suite de Cauchy dans l'espace complet E des applications continues de [O, 1]
vers lR muni de la norme de la convergence uniforme. Elle converge donc dans cet espace vers une application
continue y. Soit alors x lélément de E1 défini par x(t) = 1;
y(u) du. Alors, toujours par définition de N, pour
tout n EN, llx~ - Yll = llx~ - x'll = N(xn - x). Ainsi, la suite (xn, n E N) converge vers x dans E1
pour la norme N. L'espace E1 est donc complet pour cette norme.
2) L'application cp : E 1 --+ E, cp' (x) = x' + x 2, est la somme de cp1 : x ,_. x' et de <p2 : x ,_. x 2 .
L'application 'Pl est linéaire, continue car, pour tout x E E1, llcp1(x)ll = llx'll = N(x). Elle est donc de
classe C 1 et en tout point x E E1, et Dcp1 (x) = <p1.
L'application <p2 est la composée de deux applications, x ,_. (x, x) et ( x, y) ,_. xy. La première, x ,_. (x, x),
de E1 dans EX E muni de la norme ll(x, y)ll = sup(llxll, llYll), est linéaire continue car, pour tout x E Ei.
ll(x, x)ll = llxll S N(x). On remarque en effet que pourtoutx E E1 et tout t E [O, 1), x(t) = 1; ( x' (u)) du,
ce qui entraîne llxll S N(x). Quant à l'application (x, y) ,_. xy, de Ex E dans E, elle est bilinéaire continue,
car pour tout couple (x, y) E Ex E, llxyll S llxll llYll· L'application <p2 est donc de classe C 1 et sa différentielle
au point x est l'application linéaire, élément de .C(E1, E), h ,_. Dcp2(x)(h) = 2xh.
Ainsi, cp est de classe C 1 et, pour tous x eth E Ei. Dcp(x )(h) = h' + 2xh.
3) Soit y E E. On cherche à résoudre l'équation cp(x) =
y, d'inconnue x E E1. L'application cp est de classe
C 1 sur E1. De plus, Dcp(O) : h ,_. h' est une application bijective, donc un isomorphisme de E sur E1. Cette
application vérifie les hypotèses du théorème d'inversion locale 11.2.4. Aussi, il existe un voisinage ouvert U de
0 dans E1 tel que V = cp(U) soit un ouvert de E et que cp soit un C 1-difféomorphisme de U sur V. Un élément
y de V a donc dans U un unique antécédent f par l'application cp. Cet élément f de E1 est l'unique solution
appartenant à U de l'équation différentielle

x'(t) = -x 2 (t) + y(t).


Il resta à prouver que cette équation n'a pas d'autre solution appartenant E1.
On suppose y E V. L'application y est définie et continue sur [O, 1) et peut être prolongée en une application
continue YI sur JR. Associons-lui l'équation différentielle

x'(t) = -x 2(t) + y1(t).


Une solution de l'équation différentielle ( **) est solution de léquation différentielle ( *) si et seulement si son
intervalle de définition est contenu dans [O, 1).
L'application F : lR x lR --+ JR, F(t, x) = -x 2 +Y1 (t), est continue et admet une dérivée partielle continue par
rapport à sa seconde variable x. Elle vérifie les conditions d'application du théorème de Cauchy-Lipschitz 2.10.
L'équation différentielle ( **) possède donc une unique solution maximale satisfaisant la donnée de Cauchy
(0, 0). Or tout élément de E1 solution de ( *) est solution de ( **) sur l'intervalle [O, 1) et vérifie la donnée de
Cauchy (0,0), donc est la restriction à [O, 1) de l'unique solution maximale précédente. Ainsi, l'équation(*)
admet une et une seule solution appartenant à E1.
4) L'application g est composée d'applications différentiables, elle est donc différentiable et sa différentielle en
x vérifie, pour tout h E E1,

Dg(x)(h) = -( Dcp(O) f 1 o Dcp(x)(h) + h = -( Dcp(O) f 1 ( h' + 2xh) + h.

Or ( Dcp(O) )- 1est linéaire et Dcp(O)(h) = h' donc Dg(x)(h) = -( Dcp(O) )- 1 ( 2xh).


§ 6. Solutions 141

Onremarquequepourtoutf E Ei. (Dcp(0))- 1 (!') = f,doncqueN( (Dcp(O))-\f')) = N(f) = llf'll-


On a alors N( Dg(x)(h)) = ll2xhll :::; 2llxll llhll :::; 2N(x)N(h), ce qui prouve que N ( Dg(x)) :::; 2N(x).
Soit B1 la boule fermée de centre l'origine et de rayon K/2. Si maintenant x E Bi. on obtient N ( Dg(x)) :::;
K < 1. En appliquant le théorème des accroissements finis entre deux points quelconques de Bi. on montre
alors que g est une application contractante sur la boule B1.
Supposons que llYll :::; (1/2)K(l - K), et établissons que g(Bi) C B1. En effet, six E Bi.

N(g(x)) = N( (Dcp(O))-I (y -x' -x 2 ) + x) = N( (Dcp(O))-I (y -x 2 )) = llY- x 2 ll


:::; llYll + llxll 2 :::; llYll + N(x) 2 :::; (1/2)K(l - K) + k 2 /4 < K/2,
donc g(x) E B1. L'application g est une application contractante de l'espace B1 dans lui même. Cet espace
est complet, car il est fermé dans l'espace complet E1. On peut alors appliquer à l'application g le théorème du
point fixe (voir par exemple [T.Vl.4.3]): il existe un unique élément f de B1 tel que g(f) f, c'est-à-dire tel =
que y = cp(f). On montre alors, comme dans la question précMente que, dès que llYll :::; (1/2)K(l - K),
l'équation(*) a une unique solution f E E1 vérifiant N(f) < K/2.
5) Soit a > O. On considèrel'équationdifférentiellex' (t)+x 2 (t) = -a 2 . On montre, comme dans la question 3,
à l'aide du théorème d'existence et d'unicité globales, que pour toute donnée de Cauchy (to, xo) E IR x JR,
cette équation différentielle admet une unique solution maximale vérifiant cette donnée de Cauchy. En résolvant
cette équation, on trouve que la solution maximale f telle que f(O) = 0 est f(t) = -a arctan(at), et a pour
intervalle de définition ]-7r /(2a), 7r /(2a) [. Pour que cet intervalle contienne l'intervalle (0, 1]. il est donc
nécéssaire de choisir a tel que a < 7r /2. Lorsque a 2: 7r /2, cette équation n'a donc aucune solution appartenant
àE1.

Solution V.8.
1) Pour t E IR fixé, l'intégrale J;"°
F(s, 0) ds converge car d'après (i), sur l'intervalle [t, +oo[, la fonction
s,....... F(s, 0) est majorée en norme par la fonction intégrables,....... ae-Ns. De plus, on a la majoration

Par suite, X1(t) =- ft 00


F(O,s)ds est bien défini. On pose co = a/N. Puisque Xo = 0, l'inégalité
précédente exprime encore que llX1(t) - Xo(t)ll:::; coe-Nt.
Soit (ck' k E N) la suite de réels définie par Ck = ack N-(k+l). Supposons maintenant tous les termes xk
bien définis jusqu'au rang p par la relation de récurrence Xk+I (t) = - ft 00 F( s, Xk(s)) ds. Supposons de
plus que, pourtout entier k vérifiant 0 :::; k :::; p - 1, on ait Il Xk+l (t) - xk (t) Il :::; Cke-Nt. Compte tenu de
(ii), nous avons

111 00
(F( s, Xp(s)) - F( s, Xp-1(s))) dsll :::; 1 00
llF( s, Xp(s)) - F( s, Xp-1 (s)) Il ds
:::;c 1 00
11Xp(s)-Xp- 1(s)ljds

:::; C 1 00
Cp-Ie-Ns ds

<
-
c -
P
C e-Nt
IN
= cP e-Nt

On a ainsi prouvé que l'intégrale ft00 (F(s,Xp(s)) - F(s,Xp-1(s))) ds est convergente. Puisque

ft 00 F(s,Xp-1(s))ds l'est aussi, en posant Xp+i(t) = -ft 00


F(s,Xp(s))ds, on définit bien une
application Xp+I. De plus, cette application est telle que llXp+I (t) - Xp(t) Il :::; epe-Nt.
La suite (Xk, k E N) est bien définie et, pour tout entier k, llXk+I (t) - Xk(t) Il :::; cke-Nt.
142 Chapitre V. Équations différentielles; le problème de Cauchy

2) Soit I un intervalle compact de JR. Soit t E /, k et p deux entiers. On a, puisque ( ck) est une suite géométrique
de raison C/N,

p-1 p-1

l!xk+p(t) - Xk(t)ll $ ~.]lxk+1+i(t) - Xk+i(t)ll $ L ck+ie-Nt


i=O i=O

< ___
a _ e-Nt < ___
(c)k a _
(c)k
- N-C N - N-C N '

ce qui prouve que la suite (Xk) est de Cauchy dans l'espace C(I, lRn) des applications continues de I dans !Rn
muni de la norme de la convergence uniforme. Cet espace étant complet, la suite (X k) converge uniformément
vers une fonction XI définie sur /. De plus, en choisissant k = 0 dans les inégalités précédentes, on a
llXp(t)ll $ (a/(N - C))e-Nt, soit encore lleNtxp(t)ll $ (a/(N - c)). Par passage à la limite
Il
lorsque p tend vers +oo, on obtient lleNt XI(t) $ ( a/(N - C)).
Soit X lapplication, définie sur JR, qui coïncide avec XI sur chaque intervalle compact I. Des égalités
ft
Xk+l (t) = - 00 F( s, Xk(s)) ds on déduit, par dérivation (justifiée par la propriété 2.4.g), Xk+l (t) =
Il
F( t, Xk(t)). De plus, compte tenu de (ii), xk+p+l (t) - xk+l (t) $ Il 011 Il·
Xk+p(t) - Xk(t) Les suites
(Xk) et (Xk) converge donc uniformément sur tout intervalle compact /, par suite (voir le corallaire 1.5.9)
l'application' X est dérivable et sa dérivée X' est la limite de la suite (Xk). On obtient finalement, en utilisant
l'égalité Xk+l ( t) = F ( t, Xk ( t)) et la continuité de F, X' ( t) = F ( t, X ( t)).
On a montré que la suite (Xk) converge uniformément sur tout intervalle compact de IR vers X, solution de
l'équation différentielle X'(t) = F( t, X(t)), et que l'application t ,_. eNt X(t) est bornée par a/(N - C)
sur JR.
3) Supposons qu'il existe une autre solution Y de (E) telle que t ,_. eNtY(t) soit bornée. Des égalités
X'(t) = F(t, X(t)) et Y'(t) = F(t, Y(t)), on déduit, en utilisant (ii),

l!x'(t) - Y'(t)ll $ cl!X(t) - Y(t)ll:::; C(a + f3)e-Nt,

où l'on a posé a = suptEIRlleNtX(t)ll et (3 = suptEIRlleNty(t)ll· En appliquant le théorème des


accroissements finis à l'application X - Y entre les points 0 et t, on obtient

llx(t) - Y(t) - ( X(O) - Y(O)) Il : :; C(a + f3)1tle-Nt,

d'où on déduit

llX(O) - Y(o)ll $ llX(t) - Y(t)ll + C(a + f3)1tle-Nt $(a+ (3)(1 + Cltl)e-Nt.

En prenant la limite des deux membres lorsque t tend vers oo, on obtient X (O) = Y(O). Ainsi, X et Y sont deux
solutions de (E) satisfaisant la même donnée de Cauchy. Le théorème d'existence et d'unicité globales 2.10
s'applique et montre que X= Y. La solution X de (E) telle que t ,_. eNt X(t) soit bornée est donc unique.
4) L'équation ( E) peut avoir une solution Y distincte de X ayant pour limite 0 lorsque t tend vers +oo. En voici
un exemple.
Soit F : JR 2 --+ lR la fonction F(t, X) = e-t - CX, où C est un réel vérifiant 0 < C < 1. L'application F
satisfait aux conditions (i) et (ii) (prendre a= N = 1). L'équation (E) s'écrit X' (t) = -CX(t) + e-t. C'est
une équation linéaire dont la solution générale, définie sur JR, dépendant d'une constante arbitraire ,\ E JR, est
-t
<p>.(t) = >.e-Ct - _e__ .
1-C

Pour,\= 0, la solution Xo obtenue est telle que et Xo(t) soit bornée sur IR par par 1/(1 - C). Par contre, pour
,\ # 0, on a bien limt_,+ 00 IX>. (t) 1 = 0, mais limt_,+ 00 let X>. (t) 1 = +oo.
Chapitre VI
Le flot d'une équation différentielle

Soit E un espace de Banach réel, n un ouvert de ffi: x E et f une application continue


de n dans E, localement lipschitzienne par rapport à sa seconde variable. Le théorème
d'existence et d'unicité V.2.10 est applicable à l'équation différentielle
cp'(t) = f(t,cp(t))' (1)
et montre que pour toute donnée de Cauchy (t 0 , x 0 ) E n, il existe une solution maximale
unique t t---t 'P(to,xo) (t) de cette équation vérifiant cette donnée de Cauchy. Le flot de
l'équation différentielle ( 1), que nous étudions dans le présent chapitre, est tout simplement
l'application (t, to, xo) t---t 'P(to,xo) (t). Ce concept, qui permet de regrouper en une seule
application toutes les solutions maximales de l'équation (1), est d'une grande importance
pour l'étude des propriétés globales de l'ensemble de ces solutions. Il joue un rôle
central dans les développements actuels des mathématiques tels que l'étude des systèmes
dynamiques.
Après un paragraphe préliminaire dans lequel nous établissons certaines inégalités utiles,
nous définissons formellement le flot d'une équation différentielle, et nous établissons
ses principales propriétés, notamment les règles de composition qu'il satisfait. Nous
introduisons aussi le concept de flot réduit, mieux adapté au cas des équations différentielles
autonomes. Nous prouvons que le flot (ou le flot réduit) est une application continue
et localement lipschitzienne (c'est le résultat essentiel de ce chapitre, et celui dont
la démonstration est la plus délicate). Après une rapide étude des propriétés du flot
des équations différentielles qui dépendent d'un paramètre, nous prouvons que lorsque
l'application différentielle f est différentiable de classe CP, le flot de l'équation(l) est
différentiable de classe CP.

1. Inégalités vérifiées par les solutions d'une équation différentielle


Nous allons établir dans le présent paragraphe cetaines inégalités importantes vérifiées
par les solutions d'une équation différentielle (ou d'une inéquation différentielle). Elles
nous permettront de montrer que dans les hypothèses du théorème d'existence et
d'unicité V.2.10, les solutions maximales d'une équation différentielle dépendent de
manière continue de la donnée de Cauchy.
Nous considérons d'abord le cas d'applications à valeurs scalaires.
1.1. Lemme. - Soient D un. ouvert de IH: 2 , f : n ----) IH: une application continue,
et '!jJ : I ----) IH: une sôlution de l'équation différentielle
'l/J'(t) = f(t,'l/;(t))'
définie sur un intervalle ouvert I de R Soit d'autre part [a, b[ un intervalle semi-
ouvert contenu dans I, et cp : [a, b[----) ffi: une application continue, vérifiant les
conditions suivantes :
144 Chapitre VI. Le flot d'une équation différentielle

(i) <p(a) < 7/J(a);


(ii) l'application <p est dérivable à gauche en tout point t de ]a, b[, et sa dérivée à
gauche <p~(t) vérifie
<p~(t) < f(t,<p(t)).

Alors, pour tout t E [a, b[,


<p(t) < 'lj;(t).

Preuve : Considérons l'ensemble


V= { t E [a,b[; Vu E [a, t], cp(u) < 7/J(u)}.
C'est un ensemble non vide (il contient a). Clairement, si t appartient à V, l'intervalle [a, t]
est contenu dans V. Donc V est un intervalle de la forme [a, c), contenant son extrémité
gauche a (nous ne précisons pas encore s'il contient ou non son extrémité droite c). Nous
voulons montrer que c = b. Supposons donc c < b. Si nous avions cp(c) < 7/J(c), la
continuité des fonction cp et 7f; impliquerait l'existence d'un réel e > 0 tel que, pour tout
t E [c, c + e [, cp( t) < 7f; (t). L'intervalle [c, c + e [ serait contenu dans V, ce qui contredirait
la définition de c. Donc cp( c) 2: 7/J( c). En particulier c f; a. Maintenant, en tout point t de
l'intervalle non vide [a, c[, nous avons <p(t) < 'lj;(t), ce qui implique, par continuité de <p
et 7/J, <p(c) :::; 7/J(c). Finalement nous avons cp(c) = 7/J(c).
Pour a :::; t < c, nous avons
cp(t) - <p(c) 'lj;(t) - 7/J(c)
<
--'--'---~--'--- .
c-t c-t
En faisant tendre t vers c par valeurs inférieures, nous en déduisons
-cp~(c):::; -7/J'(c), ou cp~ (c) 2: 7/J' (c) .
Puisque c E ]a, b[ et que cp(c) = 7/J(c), nous avons l'inégalité
<p~(c) < f(c,<p(c)) = f(c,'lj;(c)) = 7/J'(c).
Ayant abouti à une contradiction, nous avons prouvé par l'absurde que c = b, donc que
V= [a, b[, c'est-à-dire que pour tout t E [a, b[, <p(t) < 'lj;(t). D

1.2. Corollaire. - Soient 0 un ouvert de IR 2 , f : 0 ~ lR et g : 0 ~ lR


deux applications continues de 0 dans IR, cp : I ~ lR une solution de l'équation
différentielle
<p'(t) = f(t,<p(t))'

7f; : I ~ lR une solution de l'équation différentielle


7/J' (t) = g(t, 'lj;(t)) '
définies toutes deux sur le même intervalle ouvert I de R Soit a un point de I.
On suppose que cp, 7/J, f et g satisfont les conditions suivantes :
(i) cp(a) = 'lj;(a);
(ii) pour tout (t, x) E 0, f(t, x) < g(t, x).
Alors, pour tout t E In ]a, +oo[,
cp(t) < 'lj;(t).
§ 1. Inégalités vérifiées par les solutions d'une équation différentielle 145

Preuve : Nous avons, pour t E I, t > a,


'1/J(t) - cp(t) = ('1/J'(a) - cp'(a)) (t - a)+ lt - al11(t - a)
= (g(a,'ljJ(a))-f(a,cp(a)))(t-a)+lt-al11(t-a),
où la fonction 17 vérifie limt ...... a, t>a 17(t - a) = O. Compte tenu de '1/J(a) = cp(a), et de
l'inégalité f(t, x) < g(t, x) pour tout (t, x) E n, cela prouve que pour t > a et t - a
assez petit, '1/J(t) - cp(t) > O. Nous pouvons alors appliquer la proposition précédente sur
un intervalle de la forme [a+ E:, b[, avec E: > 0 assez petit. D

1.3. Lemme. - Soient E un espace vectoriel normé, a et b deux éléments de E.


L'application de lR dans lui-même: t f--7 N(t) = lit a+ bll, est dérivable à gauche et
à droite en 0 (mais pas nécessairement dérivable!). De plus, ses dérivées à droite
et à gauche en 0 vérifient
N~(O) S llall ·

Preuve : La propriété étant trivialement vraie pour a = 0, nous supposons a f:. O. Nous
démontrons, par exemple, la dérivabilité à gauche. Soient u et t deux réels vérifiant
u < t < O. L'inégalité triangulaire donne:
tllua + bll - ullta + bll = -lltua + tbll + lluta + ubll S ll(u - t) bll = (t- u) llbll,
ce qui s'écrit
t(llua + bll - llbll) S u(llta + bll - llbll) ·
Posons, pour t < 0,
f(t) = N(t) - N(O) = lit a+ bll - llbll .
t t
En divisant l'inégalité ci-dessus par le réel positif ut, nous voyons que la fonction f est
croissante. Par ailleurs nous avons, puisque t < 0,

f(t) = -lita+ bll + llbll < lltall = llall ·


ltl - ltl
La fonction f a donc une limite lorsque t tend vers 0 par valeurs négatives, et cette limite,
qui n'est autre que N;(o), est majorée par llall· D
1.4. Proposition. - Soient E un espace vectoriel normé, I un intervalle de lR
ouvert à gauche, et cp : I --> E une application dérivable à gauche sur I. Alors la
fonction '1jJ : I --> IR, 'ljJ(t) = llcp(t)ll, est dérivable à gauche sur I et sa dérivée à
gauche vérifie
1'1/J~(t)I :::; llcp~(t)ll ·

Preuve : Soit a E I. Par hypothèse, cp est dérivable à gauche. Soit cp~(a) sa dérivée à
gauche en o:. Posons, pour tout t E IR,
N(t) = llcp(a) + tcp~(a)ll ·
D'après le lemme précédent, N est dérivable à gauche en 0, et sa dérivée à gauche en ce
point, notée N;(o), vérifie
146 Chapitre VI. Le flot d'une équation différentielle

Soit t E ~. t < 0, tel que a+ t E I. Nous avons


'1/J(a + t) - '1/J(a) - tN;(o) = jjcp(a + t)jj - Jjcp(a) + tcp~(a)jj
+ llcp(a) + tcp~(a)ll - ll<p(a)ll - tN;(o) ·
Nous en déduisons l'inégalité

l'l/J(a + t) - '1/J(a) - tN;(o)I :S l llcp(a + t)ll - llcp(a) + tcp~(a)ll j

+ l ii<p(a) + tcp~(a)ll - /lcp(a)ll - tN;(o)I ·


D'après l'inégalité triangulaire

l 1/cp(a + t)l/ - ll<p(a) + tcp~(a)/1 I :S l/cp(a + t) - cp(a) - tcp~(a)ll ·


D'autre part,
l/cp(a) +tep~( a) li - llcp(a)ll - tN;(o) = N(t) - N(O) - tN;(o).
Nous pouvons donc écrire
/'1/J(a + t) - '1/J(a) - tN;(o)j ::; l/cp(a + t) - cp(a) - tcp~(a)lj
+ jN(t) - N(O) - tN;(o)j,
ou encore

11/J(a + t~ - '1/J(a) - N;(o) 1::; Il cp(a + t~ - cp(a) - <p~(a) Il

+ 1 N(t) ~ N(o) - N;(o)I ·


Les deux termes du membre de droite tendant vers 0 lorsque t --t 0 par valeurs négatives,
nous voyons que '1jJ est dérivable à gauche au point a et a pour dérivée à gauche en ce
point '1/J~(a) = N;(o). L'inégalité(*) de l'énoncé est alors conséquence immédiate de
l'inégalité (**) ci-dessus. D
1.5. Remarque. - Le résultat établi dans la proposition précédente,
11/J~( t) 1::; ll'P~ (t) 11 ,
est parfois appelé inégalité de la vitesse radiale. Son interprétation mécanique justifie en
effet ce nom : supposons, pour simplifier, J'espace E muni d'une norme différentiable
dans Je complémentaire de l'origine (c'est le cas, par exemple, d'une norme euclidienne
sur un espace de dimension finie, ou de la norme sur un espace de Hilbert). Si !'application
t ~ cp(t) est interprétée comme représentant la position d'un point mobile dans J'espace
E en fonction du temps, Je vecteur cp' (t) représente la vitesse de ce point mobile à l'instant
t. La fonction t ~ 'ljJ(t) = llcp(t)ll représente la distance du point mobile à l'origine, en
fonction du temps. Sa dérivée '1/J' (t) (qui existe si le point ne coïncide pas avec !'origine à
l'instant t) représente la vitesse radiale du point mobile, c'est-à-dire la vitesse à laquelle Je
point mobile s'éloigne (ou se rapproche, selon Je signe de '1/J' (t)) de l'origine. L'inégalité
obtenue dans la proposition précédente signifie donc que la valeur absolue de la vitesse
radiale du point mobile est toujours inférieure ou égale à la norme de son vecteur vitesse.
1.6. Corollaire. - Soient n un ouvert de ~ 2 , f une application continue den dans
~' '1jJ :
I --t ~ une solution, défi.nie sur un intervalle ouvert I de~. de l'équation
différentielle
'1/J'(t) = f(t,'ljJ(t)).
§ 1. Inégalités vérifiées par les solutions d'une équation différentielle 147

Soient d'autre part [a, b[ un intervalle semi-ouvert contenu dans I, E un espace


vectoriel normé et <p: [a, b[--+ E une application continue, vérifiant les conditions
suivantes:
(i) ll<p(a)ll < 7/J(a),
(ii) l'application cp est dérivable à gauche sur ]a, b[, et sa dérivée à gauche vérine,
pour tout t E ]a, b[,
llcp~(t)ll < J (t, IJcp(t)ll).

Alors, pour tout t E [a, b[, on a


llcp(t)ll < 7/J(t).

Preuve : D'après la proposition précédente, l'application t r--+ h( t) = Il cp( t) Il est dérivable


à gauche, et sa dérivée à gauche vérifie
h~(t) ~ llcp~(t)ll < J(t, h(t)).
Nous pouvons donc lui appliquer le lemme 1.1, ce qui conduit au résultat annoncé. 0

Le résultat suivant, très fréquemment employé, s'obtient comme cas particulier du


corollaire 1.6.
1.7. Théorème [Inégalité de Gronwall]. - Soient E un espace vectoriel normé,
et cp : I --+ E une application d'un intervalle ouvert I de JR, à valeurs dans E,
dérivable sur!. On suppose qu'il existe des constantes k > 0 etc 2: 0 telles que,
pour tout t E J,
llcp'(t)JJ ~ kJJcp(t)ll +c.
Alors pour tout couple (a, b) de points de I,
llcp(a)ll e-klb-al + I (e-klb-al _ 1) ~ llcp(b)ll ~ llcp(a)ll eklb-al + I (élb-al _ 1).
Preuve: Soient A etddeux réels. Considérons l'application f : JR. 2 --+ JR, f (t, x) = k x+d.
La solution maximale de l'équation différentielle
7/J'(t) = J(t,'ljJ(t))
qui vérifie 7/J (a) = A est la fonction
7/J( t) = A ek(t-a) + ~ (ek(t-a) _ l) .
k
Supposons d'abord
b >a, IJcp(a)ll <A, c < d.
Le corollaire précédent s'applique et montre que
llcp(b)ll < 7/J(b) = Aélb-al + ~ (élb-al _ 1).
k
En faisant tendre A vers llcp( a) Il et d vers c, nous obtenons
llcp(b)ll ~ llcp(a)ll élb-al + î (élb-al - 1)'
c'est-à-dire aussi
llcp(b)ll e-klb-al + Î (e-klb-al -
1) ~ llcp(a)ll,
ce qui permet, en échangeant a et b, de traiter Je cas où b < a.
Nous obtenons l'autre inégalité en appliquant la même méthode à l'application t r--+ cp(-t).
0
148 Chapitre VI. Le flot d'une équation différentielle

1.8. Remarques. - Le lemme 1.1 peut s'étendre au cas où cp admet une dérivée à gauche
en tout point du complémentaire d'une partie finie ou dénombrable de ]a, b[, vérifiant les
inégalités indiquées. D'autre part, en remplaçant 'ljJ par-1/J, on obtient un énoncé analogue
à celui du lemme 1.1, les inégalités ::; et < étant remplacées par 2: et >. De même, en
remplaçant t par -t, on obtient des énoncés analogues à 1.1 et 1.4, les dérivées à gauche
étant remplacées par des dérivées à droite.

2. La continuité du flot

2.1. Définitions. - Soit E un espace vectoriel réel normé complet et f une


application continue d'un ouvert n de lR X E dans E, localement lipschitzienne
par rapport à sa seconde variable. L'équation différentielle
cp'(t) = J(t,cp(t))' (1)
satisfaisant les hypothèses du théorème V.2.10, notons, pour toute donnée de
Cauchy (to, xo) En, 'P(to,xo) la solution maximale de (1) qui satisfait cette donnée
de Cauchy, et I(to,xo) l'intervalle ouvert de lR contenant l'origine sur lequel cette
solution est définie.
1. On appelle.flot (ou coulée) de l'équation différentielle (1) l'application <I>, ayant
pour expression
(t, to, xo) 1---+ <l>(t, to, xo) = 'P(to,xo) (t),
définie sur la partie
D = LJ l(to,xo) X { to} X { Xo}
(to,xo)E!1
de lR x lR x E, et à valeurs dans E.
2. On suppose de plus que l'équation différentielle considérée est autonome, de la
forme
cp'(t) = f(cp(t))' (2)
f étant maintenant une application localement lipschitzienne d'un ouvert U de
l'espace de Banach E dans E. Ainsi que nous l'avons vu (VI.2.1), c'est un cas
particulier de l'équation (1) dans lequel f2 = JR X U, l'application j pouvant être
considérée comme définie sur n, mais ne dépendant pas de la variable t E R
On appelle flot réduit de l'équation différentielle (2) l'application 'li, ayant pour
expression
(t, Xo) t---+ W(t, Xo) = <l>(t, 0, Xo) = 'P(O,x 0 )(t),
définie sur la partie
Dr= {(t,xo) E lR x E (t,0,x 0 ) ED}
de lR x E, et à valeurs dans E.

2.2. Commentaires
a) Équation vérifiée par le flot. - End' autres termes, le flot <I> del' équation différentielle
(1) est l'application, fonction de trois variables t, t 0 et x 0 , telle que pour (t 0 , x 0 ) E n
fixé, t 1---+ <1>( t, t 0 , x 0 ) soit la solution maximale de l'équation (1) satisfaisant la donnée de
Cauchy ( t 0 , x 0 ). Il vérifie donc
f)
f)t <l>(t, to, Xo) = f(t, <l>(t, to, Xo)), <l>(to, to, Xo) = Xo.
§ 2. La continuité du flot 149

De même, le flot réduit '11 de l'équation (2) est l'application, fonction de deux variables
t et xo, telle que pour xo E E fixé, t 1--+ '11(t, x 0 ) soit la solution maximale de l'équation
(2) satisfaisant la donnée de Cauchy (0, x 0 ). Il vérifie donc
a
at '11(t, xo) = f(w(t, xo)), '11(0, x0 ) = x0 .
b) Flot réduit et équations autonomes. - La définition du flot réduit, donnée ci-
dessus pour une équation autonome, garde un sens lorsque l'équation considérée est non
autonome, mais ne présente dans ce cas pas beaucoup d'intérêt : mieux vaut alors utiliser le
flot proprement dit. Par contre, pour l'équation différentielle autonome (2), nous allons voir
que la connaissance du flot réduit équivaut à celle du flot proprement dit. C'est pourquoi il
est préférable dans ce cas d'utiliser le flot réduit, dont l'expression est un peu plus simple
que celle du flot proprement dit (c'est une fonction de deux variables au lieu de trois).
D'après la proposition IV.2.2, pour toute solution cp de l'équation différentielle au-
tonome (2), définie sur un intervalle ouvert I de JR, et tout 0 E JR, l'application de
I + 0 (translaté de I par 0) dans E, t 1--+ cp o Te(t) = cp(t - 0 est aussi solution de
cette équation. En raison de l'unicité de la solution maximale satisfaisant une donnée de
Cauchy spécifiée, cette propriété signifie que le flot <I> de l'équation (2) vérifie la propriété
suivante : pour tout 0 E JR, un triplet (t, t 0 , x 0 ) E lR x lR x E est élément de D si et
seulement si (t - 0, t 0 - 0, x 0 ) est élément de D; lorsque c'est le cas,
<I>(t - 0, to - 0, xo) = <I>(t, to, xo).
En particulier, en faisant 0 = t 0 , nous voyons que (t, t 0 , x 0 ) est élément de D si et
seulement si (t - t 0 , 0, x 0 ) est élément de D, et que lorsque c'est le cas,
<I>(t, to, xo) = <I>(t - to, 0, xo).
En faisant intervenir le flot réduit '11 de l'équation (2), défini sur la partie Dr de lR x E, le
résultat qui précède s'énonce ainsi: un triplet (t, t 0 , x 0 ) E lR x lR x E est élément de D
si et seulement si (t - t 0 , x 0 ) est élément de Dr, et lorsque c'est le cas,
<I>(t, to, xo) = w(t - to, xo).
La connaissance du flot réduit équivaut à celle du flot proprement dit, puisque
D = { (t, to, xo) E lR x lR x E ; (t - to, xo) E Dr}, <I>(t, to, xo) = \ll(t - to, xo).
c) Exemples. - Le flot de l'équation différentielle, sur JR,
y'(t) = y(t)'
est défini sur JR 3 , et a pour expression
<I>(t, to, xo) = xo et-ta.
Cette équation est autonome; son flot réduit '11, défini sur JR 2 , a pour expression
'1J(t,xo) = <l>(t,0,xo) = Xoet.
De même, le flot réduit de l'équation différentielle non autonome, sur IR,
z' (t) = z (t) + cos t ,
défini su~ JR 3 , a pour expression
<I>( t, t , x ) = ( xo - sin to - cos to) et-t 0 + sin t -2 cos t .
0 0 2
150 Chapitre VI. Le flot d'une équation différentielle

2.3. Proposition. - Les hypothèses et notations sont celles de la définition 2.1.


1. Le flot q, : D --+ E de l'équation différentielle (1) vérifie les propriétés suivantes.
(i) Pour tout (to, xo) E 0, (ta, to, xo) est élément du domaine de définition D de
q,, et
q,(to, ta, xo) = xa.
(ii) Soient (ta' Xa) E n, ti
et tz deux réels. On suppose le triplet (ti' ta' Xo) élément
du domaine de définition D de q,_ Alors le triplet (t2, to, xa) est élément de D
si et seulement si (t2,t1,q,(t1,ta,xa)) est élément de D. Lorsque c'est le cas,
on a

(iii) Si le triplet (t 1,t0 ,xa) est élément de D, alors (ta,t1,q,(t1,to,xa)) est aussi
élément de D, et

2. Considérons maintenant l'équation différentielle autonome (2). Son flot réduit


w vérifie les propriétés suivantes.
(iv) Pour tout xa EU, (0, xo) est élément du domaine de définition Dr de W, et
'11(0,xa)=xa. (o)
(v) Soient x 0 E U, t 1 et tz E R On suppose (t1, xa) élément du domaine de
définition Dr de W. Alors (tz, W(t 1 , xo)) est élément de Dr si et seulement si
(t 1 + t 2 , x 0 ) est élément de Dr. Lorsque c'est le cas,
w(t2, w(t1, xa)) = w(t1 + tz, xa). (oo)
(vi) Si (t 1,xa) est élément de Dri alors (-ti, w(t1,xa)) est élément de Dr, et
1J!(-t1, 1J!(t1, Xo)) = XQ. (ooo)
Preuve:
1. La propriété (i) est une conséquence immédiate de la définition : léquation ( *) ne fait
qu'exprimer le fait que pour toute donnée de Cauchy (ta, xa) E n, il existe une solution
maximale <p de l'équation (1) qui satisfait cette donnée de Cauchy, c'est-à-dire vérifie
<p(to) = xa.
La figure 1 ci-dessous illustre le raisonnement qui permet d'établir (ii) et (iii).

Xa

Figure 1. Illustration de la preuve de la proposition 2.3.


§ 2. La continuité du flot 151

Soit x1 = <I>(t1, to, xo). La solution maximale t t-t cp(t) de l'équation (1) satisfaisant
la donnée de Cauchy (t 1 , x 1 ) est identique à la solution maximale de cette équation
satisfaisant la donnée de Cauchy (t 0 , x 0 ). Nous pouvons donc exprimer de deux manières
le fait que le réel t 2 appartienne à l'intervalle de définition de cette solution : soit en disant
que (t2, ti, x1) E D, soit en disant que (t 2 , t 0 , x 0 ) E D; ces deux assertions sont donc
bien équivalentes. Lorsqu'elles sont vraies, en exprimant cp(t 2 ) de deux manières, nous
obtenons l'égalité(**).
Montrons maintenat (iii). Faisons t 2 = t 0 . Le triplet (t 0 , t 0 , x 0 ) est évidemment élément
de D, et nous avons bien sûr <I>(t 0 , t 0 , x 0 ) = x 0 . En écrivant (**)dans ce cas particulier,
nous obtenons ( ***).
2. Les propriétés (iv), (v) et (vi) ne sont que la traduction des propriétés (i), (ii) et (iii) dans
le cas particulier où l'équation considérée est autonome. D

2.4. Remarque. - Grâce à de nouvelles notations, nous allons essayer de mieux mettre
en évidence la signification des résultats établis dans la proposition précédente.
a) Cas d'une équation non autonome. - Plaçons nous d'abord dans le cas où l'équation
différentielle considérée (1) est non autonome. Posons, pour tous t 0 et t E IR,
U(t,to) = { Xo E E; (t,to,xo) ED},
et, pour tout Xo E U(t,to)•
<I>(t,t 0 )(xo) = <I>(t, to, xo).
Nous voyons alors que <I>(t,to) est une application, définie sur la partie U(t,to) de E, à
valeurs dans E.
En particulier, pour tout t 0 E IR, nous avons
U(to,to) = { xo E E ; (to, to, xo) E D} = { Xo E E ; (to, xo) E !1}.
La propriété (i) de la proposition précédente, et l'équation ( * ), s'expriment comme suit:
pour tout to E IR tel que U(to,to) soit non vide, on a
<I>(to,to) = idu(t 0 ,t 0 ) • ( *)
La propriété (ii) de la proposition précédente, et l'équation ( **),peuvent être mises sous la
forme suivante: soit x0 E U(ti ,to); alors <I>(t 1 ,to) (x 0 ) est élément de U(t 2 ,ti) si et seulement
si x 0 est élément de U(t 2 ,to)• et on a
<I>(t2,to) = <I>(t2,t1) 0 <I>(t1,to) · (**)
Quant à la propriété (iii) et à la relation ( *** ), elles s'expriment, avec ces nouvelles
notations, comme suit : pour tous to et t 1 E IR tels que U(ti ,to) soit non vide, lapplication
<I>(ti ,to) : U(ti ,to) --> E est injective et a pour image U(to,ti); lorsqu'on la considère comme
une bijection de u(t1,to) sur son image, elle a pour inverse

(<I><t1,to)r
1
= <I>(to,t1) · (***)
Ces propriétés ressemblent beaucoup à celles des éléments d'un groupe. Cependant, la
famille d'applications { <I>(t,to) ; t 0 E IR, t E IR}, munie des lois de composition et
d'inversion données par les formules ( * ), ( **) et ( *** ), n'est en général pas un groupe,
car la loi de composition n'est pas définie pour tout couple ordonné d'éléments : si <I> (ti ,to)
et <I>(si,so) sont deux éléments de cette famille d'applications, l'application composée
<I>(s 1 ,so) o <I>(ti ,to) n'appartient à la famille (sauf cas particulier) que si so = ti. On dit que
cette famille d'applications, munie des lois de composition et d'inversion(*) et(**), est
un groupoïde.
152 Chapitre VI. Le flot d'une équation différentielle

b) Cas d'une équation autonome. - L'équation différentielle considérée est maintenant


l'équation autonome (2), dont le flot réduit est l'application W, définie sur la partie Dr de
lR x E. Pour tout t E IR, posons
Ut= U(t,O) = {XE U ; (t, x) E Dr},
et notons Wt : Ut ----+ E l'application
Wt(Xo) = w(t,xo).
La propriété (iv) de la proposition précédente et l'équation(<>) s'expriment comme suit:
onaUo = U,et
Wo = idu. (<>)

La propriété ( v) de la proposition précédente et l'équation (<><>) se mettent sous la forme


w
suivante : soit x 0 E Ut 1 ; alors t 1 ( x 0 ) est élément de Ut 2 si et seulement si x 0 est élément
de Ut 2 +t 1 , et on a
(<><>)

Enfin, la propriété( vi) et la relation (<><><>) s'expriment, avec ces nouvelles notations, comme
suit: pour tout t E lR tel que Ut soit non vide, l'application Wt : Ut ----+ E est injective et
a pour image U_t; lorsqu'on la considère comme une bijection de Ut sur son image, elle
a pour inverse
(<><><>)

Dans le cas particulier où le domaine Dr du flot réduit est égal à lR x U, c'est-à-


dire où toute solution maximale de l'équation différentielle autonome (2) est définie
sur lR entier, l'application t 1--+ Wt est un homomorphisme du groupe additif lR dans
le groupe des applications bijectives de l'ouvert U de E sur lui-même. Nous verrons
plus loin que les applications Wt sont des homéomorphismes localement lipschitziens.
w
L'application t 1--+ t est donc un homomorphisme du groupe additif lR dans le groupe
des homéomorphismes localement lipschitziens de U.
2.5. Lemme. - On se place dans les hypothèses de la définition 2.1. Soit ~
un intervalle fermé et borné de IR, et W une partie den vérifiant les conditions
suivantes:
(i) la restriction de f à W est majorée en norme par un réel M 2': 0, et
lipschitzienne relativement à sa seconde variable, de rapport k 2': 0;
(ii) pour toute donnée de Cauchy (t0 , x 0 ) E W et tout t E ~' le triplet (t, t0 , x 0 )
est élément du domaine D de définition du flot <I>, et (t, <I>(t, t 0 , x 0 )) E W.
On note C(~, E) l'espace des applications continues de ~ dans E, muni de la
norme de la convergence uniforme. ·
Alors l'application de W dans C(~, E) qui, à chaque (to, xo) E W, associe la
restriction à ~ de l'application t 1--+ <I>( t, t 0 , x 0 ), est continue et lipschitzienne. Plus
précisément, si on note f la longueur de l'intervalle ~' on a, pour tous t E ~'
(to, xo) et (t1, x1) E W,
ll<I>(t, ti, x1) - <I>(t, to, xo)ll ~ ée(llx1 - xoll + M lt1 - toi).

Preuve: Soient (t0 , x 0 ) et (t 1 , x 1) deux éléments de W. Pour tout t E ~. (t, t 0 , x 0 ) E D,


(t, <I>(t, to, xo)) E W, et nous avons

li 8<I>(t,otto, xo) Il = Il f (t, <I>(t, to, xo) )Il ~ M.


§ 2. La continuité du flot 153

Comme le segment [(to, to, x 0 ), (t 1, t 0 , x0 )] est contenu dans D, le théorème des accroisse-
ments finis permet d'écrire
ll<I>(t1, to, xo) - xoll :SM lti - toi·
Mais nous avons aussi, pour tout t E Li,

ll
â<I>(t,t1,x1)_8<I>(t,to,xo)ll=ll!(
ât ât t, ""(
'!' t, t1, x1
))-!( t, ""(
'!' t, t 0 , x 0
))il .
L'inégalité de Gronwall 1.7, appliquée à la fonction t i---+ <I>(t, t1, x1) - <I>(t, to, xo) et aux
points t 1 et t, donne, en notant fla longueur de l'intervalle Li,
ll<I>(t,t1,x1)-<I>(t,to,xo)ll :S llx1-<I>(t1,to,xo)lleklti-tl
:S llx1 - <I>(t1, to, xo)ll ée
:S eke(llx1 - xoll + M lt1 - toi)·
Cette dernière inégalité montre que lorsque (t 1 , x 1 ) tend vers (t 0 , x 0 ), la fonction
t i---+ <I>( t, t1, x 1) converge unifonnément sur Li vers la fonction t i---+ <I>( t, to, xo). D
2.6. Lemme. - On se place dans les hypothèses de la définition 2.1. Pour tout
(t 0 , x 0 ) E n, il existe l > 0 et r > 0 vérifiant les propriétés suivantes :
(i) Je tonneau fermé V= [t0 - 3l, t 0 + 3l] x BF(x 0 , 3r) est un tonneau de sécurité,
et la restriction de f à ce tonneau est bornée et lipschitzienne par rapport à
sa seconde variable;
(ii) soit W = Jt 0 -l, t 0 +l[ xB(x 0 , r); c'est un tonneau de sécurité ouvert de centre
(t 0 , x 0 ) et, pour tout élément (t 1 , x 1 ) de W, et tout t E [t 0 -l, t 0 + l], le triplet
(t,t 1,xi) est élément de D et (t,<I>(t, t 1 ,xi)) est élément de V.
Preuve : La fonction f étant localement lipschitzienne relativement à sa seconde variable,
il existe un voisinage ouvert n' de (t 0 , x 0 ), n' c n, tel que la restriction de f à n' soit
lipschitzienne relativement à sa seconde variable. Cette application, étant continue, est
localement bornée; il existe donc un tonneau de sécurité fenné V = [to - 3l, t 0 + 3l] x
BF(x 0 , 3r) contenu dans n'. La restriction de f à V est alors bornée et lipschitzienne
relativement à sa seconde variable.
Soit W = Jt 0 - l, t 0 + l[ xB(x 0 , r). C'est un tonneau homothétique à l'intérieur de
V, de même centre. D'après la remarque V.2.2.b, c'est un tonneau de sécurité. Soit
(t 1,x 1) E W. Toujours d'après cette remarque, le tonneau fenné, de centre (ti,x 1),
[t 1 - 2l, t 1 + 2l] x BF(x 1, 2l), est de sécurité. D'après le théorème de Cauchy-Lipschitz
V.2.7, l'intervalle de définition de la solution maximale de l'équation différentielle
considérée, qui satisfait la donnée de Cauchy (t 1, x 1), contient ]t1 - 2l, ti + 2l[, qui
lui-même contient [t0 - l, t 0 + l]. Donc pour tout t E [to - l, to + l], le triplet (t, t1, x 1)
est élément de D, et (t, <I>(t, t 1, x 1)) est élément de [ti - 2l, t 1 + 2l] x BF(x 1, 2l), donc,
a fortiori, élément de V. D
2.7. Théorème.- Soit E un espace de Banach, n un ouvert de lR x E et f: n---+ E
une application continue, et localement lipschitzienne relativement à sa seconde
variable. On note <I> le flot de l'équation différentielle
cp'(t) = f(t,cp(t)). (1)
Le domaine de définition D du flot cp est un ouvert de lR x lR x E, et l'application
<I> : D ---+ E est continue et localement lipschitzienne.
De même, lorsque l'équation différentielle considérée est autonome, de la forme
cp'(t) = f(cp(t)), (2)
où f est une application localement lipschitzienne d'un ouvert U de E dans E,
le domaine de définition Dr de son flot réduit est un ouvert de lR x E, et ce Hot
réduit est une application continue et localement lipschitzienne de Dr dans E.
154 Chapitre VI. Le flot d'une équation différentielle

Preuve: Soit (t1, to, x 0 ) ED. Supposons par exemple t 1 ~ t 0 . L'ensemble


C = { (t, <I>(t, to, xo)) ; t E [to, t1]},
image de [t0 , t 1 ] par une application continue, est une partie compacte de n. Pour tout
point (t,x = <I>(t,t 0 ,x0 )) deC, ilexistedesréelslt > Oetrt > Ovérifiantlesconditions
énoncées dans le lemme 2.6. Rappelons ces conditions, afin de fixer les notations :
-les tonneaux vt = [t- 3lt, t + 3lt] x BF(x, 3rt) et Wt = ]t - lt, t + lt[ xB(x, rt) sont
de sécurité;
- la restriction de f à vt est majorée en norme par Mt ~ 0, et lipschitzienne relativement
à sa seconde variable, de rapport kt ;
-pour toute donnée de Cauchy (t', x') E Wt ettout t" E [t-lt. t+lt]. le triplet (t", t', x')
est élément de D et ( t", <I>( t", t', x')) E vt.
Lorsque t parcourt [t0 , ti], les tonneaux Wt forment un recouvrement ouvert de C,
dont nous pouvons extraire un recouvrement fini { Wo 0 , Wo 1 , ••• , Won}. En ajoutant si
nécessaire Wt 0 et Wt 1 à ce recouvrement, en ordonnant ses éléments et en supprimant ceux
qui sont redondants, nous pouvons nous ramener au cas où t 0 = 80 < 8 1 < · · · < Bn = t 1 ,
et où, pour tout i E { 0, 1, · · ·, n - 1 }, Wo; n Woi+ 1 =!= 0. Il existe alors, pour tout
i E { 0, 1, ... , n-l }, un réel (i E ]Bi, Bi+d tel que l(i-Bd <loi et IBi+l -(il <loi+!" Le
lecteur remarquera que les deux suites finies (Bo, . .. , Bn) et (( 0, ... , (n-1) sont emboîtées,
c'est-à-dire vérifient

to =Bo < (o < 81 < (1 < · · · < (n-1 < Bn = tl.


La figure 2 illutre la situation.

0 so s~ to
Figure 2. Illustration de la preuve du théorème 2.7.

Posons
M= sup Mo;, k = sup ko;, l = sup lo;.
O:'.Si:'.Sn 0:'.Si:'.Sn O:'.Si:'.Sn

Soient (so, Yo) et sb, Yb) deux éléments de Wo 0 • D'après le lemme 2.6, ((0 , s0 , y0 ) et
((o, sb, Yb) sont éléments de D. De plus, d'après le lemme 2.5,
ll<I>((o, so,Yo) - <I>((o, s~,yb)ll :S e2 k 1 (11Yo -ybll + Mlso - sbl) · (*)
§ 2. La continuité du flot 155

En particulier, pour sb = to et Yb = xo,


ll<I>( (o, sa, Yo) - <I>((o, to, xo) Il :::; e2 kl (llYo - xo Il +Misa - to 1) . (**)
Cette inégalité prouve que lorsque (so, Yo) converge vers (to, xo), <1>((0, s0 , y 0 ) converge
vers <1>((0, t 0 , x 0 ). Mais, d'après les règles de composition du flot,
<I>((o,to,xo) = <1>((0,81,<1>(81,to,xo)).
Nous remarquons que Wo 1 est un tonneau de sécurité de centre (81, <1>(81, t 0 , x 0 )). Par
suite, le point ( (o, <I> ((o, to, xo)) est élément de Wo 1 • Comme ( (o, <1> ((o, so, Yo)) converge
vers ((o,<l>((o,to,xo)) lorsque (so,Yo) converge vers (to,xo), nous voyons que pour
llYo - xoll et lso - toi assez petits, ( (o, <I>((o, so, Yo)) est élément de W9 1 • De même, pour
li Yb - xoll et lsb - toi assez petits, ( (o, <1>( (o, sb, y0)) est élément de Wo 1 •
D'après le lemme 2.6, ( (1, (o, <1>( (o, so, Yo)) et ( (1, (o, <I>((o, sb, y0)) sont éléments de D,
et d'après le lemme 2.5 et l'inégalité(*) ci-dessus,
11 <I> (( 1, (o, <I> ((o, so, Yo) )-<1> (( 1, (o, <I> ((o, s~, Yb)) 11
:::; e2 kl Il <1>( (o, so, Yo) - <1>( (o, sb, Yb) Il
:::; e4k 1 (11Yo -ybll +Misa - sbl) ·
De même, d'après le lemme 2.6 et l'inégalité(**) ci-dessus,
11 <I> (( 1, (o, <I> ((o, sa, Yo)) -<I> (( 1, (o, <I> ((o, to, Xo)) 11
:::; e2 k 1 ll<I>((o,so,yo)-<l>((o,to,xo)ll
:::; e4k 1(11Yo
- xoll +Misa - toi)·
Mais d'après les règles de composition du flot, ((1, sa, Yo), ((1, sb, y0) et ((1, to, xo) sont
éléments de D et
<1>((1, (o, <l>((o, so, Yo)) = <1>((1, so, Yo), <1>((1, (o, <l>((o, s~, Yb))= <1>((1, s~, Yb),
<1>( (1, (o, <1>( (o, ta, xo)) = <1>( (1, to, xo).
Nous avons, pour llYo - x0ll. llYo - xoll. lso - toi et lsb - toi assez petits, les inégalités
11<1>((1, sa, Yo) - <1>((1, to, xo)ll :::; e4kl (llYo - xoll +Misa - toi),
11 <I> (( 1, s~, Yb) - <I> (( 1, to, Xo) 11 :::; e4kl ( 11 Yb - Xo 11 + M 1sb - to 1) ,
ll<I>((i,so,Yo)-<I>((i,s~,yb)ll:::; e4k 1(llY0 -ybll +Misa - sbl) ·
En procédant comme nous l'avons fait ci-dessus pour montrer que ( (o, <I> (( 0, to, xo)) est
élément de W 91 , nous voyons que ( ( 1, <1>( ( 1, t 0, x 0 )) E Wo 2 • Les deux premières inégalités
ci-dessus montrent alors que pour llYo - xoll. llYÜ- xoll, lso - toi et lsb - toi assez petits,
((1, <1>( (1, sa, Yo)) et ( (1, <1>( (1, sb, y0)) sont éléments de Wo 2 •
Nous pouvons alors répéter plusieurs fois le même raisonnement, en remplaçant ((1, Wo 1 )
successivement par ((2, Wo 2 ) , ••• , ((n-1, Won_J. Nous voyons ainsi que pour llYo-xoll.
llYo - xoll. lso - toi et lsb - toi assez petits,
ll<I>((n-11 sa, Yo) - <I>((n-11 ta, xo)ll :::; e2 nkl (llYo - xoll +Misa - toi),
ll<I>((n-11 sb, Yb) - <l>((n-1, ta, xo)ll :::; e2nkl (llYb - xoll +Mis~ - toi),
ll<I>((n-1, sa, Yo) - <I>((n-1, sb, Yb)ll :::; e2nkl (llYo - Ybll +Misa - sbl) ·
Puisque ( (n_ 1, <l>((n-l, t 0, x 0 )) est élément de Won, l'inégalitéci-dessus montre que pour
llYo -xoll. llYÜ- xo Il. lso -toi et lsb-to 1assez petits (disons, pour fixer les notations, pour
llYo - xoll < c, llYo -xoll < c, Isa - toi< cet lsb- toi< c, pour un certain réel c > 0),
156 Chapitre VI. Le flot d'une équation différentielle

((n-1, <I?( (n-i. so, Yo)) et ((n-1, <I?((n-1, sb, Yb)) sont éléments de Wo,.. Les lemmes 2.5
et 2.6 montrent alors que pour tout élément s1 de l'intervalle ]On - lo,., On + le,. [, qu'on
peut aussi écrire ]t1 - lt 1 , tl + lt 1[, (s1, (n-1, <I?( (n-1, so, Yo)) est éléments de D et
ll<P(s1, (n-1, <I?((n-1, so, Yo))-<I?(s1, (n-1, <I?((n-1, sb, Yb)) Il
~ e2 kl ll<P( (n-1, so, Yo) - <I?( (n-1, sb, Yb) Il
~ e2 (n+l)kl(llYo -ybll + Mlso - sbl) ·
D'après les règles de composition du flot, (s1, so, y 0 ) et (s 1, sb, Yb) sont éléments de D et
la dernière inégalité s'écrit
ll<P(s1, so, Yo) - <I?(s1, sb, Yb)ll ~ e2 (n+l)kl (llYo - Ybll + Mlso - sb/) ·
Soit s~ un autre élément de l'intervalle JOn - le,., On + le,. [, qu'on peut aussi écrire
]t1 - ltp tl + lt 1[.Alors (s~, (n-1, <I?((n-1, sb, Yb)) est éléments de D et, puisque sur
Wt 1 f est majorée par M,
ll<P(s~,s1,<I?(s1,sb,yb)) - <I?(s1,sb,yb)ll ~ M/s~ - s1/,
et nous pouvons écrire
ll<P(s1, so, Yo) - <I?(s~, sb, Yb) Il ~ e 2 (n+l)kl (llYo - Ybll + M/so - sb 1) s~ /.
+ M/s1 -
Nous avons donc prouvé que le voisinage ouvert de (ti, t 0 , x 0 ) dans lR x lR x E,
]t 1 - lt 1, t 1 + lt 1[ x ]to - ê, t 0 + ê[ xB(xo, ê), est contenu dans D (ce qui montre que
D est ouvert), et que sur ce voisinage, le flot cl> est une application lipschitzienne, donc
continue.
Les propriétés correspondantes du flot réduit d'une équation différentielle autonome s'en
déduisent immédiatement, puisque le flot réduits' obtient en donnant à la seconde variable
t 0 dont dépend le flot proprement dit la valeur O. D

2.8. Corollaire. - Dans les hypothèses du théorème précédent, et avec les notations
de la remarque 2.4, pour tout couple (t 1 , t 0 ) de réels, l'ensemble
U(t 1,t0 ) = { x E E ; (t1,to, x) ED}
est un ouvert de E. Lorsque cet ouvert est non vide, l'application xi---+ <I?(ti,to)(x) =
<I?(t1' to, X) est un homéomorphisme localement lipschitzien de U(t1 ,to) sur u(to,t1)i
dont l'inverse est <I?(t 0 ,t 1 )·
Lorsque de plus l'équation différentielle considérée est autonome, toujours avec les
notations de la remarque 2.4, pour tout réel t, l'ensemble
Ut= {XE E ; (t, x) E Dr}
est un ouvert de E. Lorsque cet ouvert est non vide, l'application x i---+ Wt(x) =
\ll(t, x) est un homéomorphisme localement lipschitzien de Ut sur U_t, dont
l'inverse est '11-t·
Preuve: Puisque D est ouvert, ({ t 1 } x { t 0 } x E) nD est un ouvert de { t 1 } x { t 0 } x E,
dont l'image, par la projection sur le troisième facteur, est U(ti,to)· La restriction à
{ t 1 } x { t 0 } x E de la projection de lR x lR x E sur son troisième facteur étant un
homéomorphisme, U(ti,to) est un ouvert de E. L'application <l?(t 1 ,t 0 )> qui se déduit de
cl> en donnant des valeurs fixes aux deux premières variables, est continue et localement
lipschitzienne, car d'après le théorème précédent, cl> elle-même est continue et localement
lipschitzienne. Nous avons vu d'autre part (2.4) que <I?(ti,to) est une bijection de U(ti,to)
sur U(to,ti). et a pour inverse <I?(to,ti)·
Les propriétés analogues concernant le flot réduit d'une équation différentielle autonome
s'en déduisent immédiatement. D
§ 3. Équations différentielles dépendant d'un paramètre 157

3. Équations différentielles dépendant d'un paramètre


3.1. Le problème étudié. - Soient E un espace de Banach réel, A un espace topologique,
n un ouvert de lR x E x A, et f : n ----> E une application. Nous considérons dans ce
paragraphe 1'équation différentielle
cp'(t) = J(t, cp(t), .X)'
dans laquelle l'élément À de A est considéré comme un paramètre. Nous supposerons
que pour chaque À E A, cette équation satisfait les conditions du théorème d'existence et
d'unicité V.2.10. Nous allons nous intéresser à la continuité de son flot, qui est maintenant
un fonction de quatre variables, t, t 0 , x 0 et À.
Lorsque A est un espace de Banach (ou un ouvert d'un tel espace), nous allons voir que la
valeur du paramètre À peut être considérée comme faisant partie de la donnée de Cauchy.
L'étude faite dans le paragraphe précédent va nous permettre d'établir le résultat suivant.
3.2. Théorème. - Soient E et A deux espaces de Banach réels, n un ouvert de
lR x E x A et f : n ----> E une application continue, et localement lipschitzienne
relativement à ses deux dernières variables (x 0 , .X) E Ex A. On considère l'équation
différentielle
cp'(t) = f (t, cp(t), .X).
Pour tout À E A, on note <I> >. son flot, et D>. l'ouvert de lR x lR x E sur lequel il
est défi.ni. Soit
D = { (t, t 0 , x 0 , .X) E lR x lR x E x A ; (t, t 0 , xo) E D>. } ,
et <I> : D ----> E l'application
(t, to, xo, .X)~ <I>(t, to, xo, .X) = <1>.>.(t, to, xo).
Alors D est un ouvert de lR x lR x Ex A, et l'application <I> est continue et localement
lipschitzienne.
Preuve: Soit F: n----> Ex A l'application
F(t,(x,y)) = (f(t,x,y),O).
Nous pouvons lui associer l'équation différentielle, dans l'espace E x A,
1/J'(t) = F(t,îjJ(t)).
L'application Fest continue et localement lipschitzienne relativement à sa seconde variable
(x, y) E Ex A. Les théorèmes d'existence et d'unicité V.2.10 et de continuité du flot 2.7
lui sont applicables, et montrent que le flot '1! de cette équation est une application continue
et localement lipschitzienne, définie sur un ouvert D de lR x lR x (E x A).
En explicitant les composantes d'une solution 1/J de l'équation ( **) sous la forme
îjJ(t) = (cp( t), x( t)), nous voyons que cette équation s'écrit
cp'(t) = J(t,cp(t),x(t)),
x'(t)=O.
La seconde équation montre immédiatement que la seconde composante t ~ x( t) de toute
solution de (**)est une application constante; soit À E A sa valeur. La première équation
montre alors que la première composante t ~ cp( t) de cette solution de ( **) est solution
de l'équation (*),pour la valeur À du paramètre. Réciproquement, si t ~ cp(t) est solution
de l'équation (*)pour la valeur À du paramètre, t ~ (cp(t), .X) est solution de ( **).Par
suite, le flot '1! de ( **) n'est autre que
\J!(t,to,(Xo,À)) = (<l>(t,to,Xo,À),À),
158 Chapitre VI. Le flot d'une équation différentielle

et les propriétés de <I> que l'on veut établir découlent immédiatement de celles de '11. D

La méthode utilisée ci-dessus n'est plus applicable lorsque A est un espace topologique
sur lequel on n'a pas défini la notion de différentiabilité. Cependant, le théorème ci-dessus
reste applicable, sous la forme suivante, légèrement plus générale.
3.3. Théorème. - Soient E un espace de Banach réel, A un espace topologique,
n un ouvert de IR x E x A et f : n ~ E une application continue, localement lips-
chitzienne relativement à sa seconde variable. On considère l'équation différentielle
cp'(t) = f(t, cp(t), À).
Pour chaque À E A fixé, on note <I> >. son flot, et on pose
ta, xa, À) = <I> >. (t, ta, xa).
<I>(t,
Alors l'application <I> est définie sur un ouvert de IR x IR x E x A; elle est continue
sur cet ouvert, et localement lipschitzienne relativement à l'ensemble de ses trois
premières variables (t, ta, xa) E IR x IR x E.
Preuve : Nous n'en indiquerons que les grandes lignes. Nous avons établi dans le
chapitre précédent une version du théorème de Cauchy-Lipschitz adaptée aux équations
différentielles dépendant d'un paramètre, de la forme considérée ici (théorème V.2.9).
D'après ce théorème, la solution locale du problème de Cauchy est fonction continue du
paramètre À E A. On peut alors adapter la démonstration des lemmes 2.5 et 2.6, puis
procéder comme pour la démonstration du théorème 2.7. D

4. La différentiabilité du flot
Nous nous intéressons dans ce paragraphe à la différentiabilité et à la régularité du flot
d'une équation différentielle par rapport à l'ensemble des variables dont ce flot dépend. Un
premier résultat très simple, portant sur la régularité par rapport à la variable indépendante,
est donné par la proposition suivante.
4.1. Proposition. - Soient E un espace de Banach réel, n un ouvert de IR x E, et
f: n ~ E une application. On considère l'équation différentielle
cp'(t) = f(t,cp(t)). (1)
Si l'application f est continue, toute solution de cette équation est différentiable
et de classe ci sur son intervalle de définition.
Si l'application f est différentiable et de classe CP (avec p 2: l), toute solution de
l'équation (1) est différentiable et de classe CP+i sur son intervalle de définition.
Preuve: Soit cp : I ~ E une solution de l'équation (1). Par définition, elle est différentiable
sur son intervalle de définition I, donc, a fortiori, continue sur I, et sa dérivée, en chaque
point t de I, a pour expression cp' (t) = f (t, cp(t)).
Supposons l'application f continue. L'application cp' est alors continue sur I, puisque
composée de t t-t ( t, cp( t)), continue car ses deux composantes le sont, et de f, continue
par hypothèse. L'application cp, dérivable et à dérivée continue, est alors de classe ci.
Supposons l'application f différentiable et de classe CP, avec p 2: 1. D'après ce qui
précède, la solution cp est de classe ci. Faisons l'hypothèse de récurrence suivante : la
solution cp est de classe Cq, pour un certain entier q vérifiant 1 :S q :S p. L'application
cp' est alors aussi de classe Cq, car composée de t t-t ( t, cp( t)) et de f, toutes deux de
classe Cq. Mais alors cp est de classe cq+ i puisque sa dérivée cp' est de classe Cq. Comme
§ 4. La différentiabilité du flot 159

d'autre part notre hypothèse de récurrence est vraie pour q = 1, nous avons prouvé que 'P
est de classe CP+ 1 . D

La proposition précédente montre évidemment que lorsque l'application f est différen-


tiable de classe CP, avec p ;::: 1 (resp., continue), le flot (t, ta, xa) ~ <I>(t, ta, xa) de
l'équation différentielle (1), lorsqu'il existe, est de classe CP+ 1 (resp., de classe C 1 ) par
rapport à sa première variable t E JR. L'étude de sa continuité par rapport à l'ensemble de
ses trois variables a été faite au paragraphe 2. Nous allons maintenant nous intéresser à la
différentiabilité du flot par rapport à sa troisième variable xa.
4.2. Proposition. - Soient E un espace de Banach réel, n un ouvert de lR x E, et
f : n --+ E une application continue, ayant une différentielle partielle par rapport
à sa seconde variable, notée Dzf : n --+ .C(E, E), continue sur n. L'équation
différentielle
ip'(t) = f(t,ip(t)) (1)

possède alors les propriétés suivantes.


1. L'équation (1) satisfait les conditions du théorème d'existence et d'unicité
globales V.2.10.
2. Le flot <I> : D --+ E de l'équation (1) possède, en tout point (t, s, u) de son
domaine de défl.nition D, une différentielle partielle par rapport à sa troisième
variable u E E, notée D 3<I>(t, s, u). Pour (s, u) E n B.xé, l'application, défl.nie sur
l'intervalle ouvert I(s,u) = { t E lR ; (t, s, u) E D }, et à valeurs dans .C(E, E),
t ~ 7/J(t) = D3<I>(t, s, u),
est la solution maximale de l'équation différentielle
7/J'(t) = Dzf (t, <I>(t, s, u)) o 7/J(t),
qui satisfait la donnée de Cauchy
7/J(s) = idE ·
3. Le flot <I> est de classe C 1 sur son domaine de déflnition D.
Preuve:
1. Puisque La différentielle partielle D 2 f de f par rapport à sa seconde variable étant
continue, est localement bornée sur n. Tout point (s, u) den possède donc un voisinage
W c n, sur lequel Dzf est majorée en norme par une constante M ;::: O. En restreignant
éventuellement W, nous pouvons le supposer convexe. Pour tous t E JR, x 1 et x 2 E E tels
que (t, x 1 ) et (t, x 2 ) soient éléments de W, nous avons
llJ(t, x2) - f(t, xi) Il :S sup
zE[x1,x2]
llDzf(t, z) li llx2 - xill :S Mllx2 - xil!.

Nous avons prouvé que f est localement lipschitzienne relativement à sa seconde


variable. L'équation différentielle (1) satisfait donc bien les conditions d'application du
théorème V.2.1 O.
2. Dans le membre de droite de l'équation ( *), <I>(t, s, u) doit bien sûr être considéré
comme connu. Cette équation est une équation différentielle linéaire dans l'espace de
Banach .C(E, E), dépendant d'un paramètre (s, u) E lR x E. L'application (t, s, u) ~
Dzf (t, <I>(t, s, u)) est continue, car composée de (t, s, u) ~ (t, <I>(t, s, u)), dont les deux
composantes sont continues, et de Dzf, continue par hypothèse. Ainsi que nous le verrons
dans le chapitre VII, cette équation satisfait les conditions d'application du théorème
160 Chapitre VI. Le flot d'une équation différentielle

d'existence et d'unicité globales. Pour chaque valeur (s, u) du paramètre, elle admet une
solution maximale unique satisfaisant la donnée de Cauchy (s, idE), que nous noterons
t ~ H (t, s, u). Ainsi que nous le verrons bientôt (théorème VIl.1.2), cette solution est
définie pour tout t E I(s,u)· Le théorème 2.7 permet en outre d'affirmer que l'application
H: D--> C(E, E) est continue.
Soit (t 1 , s, u 0 ) E D. Supposons, par exemple, t 1 2: s. Puisque D est ouvert, il existe un
voisinage convexe V de u 0 dans Etel que, pour tout u E V, (t 1 , s, u) E D. La solution
t ~ <I> (t, s, u) de l'équation différentielle ( 1) étant définie sur un intervalle contenant s et
t 1 , nous voyons que pour tout t E [s, t 1 ], (t, s, u) E D. Nous pouvons donc définir, pour
tout u E V et tout t E [s, t 1 ],
h(t, u) = <I>(t, s, u) - <I>(t, s, uo) - H(t, s, uo)(u - uo).
Pour prouver que H(t1,s,uo) est la différentielle de l'application u ~ <I>(t 1,s,u) au
point u 0 , il suffit de prouver que, pour u E V,
h(t1, u) = o(llu - uoll) ·
Pour tout u E V, l'application t ~ h(t, u) est dérivable en tout point de [s, t 1 ], et a pour
dérivée
a h(t, u) = at
at a <I>(t, s, u) - at
a <I>(t, s, u0 ) -
(a
at H(t, s, u0 ) ) (u - u 0 )
= f(t, <I>(t, s, u)) - f(t, <I>(t, s, u0 ))
- D2f(t, <I>(t, s, uo)) o H(t, s, uo) (u - uo).
En ajoutant et retranchant du membre de droite de la dernière égalité l'expression
D2f(t,<I>(t,s,uo))(<I>(t,s,u)-<I>(t,s,uo)),
nous pouvons écrire
a
at h(t,u) = f(t,<I>(t,s,u)) -J(t,<I>(t,s,uo))
- D2f (t, <I>(t, s, uo) )( <I>(t, s, u) - <I>(t, s, uo))
+ D2f (t, <I>(t, s, uo)) h(t, u).
Lors de la démonstration du théorème 2. 7, nous avons vu que pour Il u-u 0 11 assez petit, pour
tout t E [s,t 1 ], le segment de droite joignant les points (t,<I>(t,s,u)) et (t,<I>(t,s,u 0 ))
est contenu dans D. Le théorème des accroissements finis nous permet donc d'écrire
llJ(t,<I>(t,s,u)) -f(t,<I>(t,s,uo)) -D2f(t,<I>(t,s,uo))(<I>(t,s,u)- <I>(t,s,uo))ll
:S sup llD2f(t,À<I>(t,s,u) + (l -À)<I>(t,s,uo)) -D2f(t,<I>(t,s,uo))ll
099
ll<I>(t, s, u) - <I>(t, s, uo)ll ·
L'expression
llD2f (t, À<I>(t, s, u) + (1 - À)<I>(t, s, uo)) - D2f (t, <I>(t, s, uo)) Il
est une fonction continue de (t, À, u), qui, pour chaque À E [O, 1] et chaque t E [s, t 1 ], tend
vers 0 lorsque u tend vers u 0 . Les intervalles [O, 1] et [s, t 1 ] étant compacts, nous pouvons
affirmer que pour tout E: > 0, il existe T/ > 0 tel que, pour tous À E [ü, 1], t E [s, t 1 ] et
u E V vérifiant llu - uoll :S ry, cette expression soit::.; E:. Nous avons donc, pour tout
t E [s, t1] et tout u E V vérifiant llu - uo 11 :S TJ,

11:t h(t,u)ll :S E:ll<I>(t,s,u)-<I>(t,s,uo)ll + llD2f(t,<I>(t,s,uo))ll 11h(t,u)ll ·


§ 4. La différentiabilité du flot 161

Nous savons aussi (2.7) que pour /lu - uoll assez petit, il existe k 2: 0 tel que, pour tout
t E [s, ti],
ll4>(t, s, u) - 4>(t, s, uo) Il ~ kllu - uo Il ·

D'autre part, l'application t ~ Dzf (t, 4>(t, s, u0 )), étant continue, est majorée en norme
sur l'intervalle compact [s, t 1 ] par un réel M > O. Nous avons donc

Il :t h(t, u)ll ~ ekllu - uoll + Mllh(t, u)ll ·


Le lemme de Gronwall implique alors, pour tout t E [s, t 1 ] et tout u E V vérifiant
llu - uoll ~ 'f/,
llh(t, u)ll ~ € kllu - uoll~Mlt-sl - 1).

Cette inégalité est en particulier satisfaite pour t = t 1 , et montre, puisque t: > 0 peut être
choisi arbitrairement petit, que h(t1, u) = o(llu - u0 ll), c'est-à-dire que H(t 1, s, u 0 ) est
la différentielle de l'application u ~ 4>(t 1 , s, u) au point u0 .
3. D'après la définition même du flot, l'application (t, s, u) ~ 4>(t, s, u) a pour dérivée
partielle par rapport à sa première variable
{)
at 4>(t,s,u) = f(t,4>(t,s,u)).
Cette dérivée partielle est continue sur D, car composée de (t, s, u) ~ (t, 4>(t, s, u)), qui
est continue puisque q> est continue, et de f, continue aussi.
Nous avons aussi montré ci-dessus que la différentielle partielle de q> par rapport à sa
troisième variable est la solution maximale du problème de Cauchy
'l/J'(t) = Dzf(t, 4>(t, s, u)) o 'lf;(t),
{
'lj;(s) = idE .
Il s'agit d'une équation différentielle dépendant d'un paramètre (s, u), à laquelle le
théorème 3.2 s'applique. Nous voyons donc que la différentielle partielle de q> par rappmt
à sa troisième variable est continue.
D'après les règles de composition du flot, nous avons
4>(s,t,4>(t,s,u)) = u.
En différentiant cette expression par rapport à u, nous obtenons
D34>(s, t, 4>(t, s, u)) o D34>(t, s, u) = idE .
Ceci montre que D34>(t,s,u) est un élément inversible de C(E,E). Mais alors, nous
pouvons appliquer le théorème des fonctions implicites à l'équation (dans laquelle
l'inconnue est l'élément v de E, les variables indépendantes s E R et u E E, le réel
t étant considéré comme fixé),
4>(s,t,v)=u.

Ce théorème nous permet d'affirmer que la solution de cette équation implicite, qui n'est
autre que V = 4>(t, s, u), est fonction de classe C 1 de (s, u). En particulier, la dérivée
partielle de l'application (t, s, u) ~ 4>(t, s, u) par rapport à sa seconde variables E R
existe et est continue sur D.
L'application q>, dont les différentielles partielles par rapport aux trois variables dont elle
dépend existent et sont continues sur D, est de classe C 1 sur D (théorème 1.5.10). D
162 Chapitre VI. Le flot d'une équation différentielle

4.3. Remarque. - Dans les hypothèses de la proposition précédente, il est facile d'obtenir
l'expression de la dérivée partielle du flot <I> par rapport à sa seconde variable. Il suffit en
effet de dériver par rapport à la variable réelles les deux membres de l'identité
<I>(t, s, <I>(s, t, v)) = v.
Le membre de droite ne dépendant pas des, nous obtenons, en posant <I>(s, t, v) = u,
8<I>(t, s, u) D <I>( ) 8<I>(s, t, v) _ 0
as + 3 t, s, u as - .
Mais d'autre part
8<I>(s,
Bst, v) = f( s, <J> (S, t, V )) = f (s, U ) ,
et nous obtenons
8<I>(t,s,u)
Bs (
=-Da<I>t,s,u )( f (s,u )) .

4.4. Théorème. - Soient E un espace de Banach réel, n un ouvert de lR x E, et


f : n ---+ E une application différentiable de classe CP, avec p ~ 1. Alors le flot <I>
de l'équation différentielle
cp'(t) = f(t,cp(t)) (1)
est différentiable de classe CP.
Preuve: Pour tout entier q ~ 1, soit H(q) l'hypothèse suivante: le flot de toute équation
différentielle dans un espace de Banach réel F, de la forme
7/J'(t)=g(t,7/J(t)), (*)
où g est une application différentiable de classe Cq d'un ouvert W de lR x F dans F, est
de classe cq.
D'après la proposition précédente, l'hypothèse H(l) est vraie. Nous allons montrer que si
H(q) est vraie, alors H(q + 1) est vraie. Considérons donc l'équation différentielle (1), et
supposons f de classe CP, avec p = q + 1. Soit (t, s, u) t--t <I>(t, s, u) son flot. L'équation
(1) vérifiant les conditions d'application de l'hypothèse de récurrence H(q), son flot <I>
est de classe Cq. Nous allons montrer que les dérivées (ou différentielles) partielles de
<I>, par rapport à chacune de ses trois variables, sont de classe Cq. Cela prouvera que la
différentielle de <I> est de classe Cq, donc que <I> est de classe cq+i.
La dérivée partielle de <I> par rapport à sa première variable a pour expression
8<I>(t, s, u) =
at
f (t, <I>( t,s,u )) '
ce qui prouve qu'elle est de classe Cq, puisque composée de (t, s, u) t--t ( t, <I> (t, s, u)),
dont les deux composantes sont de classe cq'
et de f' aussi de classe cq.
D'après 4.2, la différentielle partielle de <I> par rapport à sa troisième variable, notée
D 3 <I>(t, s, u), est solution de l'équation différentielle
7/J'(t) = D2f (t, <I>(t, s, u)) o 7/J(t),
et satisfait la donnée de Cauchy
7/J(s) = idE .
C'est une équation différentielle dépendant d'un paramètre (s, u) E lR x E. En procédant
comme dans la démonstration du théorème 3.2, nous incorporons ce paramètre dans la
donnée de Cauchy, en formant l'équation différentielle à trois composantes
7/J:(t) = D2f (t, <I>(t, s(t), u(t))) o 7/J(t),
{ s(t)=O,
u'(t) = 0.
§ 5. Exercices 163

C'est une équation différentielle de la forme (*),dans l'espace .C(E, E) x lR x E, avec


w = .C(E, E) X n. Elle satisfait les conditions d'application de l'hypothèse de récurrence
H (q); son flot est donc de classe Cq.
Or la différentielle partielle de <I> par rapport à sa troisième variable n'est autre que la
première composante (sur le facteur .C(E, E)) du flot de l'équation ( **),dans laquelle on
donne une valeur fixe idE à la première composante de la donnée de Cauchy. Nous voyons
ainsi que (t, s, u) ~ D 3 <I>(t, s, u) est de classe Cq.
Enfin la dérivée partielle du flot <I> par rapport à sa seconde variable a pour expression
(remarque 4.3)
8<I>(t,s,u)
os = -D3 <I> (t,s,u )(!( s,u)) ,
ce qui prouve qu'elle est de classe cq.
En résumé, nous avons prouvé que l'hypothèse H(l) est vraie et que, pour tout entier
q 2 1, si H (q) est vraie, H (q + 1) est vraie. L'hypothèse H (q) est donc vraie pour tout
entier q 2 1, ce qui établit le résultat annoncé. D

Le résultat ci-dessous traite enfin de la différentiabilité du flot d'une équation différentielle


dépendant d'un paramètre.
4.5. Théorème. - Soient E et F deux espaces de Banach réels, 0 un ouvert de
lR x E x F, et f : 0 ---t E une application différentiable de classe CP, avec p 2 1.
Le flot <I> de l'équation différentielle avec paramètre
<p'(t) = f (t, <p(t), >.)'
considéré comme fonction de la variable indépendante t E E, de la donnée de
Cauchy (s, u) E lR x E, et du paramètre À E F, est différentiable de classe CP.
Preuve : Il suffit d'utiliser la méthode (présentée dans la démonstration de 3.2, et utilisée
aussi dans la démonstration ci-dessus) consistant à incorporer la valeur du paramètre dans
la donnée de Cauchy, et à appliquer le théorème précédent. D

S. Exercices
Exercice Vl.1.
1) On considère l'équation différentielle sur lR: x' (t) = (x( t)) 2 . Vérifier qu'elle satisfait
les hypothèses du théorème de Cauchy-Lipschitz. Déterminer son flot, puis son flot réduit.
On aura soin de préciser soigneusement leurs domaines de définition, ainsi que, pour
chaque donnée initiale x 0 E IR, l'intervalle de définition de la solution maximale de cette
équation prenant la valeur x 0 pour t = O.
2) Mêmes questions pour l'équation différentielle x' (t) = (x(t)) 2 - 4.
3) Mêmes questions pour l'équation différentielle x' (t) = (x (t)) 3 .
4) Mêmes questions pour l'équation différentielle sur ]O, +oo[ x' (t) = -(2x(t) f 1.

Exercice Vl.2. Soit E un IR-espace de Banach et f une application de classe C 1 de E


vers E. On suppose que f est bornée sur E.
Soit (x 0 , y 0 ) E E x E, t 0 E R Étudier l'existence et l'unicité d'une solution maximale
de l'équation différentielle x" (t) = f (x(t)) satisfaisant la donnée de Cauchy x(t 0 ) = x 0 ,
x' (t 0 ) = y0 . Montrer que cette solution maximale est définie sur R
Exercice Vl.3. Soit f une application continue de lR dans !Rn qui ne s'annule pas. On
considère l'équation différentielle:
d~~t) = sin(lly(t)ll)f(t). (E)
164 Chapitre VI. Le flot d'une équation différentielle

1) Soit (t0 , a) un point de lR x ffi.n. Monter qu'il existe une unique solution maximale y
de (E) telle que y(t0 ) =a. .
2 a) Trouver les solutions constantes de l'équation (E).
2 b) Soit cp une solution maximale de (E). En utilisant 2 a, montrer que llcpll est une
fonction bornée et en déduire que cp est définie sur R
3) Soit M > 0 un nombre réel. On suppose que, pour tout réel t, on a llf(t)ll :SM. Soit
a un point de ffi.n et cp la solution maximale de (E) qui vérifie cp(O) = a. Montrer que
llcp(t)ll ~ lialle-Mltl.

Exercice VI.4. Dans cet exercice a est un nombre réel strictement positif.
1) Soit 'Y un réel strictement positif. Trouver la solution maximale '1/J'"Y : I'"Y -+ lR de
léquation différentielle '1/J' (t) = 1 2 + 'lj; 2 ( t) qui vérifie '1/J'"Y (a) = O.
2) Soit f: lR x lR-+ lR l'application f(t, x) = t + x 2 .
2 a) Justifier l'existence et l'unicité d'une solution maximale cp: ]a, ,B[-+ lR de l'équation
différentielle cp' (t) = f (t, cp( t)) qui vérifie cp( a) = O.
2 b) On suppose 1 2 < a. Montrer que, si t E ]a, ,B[ nJ'"Y, on a cp(t) > '1/J'"Y(t). En déduire
que ,8 - a :S 2 fa et que limt-+/3 cp(t) = +oo.

2 c) On suppose 1 2 > a. Montrer que, si t E ]a, ,B[ n ]a, 1 2 [ nJ'"Y, on a cp(t) < '1/J'"Y(t). En
déduire que ]a, ,B[ contient ]a, 1 2 [ nJ'"Y.
2 d) Démontrer que 271" ::; ,8 - a, où /o est la racine positive de l'équation
'Yo
3
'Y - a1 - 271" = 0 .
Exercice VI.5. Soit I un intervalle ouvert de lR contenant 0, a un nombre réel. On
définit une application fo. : lR-+ lR en posant fo.(x) = +a. /iXî
1) On suppose a> 0 et on se limite à l'ouvert JO, +oo[.
1 a) Soient € > 0 et ,B > 0 deux réels. Montrer que l'équation différentielle '1/J' (t)
fo.('1/J(t)) possède une unique solution maximale '1/Je, définie sur un intervalle ouvert J,
telle que '1/Je(€) = ,B (et '1/Je(t) > 0 pour tout t E J).
1 b) En utilisant la majoration JX::; x + 1/2, trouver une majoration de '1/Je et en déduire
que J contient l'intervalle [€, +oo[.
2) On suppose a > O. Soit cp : I -+ lR une solution de l'équation différentielle
cp'(t) = fo.(cp(t)) telle que cp(O) =O.
2 a) Montrer que cp est un C 1 -difféomorphisme de I sur un intervalle ouvert J. Pour y E J,
calculer ( cp- 1 )'(y).
2 b) En remarquant que (cp- 1 )'(y) ::; jyj- 1/ 2 , donner, pour t E Jn]O,+oo[, une
minoration de cp(t).
2 c) Soit € > O. Justifier l'existence d'une unique solution maximale '1/Je de l'équation
différentielle '1/J' (t) = f o ( '1/J( t)) telle que 1/Je (t) > 0 et limt-+e, t>e '1/Je (t) = 0, et vérifier
qu'elle est définie sur ]€, +oo[. Montrer que, pour t E In]€, +oo[, on a cp(t) < '1/Je(t) et
retrouver la minoration obtenue en 2 b.
3) On note E l'espace de Banach des suites x = (xn, n E N) de nombres réels ayant
pour limite 0, muni de la norme llxll = ll(xn)ll = supnEN lxnl· On note Pn la n-ième
projection, Pn ( x) = Xn.
§ 6. Solutions 165

Soit a= (an) une suite fixée de E. On considère l'application f: E ---t E, f(x) =y, où
y = (Yn) est la suite ayant pour termes Yn = +an. n E N.vîXJ
3 a) Montrer que l'application f est continue. [On pourra utiliser la remarque suivante :
pour tout couple (a, b) E JR+ x JR+, (a - b) 2 ::; Ja 2 - b2 1J.
3 b) On suppose qu'il existe une solution <P : I ---t E de l'équation différentielle
<P'(t) = f(<P(t)) telle que cp(O) = 0, où 0 désigne la suite nulle. Montrer que, pour
tout n E N, Pn o </! : I ---t lR est solution de l'équation différentielle cp' (t) = fa,, (cp( t)).
À l'aide de la minoration obtenue en 2, montrer que la solution <P : I ---t E ne peut pas
exister.
3 c) Expliquer pourquoi le résultat précédent ne contredit pas les théorèmes d'existence
de Cauchy-Lipschitz V.2.7 et de Peano V.3.4.
Exercice Vl.6. Soit E un IR-espace vectoriel de dimension finie muni d'un produit
scalaire (x, y) 1-> (xJy). Soit a un réel, a> O.
On considère lapplication f : lR XE ---t Ede classe C 1 vérifiant, pour tout (t, X) E lR XE'
l(x 1J(t,x))I::; a(xlx).
On désigne par cp une solution de l'équation différentielle
cp'(t) = J(t,cp(t))'
et on note I son intervalle ouvert de définition.
1) On pose N(t) = (cp(t) 1 cp(t)). Montrer que l'application N est dérivable sur I, calculer
sa dérivée et montrer qu'elle vérifie IN'
(t) 1 ::; 2aN(t).
2) Soient t 0 et t deux points de I. Comparer N(t) et N(t 0 ).
3) Montrer que les solutions maximales de (*) sont définies sur R
4) Montrer que les solutions maximales du système différentiel
dx(t)
-;ft = 2x(t) + ty(t) + y 2 (t),
{
d~~t) = -tx(t) + y(t) - x(t)y(t),
sont définies sur R

6. Solutions

Solution VI. l. On remarque d'abord que toutes les équations différentielles considérées dans cet exercice sont
de la forme x' ( t) = f ( x( t)), où f est une fonction différentiable de classe 0 00 , donc localement lipschitzienne.
Aussi, ces équations satisfont les hypothèses du théorème de Cauchy-Lipschitz.
1) Considérons l'équation différentielle x'(t) = (x(t)) 2 . La fonction nulle, définie sur IR, est évidemment
solution maximale. En raison de l'unicité, si une solution t f-+ x(t) ne s'annule pas pour une valeur particulière
to de son intervalle de définition, elle ne s'annule pour aucune valeur de t. Par continuité, elle garde un signe
constant. Pour déterminer cette solution, on peut séparer les variables en écrivant l'équation sons la forme

dx
- =dt,
x2

d'où par quadrature, en notant ( to, xo) la donnée de Cauchy,

x(t) = __x_o_ _
1 + xo(to - t)
166 Chapitre VI. Le flot d'une équation différentielle

Le dénominateur du membre de droite de cette expressions' annule pour t = to + x 0 1 . L'intervalle de définition


de la solution maximale qui satisfait la donnée de Cauchy ( to, xo) est le plus grand intervalle contenant to et ne
contenant pas td +x 0 1 . C'est donc

] -oo, to + ~ [ si xo > 0,
{ xo
1
]to + - , +oo[ si xo <O.
xo
Le flot de l'équation s'en déduit; c'est l'application <I>, ayant pour expression
xo
= { J+ xo(to -
si xo =f. 0,
<I>(t, to,xo) t)
si xo =O.

Son domaine de définition est l'ensemble des (t, to, xo) E IR3 qui vérifient

-oo < t < to + ~ si xo > 0,


xo
{ 1
to + - < t < +oo si xo < 0,
Xo
t E IR si xo = O.
Le flot réduit de l'équation s'en déduit en faisant to =O. C'est l'application

xo
---
.
SI XO r_J, 0,
(
t, xo ) >--+ Ill ( t, xo ) ={ 1 - txo
0 si xo =O.

Son domaine de définition est l'ensemble des (t, xo) E IR 2 qui vérifient txo < 1. Dans le plan (t, xo), c'est
l'ensemble des points compris entre les deux branches de l'hyperbole équilatère d'équation txo 1. =
2) On considère l'équation différentielle x' (t) = ( x( t)) 2 - 4. Les solutions constantes, définies sur
IR entier,
sont les applications constantes x(t) = 2 et x(t) = -2. En raison de l'unicité, toute autre solution t >--+ x(t)
qui, pour une valeur particulière to de t, prend une valeur xo autre que 2 et -2, ne prend les valeurs 2 ou -2
pour aucune valeur de t. Par continuité, x(t) - 2 et x(t) + 2 gardent un signe constant. Pour déterminer cette
solution on peut séparer les variables en écrivant léquation sous la forme

dx
--=dt, ou encore ~-~=4dt,
x 2 -4 x-2 x+2
d'où par quadrature
lx(t) - 21 lxo - 21
ln I
X
( )
t + 2I - ln -1

--
21 + = 4( t - to) .

Puisque x(t) - 2 et x(t) + 2 gardent un signe constant, on en déduit


x(t) - 2 xo - 2
X
()t + 2 = - - exp ( 4(t-to) )
Xü + 2
,

d'où finalement
xo + 2 + (xo - 2) exp(4(t- to))
x(t)=2 .
xo + 2- (xo -2)exp(4(t-to))

La solution maximale de l'équation qui satisfait la donnée de Cauchy (to, xo) est définie sur le plus grand
intervalle ouvert contenant to sur lequel le dénominateur du membre de droite de l'égalité ci-dessus ne s'annule
pas, c'est-à-dire sur lequel exp ( 4( t - to)) =I xo + 2 . Cet intervalle est
xo -2

] t0 + 2:. ln xo + 2 , +oo [ si xo < -2,


4 xo - 2
{ IR si - 2 :::; xo :::; 2,
xo + 2 [
] -oo, to + -1 ln - - si 2 < xo.
4 xo -2
§ 6. Solutions 167

Le flot <I> de 1' équation, défini sur lensemble des ( t, to, xo) E IR 3 qui vérifient ces conditions, a pour expression

xo + 2 + (xo - 2)exp(4(t- to))


si xo =f. ±2,
<I>(t, t 0 , xo) = { 2 xo + 2 - (xo - 2) exp( 4(t - to))
-2 si xo = -2,
2 si xo = 2.

Le flot réduit s'en déduit en faisant to = O. Il est défini sur l'ensemble des (t, xo) E IR 2 qui vérifient
1 xo+2 .
t >-
in - - - SI XO < -2,
{ 4 xo - 2
t E IR si - 2 :::; xo :::; 2,
1 xo + 2
t < - ln - - - si 2 < xo.
4 xo - 2

3) On considère léquation différentielle x' (t) = (x( t)) 3 . En procédant comme dans la question l, on voit que
lapplication nulle, définie sur IR, est une solution maximale et que toute autre solution maximale, vérifiant la
donnée de Cauchy (to, xo). avec xo =f. 0, est donnée par
xo
x(t) = .
J1+2x6(to - t)

Elle est définie sur le plus grand intervalle ouvert contenant to sur lequel l'expression qui figure au membre de
droite de l'égalité ci-dessus, sous le signe v• est strictement positive. C'est l'intervalle )-oo, to + ~ [.Le
2x 0
flot de léquation est lapplication

xo
si xo =f. 0,
<I>(t, to, xo) ={ 0
J1 + 2x6(to - t)
si xo =O.

Il est défini sur l'ensemble des (t, to, xo) E IR 3 qui vérifient 2x6(t - to)< 1.
L'expression du flot réduit, et son domaine de définition, s'en déduisent en faisant to =O.
4) L'équation différentielle x' (t) = -( 2x(t) )- 1 , sur JO, +oo[, se résoud par séparation des variables, comme
celle considérée à la question l. La solution maximale vérifiant la donnée de Cauchy (to, xo). avec xo > 0,
est x(t) = J x6 + to - t. Elle est définie sur l'intervalle J - oo, to + x6(. Le flot de l'équation, défini sur
l'ensemble des (t, to, xo) E IR 2 x JO, +oo( qui vérifient t < to + x6. est l'application

<I>(t,to,xo) = Jx6 +to -t.

Le flot réduit et son domaine de définition s'en déduisent en faisant to = O.


Solution VI.2. On pose M = supxEE f(x). Mettons l'équation différentielle
x"(t) = f (x(t)) (1)

sous forme canonique, comme indiqué en VI. l.4. Soit x : J -+ E une solution de cette équation. Pour t E J,
on pose cp( t) = (x(t), x' (t)). On introduit l'équation différentielle

X'(t) = F(t,X(t)), (2)

où lapplication F : IR x E 2 -+ E 2 est définie par

F(t,X) = F(t,(x,y)) = (y,f(x)).


Ainsi x : J -+ E est solution (maximale) de l'équation différentielle (1) si et seulement si cp : J -+ E 2 est
solution (maximale) de l'équation différentielle (2).
L'application Fest de classe C 1 sur son domaine de définition, elle vérifie donc les conditions d'application
du théorème de Cauchy-Lipschitz (forme globale V.2.10), ce qui prouve l'existence et l'unicité d'une solution
168 Chapitre VI. Le flot d'une équation différentielle

maximale de (2) satisfaisant une donnée de Cauchy quelconque ( to, (xo, yo)). Il existe donc une unique solution
maximale x : I --> Ede (1) telle que x(to) = xo. x' (to) = yo.
Montrons maintenant que l = IR. Supposons par exemple la borne supérieure f3 de I finie (le raisonnement serait
analogue pour l'étude de sa borne inférieure). Choisissons pour norme dans Ex E ll(x, y)ll = llxll + llYll·
Puisque cp = (x, x') est solution de (2), sur l'intervalle I, on a, pour tout t E I, cp'(t) = F( t, cp(t)) =
( x' ( t), f (x( t))), ce qui entraîne, puisque f est bornée par M sur E,

llcp'(t)ll S llcp(t)ll +M.


Nous pouvons appliquer à cp l'inégalité de Gronwall (1.7) ce qui donne, pour tout t E [to, /3[,

llcp(t) Il S llcp(to) llelt-to 1 + M ( elt-tol - 1) S llcp(to) lle,6-to +M ( e.B-to - 1) ,

ce qui prouve que cp est bornée sur l. Dans ces conditions, cp 1 l'est également et, d'après le théorème V.4.2, cp(t)
admet une limite f E E lorsque t tend vers {3. Le bout droit de la solution maximale cp est donc le singleton (/3, f)
qui, toujours d'après V.4.2 doit appartenir à la frontière de IR x E 2 . Mais celle-ci étant vide, il y a contradiction.
On a ainsi prouvé que f3 =
+oo et donc finalement que I IR. =
Solution VI.3.
1) Soit F : IR x !Rn --> !Rn l'application F(t, y) = sin(llyll)J(t). Cette application est continue puisque f
l'est. De plus, le théorème des accroissements finis appliqué à la fonction sin donne, pour tous y et y' E !Rn,
lsinllYll - sinlly'lll S lllYll - llY'lll S llY - y'll· On obtient alors, pour tous t E IR, y et y' E !Rn,
llF(t, y) - F(t, y')ll S 11/(t)ll llY - y' Il· Mais f est continue, donc bornée sur tout intervalle borné de IR;
l'inégalité précédente prouve donc que F est localement lipschitzienne par rapport à sa seconde variable y au
voisinage de chaque point de IR x !Rn. On peut appliquer le théorme V.2.10 à l'équation différentielle

dy(t) = sin(lly(t)ll)/(t), (E)


dt
et conclure qu'elle possède une unique solution maximale y satisfaisant une donnée de Cauchy ( to, a) E IR x !Rn.
2 a) Les solutions maximales constantes de (E) sont définies sur IR. Ce sont les constantes llYll = k-rr, k E Z.
2 b) Soit cp une solution maximale de (E), I = Ja, b[ son intervalle de définition. Supposons que b E IRt. Soit
to E I et t E [to, b[. Puisque f est bornée sur [to, b[, posons M = supto::; t<b Il/ (t) Il· La solution cp vérifie
cp'(t) = sin(llcp(t)ll)/(t), donc llcp'(t)ll S Mllcp(t)ll· Grâce à l'inégalité de Gronwall 1.7, on en déduit

llcp(t)ll S llcp(to)lleM(t-to) S llcp(to)lleM(b-to),

ce qui prouve que cp est borné sur [to, b[. Par suite, cp' l'est aussi.
Le théorème des bouts V.4.3 s'applique : l'application cp admet une limite finie f quand t tend vers b, le bout droit
de cp contient l'unique élément (b, f) de IR x !Rn, qui doit appartenir à la frontière de IR x !Rn. C'est impossible
car celle-ci est vide. On a ainsi prouvé que b = +oo. Un raisonnement analogue prouverait que a = -oo.
L'application cp est donc définie sur R
3) Soit cp la solution maximale de (E) telle que cp(O) = a. Un raisonnement analogue à celui fait dans la question
précédente prouve que, pour tout t E IR. llcp'(t)ll S Mllcp(t)ll d'où, toujours d'après l'inégalité de Gronwall,

llalle-Mltl S llcp(t)ll S llalleMltl.

Solution VI.4.
1) L'application x ,...... "Y 2 + x 2 étant de classe Coo sur IR, le théorème de Cauchy-Lipschitz V.2. 10 s'applique
à l'équation différentielle autonome 'lf;'(t) = "Y 2 + 'f/; 2 (t). Cette équation admet donc une unique solution
maximale 'lj;'Y, définie sur un intervalle ouvert I'Y, vérifiant 'lf;'Y(a) = O. On remarque que .!, arctan(:'.)
"Y "Y
a pour dérivée~· L'application 'lj;'Y vérifie donc .!.arctan('f/;'Y(t)) = t - a, ce qui implique que
"Y +x "Y "Y
"Y( t - a) E) - 7r /2,
-rr /2[. L' application 'lj;'Y est donc définie sur l'intervalle I'Y = Ja - 7r /(2"Y) , a+ 7r / (2"Y) [,
et a pour expression 'lj;'Y (t) = "Y tan ("Y( t - a)).
§ 6. Solutions 169

2 a) L'application de lR x lR vers IR, f (t, x) = t + x 2 , est de classe e 00 , ce qui justifie (voir V.2.10) l'existence
et l'unicité d'une solution maximale rp de l'équation différentielle rp' (t) = f ( t, rp( t)) vérifiant rp( a) = O. Soit
Ja, ,6[ son intervalle de définition.
2 b) On suppose 'Y 2 < a. On a 1/J"t(a) = rp(a) et, pour tout (t, x) E [a, +oo[ xlR, 'Y 2 + x 2 < t + x 2 . On
applique le corollaire 1.2. pour conclure que, si t E Ja, ,6[ nl"I, on a rp(t) > 1/J"t(t).
Supposons ,6 > a + 7r /(2"f). Alors, pour tout t E [a, a + 7r /(2'Y)[, rp(t) > 1/J"t(t) et comme
limt-+a+.,,./(2"1) 1/J"t(t) = +oo, on a également limt-+a+.,,.;( 2"1) rp(t) = +oo, ce qui est impossible,
l'application rp étant définie au point a+ 7r/(2"f). Ainsi ,6:::; a+ 7r/(2"f). Ce résultat est vrai pour tout 'Y
vérifiant 'Y < fa, on obtient finalement ,6 - a :::; 7r / (2fo,).
Pour tout t E [a,,6[. on a rp'(t) = t + rp 2 (t) 2: a+ rp 2 (t). Puisque a> 0, l'application rp est strictement
croissante sur cet intervalle. De plus, elle n'est pas majorée, car si elle l'était, rp(t) aurait une limite e E lR
lorsque t --+ ,6, et le bout droit de rp contiendrait l'unique point (,6, e), ce qui est impossible d'après V.4.3, car
la frontière du domaine de définition de l'application f est vide. On a donc limt-+ f3 rp( t) = +oo.
2 c) On suppose 'Y 2 > a. On a 1/J"t(a) = rp(a) et, pour tout (t, x) E [a, 'Y 2 [ xlR, t + x 2 < 'Y 2 + x 2 , donc
(corollaire 1.2.), si t EJa,,6[nJa,"f 2 [nI"I, on arp(t) < 1/J"t(t).
Supposons maintenant ,6 < 'Y 2 et ,6 < a+ 7r /(2"f). Alors, pour tout t E Ja, ,6[, rp(t) < 1/J"t(t). Sur cet
intervalle, l'application rp est croissante, majorée par 1f;"l(,6), donc elle admet une limite au point ,6. Le bout
droit de rp ne serait pas vide, ce qui est impossible. On a donc ,6 2: "( 2 ou ,6 2: a + 7r / (2'Y); en d'autres termes,
Ja, ,6[ contient Ja, 'Y 2 [ nl"I.
2 d) On vérifie facilement que léquation 'Y 3 - a"( - 7r /2 = 0 a une unique racine strictement positive 'YO. Cette
racine vérifie aussi .,,5 'Y5.
= a+ 7r /(2'Yo ), donc a < On peut utiliser les résultats de la question précédente et
conclure que a+ 7r /(2'Yo) :::; ,6.
7r 7r
On a finalement obtenu l'encadrement - < ,6 - a < r,::.
2'Yo - - 2va
Solution VI.5.
1 a) Soit ê > 0 et ,6 > O. L'équation différentielle autonome 1f;' (t) = f o: ( 1f;( t)) satisfait les hypothèses
du théorème de Cauchy-Lipschitz V.2.10, puisque f o: est de classe e 00 sur JO, +oo[. Elle possède donc une
solution maximale 1/Je et une seule vérifiant 1/Je(ê) = ,6. Soit J son intervalle de définition. Pour tout t E J,
1/Je (t) > 0, puisque 1f;,, prend ses valeurs dans JO, +oo[.
1 b) On vérifie que, pour tout x > 0, .,/X :::; x + 1/2. On a donc, pour tout t E J,

soit

Par l'inégalité de Gronwall 1.7, on obtient pour tout t E J vérifiant t 2: ê,

Supposons sup( J) = b < +oo. Nous avons donc, pour t E [ê, b[,

ce qui prouve que 1/Je est bornée sur [ê, b[. Par suite, 1f;~ lest aussi.
D'après le théorème V.4.3, 1/Je(t) a une limite finie equand t--+ b. Or 1/J~ > 0 et par suite 1f;,, est croissante sur
[ê, b[ d'où e > O. Le bout droit de 1/Je contient le point (b, e), mais (b, e) E IRxJO, +oo[, ce qui est impossible
car, toujours d'après V.4.3, il devrait appartenir à la frontière de lR x JO, +oo [,qui est lR X { 0}, ce qui impliquerait
e =o.
Finalement, sup(J) = +oo et [ê, +oo[ C J.
2 a) Pour t E I, on a rp' ( t) >
O. L'application rp, de classe et, est strictement croissante sur I. C'est un
1
et-difféomorphisme de I sur son image J = rp(I). Pour y E J, on a (rp-t)'(y) = t( ) . Mais
rp' 0 rp- y
170 Chapitre VI. Le flot d'une équation différentielle

1
2 b) Comme a > 0, (c,o- 1 )'(y) < !Li' De plus, c,o- 1 (0) = O. Donc, pour y > 0, on obtient, en intégrant
ylYI
les deux membres de cette inégalité entre 0 et y, c,o- 1 (y) < 2..jY.
Soit t E I, t > O. On pose y = c,o(t). On a bien y > 0 puisque c,o est strictement croissante. L'inégalité
précédente devient t < 2J;(t} d'où, pour tout t E I, t > 0, t 2 /4 < c,o(t).

2 c) Toute solution maximale de l'équation différentielle 'l/J' (t) = fo ( 'l/J(t)) à valeurs dans JO, +oo( vérifie
2~ = t - k, où k est une constante réelle. Cette solution est définie sur ]k, +oo(. L'unique solution
maximale définie sur Je, +oo( qui vérifie 'l/Je(t) > 0 et limt ..... e, t>e 'l/Je(t) = 0, s'obtient en choisissant
k = ê. On a donc
'l/Je(t) =(t; ê)2
Les fonctions c,o et 'l/Je vérifient :
limt--<e, t>e 'l/Je(t) < cp(ë),
pour tout t E ]ê, +oo( nI, 'ljJ~ (t) < f °' ('l/Je(t)).
Alors, par application du lemme 1.1, pourtout t E )ê + oo( nI, 'l/Je (t) < c,o(t).
Finalement, pour tout ê > 0 et tout t E Je, +oo( nI, (t - ê) 2 /4 < c,o(t). Par passage à la limite quand ê--+ 0,
on voit que pout tout t E I, t > 0, t 2 /4 $ c,o(t).
3a)Soientx = (xn, n E N)etx' = (x~, n E N)deuxélémentsdeE.Onadonc/(x)-/(x') = ( ~­
~. n E N).Pourtoutn EN, ( ~ - ~) 2 $ lxn-x~l.d'où llf(x)-f(x')ll 2 $ llx-x'll.
ce qui prouve la continuité de f sur E.
3 b) L'application Pn o <P est dérivable sur I et, pour tout t E I, (Pn o <P )' (t) = p~ ( <P( t)) o <P' (t). Mais Pn est
une application linéaire continue et, en tout point x de E, p~ ( x) = Pn. Finalement,

Ceci prouve que Pn o <Pest la solution, définie sur I, de l'équation différentielle c,o' (t) = fan ( c,o(t)), qui vérifie
c,o(O) =O.
La minoration obtenue en 2 donne, pour tout t E I et tout n E N, t 2 / 4 $ Pn o <P( t). Dans ces conditions, pour
t fixé, Pn o <P(t) ne saurait tendre vers 0 lorsque n--+ +oo. Par suite, <P(t) ne peut pas être élément de l'espace
E. Ainsi, la solution <P ne peut pas exister.
3 c) Le théorème de Cauchy-Lipschitz ne s'applique pas dans ce cas, car l'application f n'est pas localement
lipschitzienne au voisinage de 0 : si elle létait, Pn of le serait aussi, ce qui est impossible car sur IR, lapplication
x >--+.JFI n'est pas localement lipschitzienne au voisinage de O.
Le théorème de Peano ne s'applique pas non plus, car l'espace E est de dimension infinie.

Solution Vl.6.
1) Soit c,o une solution, définie sur un intervalle ouvert I, de l'équation différentielle

c,o'(t) = f(t,c,o(t)).

L'application N est la composée de deux applications de classe C 1 : lapplication t >--+ ( c,o( t), c,o( t)), dont la
dérivée au point test ( c,o' (t), c,o' (t)); l'application produit scalaire (x, y) >--+ (xly ), bilinéaire continue, dont
la différentielle au point (x, y) est l'application linéaire (h, k) >--+ (xlk) + (hly). L'application N est donc de
classe C 1 . Sa dérivée au point t est donnée par la formule de déri'vation des fonctions composées :

N' (t) = 2 ( c,o( t) 1 c,o' (t)) .

Or pour tout (t, x) E IR x E, l'application f vérifie 1( x 1 /(t, x)) 1 $ a(xlx), ce qui implique, puisque
c,o' (t) = f ( t, c,o(t)), IN' (t)I $ 2aN(t).
2) L'inégalité précédente s'écrit encore, puisque N est positive sur I, IN' (t)I $ 2alN(t)I. Soient to et t deux
points de I. L'inégalité de Gronwall 1.7, appliquée à N, donne, pour tout t E I,

N(to)e-2alt-tol $ N(t) $ N(to)e2alt-tol.


§ 6. Solutions 171

3) On suppose maintenant que cp est une solution maximale de l'équation différnetielle ( *), définie sur
l'intervalle ouvert I =]a, ,B[. Supposons ,B < +oo. L'application N est alors majorée, sur l'intervalle [to, ,B[
par N(t 0 )e 2 a(/3-to). Mais N(t) = llcp(t)ll 2 . Ainsi, l'application cp est alors bornée sur cet intervalle par
A= llcp(to)llea(/3-to).
Soit B la boule fermée de Ede centre 0 et de rayon A. Lorsque t E [to, ,B[, le graphe de cp est contenu dans la
partie fermée et bornée [to, ,B] x B de IR x E. L'espace E étant de dimension finie, [to, ,B] x Best une partie
compacte de IR x E. L'application f étant de classe C 1 sur IR x E, la frontière de son domaine de définition
est vide donc, d'après V.4.2, le bout droit de la solution maximale cp est vide. Mais alors, toujours d'après V.4.2,
il existe E: > 0 tel que pour tout t E ],B - E:, ,B[, ( t, cp( t)) ~ [to, ,B] x B. On aboutit à une contradiction. On a
ainsi montré que ,B = +oo. On montrerait de même que a = -oo, donc que les solutions maximales de ( *)
sont définies sur IR.
4) Soit f : IR x IR 2 ---+ IR 2 l'application f (t, (x, y)) = (2x + ty + y 2 , -tx +y -xy). On muni IR 2 du produit
scalaire usuel. On a ((x,y) 1 f (t, (x,y))) = 2x 2 + y 2 ~ 2(x 2 + y 2 ) = 2((x,y) 1 (x,y)). On peut donc
appliquer les résultats précédents (prendre a = 2) : les solutions maximales du système différentiel considéré
sont définies sur IR.
Chapitre VI 1
Équations différentielles linéaires

Les équations différentielles linéaires forment une classe particulière d'équations ayant des
propriétés relativement simples. On observera en particulier que les solutions maximales
d'une équation linéaire sont définies sur l'intervalle sur lequel l'équation elle-même est
définie, et que le flot d'une équation différentielle linéaire et homogène s'exprime au
moyen de la résolvante, famille paramétrée d'isomorphismes linéaires.
Ainsi qu'on l'a vu à la fin du chapitre précédent (proposition VI.4.2), la différentielle
partielle, par rapport à sa troisième variable, du flot d'une équation différentielle de la
forme cp'(t) = f(t, cp(t)), où f est une fonction différentiable de classe CP, est solution
d'une équation différentielle linéaire. Cette propriété, qui est à la base de la méthode de
linéarisation pour l'étude des solutions d'une équation différentielle voisines d'une solution
particulière connue, est une des raisons de l'importance des équations différentielles
linéaires.

1. Propriétés générales

1.1. Définition. - Soit E un espace de Banach. L'équation différentielle, dans


l'espace E,
cp'(t) = f(t,cp(t)),

où f est une application d'un ouvert n de IR x E dans E, est dite linéaire si l'ouvert
n est de la forme I x E, où I est un intervalle ouvert de IR, et si l'application f
est de la forme
f(t, x) = A(t) x + b(t),
où A est une application continue de I dans .C(E, E) et b une application continue
de I dans E. Cette équation différentielle linéaire est dite homogène si, de plus,
b =o.
1.2. Théorème d'existence. - On considère l'équation différentielle linéaire, dans
l'espace de Banach E,
cp'(t) = A(t) cp(t) + b(t),
où A et b sont des applications continues d'un intervalle ouvert Ide IR, respective-
ment dans .C(E, E) et dans E. Pour toute donnée de Cauchy (t0 , x 0 ) E IR x E, cette
équation différentielle a une solution maximale unique cp satisfaisant cette donnée
de Cauchy, c'est-à-dire vérifiant cp(to) = xo. De plus, cette solution maximale est
définie sur tout l'intervalle I. Autrement dit, le flot de cette équation différentielle
est défini sur l'ouvert D = I x I x E de IR x IR x E.
§ 1. Propriétés générales 173

Preuve : Les applications A et b étant continues, l'application (t, x) t-t f(t, x) =


A(t) x + b(t) est continue. Soient t E J, x et y E E. Nous avons
llJ(t,x)- f(t,y)ll ~ llA(t)ll llx-yll ·
L'application A, étant continue, est bornée sur toute partie compacte de I. Tout point
de I ayant un voisinage compact, l'inégalité ci-dessus prouve que l'application f est
localement lipschitzienne par rapport à sa seconde variable. Les théorèmes de Cauchy-
Lipschitz et d'existence et d'unicité globales montrent alors que pour toute donnée de
Cauchy (t 0 , x 0 ) E I x E, il existe une solution maximale unique <p de l'équation vérifiant
cette donnée.
Posons I =]a, b[, et soit ]a, ,8[ l'intervalle de définition de la solution maximale <p. Nous
avons bien sûr a ~ a < /3 ~ b. Supposons ,8 < b, et soit d un point de ]a, ,8[. Les
applications A et b sont bornées en norme sur l'intervalle compact [d, ,8], par des réels
notés, respectivement, Met N. Nous pouvons leur imposer de vérifier M > 0, N 2: O.
Nous avons, pour tout t E [d, ,8[,
ll<p'(t)ll ~M ll<p(t) Il+ N,
ce qui implique, d'après l'inégalité de Gronwall,

ll'P'(t)ll ~ ll'P'(d)ll eM<t-d) + z 1)


z
(eM<t-d) -

~ ll<p'(d)ll eM(f3-d) + (eM(f3-d) -1)


La fonction <p1 est donc bornée au voisinage de l'extrémité droite /3 de l'intervalle de
définition de <p. Par suite, la limite limt-+f3 <p( t) existe, et (/3, Iimt-+f3 <p( t)) est )'unique
point du bout droit de la solution <p. D'après le théorème V.4.3, il devrait appartenir à la
frontière de I x E, c'est-à-dire à {a, b} x E, ce qui n'est pas le cas puisque nous avons
supposé a ~ a < /3 < b. Puisque l'hypothèse /3 < b nous a conduit à une contradiction,
nous concluons que /3 = b. De même, nous pouvons montrer que a = a. 0
1.3. Proposition. - On considère l'équation différentielle linéaire, dans l'espace de
Banach E,
<p'(t) = A(t) <p(t) + b(t),
où A et b sont des applications continues d'un intervalle ouvert Ide IR, respective-
ment dans .C(E, E) et dans E. Soit <po une solution maximale de cette équation.
Toute autre solution maximale <p : I - E de l'équation (*) est nécessairement
de la forme <p = <po + 1/J, où 1/J : I - E est une solution maximale de l'équation
différentielle linéaire homogène
1/J' (t) = A( t) 1/J( t) . (**)
Réciproquement, pour toute solution maximale 1/J : I - E de l'équation
différentielle linéaire homogène (**), <p = <po + 1/J est solution maximale de
l'équation linéaire (1).
L'équation linéaire homogène (**) est dite associée à l'équation différentielle
linéaire (1).
Preuve : Un calcul simple montre immédiatement que si <p est solution maximale de ( *),
1/J = <p- <po est solution de (**),sûrement maximale puisque définie sur I entier. Le même
calcul simple montre que réciproquement, si 1/J est solution maximale de (** ), <p = <po + 1/J
est solution maximale de (*). 0
174 Chapitre VII. Équations différentielles linéaires

2. Équations différentielles linéaires homogènes

2.1. Proposition. - On considère l'équation différentielle linéaire homogène, dans


l'espace de Banach E,
c.p'(t) = A(t) c.p(t),
où A est une application continue d'un intervalle ouvert I de lR dans l'espace
.C(E, E) des applications linéaires continues de E dans lui-même.
1. L'ensemble M des solutions maximales Je l'équation ( *) est un sous-espace
vectoriel de l'espace C(I, E) des applications continues de I dans E.
2. Soit to un point de I. L'application qui associe, à chaque solution maximale c.p
de l'équation (*), sa valeur c.p( t 0 ) au point t 0 , est une application linéaire bijective
de M sur E. De plus, pour toute partie compacte non vide K de I, l'application
<p ~ llc.pl!K = sup//c.p(t)//, c.p E M,
tEK

est une norme sur M. L'espace M étant muni de cette norme, l'application de M
sur E : c.p ~ c.p(t0 ), est continue et d'inverse continue.
Preuve : La vérification de la propriété 1 est immédiate. Montrons la propriété 2.
L'application de M dans E, c.p ~ c.p(t0 ), est évidemment linéaire. D'après le théorème
d'existence et d'unicité globales, elle est bijective, puisque pour tout x 0 E E, il existe une
solution maximale unique c.p de l'équation (1) qui vérifie c.p(t0 ) = x 0 .
Soit K une partie compacte de I. Une solution maximale c.p de (*) non identiquement nulle
ne s'annule en aucun point de K, car si elle s'annulait en un point () E K, il existerait deux
solutions maximales distinctes de (*)satisfaisant la donnée de Cauchy (0, 0), la solution
c.p et l'application identiquement nulle. Nous avons donc nécessairement llc.pllK =I= O. Il est
alors facile de vérifier que l'application de M dans IR, c.p ~ llc.pllK, vérifie bien les autres
propriétés d'une norme (homogénéité et sous-additivité); c'est donc une norme sur M.
Soit K 1 un intervalle fermé et borné de IR, contenu dans I, et contenant à la fois K et t 0 .
L'application A, étant continue, est majorée par un réel M ;::: 0 sur le compact K 1 . Nous
avons, pour tout t E K 1 ,

Notons l la longueur de l'intervalle K 1 . L'inégalité de Gronwall montre alors que pour


tout t E K1,

Nous en déduisons

ce qui prouve que lorsque M est muni de la norme c.p ~ llc.pllK. l'application linéaire
bijective de M dans E, c.p ~ c.p(t0 ), est continue et d'inverse continue. D
2.2. Remarque. - Dans les hypothèses de la proposition précédente, on ne peut en
général pas munir M de la norme de la convergence uniforme sur l'intervalle I entier, qui
n'est pas compact.
2.3. Proposition. - On considère l'équation différentielle linéaire homogène, dans
l'espace de Banach E,
c.p'(t) = A(t) c.p(t),
§ 2. Équations différentielles linéaires homogènes 175

où A est une application continue d'un intervalle ouvert I de lR dans l'espace


.C(E, E) des applications linéaires continues de E dans lui-même. Le flot <I> de
cette équation est de la forme
<I>(t, to, xo) = R(t, to) Xo,
où, pour tous to et t E J, R(t, t 0 ) est un élément de l'ouvert GL(E) de .C(E, E)
(ensemble des applications linéaires inversibles, continues ainsi que leur inverse,
de E dans lui-même). L'application de I x I dans GL(E), (t, t 0 ) f-t R(t, t 0 ), est
appelée résolvante de l'équation différentielle linéaire (*).
Preuve : Soient t 0 et t deux éléments de I. D'après la proposition 2.1, l'application de E
dans lui-même x 0 f-t <I>(t, t 0 , x 0 ) est composée de deux applications linéaires bijectives:
l'application qui, à un élément x 0 de E, fait correspondre l'élément unique cp de l'espace
M des solutions maximales de (*) qui vérifie cp( t 0 ) = x 0 , et l'application de M dans E
qui, à l'élément cp de M, fait correspondre l'élément cp(t) de E. C'est donc une application
linéaire et bijective de E sur lui-même. En choisissant une partie non vide quelconque K
de I et en munissant M de la norme cp f-t ll'PllK, nous voyons de plus que cette application
est continue et d'inverse continue, car composée de deux applications continues ainsi que
leurs inverses. Le flot <I> de l'équation ( *) a donc bien pour expression
<I>(t, to, xo) = R(t, to) xo,
où, pour tous t 0 et t E /, R(t, t 0 ) est élément de GL(E). D

2.4. Proposition. - Les hypothèses et notations étant celles de la proposition 2.3,


la résolvante R de l'équation différentielle linéaire homogène (*) vérifie, pour tous
to, ti et t2 E J,

ce qui implique
R(t1, to)- 1 = R(to, ti).

Preuve : Ces propriétés ne sont que la traduction, dans le cas présent, des règles de
composition du flot d'une équation différentielle (proposition VI.2.3). D
2.5. Théorème. - On considère l'équation différentielle linéaire homogène, dans
l'espace de Banach E,
cp'(t) = A(t) cp(t),

où A est une application continue d'un intervalle ouvert I de lR dans l'espace


.C(E, E). Soit R la résolvante de cette équation, et t 0 un élément de I. L'application
de I dans .C(E, E),
t f-t U(t) = R(t, to),

est différentiable de classe C 1 , et c'est l'unique solution maximale de l'équation


différentielle, dans l'espace de Banach .C(E, E),
U'(t) = A(t) o U(t),
qui satisfait la donnée de Cauchy (t0 , idE), c'est-à-dire qui vérifie U(to) = idE.
L'équation différentielle linéaire homogène (**) est appelée équation résolvante de
l'équation ( *).
176 Chapitre VII. Équations différentielles linéaires

Preuve: Pour alléger l'écriture et éviter les confusions, posons E = .C(E, E), et pour tout
t E J, désignons par A(t) l'application de E dans lui-même
A(t)(u) = A(t) ou, u E E = .C(E, E).
Pour tout t E J, l'application A(t) de E dans lui-même est évidemment linéaire. Elle est
continue, de norme majorée par llA(t)ll, puisque

llA(t)(u)li = llA(t) o ull ~ llA(t)ll llul/, u E E = .C(E, E).


De plus, l'application A: I-+ .C(E, E) est continue en tout point t 0 E J. Nous avons en
effet, pour tout u E E,
11 (A (t) - A(to)) (u) 11 ~ 11 A ( t) - A (to) 11 // u 11 ,

donc
llA(t) - A(to) Il ~ llA(t) - A(to)ll,

de sorte que la continuité de A au point t 0 implique celle de A au même point.


L'équation différentielle ( ** ), qui peut s'écrire
U'(t) = A(t) U(t)'
est une équation différentielle linéaire et homogène dans l'espace de Banach E, à laquelle
s'applique le théorème 1.2. Elle possède donc une solution maximale unique U vérifiant
U(t 0 ) = idE. Posons alors, pour tout t E J, ip(t) = U(t) x 0 . L'application <p : I -+ E
est de classe ci, car composée de U : I -+ E, qui est de classe ci, et de l'application de
E dans E, u !-? u(x 0 ), qui est linéaire continue, de norme llxoll, donc de classe ci. En
calculant sa différentielle, nous obtenons
<p1 (t) = U' (t) x 0 = A(t)(U(t)) x 0 = A(t) o U(t) x 0 = A(t) ip(t) ,
ce qui prouve que <p est solution de l'équation différentielle (1). Cette solution vérifie bien
sûr cp(t 0 ) = x 0 , donc n'est autre que t !-? R(t, t 0 ) x 0 . Nous avons donc bien, pour tout
t E J, U(t) = R(t, t 0 ), ce qui établit le résultat annoncé. D

2.6. Théorème. - On considère l'équation différentielle linéaire homogène, dans


l'espace de Banach E,
cp'(t) = A(t) cp(t),
où A est une application continue d'un intervalle ouvert I de lR dans l'espace
.C(E, E). Sa résolvante R est une application différentiable de classe ci de I x I
dans .C(E, E).
Preuve: Considérons momentanément t 0 comme un élément fixé de I. D'après le théorème
précédent, l'application t !-? R(t, t 0 ) est la solution maximale de l'équation résolvante ( **)
qui vérifie la donnée de Cauchy (t 0 , idE)· C'est donc une application qui est différentiable
de classe ci par rapport à la variable t. Mais d'après le théorème de continuité du flot VI.2.7,
appliqué à l'équation résolvante, l'application Rest continue par rapport à l'ensemble de
ses deux variables (t, t 0 ). En écrivant l'équation résolvante sous la forme

oR(t, to) = A(t) o R(t t )


ot ' 0 '
nous voyons que la dérivée partielle de R par rapport à sa première variable est une fonction
continue de (t, t 0 ).
Considérons maintenant t comme un élément fixé de I. D'après 2.4, nous avons
R(t, to) = R(t0 , t)-i.
§ 3. Méthode de variation de la constante 177

L'application t 0 1---4 R(t, t 0 ) est donc composée de l'application t 0 1---4 R(t0 , t), qui est de
classe ci, et de l'application de l'ouvert GL(E) de .C(E, E) dans .C(E, E), u 1---4 u-i, qui
est de classe C 00 (proposition III.3.2), donc a fortiori de classe ci. Par suite, t 0 1---4 R( t, t 0 )
est de classe ci.D'après la règle de différentiation des applications composées, nous avons
fJR(t, to) = - R( to, t )-i 0 8R(to,
ato t) 0 R( to, t )-i
ato
= -R(t, t 0 ) o A(t0 ) o R(t 0 , t) o R(t0 , t)-i
= -R(t, to) o A(to).
La dernière égalité montre que la dérivée partielle de R par rapport à sa seconde variable
est fonction continue de (t, t 0 ).
La résolvante R, dont les dérivées partielles par rapport à chacune des deux variables t et
t 0 dont elle dépend existent et sont des fonctions continues de (t, t 0 ), est de classe ci. D
2.7. Remarque. - D'après le théorème 2.5, la résolvante R de l'équation différentielle
linéaire homogène (*)est solution de l'équation résolvante, que nous pouvons écrire sous
la forme
8R(t,
ot to) -_A( t ) 0 R( t, to ) .
Au cours de la démonstration du théorème ci-dessus, nous avons prouvé que la résolvante
R vérifie aussi
{)R~t, to) = -R(t, t0 ) o A(t0 ).
to
C'est une équation différentielle linéaire et homogène dans l'espace de Banach .C(E, E),
la variable indépendante étant maintenant t 0 . Cette équation, dont le lecteur remarquera
la grande ressemblance avec l'équation résolvante, est parfois appelée seconde équation
résolvante.

3. Méthode de variation de la constante


Nous considérons de nouveau dans ce paragraphe une équation différentielle linéaire, non
homogène. Nous allons voir que la connaissance de la résolvante de l'équation homogène
associée permet la détermination, par une simple quadrature (calcul d'intégrale), de toutes
les solutions maximales de cette équation non homogène.
3.1. Théorème. - Soient E un espace de Banach, A et b des applications
continues d'un intervalle ouvert I de IR, respectivement dans .C(E, E) et dans
E. Soit (t, to) 1---4 R(t, t 0 ) la résolvante de l'équation différentielle homogène
'l/J'(t) = A(t)'l/;(t). (*)
Soit (to, xo) E I x E une donnée de Cauchy. La solution maximale <.p de l'équation
différentielle non homogène
c.p'(t) = A(t) c.p(t) + b(t)
qui satisfait cette donnée de Cauchy est

c.p(t) = R(t, to) xo + lt


to
R(t, e) b(e) de.

Preuve : Soit x un élément de E. La solution maximale de l'équation homogène ( *) qui


satisfait la donnée de Cauchy ( t 0 , x) est
'l/;(t) = R(t, to) X.
178 Chapitre VII. Équations différentielles linéaires

Comme nous cherchons les solutions maximales de l'équation non homogène ( ** ), et


non pas celles de l'équation homogène(*), nous allons supposer que x est non plus un
élément constant de E, mais plutôt une application différentiable del dans E. Nous allons
déterminer cette application de manière telle que l'application
t t-t ip(t) = R(t, to) x(t)
soit la solution maximale de ( **) qui satisfait la donnée de Cauchy ( t 0 , x 0 ). Ce procédé
est connu sous le nom de méthode de variation de la constante, car il consiste à faire varier
l'élément x de E qui, lorsqu'il est constant, apparaît dans l'expression des solutions de
l'équation homogène ( *).
Puisque nous avons supposé x différentiable, l'application t t-t R(t, t 0 ) x(t) est
différentiable sur 1, car elle est composée de t t-t (R(t, t 0 ),x(t)), dont les deux com-
posantes sont différentiables, et de l'application de .C(E, E) x E dans E, (U, x) t-t U x,
bilinéaire continue donc différentiable. Sa dérivée, en tout point t de 1, est, puisque
t t-t R(t, t 0 ) est solution de l'équation résolvante,
ip'(t) = âR~; to) x(t) + R(t, t0 ) x'(t) = A(t) o R(t, to) x(t) + R(t, to) x'(t).
En portant cette expression de <.p1 ( t) et l'expression ci-dessus de ip( t) dans l'équation ( **),
nous obtenons
R(t, to) x'(t) = b(t),
d'où
x'(t) = (R(t, t 0 ))- 1 b(t) = R(t0 , t) b(t).
D'autre part, nous devons avoir <.p(t0 ) = x 0 , donc x(t0 ) = x 0 . Par suite, pour tout t E 1,

x(t) = Xo + lt R(to,(J) b(O) dO,


to
donc
ip(t) = R(t, to) x(t) = R(t, to) xo + R(t, to) lt R(to, 0) b(O) dO,
to

ou, compte tenu de la propriété de l'intégrale rappelée en V.2.4.f,

ip(t) = R(t, t 0 ) x 0 + lt R(t, t0 ) o R(t0 , 0) b(O) dO,


to
d'où le résultat indiqué, puisque R(t, t 0 ) o R(t0 , 0) = R(t, 0). D
3.2. Exemple. - Considérons l'équation différentielle sur lR
ip'(t) = kip(t) + cos(wt),
avec k E IR, w E R L'équation homogène associée,
'If;' (t) = k'lj; (t) ,
a pour résolvante
R(t, to) = é(t-to).

La solution maximale del' équation ( *) qui satisfait la donnée de Cauchy (t 0 , xo) est donc

ip(t) = x 0 é(t-to) + lt ek(t-to) cos(wO) dO


to
k(t-to) wsin(wt)- kcos(wt)-ek(t-to)(wsin(wt 0 ) - kcos(wt 0 ))
= xoe + k2 + w2 .
§ 4. Étude de l'équation résolvante 179

4. Étude de l'équation résolvante


Considérons d'abord un cas particulier, celui d'une équation différentielle linéaire ho-
mogène et autonome.
4.1. Proposition. - Soit E un espace de Banach, et A un élément de .C(E, E). La
résolvante de l'équation différentielle linéaire homogène et autonome
cp'(t) =A cp(t)
est
R(t, to) = exp((t - to)A).

Preuve : D'après les propriétés du flot d'une équation autonome (VI.2.3 et VI.2.4), nous
savons que la résolvante de l'équation considérée est de la forme
R(t, to) = U(t - to).
D'autre part, s étant un réel, exp(sA) a pour expression (voir par exemple [T.IX.4.3]),

exp(sA) = idE + L;n. An,


OO

n=l
n

la série figurant dans le membre de droite étant normalement convergente dans .C(E, E).
La série obtenue par dérivation terme à terme, par rapport à s, est

f; (:~-:)!A"~ Ao (dE+ t. ~Am)


=A o exp(sA) = exp(sA) o A.
L'opération que nous avons effectuée (mise en facteurs de A à gauche) est en effet
légitime, en raison de la convergence normale de la série et de la continuité de l'application
(A, B) 1---+ A o B, où A et B sont deux éléments de .C(E, E). D'autre part, la série obtenue
par dérivation terme à terme par rapport à s du membre de droite de l'égalité ( *) étant
nomalement convergente, est égale à la dérivée par rapport à s du membre de gauche. Nous
voyons donc que l'application s 1---+ exp(sA) est dérivable en tout points de IR, et que sa
dérivée a pour expression
d
ds exp(sA) =A o exp(sA) = exp(sA) o A.
Comme de plus, pour s = 0, exp(OA) = idE, le théorème 2.5 permet d'affirmer que
exp(sA) = R(s, 0). Par suite, nous avons bien, pour tous t et to E IR, R(t, to) =
exp( (t - to)A). D

Lorsque l'application A n'est pas constante, il existe une expression de la résolvante


appelée exponentielle de Dyson qui, en un certain sens, généralise le résultat ci-dessus
(voir [3, page 62]). Nous nous bornerons à traiter le cas particulier simple où l'application
A possède une primitive avec laquelle elle commute. Nous devons auparavant établir le
résultat suivant.
4.2. Lemme. - Soit E un espace de Banach, et C une application continue d'un
intervalle ouvert I de lR dans .C(E, E). Soit t 0 un point de I. On suppose que C
est dérivable au point t 0 , et que sa dérivée C'(t 0 ) en ce point commute avec C(to),
c'est-à-dire vérine
C'(to) o C(to) = C(to) o C'(to).
180 Chapitre VII. Équations différentielles linéaires

Alors l'application t t--t exp( C(t)) est dérivable au point t 0 , et a pour dérivée en
ce point
d
dt exp(C(t)) lt=to = C'(to) o exp(C(to)) = exp(C(to)) o C'(t0 ).

Preuve: Nous avons, pour tout t E J,


exp(C(t)) - exp(C(t0 )) - (t - t0 )C'(t0 ) o exp(C(t0 ))

= f ~!
n=l
( ( C(t) r - (C(to)r - n(t - to)C'(to) o ( C(to) r- 1 ) .

Nous allons majorer en norme chaque terme de la série figurant au membre de droite. Pour
cela nous remarquons d'abord qu'il existe un intervalle fermé et borné J, contenu dans
I, dont l'intérieur contient t 0 • Sur le compact J, l'application continue C est majorée en
norme par un réel M 2 O. Pour tout entier n 2 1 et tout t E J, nous avons
n-1
(c(t)t - (c(to)r = L(c(to))k o (c(t) - c(to)) o (c(t)r-k-l, (*)
k=O
d'où nous déduisons
li(C(t)r- (C(to)rli::; nMn- 1 1iC(t) -C(to)li.
D'autre part, puisque C'(to) et C(t 0 ) commutent, nous avons
n-1
nC'(to) 0 (C(to)r-l = L(C(to))k 0 C'(to) 0 (C(to)r-k-l. (***)
k=O
En combinant (*) et ( *** ), nous obtenons
(C(t)t - (C(to)t - n(t - to)C'(to) o (C(to)r- 1
n-1
= L(C(to))k o (C(t) - C(to) - (t - to)C'(to)) o (C(to))n-k-l
k=O
n-1
+ L(c(to))k o (c(t) - c(to)) o ( (c(t)r-k-l - (c(to)r-k- 1 ) .
k=O
En utilisant l'inégalité (**)(dans laquelle nous remplaçons n par n - k - 1) pour majorer
le second terme du membre de droite, nous en déduisons l'inégalité, valable pour tout
entier n 2 1 et tout t E J,
li(C(t)t - (C(to)t - n(t- to)C'(to) o (C(to)r- 1 11
::; nMn- 1 llC(t) - C(to) - (t - to)C'(to)ll
+ (n ~ l)n Mn-211C(t) - C(to)i12.
Nous avons donc, pour tout t E J,
Il exp (C (t)) - exp (C (to)) - (t - to) C' (to) o exp (C (to)) Il
::; eM (llC(t) - C(to) - (t - to)C'(to)li + llC(t) - C(to)i1 2),
ce qui prouve que le membre de gauche de cette inégalité est o(t - t 0 ), c'est-à-dire que
lapplication t t--t exp (C (t)) est dérivable au point t 0 et a pour dérivée en ce point
C'(t0 ) o exp(C(to)). Remarquons enfin que C'(t 0 ), commutant avec toute puissance de
C(to), commute aussi avec exp( C(t 0 ) ). D
§ 4. Étude de l'équation résolvante 181

4.3. Proposition. - Soit E un espace de Banach, et A une application continue


d'un intervalle ouvert I de lR dans C(E, E). On suppose qu'il existe une primitive
C : I ---+ C(E, E) de l'application A qui vérifie, pour tout t E J,
A(t) o C(t) = C(t) o A(t).
Alors la solution de l'équation résolvante
8R(t, ta) - A(t) R(t t ) t et ta E I,
8t - 0 ,, a '

qui vérifie R(ta, ta)= idE, est


R(t, ta)= exp(C(t)) o exp(-C(ta)).

Preuve: L'application C est dérivable et a pour dérivée, en tout point t de I, C' (t) = A(t),
qui par hypothèse commute avec C(t). D'après le lemme4.2, l'application t 1---7 exp( C(t))
est dérivable et a pour dérivée, en tout point t de I,
d
dt exp (C (t)) = A (t) o exp (C (t)) .
La composition à droite avec 1'élément fixé exp ( -C (ta)) étant une application linéaire
continue, nous en déduisons que t 1---7 exp(C(t)) o exp(-C(ta)) est dérivable et a pour
dérivée, en tout point t de I,

:t (exp( C(t)) o exp(-C(ta))) = A(t) o exp( C(t)) o exp(-C(ta)) .


Cette application est bien solution de l'équation résolvante, et elle satisfait la donnée de
Cauchy (ta, idE). Nous avons bien R(t, ta)= exp(C(t)) o exp(-C(ta)). D

Une application continue A : I ---+ C(E, E) ne possède pas toujours une primitive C telle
que, pour tout t E J, A(t) et C(t) commutent. La proposition 4.5 indique un cas où une
telle primitive existe. Nous 1' obtiendrons comme conséquence du lemme suivant.
4.4. Lemme. - Soit E un espace de Banach, et E = C(E, E). On considère
l'équation différentielle dans E
U'(t) = A1 (t) o U(t) + U(t) o A2(t) + B(t),
où Ai, A 2 et B sont des applications continues d'un intervalle ouvert Ide lR dans
E. Soient U : I ---+ E une solution maximale de cette équation, ta un élément de I,
et D un élément de E. On suppose que D commute avec U(ta) et, pour tout t E IR,
avec A1 (t), A2 (t) et B(t). Alors, pour tout t E J, D commute avec U(t).
Preuve : Pour alléger l'écriture posons, pour tous V et W E E,
[V, WJ = V o W - W o V.
Nous avons
d
dt [U(t), D] = [U' (t), D]
= (A 1 (t) o U(t) + U(t) o A2(t) + B(t), D]
= A1 (t) o [U(t), D] + [U(t), D] o A2(t).
L'application t 1---7 V (t) = [U (t), D J est donc solution de l'équation différentielle linéaire
V'(t) = A 1 (t) o V(t) + V(t) o A2(t).
Comme elle s'annule au point ta. l'application V est identiquement nulle sur I. D
182 Chapitre VII. Équations différentielles linéaires

4.5. Proposition. - Soit E un espace de Banach et A une application continue


d'un intervalle ouvert I de IR dans .C(E, E). On suppose que pour tous fh et
82 E /, A(01) et A(02) commutent. Alors, pour tous to, t1, t2 et t3 E /, 1 A(O) dO ft:
commute avec A(t 2) et avec ft:
A(O) dO.
3

Sous ces hypothèses, la résolvante de l'équation différentielle


cp'(t) = A(t) cp(t)
est
R(t, t 0 ) =exp (1: A(O) dO)

Preuve : Posons
U(t) = t A(O) dO.
lto
Nous avons
U'(t) = A(t).
Le lemme 4.4, dans lequel nous remplaçons B par A, et nous faisons A 1 = 0, A 2 = 0 et
D = A(t 2), montre que A(t 2) commute avec U(t) pour tout t E J, et en particulier pour
t = ti.
Remplaçons t 2 par t, t 0 par t 2 et t 1 par t 3 . Nous voyons ainsi que pour tout t E J,
ft:
A(t) commute avec 3 A(O) dO. En appliquant à nouveau le lemme 4.4, dans lequel nous
remplaçons B par A et nous faisons A1 = 0, A 2 = 0 et D = ft:
3 A(O) dO, nous voyons
que ft:3 A(O) dO commute avec U(t) pour tout t E /,et en particulier pour t = t 1 .
L'application U est une primitive de A et, pour tout t E /, U(t) et A(t) commutent.
D'après la proposition 4.3, la résolvante de l'équation différentielle
cp'(t) = A(t) cp(t)
est
R(t,to) = exp(U(t)) oexp(-U(t0 )) = exp(U(t)),

puisque U(t 0 ) =O. D

La proposition suivante donne, dans le cas où l'espace vectoriel E est de dimension finie,
une expression remarquable du déterminant de la résolvante. Le lecteur observera que cette
expression ne suppose pas que l'application A possède une primitive avec laquelle elle
commute. Il observera aussi que cette expression du déterminant de la résolvante est de
même forme que l'expression de la résolvante elle-même donnée par la proposition 5.5.
4.6. Proposition. - Soit E un espace vectoriel réel de dimension fi.nie et A une
application continue d'un intervalle ouvert I de IR. dans .C(E, E). Soit R(t, t 0 ) la
résolvante de l'équation différentielle
cp'(t) = A(t)cp(t).
Le déterminant de R(t, t 0 ) a pour expression

détR(t, to) =exp (1: TraceA(O) dO) ,

où TraceA(O) c1ésigne la trace de l'endomorphisme A(O).


§ 4. Étude de l'équation résolvante 183

Preuve: Soit n la dimension de E, et 17 une forme élément de volume sur E, c'est-à-dire


une forme n fois multilinéaire alternée sur En, non identiquement nulle.
Rappelons deux résultats bien connus d'algèbre linéaire, dont le lecteur trouvera la
démonstration, par exemple, dans [3]. Soient B un endomorphisme de E, ai, ... , an
n éléments de E. Nous avons
détB17(ai, ... ,an) =r1(Bai, ... ,Ban)
Trace B 17(ai, ... , an) = 17(Bai, a2, ... , an)
+11(ai,Ba2,a3, ... ,an)
+···
+11(ai,a2, ... ,an-i,Ban)· (***)
Posons, pour alléger l'écriture,
'Pi(t) = R(t, to)ai, 1 ~ i ~ n, D.(t) = détR(t, to).
Remarquons que t 1--+ 'Pi (t) est la solution maximale de l'équation différentielle ( *) qui
prend la valeur ai pour t = t 0 .
Faisons B = R(t, t 0 ) dans l'équation(**). Nous obtenons
D.(t)17(ai, ... ,an)= 17(cpi(t), ... ,cpn(t)).
Dérivons par rapport à t. Nous avons

dcpd?) = A(t)cpi(t).
Compte tenu de la formule(***), dans laquelle nous faisons B = A(t), nous obtenons
dD.(t)
-;ft17(ai, ... , an)= TraceA(t)17(cpi(t), ... , 'Pn(t))
= Trace A( t)D.( t)17( ai, ... , an) .
En choisissant les éléments ai, ... , an de E linéairement indépendants, nous pouvons faire
en sorte que 17( ai, ... , an) soit non nul. En divisant par 17( ai, ... , an), nous obtenons
dD.(t)
-;fi= TraceA(t)D.(t),
d'où
D.(t) = D.(t0 ) exp (1: Trace A(O) de)
Mais puisque R(t0 , t 0 ) = idE, D.(t0 ) = détidE = 1. Le résultat indiqué en découle. D

Indiquons enfin une autre conséquence du lemme 4.4, qui sera utile dans la suite.
4.7. Proposition. - Soit E un espace de Banach complexe, et A une application
continue d'un intervalle ouvert I de lR dans Cc(E, E) (espace des applications C-
linéaires continues de E dans lui-même). La résolvante R de l'équation différentielle
cp'(t) = A(t) cp(t)
est à valeurs dans l'espace Cc(E, E).
Preuve : Notons J : E ---> E la multiplication par le scalaire complexe i = A.
Nous pouvons considérer J comme une application IR-linéaire de E dans lui-même. Nous
savons (I.4.2) qu'une autre application IR-linéaire U de E dans lui-même est C-linéaire si
et seulement si elle commute avec J. Soit t 0 un élément de I. Posons, pour tout t E J,
U(t) = R(t, t 0 ).
184 Chapitre VII. Équations différentielles linéaires

L'application U est solution de l'équation résolvante


U'(t) = A(t) o U(t).
Pour tout t E J, A(t) commute avec J, puisque c'est un élément de .Lc(E, E). De plus,
U(t 0 ), qui n'est autre que idE, commute aussi avec J. D'après le lemme 4.4, dans lequel
nous faisons A 1 = A, A 2 = 0, B = 0 et D = J, pour tout t E J, U(t) commute avec J.
Autrement dit, pour tout t E I (et bien sûr aussi pour tout t 0 E J), R(t, t 0 ) commute avec
J, donc est élément de .Lrc(E, E). 0

5. Équations. différentielles linéaires homogènes autonomes dans !Rn


5.1. Le problème étudié. - On considère l'équation différentielle
cp'(t) = Acp(t),
où A est une application linéaire continue d'un espace de Banach E dans lui-même.
D'après la proposition 4.1, la résolvante de cette équation est
R(t, to) = exp((t - to)A),
et la solution maximale de cette équation qui prend la valeur x 0 pour t = t 0 , définie sur lR
entier, est
cp(t) = exp((t - to)A)xo.
Nous allons voir que lorsque l'espace E est de dimension finie, l'expression de exp(tA),
avec t E IR, peut être précisée.
5.2. Rappels d'algèbre linéaire. - Le lecteur trouvera les démonstrations des quelques
propriétés classiques rappelées ici par exemple dans [3].
Soit E un espace vectoriel complexe de dimension finie n, et A un endomorphisme C-
linéaire de E. Le polynôme caractéristique de A est, par définition,
IIA(À) = dét(A- ÀidE),
où À est l'indéterminée. Il se décompose en un produit de polynômes élémentaires deux à
deux premiers entre eux,
p

IIA(À) = (-l)n II (À - Àktk,


k=l
où les Àk sont des complexes deux à deux distincts (ce sont les racines du polynôme IIA,
appelées valeurs propres de A). Chaque nk est un entier : '.'.'. 1 appelé multiplicité de la
valeur propre Àk. Nous avons
p

Lnk =n.
k=l

Posons, pour chaque k (1 ::::; k ::::; p),


Ek = ker(A - Àk idErk.
Chaque Ek est un sous-espace vectoriel de E, de dimension nk, invariant par A (c'est-
à-dire tel que A(Ek) c Ek), et la restriction de A à Ek a pour polynôme caractéristique
(-l)nk (À - Àkrk. De plus, E est somme directe des Ek,
E = EBL1Ek'
ce qui signifie que chaque élément x de E s'exprime, de manière unique, comme une
somme
avec Xk E Ek.
§ 5. Équations différentielles linéaires homogènes autonomes dans !Rn 185

Soit S l'endomorphisme de E dont la restriction à chaque Ek est


SIEk = Àk idEk
Posons
N=A-S.
Les endomorphismes S et N de E laissent invariant chaque sous-espace Ek, et ils
commutent : S o N = N o S. L'endomorphisme N est nilpotent; plus précisément,
pour chaque k (l ~ k ~ p),

On dit que S est la partie semi-simple et N la partie nilpotente de l'endomorphisme A.


Pour tout t E lR nous avons, puisque S et N commutent
exp(tA) = exp(t(S + N)) = exp(tS) o exp(tN) = exp(tN) o exp(tS).
Nous remarquons que exp( tS), exp( tN) et exp( tA) laissent invariant chaque sous-espace
Ek. et que

Ainsi exp(tN)IEk = Pk(t) est un polynôme en t de degré inférieur ou égal à nk - l, dont


les coefficients sont des endomorphismes de Ek.
Les résultats qui précèdent subsistent lorsque E est un espace vectoriel réel de dimension
finie net A un endomorphisme IR-linéaire de E dont toutes les valeurs propres sont réelles.
5.3. Application aux équations différentielles : cas complexe. - Revenons à l'équation
différentielle
<p'(t) = A<p(t).
Supposons pour commencer que E est un espace vectoriel complexe de dimension n, et
A un endomorphisme C-linéaire de E. D'après la proposition 4.7, la résolvante de cette
équation est à valeurs dans Cc(E, E), ce qui n'a rien de surprenant car, A étant élément de
Cc ( E, E), pour tous t ou t 0 réels (ou même éventuellement complexes), exp ( (t - t 0 ) A)
est aussi élément de Cc (E, E).
Décomposons E en somme directe,
E = EB~= 1 Ek,
comme indiqué dans le paragraphe précédent. Soit t 0 E lR et x 0 E E, que nous
décomposons en une somme
p

x0 = LXok, avec Xok E Ek.


k=l
La solution maximale <p de léquation différentielle ( *) qui vérifie <p( to) = xo a pour
expression
p
<p(t) = L e>.k(t-to) Pk(t - to)(xok),
k=l

où les Pk sont les polynômes, à coefficients éléments de l'espace des endomorphismes de


Ek, définis dans le paragraphe précédent.
186 Chapitre VII. Équations différentielles linéaires

5.4. Application aux équations différentielles: cas réel. - Nous considérons toujours
l'équation différentielle
ip'(t) = Aip(t),

mais nous supposons maintenant que E est un espace vectoriel réel de dimension n, et A
un endomorphisme JR-linéaire de E.
Si les valeurs propres de A sont toutes réelles, les résultats du paragraphe 5.3 subsistent
sans changement.
Si certaines valeurs propres de A sont complexes, nous pouvons considérer le complexifié
Ec de E: c'est l'ensemble des couples (x, y) E E x E, notés z = x + iy, muni des lois
de composition d'addition et de multiplication par les scalaires réels usuelles de E x E,
et de la multiplication par i :
i(x+iy) = -y+ix.
Il est facile de vérifier que Ec est un espace vectoriel complexe de dimension (complexe)
n.
Nous prolongeons A en un endomorphisme C-linéaire de Ec, encore noté A, en posant
A(x + iy) = A(x) + iA(y).
Nous pouvons alors considérer l'équation (*)comme une équation différentielle dans Ec,
à laquelle nous pouvons appliquer les résultats du paragraphe 6.3.
L'espace E s'identifie au sous-ensemble de Ec formé par les éléments z =-= x + iy pour
lesquels y = O. Comme il se doit, si une donnée de Cauchy (t 0 , x 0 ) E lR x Ec est telle
que x 0 E E, la solution maximale <p de léquation (*) vérifiant cette donnée de Cauchy
est à valeurs dans E. Afin de l'exprimer en termes réels, nous remarquons que les valeurs
propres complexes de A se groupent par paires, les deux termes d'une paire étant complexes
conjugués l'un de l'autre et de même multiplicité; ce sont en effet les racines complexes
du polynôme caractéristique de A, qui est à coefficients réels.
Nous notons maintenant À1 , ... , Àr les valeurs propres réelles de A, n 1 , ... , nr leurs
multiplicités, µr+ 1, µr+ 1, ... , µr+s, µr+s les valeurs propres complexes de A groupées
par paires conjuguées, mr+l, ... , mr+s leurs multiplicités. Posons, pour 1 :::; k :::; r,
Eck= ker(A - Àk idEcrk,
et, pour r + 1 :::; l :::; r + s,
Ec1 = ker(A - µ1 idEc)m 1 ,

Bien entendu, dans les expressions ci-dessus A est considéré comme un endomorphisme
C-linéaire de Ec.
Chaque sous-espace vectoriel complexe Eck de Ec (1 :::; k:::; r) est le complexifié d'un
sous-espace vectoriel réel Ek de E, de dimension nk,
Ek = ker(A - Àk idE)nk ,
expression dans laquelle A est condidéré comme un endomorphisme JR-linéaire de E.
Pour chaque entier l (r + 1 :::; l :::; r + s ), les sous-espaces vectoriels complexes Ec l et
Ec l de Ec sont images l'un de lautre par l'application de conjugaison complexe (de Ec
dans lui-même),
z = x + iy 1--+ z = x - iy , x et y E E .

Leur somme directe Ec l EB Ec l est le complexifié d'un sous-espace vectoriel réel E 1 de


E, de dimension 2m1. Ce sous-espace n'est autre que
E1 = ker(A 2 - 2~µ1A + lµtl 2 idErk'
§ 5. Équations différentielles linéaires homogènes autonomes dans IR.n 187

expression dans laquelle A doit être considéré comme un endomorphisme IR.-linéaire de


E.
Nous avons une décomposition en somme directe de Ec,
Ec = (EBk=l Eck) EB ( EB[,!:+1(Ec1 EB Ec i)) ,
et aussi une décomposition en somme directe de E,

E = (EBk=1Ek) EB (EB[,!:+ 1E1).


Soit alors x 0 un élément de E. Nous pouvons le décomposer en une somme, soit en le
considérant comme élément de Ee,, soit en le considérant comme élément de E, et en
utilisant les décompositions en somme directe de ces deux espaces indiquées ci-dessus.
Nous obtenons
r r+s
xo = L:xok + L (zo1 + zo1)
k=l l=r+l
r r+s
=L xo k + L xo 1,
k=l l=r+l

avec
xo k E Ek c Eck , zo 1 E Ec 1 , zo 1 E Ec 1 , xo 1 = zo 1 + zo 1 E E1 .
L'expression de la solution maximale cp de l'équation différentielle (*) qui vérifie
cp(t0 ) = x 0 , donnée à la fin du paragraphe 6.3, s'écrit maintenant, avec les nos nouvelles
notations,
r
cp(t) = L e>.k(t-to) Pk(t - to)(xok)
k=l
r+s
+ L (eµi(t-to) P1(t - to)(zo1) + eµi(t-to) P1(t - to)(zo1).
l=r+l
Nous pouvons la mettre sous une forme ne faisant intervenir que des quantités réelles :
r
cp(t) = L e>.k(t-to) Pk(t - to)(xok)
k=l
r+s
+ L e1Rµi(t-to) ( cos(t.Sµ1(t - to) )Q1(t - to)
l=r+l

+ sin(t.Sµ1(t - to))S1(t - to)) (xo1),

où chaque Pk(t) est un polynôme en t de degré ::; nk - 1, chaque Q1(t) et chaque


S1(t) un polynôme en t de degré::; m 1 - 1, les coefficients de ces polynômes étant des
endomorphismes IR.-linéaires de E.
5.5. Application aux équations scalaires d'ordre n. - Les résultats du paragraphe 6.3
s'appliquent en particulier aux équations différentielles linéaires homogènes d'ordre n
dans <C, à coefficients constants, de la forme

Les coefficients ai (0 ::; i ::; n - 1) sont éléments de <C, et l'inconnue cp est une application
IR.-différentiable de IR. dans <C.
188 Chapitre VII. Équations différentielles linéaires

Nous avons vu (IV.1.4) que la résolution de cette équation se ramène à celle d'une équation
différentielle du premier ordre dans en' de la forme
'1/J'(t) = A'ljJ(t),
où l'inconnue 'ljJ = (<p, <p', ... , <p(n-l)) est une application IR-différentiable de IR dans en,
et où A est l'endomorphisme de en ayant pour matrice (également notée A),
0 1 0 0
0 0 1 0 0

A=
0
0 0 1

Les valeurs propres de A sont les racines de l'équation


"\n - aoA\n-1 - al"\n-2 - · · · - an-1 = Ü .
Nous les désignons par Àk (1 ::; k ::; p) (en convenant de ne considérer que les racines
deux à deux distinctes), et pour chaque k, nous notons nk la multiplicité de Àk.
Toute solution de l'équation (**)est donnée par une expression de la forme
p
<p(t) = L e.\kt Pk(t)'
k=l
où Pk(t) est un polynôme en t de degré nk - l, à coefficients complexes. Réciproquement,
toute expression de cette forme est une solution de l'équation ( **); en effet, le nombre
total des coefficients des polynômes Pk est L~=l nk = n; il est égal à la dimension de
l'espace vectoriel complexe des solutions de l'équation ( **).Remarquons que par contre,
dans le cas traité dans le paragraphe 6.3, les polynômes Pk ne pouvaient pas être choisis
arbitrairement.
Si les coefficients de l'équation ( **) sont réels, ainsi que les termes <p( t 0 ), <p 1 ( t 0 ), ... ,
<pn- 1(to) de la donnée de Cauchy, la solution maximale <p qui vérifie cette donnée de
Cauchy s'exprime, en termes réels, sous la forme
p
<p(t) = L efükt(cos(SSÀkt)Qk(t) + sin(SSÀkt)Sk(t)),
k=l
où Qk(t) et Sk(t) sont des polynômes en t de degré n - 1, à coefficients réels.

6. Exercices

Exercice VII.1. Soit I un intervalle ouvert de IR et A: I ~ .C(IR 3 , IR 3 ) une application


continue. On considère l'équation différentielle linéaire dans IR 3 :
X'(t) = A(t) X(t).
Soient X 1 , X 2 , X 3 trois solutions maximales de (*).On rappelle qu'elles sont définies sur
I. Pour tout t E J, soit U(t) l'endomorphisme de IR 3 ayant pour matrice
x1(t) x2(t) x3(t))
( Y1 (t) Y2 ( t) Y3 (t) .
z1(t) z2(t) z3(t)
1) Etablir que les trois conditions suivantes sont équivalentes :
§ 6. Exercices 189

(i) les solutions X 1 , X 2 , X 3 sont linéairement dépendantes,


(ii) il existe t 0 E I tel que U (t 0 ) ne soit pas inversible,
(iii) pour tout t E I, U(t) n'est pas inversible.
2) On suppose maintenant que X 1 , X 2 , X 3 sont linéairement indépendantes. Montrer que,
pour tous t 0 et t E I, la résolvante de l'équation (*) est R(t, t 0 ) = U(t) o U(t 0 )- 1 .
3) Soit v E IR 3 . Déterminer la solution maximale cp de ( *) telle que cp(to) = v.
Exercice VII.2. Soit Mn(IR) l'espace des matrices n x n à coefficients réels. Pour toute
matrice ME Mn(IR), on note tM la matrice transposée. Soit A: JO, +oo[---t Mn(IR) une
application continue. On considère l'équation différentielle linéaire
X'(t) = A(t) X(t),
et on note R(t, t 0 ) sa résolvante.
1) Montrer que la résolvante S(t, t 0 ) de l'équation différentielle
Y'(t) = _tA(t) Y(t)
est S(t, to) = tR(to, t).
2) Dans cette question on choisit :

A(t)= (
! +2t
~-!
1 t
0 !t
3t t - t
-t)
1
.
2( t - t) 0 1t +t
Montrer que A(t) possède une base de vecteurs propres indépendante de t. En déduire la
résolvante R( t, t 0 ) de léquation (*).
3) Résoudre à l'aide des questions précédentes le système :

x' = -( ~ + 2t)x + (~ - t)y + 2(t - ~ )z,


y'= -3ty'
z' = (t - ~ )x + (~ - t)y - (t + ~)z.
t t t
Exercice VII.3. Soit E un IR-espace vectoriel de dimension finie, A une application
de IR dans .C(E, E), continue et périodique de période T (c'est-à-dire telle que pour tout
t E IR, A(t + T) = A(t)) et f une application de IR dans E continue et périodique de
période T. On considère les équations différentielles :
cp'(t) = A(t) cp(t), (H)
1/J'(t) = A(t) cp(t) + f(t). (L)
1) Montrer qu'une solution cp de (L) (resp., une solution 'ljJ de (H)) est périodique de
période T si et seulement si cp(T) = cp(O) (resp., si et seulement si 1/J(T) = 1/J(O)). [Pour
l'équation (H) par exemple, on pourra poser cp 1 (t) = cp(t + T)].
2) On note R(t, t 0 ) la résolvante de l'équation (H). Montrer que cette équation possède
une solution non nulle périodique de période T si et seulement si l'application linéaire
id.C(E,E) -R(T, 0) n'est pas inversible.
3) Soit a E E et 'ljJ la solution maximale de l'équation (L) qui vérifie cp(O) =a. Donner
une expression de 'ljJ à l'aide de R, de f et de a.
4) On suppose que l'équation (H) n'a pas de solution périodique non nulle. Montrer que
l'équation (L) a une unique solution périodique de période T.
190 Chapitre VII. Équations düférentielles linéaires

Exercice VII.4. Soient a et b deux applications de IR vers IR, de classe c=. Soit
x 0 E IR*. On considère l'équation différentielle
x'(t) = a(t) x(t) + b(t). (1)

1) Calculer explicitement la solution maximale <.p de (1) qui vérifie 1.p(O) = x 0 • Vérifier
que <.p est définie sur R
2) Soit 'ljJ : [O, ,6[ ~ IR une application de classe C 1 (,6 pouvant être fini ou égal à +oo)
vérifiant 'l/J(O) = x 0 et, pour tout t E [O, ,6[, 'ljJ' (t) :::; a(t)'ljJ(t) + b(t). Montrer que pour
tout t E [O, ,6[, 'ljJ(t) :::; cp(t).
3) Soit l'équation différentielle
x'(t) = x(t) - 2t 3 cosx(t). (2)
Vérifier qu'il existe une solution maximale 'ljJ de (2), définie sur un intervalle ouvert I, telle
que'ljJ(O) = 1. Donnerunencadrementde'ljJ sur Jn[O, +oo[. En déduire que [O, +oo[ c I.

Exercice VII.5. Soit I un intervalle ouvert de lR contenant [O, 1]. Soientp, q, r et f des
fonctions à valeurs réelles définies et continues sur I. On suppose que p ne s'annule pas
sur I. On considère l'équation différentielle
p(t)x"(t) + q(t)x'(t) + r(t)x(t) = f(t), (1)
et l'équation linéaire et homogène que lui est associée
p(t)x"(t) + q(t)x'(t) + r(t)x(t) = 0. (2)
1) Soit (x 0 , y 0 ) E JR 2 • Vérifier qu'il existe une unique solution maximale cp de (1) (resp.,
de (2)), définie sur I, vérifiant cp(O) = xo et cp'(O) = Yo·
2) Soient cp 1 et cp 2 deux solutions maximales de (2). Pour tout t E J, on pose
W(t) = cp1(t)cp~(t) - cp2(t)cp~(t).
Etablir que les propriétés suivantes sont quivalentes :
(i) les solutions cp 1 et cp 2 sont linéairement indépendantes,
(ii) pour tout t E J, W(t) f:. 0,
(iii) il existe t E I tel que W(t) f:. O.
3) On suppose désormais que cp 1 et cp 2 sont linéairement indépendantes. Soit cp la solution
maximale de (1) qui vérifie 1.p(O) = cp'(O) =O. Montrer qu'il existe deux fonctions ..\ 1 et
..\ 2 , définies et de classe C 1 sur I, telles que on ait

{
À1<.p1 + À2<.p2 = cp'
À~ 'Pl + À~'P2 = 0.
Déterminer ..\ 1 et ..\ 2 en fonction de f, <.pi. cp 2 , pet W.
4) Montrer qu'une condition nécessaire et suffisante pour que (1) possède une solution cp
vérifiant cp(O) = cp'(O) = 0 et cp(l) = cp'(l) = 0 est que

rl 'P1(t)f(t)
}0 W(t)p(t)
dt= rl cp2(t)f(t) dt= o
} W(t)p(t) ·
0
§ 7. Solutions 191

7. Solutions

Solution VII.1.
1) Supposons les trois solutions Xi. X2, X3 linéairement dépendantes. Il existe alors (a 1 ,a2,a 3 ) E JR 3 ,
f (0, 0, 0), tel que pour tout t E /, a1X1 (t) + a2X2(t) + a3X3(t) = (0, 0, 0). Le système linéaire et
homogène
a1x1(t) +a2x2(t) + a3x3(t) = 0,
{ a1y1(t) + a2y2(t) + a3y3(t) = 0,
a1z1 (t) + a2z2(t) + a3z3(t) = 0,

admettant une solution non nulle (a1, a2, a3), a un déterminant nul. Cela prouve que pour tout t E /, U(t)
n'est pas inversible. On vient de prouver que (i) implique (iii).
Il est évident que (iii) implique (ii).
Prouvons maintenant que (ii) implique (i). Soit ta E I tel que U(ta) ne soit pas inversible. Les vecteurs X1 (to).
X2(ta), X3(ta) sont linéairement dépendants; aussi il existe des réels non tous nuls a1, a2 et a3 tels que
a1X1(to) + a2X2(ta) + a3X3(ta) =O. L'application t 1-+ a1X1(t) + a2X2(t) + a3X3(t), définie sur/,
est l'unique solution maximale de l'équation différentielle ( *) qui s'annule au point ta; elle est donc nulle en
tout point de/, et ainsi les applications X1, X2, X3 sont linéairement dépendantes.
2) Soit to E /.On sait (proposition 2.3) que la résolvante R de l'équation (*)vérifie, pourtout i E {1, 2, 3} et
tous tet ta E /, Xi(t) = R(t, to) Xi(to). D'après la définition de U(t), ceci entraîne U(t) = R(t, to)oU(to).
Or, les solutions X1, X2 et X3 étant linéairement indépendantes, U(ta) est inversible, compte tenu de la question
précédente. On obtient donc finalement, pour tout t E I, R( t, to) = U (t) o U (to )- 1.
3) Soit v E JR 3 . D'après la proposition 2.3 et la question précédente, la solution maximale cp de(*) telle que
cp(to) = v est définie sur I par cp(t) = R(t, ta) v = U(t) o U(ta)- 1 v.
Solution VII.2.
1) Soit ta E JO, +oo[ pour le moment fixé. Posons, pour tout t E JO, +oo[, </>(t) = tR(to, t). On a
</>(ta)= tR(to, to)I = t1 =/,matrice unité. D'autre part, pour tout t E JO, +oo(. R(to, t) = R(t, to)- 1.
L'application</> est donc composée, dans cet ordre, de l'application t 1-+ R(t, to) (définie sur JO, +oo[), et des
applications M 1-+ M- 1 et M 1-+ tM, définies respectivement sur GL(n, IR) (sous-ensemble de Mn(IR)
formé par les matrices inversibles) et Mn(IR). Ces applications sont différentiables. L'application <Pest donc
dérivable et sa dérivée <f/ (t) au point t s'obtient par application de la formule de dérivation d'une application
composée. Le calcul donne :

</>'()
t =- t( R (to, t ) 8R(t,ta)
at R (ta, t )) .

Mais l'application t
1-+ R(t, to) est solution de l'équation résolvante U'(t) = A(t)U(t), ce qui entraîne

8R(t, to)
- -8-t- = A(t) R(t, t 0 ), et donc finalement

</>'(t)=- t(R(ta,t)A(t)R(t,to)R(ta,t)) =- \R(to,t)A(t)) =-tA(t)</>(t).

On peut ainsi conclure (théorème 2.5) que S(t, to) = tR(to, t).
2) Pour tout t E JO, +oo[, les valeurs propres de A(t) sont les racines de son polynôme caractéristique
dét( A(t) - .u) = -(.>. - 3t) 2 (.>. - 3/t). Pour t = 1, A(t) possède une valeur propre triple À = 3 et
on remarque que A(l) = 31. Pour t E JO, +oo[, t f 1, A(t) possède une valeur propre double À= 3t et une
valeur propre simple.>. = 3/t; de plus les sous-espaces propres qui leurs sont associés sont engendrés par les
vecteurs v1 = ( 1, 0 - 1), v2 = (0, 1, 0) pour la valeur propre 3t et par v3 = ( 1, -1, 2) pour la valeur propre
3/t. On constate donc, dans les deux cas, que l'on peut écrire A(t) sous la forme A(t) = P D(t) p-I où D(t)
et P sont les matrices

D(t) = G~ 00 ) '
3/t
p =( ~ ~ ~1)
-1 0 2
192 Chapitre VII. Équations différentielles linéaires

On remarque ainsi que, pour tous t et t' E )0, +oo[, A(t) et A(t') commutent. On sait alors que la résolvante
R(t, ta) de l'équation (*)a pour expression R(t, ta) =exp ( J:: A(s) ds). Mais la matrice Pétant constante,

on a Jt: A(s)ds = P(Jt: D(s) ds )P- 1 , d'è>u finalement

0 ) p-1.
(t/to ) 3

3) Le système à résoudre dans cette question s'écrit X'(t) = _tA(t)X(t). D'après la question 1, pour
toute donnée de Cauchy (t 0 , (x 0 , y0 , zo)) E JO, +oo[ xIR 3 , la solution maximale <f>(t) de ce système vérifiant
<f>(to) = (xo, yo, zo) est la matrice-colonne

O(t) ~ 'R(t-O,t) GD
Solution VII.3.
1) Soit '1jJ une solution maximale de (L) (on pourrait raisonner de la même manière à partir de l'équation (H)).
Si '1jJ est périodique de période T, elle vérifie en particulier '1/J(T) = '1/J(O). Réciproquement, supposons que
= =
'1/J(T) '1/J(O) et posons, pour tout t E IR, '1/J1 (t) 'ljJ(t + T). L'application '1/J1 ainsi définie est dérivable sur
IR, et sa dérivée au point test '1/J~ (t) = '1/J'(t + T). Mais '1jJ étant solution de (L), on a, pour tout t E IR,

'1/J' (t + T) = A(t + T) 'ljJ(t + T) + J(t + T) = A(t) 'ljJ(t + T) + J(t),

puisque les applications A et f sont périodiques de période T. On a donc '1/J~ (t) = A(t) '1/J1 (t) + f(t). De plus
'1/J1 (0) = '1/J(T) = 'ljJ(O). Les applications '1jJ et '1/J1, toutes deux solutions maximales de (L) satisfaisant la même
donnée de Cauchy, sont égales. Autrement dit, la solution '1jJ de ( L) est périodique de période T.
2) Supposons qu'il existe une solution non nulle cp de (H), périodique de période T. L'application cp ne s'annule
en aucun point; en particulier cp(O) # O. On sait que pour tout t E IR, cp(t) = R(t, 0) cp(O); on a donc aussi
cp(t + T) = R(t + T, 0) cp(O), ce qui entraîne ( R(t, 0) - R(t + T, 0)) cp(O) = 0 soit encore, en choisissant
t = 0, (ide -R(T, 0)) cp(O) = 0, ce qui prouve que ide -R(T, 0) n'est pas inversible.
Réciproquement, supposons ide -R(T, 0) non inversible. Il existe alors un élément non nul xo de Etel que
(ide -R(T, 0)) xo = O. Ceci s'écrit encore R(O, 0) xo = R(T, 0) xo. Désignons par cp la solution maximale
de (H) telle que cp(O) = xo. On sait que pour tout t E IR, cp(t) = R(t, 0) xo. On a donc cp(O) = cp(T) ce qui
prouve, d'après la question 1, que cp est périodique de période T.
3) Soit a E E et '1jJ la solution de l'équation (L) telle que '1/J(O/ =a. La méthode de variation de la constante
(voir théorème 3.1) donne, pour t E IR, cp(t) = R(t, O) a+ j 0 R(t, u)f(u) du.
4) Puisque par hypothèse l'équation ( H) n'a pas de solution périodique non nulle, d'après la question 2, pour tout
= '1/J(O). Les résultats précédents
t E IR, ide -R( t, 0) est inversible. Soit '1jJ une solution maximale de (L ), et a
montrent que l'application '1jJ est périodique de période T si et seulement si '1/J(T) = '1/J(O), soit encore si
et seulement si '1/J(O) = R(T, 0) a+ j 0T R(t, u)f(u) du. Cette condition est satisfaite sui et seulement si
a= (R(T,0)- Ide)- 1
(J: R(T,u)f(u) du). ce qui prouve l'existence et l'unicité de la solution de (L)
périodique de période T.

Solution VII.4.
1) D'après la proposition 4.5, la résolvante de l'équation différentielle homogène associée à l'équation (1) a
pour expression R(t, ta) = exp(ft: a(u) du). La solution maximale cp de (1) vérifiant cp(O) = xo est donc,
d'après 3.1,

Comme il se doit, cette solution est définie sur IR.


§ 7. Solutions 193

2) Soit ê >O. Posons fe(t, x) = a(t)x + b(t) + ê et considérons l'équation différentielle

x'(t) = f"(t,x(t)).
La solution maximale 'Pe de cette équation qui vérifie 'Pe (0) = xo + ê est

L'application 'li> vérifie 11>(0) < 'Pe (0) et, pour tout t E [O, +oo[, 1/1 1 ( t) < f" ( t, 1/1( t)). On peut donc appliquer
le lemme IV.1.1 et conclure que pour tout t E (0, +oo[.1/J(t) < 'Pe(t). En faisant tendre ê vers 0, pour chaque
t fixé, on obtient finalement 1/J(t) ~ <p(t).
On montre de même que si lapplication 1/1 vérifie 1/1 (0) = xo et, pour tout t E [O, .B [, 1/1 1 ( t) ~ a( t )1/1( t) + b( t),
alors pour tout t E [O, +oo[.1/J(t) ~ <p(t).
3) La forme globale du théorème de Cauchy-Lipschitz s'applique à l'équation différentielle (2); on peut donc
affirmer qu'il existe une solution maximale unique 1/J de cette éqaution vérifiant 1/1(0) = 1; elle est définie sur
IR, puisque l'équation (2) est linéaire et définie sur IR.
Pour tous x E IR et t E IR+, on a x - 2t 3 ~ x - 2t 3 cos x ~ x + 2t 3 . Un calcul simple montre que les
solutions maximales 'Pl et 'P2 des équations différentielles linéaires x' (t) = x(t) - 2t 3 et x' (t) = x( t) + 2t 3
satisfaisant la donnée de Cauchy (0, 1) sont, respectivement,

'Pl (t) =et - 1 t 2u 3 et-u du= -llet + 2(t 3 + 3t 2 + 6t + 6),

<p2(t) =et+ 1t 2u 3 et-u du= 13et - 2(t 3 + 3t 2 + 6t + 6).

Les résultats de la question 2 permettent de conclure que, pour tout t E In [O, oo[,

-llet + 2(t 3 + 3t 2 + 6t + 6) ~ 1/J(t) ~ 13et - 2(t 3 + 3t 2 + 6t + 6).

Soit .B la borne supérieure de I. Supposons .B fini. Pour t E [O,,B[, 1/J'(t) = 1/J(t) - 2t 3 cos'ljJ(t), donc
11/J'(t)I ~ 11/J(t)I + 2,8 3 et, par application de l'inégalité de Gronwall VI.1.7,

ce qui prouve que 11/JI est majoré sur (O, ,B( et, par suite, que 11/J'l I'est aussi. Dans ces conditions (voir V.4.3),
e
1/J admet une limite E IR quand t tend vers .B et le bout droit de la solution maximale 1/1 contient le point
(,B, e). Or, toujours d'après V.4.3, ce point appartient à la frontière du domaine de définition de lapplication
(t, x) >-+ x - 2t 3 cos x. Cette frontière étant vide, il y a contradiction. On conclut que .B = +oo.
Solution VII.5.
1) Traitons le cas de l'équation (1). Les résultats concernant l'équation (2) s'en déduiront immédiatement en
remplaçant f par la fonction nulle. Mettons l'équation différentielle ( 1) sous forme canonique. Soit <p une solution
de cette équation, définie surun intervalle J. On pose, pourtout t E J, cf!( t) = (<p(t), <p1 ( t)). L'application cf!
ainsi définie sur J est solution de l'équation différentielle du premier ordre, dans IR 2,

( f (t) r(t) q(t) )


X'(t) = G(t,X(t)), avec G t, (x, y)) = ( y, p(t) - p(t) x - p(t) Y ·

Réciproquement, si cf! est une solution de l'équation différentielle ( *) définie sur un intervalle J, sa première
composante <p est solution, sur cet intervalle, de l'équation différentielle ( 1). De plus <p est solution maximale
de ( 1) si et seulement si cf! est solution maximale de ( *).
L'équation différentielle(*) est linéaire, de la forme X'(t) = A(t) X(t) + b(t), avec, pour tout t E I,

A(t) = (-r(t~/p(t) -q(t~/p(t)) ' b(t) = ( f(t)~p(t)) .


194 Chapitre VII. Équations différentielles linéaires

Les applications A et b sont continues sur J. Soit (xo, yo) E IR 2 . Le théorème 1 prouve alors l'existence d'une
unique solution maximale 4> de ( *), définie sur J, et satisfaisant la donnée de Cauchy ( 0, (xo, yo)). Il lui
correspond une unique solution maximale r.p de (1), également définie sur l, telle que r.p(O) xo, r.p' (0) yo. = =
2) L'équation différentielle du premier ordre, sous forme canonique, associée à l'équation (2) est l'équation
linéaire et homogène
X'(t) = A(t) X(t).
Soient r.p1 et r.p2 deux solutions maximales de (2). Pour tout t E J, on note U(t) l'endomorphisme de IR 2 ayant
pour expression (lorsqu'on convient de l'identifier à sa matrice),

U(t)-(r.p1(t) r.p2(t))
- r.p~ (t) r.p~(t) .
On remarque que U(t) est inversible si et seulement si W(t) = r.p1 (t)r.p~(t) - r.p2(t)r.p~ (t) n'est pas nul. Par un
raisonnement analogue à celui fait dans lexercice 1, on montre que les propriétés suivantes sont équivalentes :
- les solutions r.p1 et r.p2 sont linéairement dépendantes,
- il existe t E I tel que U(t) ne soit pas inversible,
- pour tout t E J, U(t) n'est pas inversible.
On en déduit immédiatement que les propriétés (i), (ii) et (iii) de lénoncé sont équaivalentes.
3) On suppose désormais que r.p1 et r.p2 sont linéairement indépendantes. Soit r.p la solution maximale de (1) qui
vérifie r.p(O) = r.p' (0) = O. Montrons l'existence de deux fonctions .X 1 et .X2, de classe C 1 sur I, telles que,
pour tout t E I
.X1(t)r.p1(t) + .X2(t)r.p2(t) = r.p(t)'
{
.X1 (t)r.p~ (t) + .X2(t)r.p~(t) = r.p 1 (t).
C'est un système linéaire de deux équations à deux inconnues À1 (t), .X2(t), dont le déterminant W(t) est non
nul. Il admet donc une unique solution, qui a pour expression
À (t) = r.p(t)r.p~(t) - r.p2(t)r.p'(t) À (t) = 'Pl (t)r.p' (t) - r.p(t)r.p~ (t) .
1 W(t) ' 2 W(t)
Les applications r.p1, r.p2, r.p étant de classe C 2, les applications .X1 et .X2 ainsi définies sont de classe C 1 sur I.
De plus, on a l'égalité .X~ r.p1 + .X~r.p2 = 0, obtenue par dérivation de r.p = .X1 r.p1 + .X2r.p2, compte tenu de r.p' =
= =
.X1 r.p~ + .X2r.p~. De légalité r.p' À1 r.p~ + .X2r.p~ on tire, par dérivation, r.p 11 .X~ r.p~ + .X~r.p~ + .X1r.p~ + .X2r.p~.
Mais r.p est solution de (1), r.p1 et r.p2 sont solutions de (2), .X1(t), .X2(t) vérifient donc le système

À~ (t)r.p1 (t) + .X~(t)r.p2(t) = 0'


{
À~ (t)r.p~ (t) + .X~(t)r.p~(t) = ;g~ '
qui admet pour solution

.X' (t) = - r.p2(t)f(t) .X' (t) =- r.p1(t)j(t).


1 W(t)p(t) ' 2 W(t)p(t)
Mais r.p(O) = r.p' (0) = 0 entraîne .X1 (0) = .X2 (0) = 0, d'où finalement
.X1 (t) = -1t 0
r.p2(u)f(u) du'
W(u)p(u)
.X~(t) = -1t 0
'Pl (u)f(u) du.
W(u)p(u)

4) La solution r.p = .X1 r.p1 + .X2r.p2 de l'équation (1) précédemment trouvée vérifie de plus r.p(l) = r.p' (1) = 0
si et seulement si
{
.X1(l)r.p1(l) + .X2(l)r.p2(l) = 0,
À1 (l)r.p~ (1) + .X2(l)r.p~(l) = 0.
Puisque W(l) =1- 0, ce système admet pour unique solution .X1 (1) = .X2(l) =O. L'équation (1) possède donc
une solution r.p vérifiant r.p(O) = r.p'(O) = 0 et r.p(l) = r.p'(l) = 0 si et seulement si

1 'Pl (t)j(t) dt= 11 r.p2(t)f(t) dt= 0.


1 W(t)p(t)
0 0 W(t)p(t)
Chapitre VIII
Calcul des variations

Le calcul des variations se propose de déterminer les extréma de certaines fonctions définies
sur des espaces d'applications d'un ensemble dans un autre, traditionnellement appelées
fonctionnelles (car la variable dont elles dépendent est une application, aussi appelée
fonction). Nous ne traiterons ici que le cas de fonctionnelles définies sur un espace de
courbes paramétrées, c'est-à-dire d'applications définies sur un intervalle de lR et à valeurs
dans un espace de Banach.
L'importance du calcul des variations est liée à ses applications à la Mécanique et à la
Physique. De plus, nous y trouverons l'occasion d'illustrer les résultats des chapitres
précédents en étudiant un exemple de fonction différentiable définie sur un espace de
Banach de dimension infinie (l'espace des courbes paramétrées de classe ci), et nous
verrons comment la recherche d'un extremum peut conduire à des équations différentielles.

1. L'espace des courbes de classe ci


Nous nous sommes intéressés jusqu'à présent aux applications différentiables de classe
ci définies sur un intervalle ouvert de R Nous allons maintenant devoir considérer des
applications définies sur un intervalle fermé et borné. C'est pourquoi nous introduisons la
définition suivante.
1.1. Définition. - Soit I = [a, b] un intervalle fermé et borné de IR, et E un espace
de Banach. Une application cp : I ---+ E sera dite de classe ci sur I si elle est
continues sur I, de classe ci (au sens usuel I.1. 7) sur l'intérieur ]a, b[ de I, et si
les limites
lim cp' (t) et lim cp' (t)
t-->a, t>a t-->b, t<b
existent. Lorsque c'est le cas, ces limites seront appelées, respectivement, dérivées
de cp aux points a et b, et notées cp'(a) et cp'(b).
Les applications de classe ci de I dans E seront appelées courbes paramétrées de
classe ci définies sur I et à valeurs dans E, ou plus simplement courbes de classe
ci, et leur ensemble sera noté C 1 ( I, E).
1.2. Remarques. - Dans les hypothèses de la définition 1.1, il est facile de montrer (par
un raisonnement analogue à celui fait dans la solution de l'exercice 13 du chapitre 1) que
cp' (a) et cp' (b) sont égales, respectivement, à la dérivée à droite de cp au point a et à la
dérivée à gauche de cp au point b (1.1.6.c ).
D'autre part, pour tout entier p 2: 1, on peut définir de même les applications de classe CP
de I dans E.
1.3. Proposition. - Soit I = [a, b] un intervalle fermé et borné de IR, et E un
espace de Banach. Pour toute application cp E ci (I, E), posons
ll'Pllc = supllcp(t)ll + supllcp'(t)ll ·
1
tE/ tE/
196 Chapitre VIII. Calcul des variations

L'application cp 1-t ll'Pllc1 est une norme sur ci(!, E). Muni de cette norme,
ci (I, E) est un espace de Banach.
Preuve : Il est facile de vérifier que ci (I, E) est un espace vectoriel et que cp 1-t ll'Pllc1
est une norme sur cet espace. Montrons que muni de cette norme, ci(!, E) est complet.
Remarquons d'abord que pour tout cp E ci (I, E), nous avons
supllcp(t)ll ~ ll'Pllc 1 ' supllcp'(t)ll ~ ll'Pllc 1 ·
tE/ tE/

Soit ('Pn, n E N) une suite de Cauchy dans ci (I, E). D'après ce qui précède, les suites
('Pn , n E N) et ( cp~ , n E N) sont de Cauchy pour la norme de la convergence uniforme
sur I. Elles convergent donc uniformément vers des applications continues de I dans E
(voir par exemple [T.VIII.1.8)), notées respectivement cp et 'I/;. D'après le théorème I.5.8, cp
est de classe ci sur ]a, b[ , et sa dérivée, en tout point t de cet intervalle, est cp' (t) = 'l/; (t).
Comme 'l/; est continue sur I, les limites limt-+a, t>a cp' (t) et limt-+b, t<b cp' (t) existent et
sont égales, respectivement, à 'l/;(a) et 'l/;(b). L'application cp est donc de classe ci sur I
au sens de la définition 1.1. Puisque la suite ('Pn , n E N) est de Cauchy, pour tout ê > 0,
il existe N E N tel que, sin 2 Net m 2 N, ll'Pn - 'Pmllc1 ~ €.En faisant tendre m
vers +oo, nous en déduisons que pour tout n 2 N, ll'Pn - cpllc1 ~€.Cela prouve que la
suite ('Pn , n E N) converge vers cp au sens de la norme dont est muni l'espace ci (I, E).
Nous concluons donc que cet espace est complet. D
1.4. Définitions. - Soient I = [a, b] un intervalle fermé et borné de IR, E un espace
de Banach, U un ouvert de IR x E x E et L : U - IR une application continue
(souvent appelée fonction de Lagrange ou lagrangien).
On appelle courbe L-admissible une application cp de I dans E, de classe ci sur I,
telle que pour tout t E I, (t, cp(t), cp'(t)) soit élément de U. L'ensemble des courbes
L-admissibles est noté fk.
On appelle fonctionnelle de Lagrange associée au lagrangien L l'application <PL qui
associe, à toute courbe L-admissible cp, le réel

<PL(cp) = 1b L(t, cp(t), cp'(t)) dt.

Remarquons que la fonctionnelle de Lagrange <PL est bien définie, puisque l'application
t 1-t L (t, cp( t), cp' (t)) est continue comme composée d'applications continues, donc peut
être intégrée sur l'intervalle fermé borné [a, b].
Le lemme qui suit montre que la fonctionnelle de Lagrange est définie sur un ouvert de
ci(!, E).
1.5. Lemme. - Avec les hypothèses et notations de la définition 1.4, l'ensemble
OL des courbes L-admissibles est un ouvert de l'espace de Banach ci(!, E).
Preuve : Si OL est vide, il est bien sOr ouvert. Supposons le non vide et montrons qu'il
est voisinage de chacun de ses éléments. Soit cp E 0 L. L'application de l x ci (l, E)
dans IR x E x E, (t, 'l/;) 1-t ( t, 'l/; (t), 'l/J' (t)), est continue car ses trois composantes le sont.
Pour chaque t E I, U est voisinage de (t, cp(t), cp'(t)), donc il existe un intervalle ouvert
Jt contenant t et un réel r t > 0 tels que pour tous s E Jt et 'l/; E ci (I, E) vérifiant
11'1/J - cpllc1 <Tt, nous ayons (s,'l/;(s),'l/;'(s)) E U. L'intervalle I est compact et les
Jt en forment un recouvrement ouvert, dont nous pouvons extraire un recouvrement fini
{ Ut 1' Ut 2 , ••• , Utn }. Soit r = inf (r tp r t 2 , ••• , r t,.). Nous voyons alors que pour tout
'l/; E ci(I,E) vérifiant 11'1/J- cpllc1 < r ettout t El, (t,'l/;(t),'l/;'(t)) est élément de U.
§ 2. La différentielle de la fonctionnelle de Lagrange 197

Autrement dit, la boule ouverte de centre <p et de rayon r est contenue dans nL. Nous
avons ainsi prouvé que nL est ouvert. D

2. La différentielle de la fonctionnelle de Lagrange


Nous allons prouver (théorème 2.3) que sous les hypothèses de la définition 1.4, lorsque de
plus le lagrangien Lest de classe CP, avec p ;::: 1, la fonctionnelle de Lagrange <I> L qui lui
est associée est de classe CP sur nL, et nous allons donner l'expression de sa différentielle.
Nous supposerons bien entendu désormais nL non vide. Nous utiliserons le lemme 2.2
ci-après (déjà énoncé en V.2.4.i), qui lui-même repose sur le lemme suivant.
2.1. Lemme. - Soit K un espace topologique compact, E un espace topologique,
(F, d) un espace métrique et h : K x E ~ F une application. Soit x 0 E E. On
suppose que pour toute E K, l'application h est continue au point (0, x 0 ). Alors
pour tout € > 0, il existe un voisinage U de x 0 dans E tel que, pour tout x E U et
tout t E K, d(h(t,x),h(t,x 0 ))::; €.
Preuve: Soit e E K. Puisque h est continue au point (0, x 0 ), il existe un voisinage ouvert
le de 0 dans K et un voisinage Ue de xo dans E tels que pour tous t E le et .'E E Ue,
on ait d(h(t, x), h(O, x0 )) ::; é/2. Lorsque eparcourt K, les le forment un recouvrement
ouvert du compact K, dont nous pouvons extraire un recouvrement fini. Il existe donc une
partie finie { 81, ... , Op} de K telle que LJ~=l le3 = K. Posons U = n~=l Ue 3 • C'est
l'intersection d'une famille finie de voisinages de x 0 , donc un voisinage de x 0 dans E. Soit
x E U et t E K. Il existe alors j (1 ::; j ::; p) tel que t E le3 , et bien sûr x E U c Uer
Nous avons, puisque (t, x) et (t, x 0 ) sont éléments de le3 x Ue 3 ,
€ €
d(h(t, x), h(t, x0 )) ::; d(h(t, x), h(Oj, xo)) + d(h(Oj, xo), h(t, xo)) ::; 2 + 2 = €. 0

2.2. Lemme. - Soient l = [a, b] un intervalle fermé et borné de IR, E et F deux


espaces de Banach, V un ouvert de E et h : l x V ~ F une application continue.
On pose, pour tout x E V,

'lf;(x) = 1b h(t, x) dt.

1. Dans ces hypothèses, l'application 'l/J : V~ F ainsi défi.nie est continue.


2. Soit p un entier ;::: 1. On suppose que pour tout entier k vérifiant 1 ::; k ::; p,
la différentielle partielle d'ordre k de h par rapport à sa seconde variable existe
en tout point (t, x) de l x V, et on la note n;~) h( t, x). On suppose aussi que les
applications (t,x) ~ n;~)h(t,x), pour 1::; k::; p, sont toutes continues sur lx V.
Alors l'application 'l/J est différentiable de classe CP sur V, et pour tout entier k
vérifiant 1 ::; k::; p, sa différentielle d'ordre ken un point x de V a pour expression

D(k)'lf;(x)= 1bn;~)h(t,x)dt. (*)

Preuve:
1. Soit x 0 E V. L'intervalle [a, b] étant compact et l'application h continue, le lemme
précédent montre que pour tout € > 0, il existe 'f/ > 0 tel que, pour tout x E V vérifiant
llx - xoll ::; 'fJ et tout t E [a, b], nous ayons

llh(t,x)- h(t,xo)ll::; b- a.
198 Chapitre VIII. Calcul des variations

Nous en déduisons

117/J(x) -7/J(xo)ll = 1b (h(t,x) - h(t,xo)) dt ~ 1bllh(t,x) - h(t,xo)ll dt


é
~ b-a (b-a)=é,
ce qui prouve que 7/J est continue au point x 0 .
2. Traitons d'abord le cas p = 1. Pour tout x E V, posons

x(x)= 1bDxh(t,x)dt.
D'après le résultat ci-dessus (appliqué à Dxh), x est une application continue de V dans
.C(E, F). Soit x 0 E V. Il existe p > 0 tel que tout élément x de E vérifiant llx - xoll ~ p
soit élément de V. Pour un tel élément x, le segment de droite [x 0 , x] est contenu dans V,
et (théorème des accroissements finis),
llh(t,x)-h(t,xo)-Dxh(t,xo)(x-xo)ll ~ sup llDxh(t,z)-Dxh(t,xo)ll llx-xoll ·
zE[xo,x]
Mais le lemme 2.1, appliqué à D x h, montre que pour tout é > 0, il existe rJ > 0 tel que,
si z E V vérifie llz - xoll ~ TJ, nous ayons
é
sup llDxh(t, z) - Dxh(t, xo)ll ~ -b- ·
tE[a,b] a
-
Nous pouvons imposer à rJ de vérifier rJ < p. Pour x E V vérifiant llx - xoll < rJ nous
avons alors, pour tout z E [xo, x], llz - xo Il < rJ donc, pour tout t E [a, b],
é
llh(t,x) - h(t,xo) - Dxh(t,xo)(x - xo)ll ~ b- a llx - xoll ·
Nous en déduisons
117/J(x)- 7/J(xo) - x(xo)(x - xo)ll
= 1b (h(t, x) - h(t, xo) - Dxh(t, xo)(x - xo)) dt

~ 1bllh(t,x) -h(t,xo)-Dxh(t,xo)(x - xo)ll dt


é
~ -b- llx - xoll(b- a)= éllx - xoll ·
-a
Ce résultat prouve que 7/J est différentiable au point x 0 et que sa différentielle en ce point
est x(x0 ) Comme nous avons prouvé la continuité de x, l'application 7/J est de classe C 1 .
Traitons maintenant le cas où p > 1. Soit j un entier vérifiant 1 ~ j < p, et supposons
qu'on ait déjà prouvé que pour tout entier k vérifiant 1 ~ k ~ j, D(k)'lj; existe et soit
continue sur V, et que sa valeur en un point x de V soit donnée par la formule (*). En
remplaçant h par D~) h et 7/J par D(Jl7j;, et en procédant exactement comme ci-dessus, on
montre alors que DU) 7/J est différentiable sur V et que sa différentielle D (DU) 7/J) (x) en
un point x de V est donnée par la formule

D(D<Jl7/J)(x) = 1b D(D~)h)(t,x)dt.

Mais D(D(j)7/J)(x) = D(J+1)7j;(x) et D(D~)h)(t,x) = D~!~)h(t,x). Nous voyons


donc que D(J+l)'lj;(x) existe et est donné par la formule (*),dans laquelle on fait k = j + 1.
La première partie du présent lemme montre alors que DU+l)'lj; est continue. Nous pouvons
conclure que 7/J est de classe CP sur V et que ses différentielles jusqu'à l'ordre p sont
données par la formule (*). D
§ 2. La différentielle de la fonctionnelle de Lagrange 199

2.3. Théorème. - Soient I = [a, b] un intervalle fermé et borné de IR, E un espace


de Banach, U un ouvert de lR x E x E et L : U -----> lR un lagrangien différentiable
de classe CP, avec p ;::: 1. La fonctionnelle de Lagrange

cp ~ <I>L(cp) = 1b L(t, cp(t), cp'(t)) dt

est différentiable de classe CP sur l'ensemble fh des courbes L-admissibles (1.4).


Sa différentielle première, en un point cp de nL, a pour expression

(D<I> L( cp ), u) = 1b (D 2 L(t, cp(t), cp' (t)), u(t)) dt+ 1b (D 3L( t, cp(t), cp' (t)), u' (t)) dt,

où D 2 L(t, x, v) et D 3L(t, x, v) désignent les différentielles partielles de L par


rapport à sa seconde et à sa troisième variable, respectivement, au point (t, x, v)
de U, et où u est un élément de ci (J, E). Nous avons noté ci-dessus (77, x) ~ (77, x)
le couplage d'un élément 77 du dual E' de E avec un élément x de E.
Preuve: D'après le lemme 1.5, <I> Lest une application définie sur l'ouvert OL de l'espace
de Banach ci(/, E). Soit h: l x OL -----> lR l'application

h(t,cp) = L(t,cp(t),cp'(t)).
Elle est composée de l'application de I X nL dans I X E X E, (t, cp) ~ (t, cp(t), cp' (t)),
qui est continue puisque ses trois composantes le sont, et del' application de l'ouvert U de
lR x Ex E dans IR, (t, x, y)~ L(t, x, y), qui est continue par hypothèse. L'application
h est donc continue.
D'autre part, l'application (t, cp) ~ (t, cp(t), cp'(t)) a des différentielles partielles de tous
les ordres par rapport à sa seconde variable cp, et ces différentielles partielles sont continues
sur I x OL. En effet, pour t E lR fixé, chacune des trois composantes de cette application
a des différentielles partielles de tous les ordres par rapport à cp : la première composante,
étant constante, a des différentielles partielles de tous ordres nulles; la seconde et la
troisième composantes sont les applications cp ~ cp(t) et <p ~ cp'(t), qui sont linéaires
continues; leurs différentielles partielles premières par rapport à la variable cp sont donc
les applications linéaires de ci (I, E) dans E : u ~ u( t) et u ~ u' (t ), repectivement, qui
dépendent continûment de (t, cp) (en fait, elles ne dépendent que de t, non de cp); quant à
leurs différentielles partielles d'ordre ;::: 2 par rapport à la variable cp, elles sont nulles.
L'application L étant, par hypothèse, de classe CP, avec p ;::: 1, l'application composée
h a des différentielles partielles par rapport à sa seconde variable jusqu'à l'ordre p, et
ces différentielles partielles sont continues. On obtient en particulier l'expression de
la différentielle partielle première par application de la règle de différentiation d'une
application composée:
D 2 h(t, cp)(u) = (D 2 L(t, cp(t), cp'(t)), u(t)) + (D3L(t, cp(t), cp'(t)), u'(t)).
En appliquant le lemme 2.2, nous voyons que la fonctionnelle de Lagrange <I> L est de classe
CP sur OL, et que sa différentielle première, en un élément cp de fh, a pour expression

(D<I>L(cp), u) = 1b (D 2 L(t, cp(t), cp'(t)), u(t)) dt+ 1b (D 3L(t, cp(t), cp'(t)), u'(t)) dt,

où u désigne un élément de ci(/, E). D


200 Chapitre VIII. Calcul des variations

3. L'équation d'Euler
3.1. Problème d'extremum pour les courbes d'extrémités fixées. - Dans tout ce
paragraphe, les hypothèses et notations sont celles du théorème 2.3. Pour tous a et
(3 E E, nous notons C 1 (I, E, a, (3) l'ensemble des courbes paramétrées c.p E C 1 (I, E)
qui vérifient c.p(a) = a, c.p(b) = (3. C'est visiblement un sous-espace affine de l'espace
vectoriel C 1 (I, E) qui se déduit, par translation, du sous-espace vectoriel C 1 (I, E, 0, 0) de
C 1 (I, E). Puisque l'application de C 1 (I, E) dans Ex E, cp 1--t ( cp(a), cp(b)) est continue,
C 1 (I, E, 0, 0) est un sous-espace vectoriel fermé de C 1 (I, E), donc un espace de Banach.
De même, pour tous a et (3 E E, C 1 ( I, E, a, (3) est un sous-espace affine fermé, donc
complet, de C 1 (I, E). Posons
fh,a,/3 = fh n C 1 (I, E, a, (3).
Puisque fh est un ouvert de C 1 (I, E) (lemme 1.5), nL,a,/3 est un ouvert de l'espace affine
C 1 (!, E, a, (3). En particulier, OL,o,o est un ouvert de l'espace de Banach C 1 (!, E, 0, 0).
Nous dirons que nL,a,/3 est l'ensemble des courbes L-admissibles d'extrémités a et (3, et
que nL,o,o est l'ensemble des courbes L-admissibles d'extrémités nulles.
Les éléments a et (3 de E étant supposés fixés et tels que nL,a,/3 soit non vide, nous
étudions le problème suivant: trouver une courbe paramétrée c.p, élément de nL,a,/3• telle
que la fonctionnelle de Lagrange <PL restreinte à nL,a,/3 admette en c.p un maximum relatif
ou un minimum relatif. La proposition suivante indique une condition nécessaire que doit
satisfaire cp.
3.2. Proposition. - Soient I = [a, b] un intervalle fermé et borné de~. E un espace
de Banach, U un ouvert de ~ x E x E et L : U --t ~ un lagrangien différentiable
de classe CP, avec p 2: 1, a et (3 deux éléments de E. Les notations étant celles
du théorème 2.3 et de 3.1, on suppose que la restriction de la fonctionnelle de
Lagrange
<I>L(cp) = 1b L(t,cp(t),cp'(t)) dt, <p E C 1 (I, E),

à l'ensemble (supposé non vide) nL,a,/3 des courbes L-admissibles d'extrémités a


et (3 admet, en un point c.p de cet ensemble, un minimum relatif ou un maximum
relatif. Alors, pour toute courbe L-admissible d'extrémités nulles u E C 1 (I, E, 0, 0),
on a
(D<I> L( cp ), u) = 1b(D L(t, cp(t), cp' (t)), u(t)) dt+ 1b(D L(t, cp(t), cp' (t)), u' (t)) dt
2 3

=0.

Preuve: Nous avons vu (3.1) que C 1 (I,E,a,(3) est un sous-espace affine fermé de
l'espace de Banach C 1 (I, E), qui se déduit par translation du sous-espace vectoriel fermé
C 1 (I, E, 0, 0). Nous avons vu également que OL,a,/3 est un ouvert de C 1 (I, E, a, (3), que
nous supposons non vide. La fonctionnelle <I> L étant de classe CP sur nL. sa restriction à
nL,a,{3 est aussi de classe CP.
Supposons que la restriction de la fonctionnelle de Lagrange <I> Là nL,a,/3 ait un minimum
relatif ou un maximum relatif en un point c.p de nL,a,/3· D'après le théorème III.5.3, la
différentielle, au point <p, de la restriction de <I> L à nL,a,/3 est nulle. Mais cette différentielle
n'est autre que la restriction de D<I> L( <p) au sous-espace vectoriel C 1 (I, E, 0, 0) de
C 1 (I, E). Le résultat annoncé en découle. D

Afin de mettre la condition suffisante obtenue dans la proposition 3.2 sous une forme plus
commode, nous aurons besoin des trois lemmes suivants.
§ 3. Uéquation d'Euler 201

3.3. Lemme. - Soit I = [a, b] un intervalle fermé et borné de IR, E un espace de


Banach réel, E' = C(E, JR) son dual. Une application continue A de I dans E' est
identiquement nulle si et seulement si, pour pour toute application u de I dans E,
de classe ci sur I, vérifi.ant u(a) = 0 et u(b) = 0, on a

1b(A(t),u(t))dt=O. (*)

Preuve: Si A est identiquement nulle sur [a, b], l'égalité (*)est évidemment vérifiée pour
toute application u E ci (I, E, 0, 0). Réciproquement, supposons A non identiquement
nulle, et prouvons qu'il existe une application u E ci(J, E, 0, 0) telle que le membre de
gauche de ( *) soit strictement positif. Puisque A est continue et non identiquement nulle,
il existe un point c intérieur à l'intervalle I tel que A(c) # O. Il existe un élément z de
Etel que (A(c), z) # O; en remplaçant éventuellement z par son opposé, nous pouvons
supposer (A(c), z) >O. Par continuité de l'application t ~ (A(t), z), il existe ry > 0 tel
que a< c-ry < c+ry < betquepourtoutt E [c-ry,c+ry],nousayons(A(t),z) >O. Soit
x : [a, b] --t lR une fonction de classe ci, à valeurs 2'. 0, nulle en dehors de [c - ry, c + ry],
et strictement positive au point c. Une telle fonction existe, par exemple
pour a ::; t ::; c - ry,

x(t) ~ ~xp (- ~2 (~
{ _ _ c)') pour c - ry ::; t ::; c + ry,
pour c + rJ ::; t ::; b.
Posons, pour tout t E [a,b], u(t) = x(t)z. L'application t ~ (A(t),u(t)) est alors
continue, partout positive ou nulle sur [a, b] et strictement positive au point c. Son intégrale
sur [a, b] est donc strictement positive. 0
3.4. Lemme de Du Bois-Reymond. - Soit I = [a, b] un intervalle fermé et borné de
IR, E un espace de Banach réel, E' = C(E, IR) son dual. Une application continue
B de I dans E' est constante si et seulement si, pour toute application u de I dans
E, de classe ci sur I, vérifi.ant u(b) = u(a) = 0, on a

1b ( B (t) , u' (t)) dt = 0 .

Preuve : Si B est constante nous avons, d'après la propriété V.2.4.f de l'intégrale, pour
toute application u : I --t E de classe ci prenant la même valeur aux extrémités a et b de
l'intervalle I,

1b(B,u'(t))dt= (B,1b u'(t)dt) = (B,u(b)-u(a)) =0.


Réciproquement, supposons B non constante sur I. Comme cette application est continue,
il existe deux points ci et c2 de I, vérifiant a < ci < c2 < b, tels que B (ci) # B (c2). Il
existe un élément z de E tel que ( B (ci), z) # ( B (c 2), z) ; en remplaçant éventuellement
z par son opposé, nous pouvons supposer (B(ci), z) > (B(c2), z). Par continuité de
l'application t ~ (B(t), z), il existe rJ > 0 tel que a < ci - 'TJ < ci + 'TJ < c2 - 'TJ <
c2 + rJ < b, et que

inf { (B(t), z) ; t E [ci - r1, ci+ 77]} > sup{ (B(t), z) ; t E [c2 - ry, c2 + ry]}.
Cela implique, a fortiori, que pour touts E [-ry, ry],
( B (Ci + s) - B ( C2 + s)' z) > 0 .
202 Chapitre VIII. Calcul des variations

Soit alors x : IR ---? IR une fonction continue, à valeurs 2:: 0, nulle en dehors de l'intervalle
] - rJ, ry[ et strictement positive à l'origine. Nous pouvons prendre par exemple
rJ - ltl
x(t) = { -rJ- pour ltl ::; 'f/,
0 pour ltl > rJ.
Posons alors, pour tout t E J,

((t) = l t (x(O - ci) - x(O - c2)) dO,


et
u(t) = ((t) z.
L'application u vérifie u(a) = u(b) = 0, elle est de classe ci sur I et a pour dérivée
u'(t) = (x(t - ci) - x(t - c2))z.
Nous avons donc

lb (B(t), u'(t)) dt= lb (B(t), z) (x(t - ci) - x(t - c2)) dt

= 1: (B(ci + s) - B(c2 + s), z)x(s) ds.


Cette dernière expression est visiblement strictement positive, puisque la fonction intégrée
sur [-ry, ry] est continue, partout positive ou nulle et non nulle à l'origine. D
3.5. Lemme fondamental du calcul des variations. - Soit I = [a, b] un intervalle
fermé et borné de IR, E un espace de Banach réel, E' = .C(E, IR) son dual, A et B
deux applications continues de I dans E'. On a

lb ((A(t),u(t)) + (B(t),u'(t))) dt= 0


pour toute application u de I dans Ede classe ci sur I vérifiant u(a) = u(b) = 0,
si et seulement si B est une primitive de A, c'est-à-dire est différentiable sur ]a, b[
et a pour dérivée, en tout point t de cet intervalle,
B'(t) = A(t).

Preuve : Posons, pour tout t E I,

C(t) = l t A(O) dO.


L'application C est une primitive de A; elle est de classe ci sur I et a pour dérivée A.
Soit u une application de I dans E, de classe ci sur I, vérifiant u(a) = u(b) = O. Nous
avons, pour tout t E J,
d
(A(t),u(t)) =dt (C(t),u(t))- (C(t),u'(t)),
donc

lb(A(t),u(t))dt = (C(b),u(b))-(C(a),u(a))- lb(C(t),u'(t))dt

= - lb ( C (t), u' (t)) dt ,


§ 3. L'équation d'Euler 203

puisque u(a) = u(b) =O. Nous pouvons donc écrire

lb ( (A(t) u(t)) + (B(t), u'(t))) dt= lb (B(t) - C(t), u'(t)) dt.


D'après le lemme de Du Bois-Reymond, cette expression est nulle pour toute application
u : I --+ E de classe ci sur I vérifiant u( a) = u( b) = 0 si et seulement si B - C est
constant sur I, c'est-à-dire si et seulement si Best, comme C, une primitive de A. 0
3.6. Remarque. - Lorsque lapplication B est supposée différentiable de classe ci, la
démonstration du lemme fondamental du calcul des variations peut être simplifiée. Nous
pouvons en effet dans ce cas faire une intégration par parties, c'est-à-dire écrire

(B(t),u'(t)) = :t (B(t),u(t))- (B'(t),u(t)),


puis

lb (\A(t),u(t)) + (B(t),u'(t))) dt= lb(A(t)-B'(t),u(t))dt


+ (B(b),u(b))- (B(a),u(a))

= lb(A(t)-B'(t),u(t))dt,
puisque u(b) = u(a) =O. Il ne reste plus alors qu'à utiliser le lemme 3.3 pour tenniner
la démonstration. Mais la démonstration donnée précédemment est préférable car elle ne
nécessite pas d'hypothèse sur la différentiabilité de B.
3.7. Théorème. - Soient I = [a, b] un intervalle fermé et borné de IR, E un espace
de Banach, U un ouvert de lR x E x E et L : U --+ lR un lagrangien différentiable
de classe CP, avec p 2: 1, o: et /3 deux éléments de E. Les notations étant celles
du théorème 2.3 et de 3.1, on suppose que la restriction de la fonctionnelle de
Lagrange
<I>L(<p) =lb L(t,<p(t),<p'(t)) dt, <p E ci(J,E),

à l'ensemble (supposé non vide) O.L,a,/3 des courbes L-admissibles d'extrémités o:


et /3 admet, en un point <p de cet ensemble, un minimum relatif ou un maximum
relatif. Alors l'application de I dans le dual E' de E,
t 1-+ DaL(t, <p(t), <p'(t))
est de classe ci sur I et sa dérivée, en chaque point t E J, est D 2 L(t,<p(t),<p'(t)).
On peut exprimer ce résultat par la relation, appelée équation d'Euler,

:t DaL(t, <p(t), <p'(t)) = D 2 L(t, cp(t), cp'(t)).

Preuve : Il suffit d'appliquer la proposition 3.2 et le lemme fondamental du calcul des


variations 3.5. D
3.8. Étude de l'équation d'Euler. - Les hypothèses et notations étant celles du théorème
précédent, nous supposons de plus le lagrangien L différentiable de classe CP, avec p 2: 2.
Nous allons mettre l'équation d'Euler sous une fonne plus explicite. Afin d'alléger les
notations, nous écrirons le lagrangien L comme une fonction de trois variables,
(t,x,v) 1-+ L(t,x,v).
204 Chapitre VIII. Calcul des variations

Nous noterons les différentielles partielles premières de L par rapport à sa première, sec-
onde et troisième variable, L~ (t, x, v ), L~(t, x, v) et L~(t, x, v ),respectivement. De même,
nous noterons ses différentielles partielles secondes distinctes L~'t (t, x, v ), L~' x ( t, x, v ),
L~'v(t, x, v ), L~ x(t, x, v ), L~ v(t, x, v) et L~ v(t, x, v ). L'équation d'Euler s'écrit

:t L~(t,<p(t),<p'(t))-L~(t,<p(t),<p'(t)) =O.
Supposons d'abord la courbe <p : I -----+ E qui figure dans cette équation différentiable de
classe C 2 . Nous avons alors, par application des règles de différentiation d'une application
composée,

~ L~(t, <p(t), <p (t)) = L~'v(t, <p(t), <p (t)) + L~ v(t, <p(t), <p (t)) <p (t)
1 1 1 1

+ L~v(t, <p(t), <p (t))<p (t),


1 11

où nous avons noté <p 1 et <p 11 les dérivées première et seconde de <p. L'équation d'Euler
s'écrit donc
L~ V ( t, <p(t), <p1 (t) )<p" (t) + L~ V ( t, <p(t), <p 1 (t) )<p' (t)
+L~'v(t,<p(t),<p'(t))-L~(t,<p(t),<p'(t)) =0. (**)
C'est une équation différentielle du second ordre dont l'inconnue est l'application <p.
Elle n'est pas sous forme canonique, puisqu'elle n'est pas résolue par rapport à la
dérivée de <p(t) de l'ordre le plus élevé, <p11 (t). Celle-ci apparaît en effet dans le terme
L~ v (t, <p( t), <p1 ( t)) <p11 ( t). Rappelons que L~ v (t, <p( t), <p1 ( t)) doit être considérée ici
comme une application linéaire de E dans C(E, IR.), c'est-à-dire de E dans son dual
E'. Nous verrons plus loin comment, moyennant certaines hypothèses supplémentaires,
l'équation d'Euler sous sa forme explicite (**) peut être mise sons forme canonique (et,
simultanément, ramenée au premier ordre).
Il y a cependant une difficulté : l'application <p étant élément de l'espace ci (I, E) des
applications de classe ci de I dans E, et étant l'inconnue, nous ne sommes pas assurés a
priori qu'elle est de classe C 2 • Par conséquent, nous ne pouvons pas affirmer a priori que
l'équation d'Euler (*) puisse être explicitée sous la forme (** ). La proposition suivante
résoud en partie cette difficulté.
3.9. Proposition. - Les hypothèses et notations étant celles du paragraphe
précédent, soit (to, xo, vo) un élément de l'ouvert U de IR. x E x E sur lequel
est défi.ni le lagrangien L, avec to E ]a, b[. On suppose que L~ v(t0 , x 0 , v0 ) est un
isomorphisme de E sur son dual E'. Sous ces hypothèses,
(i) il existe une solution <p de l'équation d'Euler (*), défi.nie sur un intervalle ouvert
J contenant t 0 , vérifiant <p(to) = xo et <p1 (t 0 ) = v0 , et de classe CP sur J;
(ii) toute autre solution 'ljJ de l'équation d'Euler(*), définie sur un intervalle J'
contenant to et vérifiant 'ljJ(to) = xo et 'ljJ'(to) = vo, coïncide avec <p sur un intervalle
ouvert contenant t 0 ; en particulier, elle est de classe CP sur cet intervalle.
Preuve : Considérons l'application, définie sur l'ouvert U de IR. x E x E, et à valeurs
dans IR. x E x E', (t, x, v) 1-t ( t, x, L~ (t, x, v)). Puisque, par hypothèse, L~ v(to, x 0 , vo)
est un isomorphisme de E sur E', nous pouvons appliquer à L~ le théorème des
fonctions inverses. Posons p0 = L~(t 0 , x 0 , v0 ). Nous pouvons affirmer qu'il existe un
voisinage V de (t 0 , x 0 , v 0 ) dans IR. x Ex E, V c U, et un voisinage W de (t 0 , x 0 ,p0 )
dans IR. x Ex E', tels que l'application (t,x,v) 1-t (t,x,p = L~(t,x,v)) soit un
difféomorphisme de classe cp-i de V sur W. Le difféomorphisme inverse est de la
forme (t,x,p) 1-t (t,x,v = h(t,x,p)).
§ 3. L'équation d'Euler 205

Considérons l'équation différentielle non autonome, dans J'espace Ex E',


d~~t) = h(t, x(t),p(t)),
{ ( ***)
dp(t) =Lx'(t,x(t),h(t,x(t),p(t)) ) .
--;ft
Nous avons noté t f-t (x(t),p(t)) une application (inconnue) d'un intervalle ouvert de lR
dans E x E', solution de cette équation.
L'équation différentielle ( ***) est sous forme canonique.L'application (définie sur l'ouvert
W de lR x Ex E', à valeurs dans Ex E') qu'elle fait intervenir,
(t, x,p) f-t ( h(t, x,p), L~ (t, x, h(t, x,p)))
est différentiable de classe cp-l. Le point (t 0 , x 0 , p 0 ) est une donnée de Cauchy acceptable
pour cette équation, puisque c'est un élément de W. Il existe donc une solution maximale
unique de cette équation, notée t f-t (x(t),p(t)), qui vérifie x(t 0 ) = x 0 etp(t0 ) = p0 .
Soit J l'intervalle ouveit contenant t 0 sur lequel elle est définie. La proposition Vl.4.1
nous permet d'affirmer que cette solution est différentiable de classe CP sur J. Posons
<.p(t) = x(t). Nous vérifions aisément que <.p, ainsi définie, est solution de l'équation
d'Euler(*) et qu'elle vérifie <.p(t0 ) = x 0 , <.p'(t0 ) = v0 . De plus, elle est différentiable de
classe CP, puisque c'est la première composante de l'application t f-t (x(t), p(t)), qui est
de classe CP.
Soit maintenant 'ljJ : J' ---+ E une solution de l'équation d'Euler (*), définie sur un
intervalle ouvert J' contenant t 0 et vérifiant 'l/;(to) = x 0 , 'l/J'(t0 ) = vo. Pour tassez voisin
de t 0 , (t,'l/;(t),'l/;'(t)) est élément de V. Nous pouvons alors prendre son image par le
difféomorphisme de V sur W, (t,x,v) f-t (t,x,p = L~(t,x,v)). Nous voyons alors
que l'application t 'I/;( t), L~ (t, 'I/;( t), 'l/J' (t))) est solution de l'équation différentielle
f-t (

(***),et satisfait la donnée de Cauchy (t 0 ,x0 ,v0 ). En raison de l'unicité, nous avons
donc, pour tout t E J' n J assez voisin de t 0 , 'l/;(t) = <.p(t). D
3.10. Remarques. - Nous supposons toujours le lagrangien L différentiable de classe
CP, avec p ~ 2.
a) La notion d'extrémale. - Afin de faciliter le langage, on appelle souvent extrémale de
la fonctionnelle de Lagrange <I> L· relativement au problème d'extremum pour les courbes
<.p à extrémités fixées <.p(a) = a, <.p(b) = /3, toute courbe paramétrée <.p E nL,o,f3 qui
vérifie, pour toute courbe L-admissible u E C 1 (E, I, 0, 0) d'extrémités nulles,
( D<I> L( <.p), u) = O.
La proposition 3.2 montre que si la restriction de la fonctionnelle <I> L à l'ensemble nL,a,f3
des courbes L-admissibles d'extrémités <.p(a) = a et <.p(b) = /3 admet, en un élément <.p
de cet ensemble, un maximum relatif ou un minimum relatif, alors <.p est une extrémale de
<I> L relativement au