Vous êtes sur la page 1sur 472

Agrégation

E N S E I G N E M E N T S U P M AT H Master

Jean-Étienne Rombaldi

ÉLÉMENTS
D’ANALYSE RÉELLE
2e édition
Jean‐Étienne ROMBALDI

Éléments d’analyse réelle


2e édition
Imprimé en France

ISBN (papier) : 978‐2‐7598‐2339‐0 ‐ ISBN (ebook) : 978‐2‐7598‐2378‐9

Tous droits de traduction, d’adaptation et de reproduction par tous procédés, réservés


pour tous pays. La loi du 11 mars 1957 n’autorisant, aux termes des alinéas 2 et 3 de
l’article 41, d’une part, que les « copies ou reproductions strictement réservées à
l’usage privé du copiste et non destinées à une utilisation collective », et d’autre part,
que les analyses et les courtes citations dans un but d’exemple et d’illustration, « toute
représentation intégrale, ou partielle, faite sans le consentement de l’auteur ou de ses
ayants droit ou ayants cause est illicite » (alinéa 1er de l’article 40). Cette représentation
ou reproduction, par quelque procédé que ce soit, constituerait donc une contrefaçon
sanctionnée par les articles 425 et suivants du code pénal.

© EDP Sciences, 2019


Table des matières

Avant-propos vii

1 Espaces métriques 1
1.1 Topologie associée à une distance . . . . . . . . . . . . . . . . . . . 1
1.2 Suites à valeurs dans un espace métrique . . . . . . . . . . . . . . . 5
1.3 Limites et continuité . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.4 Propriétés globales des fonctions continues . . . . . . . . . . . . . . 13
1.5 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

2 Espaces normés 25
2.1 Semi-normes et normes . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.2 Applications linéaires continues . . . . . . . . . . . . . . . . . . . . 30
2.3 Espaces vectoriels normés de dimension finie . . . . . . . . . . . . . 34
2.4 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

3 Espaces préhilbertiens 49
3.1 Inégalités de Cauchy-Schwarz et Minkowski . . . . . . . . . . . . . 50
3.2 Orthogonalité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
3.3 Orthogonalisation de Gram-Schmidt . . . . . . . . . . . . . . . . . 54
3.4 Meilleure approximation dans un espace préhilbertien . . . . . . . 56
3.5 Inégalité de Bessel et égalité de Parseval . . . . . . . . . . . . . . . 60
3.6 Déterminants de Gram . . . . . . . . . . . . . . . . . . . . . . . . . 64
3.7 Les théorèmes de Müntz . . . . . . . . . . . . . . . . . . . . . . . . 69
3.8 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

4 Suites numériques 87
4.1 Suites numériques convergentes . . . . . . . . . . . . . . . . . . . . 87
4.2 Suites réelles monotones, adjacentes . . . . . . . . . . . . . . . . . 93
4.3 Développement décimal d’un réel . . . . . . . . . . . . . . . . . . . 98
4.4 Fractions continues . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
4.5 Sous-groupes additifs de R . . . . . . . . . . . . . . . . . . . . . . . 114
4.6 Moyennes de Cesàro . . . . . . . . . . . . . . . . . . . . . . . . . . 116
4.7 Limites supérieure et inférieure . . . . . . . . . . . . . . . . . . . . 120
4.8 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
iv

5 Vitesse et accélération de la convergence des suites réelles 139


5.1 Vitesse de convergence . . . . . . . . . . . . . . . . . . . . . . . . . 139
5.2 Accélération de la convergence . . . . . . . . . . . . . . . . . . . . 143
5.3 Méthode d’accélération d’Aitken . . . . . . . . . . . . . . . . . . . 144
5.4 Méthode d’accélération de Richardson . . . . . . . . . . . . . . . . 146
5.5 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151

6 Limites et continuité des fonctions d’une variable réelle 161


6.1 Limite et continuité en un point . . . . . . . . . . . . . . . . . . . . 161
6.2 Opérations sur les fonctions continues . . . . . . . . . . . . . . . . 167
6.3 Fonctions périodiques continues . . . . . . . . . . . . . . . . . . . . 169
6.4 Propriétés globales des fonctions continues . . . . . . . . . . . . . . 169
6.5 Le théorème des valeurs intermédiaires . . . . . . . . . . . . . . . . 173
6.6 Fonctions réciproques . . . . . . . . . . . . . . . . . . . . . . . . . 175
6.7 Prépondérance, domination et équivalents . . . . . . . . . . . . . . 178
6.8 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 184

7 Dérivées des fonctions d’une variable réelle 197


7.1 Dérivée d’ordre 1 et dérivées d’ordre supérieur . . . . . . . . . . . 197
7.2 Opérations sur les fonctions dérivables . . . . . . . . . . . . . . . . 201
7.3 Sens de variation d’une fonction . . . . . . . . . . . . . . . . . . . . 205
7.4 Dérivée logarithmique . . . . . . . . . . . . . . . . . . . . . . . . . 208
7.5 Extrema et dérivation . . . . . . . . . . . . . . . . . . . . . . . . . 209
7.6 Position d’une courbe par rapport aux sécantes et aux tangentes . 212
7.7 Dérivation et intégration . . . . . . . . . . . . . . . . . . . . . . . . 214
7.8 Suites de fonctions dérivables . . . . . . . . . . . . . . . . . . . . . 215
7.9 Fonctions différentiables . . . . . . . . . . . . . . . . . . . . . . . . 216
7.10 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217

8 Fonctions convexes 225


8.1 Fonctions convexes . . . . . . . . . . . . . . . . . . . . . . . . . . . 225
8.2 Régularité des fonctions convexes . . . . . . . . . . . . . . . . . . . 231
8.3 Inégalités de convexité . . . . . . . . . . . . . . . . . . . . . . . . . 239
8.4 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245

9 Théorèmes de Rolle et des accroissements finis 251


9.1 Le théorème de Rolle . . . . . . . . . . . . . . . . . . . . . . . . . . 251
9.2 Applications du théorème de Rolle . . . . . . . . . . . . . . . . . . 254
9.3 Théorème et inégalité des accroissements finis . . . . . . . . . . . . 258
9.4 Applications des théorèmes et inégalités des accroissements finis . . 261
9.5 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 279

10 Les formules de Taylor 287


10.1 La formule de Taylor-Lagrange . . . . . . . . . . . . . . . . . . . . 287
10.2 Formule de Taylor avec reste intégral . . . . . . . . . . . . . . . . . 288
10.3 Cas des fonctions de plusieurs variables . . . . . . . . . . . . . . . 289
10.4 Applications des formules de Taylor . . . . . . . . . . . . . . . . . 292
10.5 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 303
v

11 Développements limités 307


11.1 Le théorème de Taylor-Young . . . . . . . . . . . . . . . . . . . . . 309
11.2 Opérations sur les développements limités . . . . . . . . . . . . . . 310
11.3 Utilisation des développements limités . . . . . . . . . . . . . . . . 315
11.4 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 323

12 Points fixes et approximations successives 329


12.1 Le théorème du point fixe de Picard . . . . . . . . . . . . . . . . . 329
12.2 Cas des fonctions d’une variable réelle . . . . . . . . . . . . . . . . 334
12.3 Suites homographiques . . . . . . . . . . . . . . . . . . . . . . . . . 337
12.4 Applications à la résolution d’équations numériques . . . . . . . . . 342
12.5 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 348

13 Équations fonctionnelles 355


13.1 Morphismes du groupe additif (R, +) dans lui même . . . . . . . . 355
13.2 Morphismes de groupes de (R, +) dans (C, +) . . . . . . . . . . . . 357
13.3 Morphismes du groupe (C, +) dans lui même . . . . . . . . . . . . 358
13.4 Morphismes de groupes de (R∗ , ·) dans (R, +) . . . . . . . . . . . . 358
13.5 L’équation fonctionnelle f (x + y) = f (x) f (y) sur R . . . . . . . . 360
13.6 L’équation fonctionnelle f (xy) = f (x) f (y) sur R+,∗ . . . . . . . . 361
13.7 L’équation fonctionnelle f (x + y) + f (x − y) = 2f (x) f (y) sur R . 361
13.8 L’exponentielle complexe . . . . . . . . . . . . . . . . . . . . . . . 363
13.9 L’équation fonctionnelle f (x + 1) = xf (x) . . . . . . . . . . . . . . 364
13.10 L’équation fonctionnelle f (x ∧ y) = f (x) ∧ f (y) sur R3 . . . . . . 367
13.11 Suites complexes définies par une relation de récurrence linéaire . 371
13.12 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 375

14 Équations différentielles linéaires 381


14.1 Équations différentielles linéaires du premier ordre . . . . . . . . . 381
14.2 Équations différentielles linéaires d’ordre 2 à coefficients constants 385
14.3 Équations différentielles linéaires d’ordre n à coefficients constants 389
14.4 Équations différentielles linéaires d’ordre n . . . . . . . . . . . . . . 392
14.5 Racines des solutions d’une équation différentielle linéaire d’ordre 2 394
14.6 Équations différentielles linéaires à coefficients développables en sé-
rie entière . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 399
14.7 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 402

15 Polynômes orthogonaux 417


15.1 Produit scalaire associé à une fonction poids et polynômes orthogo-
naux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 417
15.2 Polynômes orthogonaux classiques, formules de Rodrigues . . . . . 425
15.3 Les polynômes de Legendre . . . . . . . . . . . . . . . . . . . . . . 432
15.4 Développement en série de polynômes orthogonaux . . . . . . . . . 440
15.5 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 446

Bibliographie 453

Index 455
Avant-propos

Cet ouvrage destiné aux étudiants préparant l’agrégation de Mathématiques


(interne ou externe) n’est pas organisé comme un cours suivant strictement les
programmes. L’ouvrage de Guy Auliac et J. Y. Caby ou celui de Jean-François
Dantzer indiqués en bibliographie répondent tout à fait à cet objectif. Je me suis
efforcé de rédiger les chapitres de ce livre de manière indépendante en me concen-
trant sur les thèmes importants des programmes. Le chapitre 1 peut très bien utili-
ser un résultat classique exposé dans un chapitre suivant. Je pense que cette façon
de procéder peut être utile pour construire des leçons d’oral de l’agrégation. J’ai
également privilégié la recherche d’exemples d’applications et de contre-exemples
illustrant la nécessité de certaines hypothèses dans l’énoncé d’un théorème, c’est
ce travail de synthèse qu’il s’agit de faire dans l’élaboration d’un plan de leçon
d’oral.
Chaque chapitre se termine par une série d’exercices tous corrigés en détails.
On a un total de 166 exercices qui peuvent constituer un bon entraînement pour
les épreuves écrites et fournir du matériel pour la deuxième épreuve orale de l’agré-
gation interne.
Les deux premiers chapitres sont consacrés aux espaces métriques et aux es-
paces normés. On y présente les principaux résultats topologiques en relation avec
l’étude des suites et des fonctions continues. Le cas des espaces vectoriels normés
de dimension fini est particulièrement étudié.
Le cas particulier des espaces préhilbertiens fait l’objet du chapitre 3. Les ré-
sultats de ce chapitre seront utiles pour l’étude des polynômes orthogonaux.
Le chapitre 4 est consacré à l’étude des suites réelles ou complexes et à l’ap-
proximation des nombres réels par des nombres décimaux ou par des fractions
continues régulières limitées à coefficients entiers. On étudie en particulier les dé-
veloppements décimaux des réel, et les nombres rationnels sont caractérisés comme
les réels admettant un développement décimal illimité propre périodique à partir
d’un certain rang. Les fractions continues nous donnent un autre moyen d’appro-
cher les nombres réels par des rationnels et ils permettent également de caractériser
les nombres rationnels comme les réels admettant un développement en fraction
continue régulière limité à coefficients entiers. Dans ce chapitre, on s’intéresse
également aux sous-groupes additifs de R avec pour applications, un important
critère d’irrationalité et l’étude des fonctions continues périodiques. Les théorèmes
de Cesàro y sont étudiés en détails.
Le chapitre 5 complète le précédent par une étude des méthodes d’accélération
de la convergence de Aïtken et de Richardson.
viii Avant-propos

Avec le chapitre 6, on s’intéresse aux propriétés des fonctions continues d’une


variable réelle à valeurs réelles. On s’intéresse aux notions propres à la droite
réelle de continuité à gauche et à droite, ce qui permet de distinguer deux types
de discontinuités : les discontinuités de première et de deuxième espèce. Le cas
des fonctions monotones est particulièrement intéressant du fait qu’une fonction
monotone sur un intervalle réel admet des limites à droite et à gauche en tout point,
ce qui entraîne qu’elle ne peut avoir que des discontinuités de première espèce et
que l’ensemble de ses points discontinuités est au plus dénombrable. Toujours dans
le cadre des fonctions d’une variable réelle, le cas des fonctions périodiques est
particulièrement intéressant. L’étude des sous-groupes additifs de R nous permet
de montrer que le groupe des périodes d’une fonction continue périodique non
constante est discret, ce qui permet de définir la plus petite période strictement
positive d’une telle fonction. Quelques conséquences de ce résultat sont proposées
en exercice. L’étude des propriétés globales des fonctions continues a été faite au
premier chapitre. En lien avec la connexité, on montre que les connexes (et les
convexes) de R sont les intervalles et que la continuité conserve la connexité. La
version réelle de ce résultat est le théorème des valeurs intermédiaires. Dans le cadre
des fonctions d’une variable réelle, on montre le résultat suivant : si f : I → R
vérifie la propriété des valeurs intermédiaires, où I est un intervalle réel, alors elle
est continue si, et seulement si, f −1 {y} est un fermé pour tout réel y. Dans le cas
particulier des fonctions monotones, on montre que si f : I → R est monotone et si
f (I) est un intervalle alors f est continue sur l’intervalle I. Ce résultat est utilisé
pour montré le résultat suivant à la base des définitions des fonctions réciproques
usuelles : si f : I → R est continue strictement monotone, elle réalise alors un
homéomorphisme de I sur f (I) , les intervalles I et f (I) étant de même nature.
L’étude de la dérivation des fonctions d’une variable réelle à valeurs réelles ou
complexes arrive naturellement au chapitre 7. Dans un premier temps, on rappelle
les définitions des dérivées d’ordre 1 et d’ordre supérieur. Si une fonction déri-
vable est continue, on peut construire un exemple de fonction continue nulle part
dérivable. J’ai choisi de présenter l’exemple classique de Van der Waerden. Les ré-
sultats usuels concernant les opérations sur les fonctions dérivables sont complétés
par l’énoncé de la formule de Faà di Bruno donnant la dérivée d’ordre n d’une com-
posée de deux fonctions dérivables en renvoyant à [13] pour une démonstration.
La définition de la dérivée logarithmique est suivie d’une application au théorème
de relèvement utilisé pour montrer que l’indice d’un lacet dans le plan complexe
est un entier.
Après avoir étudié le lien entre dérivation et extrema, on s’intéresse au théorème
de Darboux qui nous dit qu’une fonction dérivée vérifie la propriété des valeurs
intermédiaires. Ce théorème est suivi de quelques applications qu’il est bon de
connaître pour des leçons d’oral.
La dérivation est également utilisée pour étudier les positions relatives d’une
courbe par rapport aux sécantes et aux tangentes. L’étude de la position d’une
courbe par rapport aux sécantes nous conduit naturellement à la notion de convexité
qui sera étudiée de manière plus approfondie au chapitre 8.
On s’intéresse également dans ce chapitre au lien entre dérivation et intégration
et aux suites de fonctions dérivables.
Avant-propos ix

La condition nécessaire d’extremum, f  (a) = 0 n’est qu’un cas particulier d’un


résultat plus général portant sur les fonctions différentiables définies sur un ouvert
de Rn et à valeurs réelles.
Le chapitre 8 est consacré à l’étude des fonctions convexes d’une variable réelle.
Après en avoir donné les principales propriétés, on s’intéresse à la régularité de
ces fonctions, à savoir la continuité sur l’intérieur de l’intervalle de définition, la
dérivabilité à droite et à gauche et la monotonie des dérivées. Dans le cas des
fonctions dérivables, la convexité de la fonction f est équivalente à la croissance
de sa dérivée f  . Ce résultat peut se généraliser au cas des fonctions définies sur
un ouvert convexe d’un espace vectoriel normé et à valeurs réelles. L’étude des
fonctions convexes est en particulier intéressant pour l’obtention d’inégalités de
convexité. Ainsi à partir de la convexité de la fonction exp et de la concavité de la
fonction ln, on déduit quelques inégalités classiques dont celle de Hölder. La conca-
vité de la fonction ln peut être utilisée pour comparer les moyennes harmoniques,
arithmétiques et géométriques. Les inégalités de Jensen sont montrées dans le cas
des espaces vectoriels normés.
Le chapitre 9 est consacré au théorèmes de Rolle et des accroissements finis
ainsi qu’aux nombreuses applications de ces théorèmes. Pour l’étude du théorème
de Rolle on se place directement dans le cadre des espaces vectoriels normés dans
la mesure où le raisonnement est identique à celui mené dans le cadre des fonctions
d’une variable réelle. Dans le cadre des fonctions d’une variable réelle ce théorème
est encore valable sur une demi-droite fermée ou sur R. Le théorème de Rolle
sur un intervalle compact de R peut aussi se montrer en utilisant le principe de
dichotomie. Parmi les nombreuses applications du théorème de Rolle, on s’intéresse
au théorème de Darboux, à l’étude des racines des polynômes réels avec comme
cas particulier celui des polynômes orthogonaux, à l’obtention d’une majoration de
l’erreur dans la méthode d’interpolation de Lagrange et à un critère de convexité.
Le théorème des accroissements finis et sa généralisation peuvent se déduire
du théorème de Rolle. Ce théorème n’est pas valable pour les fonctions à valeurs
dans Rp pour p ≥ 2, mais on dispose toutefois d’une inégalité des accroissements
finis. Parmi les nombreuses applications du théorème des accroissements finis, on
s’intéresse à l’étude du sens de variation des fonctions, au lien entre limite et dé-
rivation, à l’étude de la dérivabilité d’une fonction définie par une intégrale, à la
longueur des arcs géométriques, à l’étude des points fixes attractifs et répulsifs, à
l’obtention d’une majoration de l’erreur dans la méthode de Simpson, aux suites
de fonctions dérivables, au lien entre l’existence de dérivées partielles et la différen-
tiabilité, au théorème de Schwarz sur les dérivées partielles d’ordre 2, au théorème
de Darboux et aux nombre de Liouville qui nous donnent un exemple d’ensemble
infini de nombres transcendants.
Le théorème de Rolle permet également d’aboutir à la formule de Taylor-
Lagrange. Les différentes formules de Taylor sont étudiées au chapitre 10. Dans ce
chapitre on s’intéresse également au cas des fonctions de plusieurs variables avec
pour application l’étude de problèmes d’extrema. Là encore l’accent est mis sur
les applications avec l’introduction des développements limités à une et plusieurs
variables, l’étude de problèmes d’extrema, l’obtention d’inégalités, les développe-
ments en série entière avec en particulier des théorèmes de Bernstein donnant des
conditions suffisantes pour qu’une fonction de classe C ∞ soit développable en série
x Avant-propos

entière, un théorème de Kolmogorov sur des majorations de dérivées, l’obtention


de majorations d’erreurs dans les méthodes de Lagrange et de Newton ainsi que
dans la méthode des rectangles.
La formule de Taylor-Young nous conduit naturellement à l’étude des dévelop-
pements limités. Cette étude est menée au chapitre 11. Dans ce chapitre on s’inté-
resse tout d’abord aux notions de prépondérance, de domination et d’équivalence
en regroupant dans un premier paragraphe la plupart des résultats importants sur
le sujet. Après avoir présenté les différentes techniques d’obtention des développe-
ments limités, on s’intéresse aux applications avec l’obtention d’équivalents pour
les suites ou les séries, l’obtention de développements asymptotiques, l’étude de la
position d’une courbe par rapport aux tangentes ou aux asymptotes.
Le chapitre 12 qui peut être vu comme une application à l’analyse numérique
des chapitres précédents est consacré à l’étude des suites d’approximations succes-
sives définies par une relation de récurrence xn+1 = f (xn ) . Ces suites permettent
d’obtenir des approximations des points fixes de la fonction continue f. Les suites
homographiques représentent un cas intéressant de telles suites, elles sont étu-
diées en détail en s’intéressant à la façon de choisir le terme initial x0 pour que
la suite soit bien définie (cette étude est souvent éludée dans les ouvrages de pre-
mier cycle). Pour f continue sur un intervalle compact, une première condition
nécessaire et suffisante de convergence d’une telle suite est donnée par la condition
lim (xn+1 − xn ) = 0. Le théorème du point fixe, qui nous donne une importante
n→+∞
condition suffisante de convergence, est étudié dans le cadre des espaces métriques
complets. Ce théorème peut être utilisé pour la recherche de solutions approchées
d’une équation numérique f (x) = 0 et nous conduit naturellement aux méthodes
de Lagrange et de Newton. Dans l’étude de ces méthodes on s’intéresse aux ma-
jorations des erreurs d’approximation.
Le chapitre 13 est consacré aux équations fonctionnelles. On étudie les équa-
tions classiques f (x + y) = f (x) + f (y) pour f définie sur R ou C et à valeurs
réelles ou complexes ; f (xy) = f (x) + f (y) sur R+ et f (x + y) = f (x) f (y) sur
R qui nous conduisent aux fonctions logarithmes et exponentielles réelles ou com-
plexes ; f (xy) = f (x) f (y) sur R+,∗ qui nous conduit aux fonctions puissances ;
f (x + y) + f (x − y) = 2f (x) f (y) qui nous conduit aux fonctions cos et ch . Pour
ces études on ne se limite pas seulement au cas des fonctions continues. On s’inté-
resse également à une caractérisation de la fonction Γ d’Euler par sa log-convexité
et l’équation fonctionnelle f (x + 1) = xf (x) . Dans ce chapitre on ne se limite pas
aux fonctions d’une variable réelle ou complexe. On donne une caractérisation des
rotations vectorielles de R3 par l’équation fonctionnelle f (x ∧ y) = f (x) ∧ f (y) ,
où ∧ désigne le produit vectoriel. Les suites définies par une récurrence linéaire
d’ordre n sont également étudiées comme solutions d’équations fonctionnelles.
Le chapitre 14 est consacré à l’étude des équations différentielles linéaires. Dans
un premier temps on étudie les équations différentielles linéaires d’ordre 1, ce qui
permet de motiver l’introduction de l’équation caractéristique lors de l’étude des
équations différentielles linéaires d’ordre 2 à coefficients constants et sans second
membre. Cette étude est généralisée au cas des équations d’ordre n et c’est le
lemme des noyaux qui permet de donner la forme générale des solutions. Le cas
des équations différentielles linéaires d’ordre n à coefficients non constants est
étudié en se ramenant à un système linéaire d’ordre 1 et en utilisant le théorème
Avant-propos xi

de Cauchy-Lipschitz linéaire. Ce chapitre se termine par une étude qualitative


des solutions des équations différentielles linéaires d’ordre 2 en s’intéressant aux
racines de ces solutions.
Enfin le chapitre 15 est consacré à une étude des polynômes orthogonaux. On
y présente les principales propriétés (relations de récurrence, racines de ces poly-
nômes, ...). Les polynômes orthogonaux classiques sont présentés comme vecteurs
propres de certains opérateurs différentiels, ce qui nous conduit aux formules de
Rodrigues. Les polynômes de Legendre sont étudiés de façon plus approfondie.
Cette deuxième édition contient pour l’essentiel ce qui était présent dans la pre-
mière avec l’ajout des chapitres sur les espaces métriques, normés, préhilbertiens
et le chapitre sur les polynômes orthogonaux.
Pour conclure, je tiens à remercier les éditions EDP Sciences pour la confiance
qu’ils m’accordent en publiant cette deuxième édition.
xii Avant-propos
Chapitre 1

Espaces métriques

Avec ce chapitre, on se contente de donner les définitions et résultats basiques


sur les espaces métriques. Les notions de suites et de continuité dans le cadre des
espaces vectoriels normés et dans le cadre réel seront étudiées plus en détails dans
les chapitres suivants.

1.1 Topologie associée à une distance


Pour ce paragraphe, on se donne un ensemble non vide E.

Définition 1.1. Une distance sur E est une application d : E × E → R


telle que pour tous x, y, z dans E, on ait :
— d (y, x) = d (x, y) ;
— d (x, y) = 0 si, et seulement si, y = x ;
— d (x, z) ≤ d (x, y) + d (y, z) (inégalité triangulaire).
Le couple (E, d) est un espace métrique.

Exemple 1.1 La valeur absolue [resp. le module] sur R [resp. sur C] induit une
distance en posant d (x, y) = |y − x| pour tous x, y dans R [resp. dans C].

On peut remarquer qu’une distance sur E est nécessairement à valeurs positives.


En effet, pour tous x, y dans E, on a :

0 = d (x, x) ≤ d (x, y) + d (y, x) = 2d (x, y)

et nécessairement d (x, y) ≥ 0. Cette condition de positivité est souvent imposée


dans la définition d’une distance, ce qui n’est pas vraiment utile.
Si d est une distance sur E et I une partie non vide de E, la restriction de d à
I × I définit alors une distance sur I (distance induite).
De l’inégalité triangulaire, on déduit que pour tous x, y, z dans E, on a :

|d (x, z) − d (y, z)| ≤ d (x, y)


2 Espaces métriques

(deuxième inégalité triangulaire). Cela résulte de d (x, z) ≤ d (x, y) + d (y, z) et


d (y, z) ≤ d (y, x) + d (x, z) .
Pour la suite de ce paragraphe, (E, d) est un espace métrique.
Pour toute partie non vide A de E et tout élément x de E, on note respec-
tivement δ (A) = sup d (x, y) et d (x, A) = inf d (x, a) le diamètre de A et la
(x,y)∈A2 a∈A
+
distance de x à A. d (x, A) est un élément de R (borne inférieure d’une partie
non vide et minorée) et δ (A) est un élément R+ = R+ ∪ {+∞} . Dans le cas où
δ (A) est fini, on dit que A est bornée.
On vérifie facilement que pour tous x, y dans E, on a :

|d (x, A) − d (y, A)| ≤ d (x, y)

Pour tout a ∈ E et tout r ∈ R+,∗ , on note B (a, r) = {x ∈ E | d (x, a) < r} et


B (a, r) = {x ∈ E | d (x, a) ≤ r} . L’ensemble B (a, r) [resp. B (a, r)] est la boule
ouverte [resp. la boule fermée] de centre a et de rayon r.

Définition 1.2. On appelle voisinage d’un point a de (E, d) toute partie V


de E qui contient une boule ouverte de centre a et de rayon r > 0.

Définition 1.3. On dit qu’une partie O de (E, d) est un ouvert si elle est
vide ou si elle est non vide et voisinage de chacun de ses points, ce qui
signifie que pour tout a ∈ O il existe un réel r > 0 tel que B (a, r) ⊂ O. On
dit qu’une partie F de (E, d) est un fermé si son complémentaire E \ F est
un ouvert.

Un ouvert est donc une réunion de boules ouvertes.


Pour toute partie non vide I de E, les ouverts [resp. les fermés] de (I, d) sont
les ensembles de la forme O ∩ I [resp. F ∩ I] où O [resp. F] est un ouvert [resp.
un fermé] de E (ouverts et fermés pour la topologie induite).

Exemples 1.1
1. Une boule ouverte [resp. fermée] de E est un ouvert [resp. un fermé] de (E, d) .
En effet, pour tout x ∈ B (a, r) , on a r  = r − d (a, x) > 0 et B (x, r ) ⊂ B (a, r)
(pour y ∈ B (x, r ) on a d (y, a) ≤ d (y, x) + d (x, a) < r + d (x, a) = r). De
même pour x ∈ E \ B (a, r) , on a r = d (a, x) − r > 0 et B (x, r ) ⊂ E \ B (a, r)
(pour y ∈ B (x, r ) on a d (y, a) ≥ d (x, a) − d (x, y) > d (a, x) − r = r).
2. Pour toute partie non vide A de E et tout réel r ∈ R+,∗ , l’ensemble Vr (A) =
{x ∈ E | d (x, A) < r} est un ouvert qui contient A. En effet, il est clair que
Vr (A) contient A (on a d (x, A) = 0 pour x ∈ A) et pour tout x ∈ Vr (A) ,
on a r = r − d (A, x) > 0 et B (x, r ) ⊂ Vr (A) (pour y ∈ B (x, r ) on a
d (y, A) ≤ d (y, x) + d (x, A) < r + d (x, A) = r).

Définition 1.4. Un sous-ensemble non vide C de (E, d) est connexe si la


condition C ⊂ O1 ∪ O2 avec O1 , O2 ouverts de E tels que C ∩ O1 ∩ O2 = ∅
Topologie associée à une distance 3

entraîne C ∩ O1 = ∅ (et donc C ⊂ O2 ) ou C ∩ O2 = ∅ (et donc C ⊂ O1 ),


c’est-à-dire que C ne peut s’écrire comme réunion disjointe de deux ouverts
de C.

Le résultat qui suit nous sera utile pour montrer que les connexes (et convexes)
de R sont les intervalles (corollaire 2.1).

Lemme 1.1 L’intervalle [0, 1] est connexe dans (R, |·|) .

Preuve. Supposons qu’il existe deux ouverts O1 , O2 dans R tels que [0, 1] ⊂
O1 ∪ O2 et [0, 1] ∩ O1 ∩ O2 = ∅. On peut supposer que 0 ∈ O1 . Il existe alors un
réel ε ∈ ]0, 1[ tel que [−ε, ε] ⊂ O1 et l’ensemble I = {x ∈ ]0, 1] | [0, x] ⊂ O1 } est
non vide majoré par 1. On peut donc poser α = sup (I) et on a 0 < α ≤ 1. Par
définition de la borne supérieure, pour tout x ∈ ]0, α[ on peut trouver y ∈ ]x, α] ∩ I
et on a x ∈ [0, y] ⊂ O1 . On a donc ainsi montré que ]0, α[ ⊂ O1 . Si α ∈ O2 , il
existe alors ε ∈ ]0, α[ tel que [α − ε, α + ε] ⊂ O2 et [α − ε, α[ ⊂ [0, 1] ∩ O1 ∩ O2
ce qui est impossible. On a donc α ∈ O1 et [0, α] ⊂ O1 . Si α < 1, il existe alors
ε ∈ ]0, 1 − α[ tel que [0, α + ε] ⊂ O1 et α+ε ∈ I en contradiction avec α = sup (I) .
On a donc α = 1 et [0, 1] ⊂ O1 , ce qui entraîne [0, 1] ∩ O2 = ∅. En conclusion,
[0, 1] est connexe. 
Théorème 1.1.
L’ensemble vide, l’ensemble E, une réunion d’ouverts et une intersection
finie d’ouverts sont des ouverts de (E, d) . L’ensemble vide, l’ensemble E,
une réunion finie de fermés et une intersection de fermés sont des fermés
de (E, d) .

Preuve. Il est clair que ∅ et E sont des ouverts.


Si (Oi )i∈I est une famille quelconque d’ouverts non vides (les Oi vides peuvent

être supprimés de la réunion) et x un élément de O = Oi , il existe alors un réel
i∈I
ri0 > 0 tel que B (x, ri0 ) ⊂ Oi0 ⊂ O, donc O est ouvert.
Si (Ok )1≤k≤n est une famille finie d’ouverts non vides (le cas où l’un des Ok
n
est vide est trivial) et x un élément de O = Ok , il existe alors des réel rk > 0,
k=1
tels que B (x, rk ) ⊂ Ok pour tout k compris entre 1 et n. Le réel r = min rk est
1≤k≤n

n
alors strictement positif et B (x, r) ⊂ B (x, rk ) ⊂ O, donc O est ouvert.
k=1
Le résultat sur les fermés s’en déduit par passage au complémentaire. 
Une intersection infinied’ouverts
 n’est pas nécessairement un ouvert comme le
 1 1
montre l’exemple de − , = {0} dans (R, |·|) .
n n
n∈N∗
Une réunion infinie de fermés n’est pas nécessairement un fermé comme le
 1
montre l’exemple de , +∞ = ]0, +∞[ dans (R, |·|) .

n
n∈N
4 Espaces métriques

De manière plus générale, un fermé de (E, d) est l’intersection d’une suite dé-
croissante d’ouverts et un ouvert est la réunion d’une suite croissante de fermés
(exercice 1.4).


Définition 1.5. L’intérieur d’une partie A de (E, d) , noté A, est le plus
grand ouvert de E contenu dans A. L’adhérence d’une partie A de (E, d) ,
notée A, est le plus petit fermé de E contenant A.

On vérifie facilement que l’intérieur de A est aussi la réunion de tous les ouverts
de E contenus dans A et que l’adhérence de A est l’intersection de tous les fermés
de E qui contiennent A.
Théorème 1.2.

Pour tout sous-ensemble A de (E, d) , on a A ⊂ A [resp. A ⊂ A], l’égalité
étant réalisée si, et seulement si, A est ouvert [resp. fermé].

◦ 
Preuve. Par définition, on a A = Oi ⊂ A où (Oi )i∈I est la famille de tous
i∈I

les ouverts de E contenus dans A. L’égalité A = A nous dit que A est ouvert
comme réunion d’ouverts. Réciproquement si A est ouvert, c’est alors l’un des Oi
◦ ◦
et nécessairement, A ⊂ A, cequi donne l’égalité A = A.
De même, on a A ⊂ A = Fi où (Fi )i∈I est la famille de tous les fermés de E
i∈I
qui contiennent A. L’égalité A = A nous dit que A est fermé comme intersection de
 Réciproquement si A est fermé, c’est alors l’un des Fi et nécessairement,
fermés.
A= Fi ⊂ A, ce qui donne l’égalité A = A. 
i∈I

Théorème 1.3.
L’adhérence d’une partie A de (E, d) est l’ensemble des éléments x de E
tels que d (x, A) = 0, ce qui revient à dire que x ∈ A si, et seulement si, pour
tout réel ε > 0, il existe y ∈ A tel que d (x, y) < ε (soit A ∩ B (x, ε) = ∅).

Preuve. Il revient au même de montrer que d (x, A) > 0 si, et seulement si,
x ∈ E \ A.
Si δ = d (x, A) > 0, on a alors d (x, y) ≥ δ pour tout y ∈ A et E \ B (x, δ) est un
fermé qui contient A, donc A ⊂ E \ B (x, δ) et en conséquence, B (x, δ) ⊂ E \ A,
donc x ∈ E \ A. Réciproquement, si x ∈ E \ A, comme cet ensemble est ouvert, il
existe un réel ε > 0 tel que B (x, ε) ⊂ E \ A, donc A ⊂ A ⊂ E \ B (x, ε) et on a
d (x, y) ≥ ε pour tout y ∈ A, ce qui implique que d (x, A) ≥ ε > 0. 
Du théorème précédent, on déduit que A ⊂ E est fermé si, et seulement si,
d (x, A) = 0 pour tout x ∈ A.
Suites à valeurs dans un espace métrique 5

Définition 1.6. On dit qu’une partie A de E est dense dans (E, d) si


A = E, ce qui signifie que pour tout x ∈ E et tout ε > 0, il existe y ∈ A tel
que d (x, y) < ε (soit A ∩ B (x, ε) = ∅).

Définition 1.7. On dit que l’espace métrique (E, d)est séparable s’il existe
dans E une partie dense dénombrable.

Exemples 1.2
1. De la densité de Q dans R (corollaire 4.2 ou exercice 4.1), on déduit que (R, |·|)
est séparable.
2. Un espace métrique compact est séparable (exercice 1.6).

1.2 Suites à valeurs dans un espace métrique


Pour ce paragraphe, (E, d) est un espace métrique et les résultats de base sur
les suites réelles sont supposés connus. Ces suites sont étudiées au chapitre 4.

Définition 1.8. On dit qu’une suite (xn )n∈N d’éléments de (E, d) est
convergente s’il existe un élément  de E tel que lim d (xn , ) = 0. Une
n→+∞
suite non convergente est dite divergente.

La convergence de (xn )n∈N vers  se traduit par :

∀ε > 0, ∃n0 ∈ N | ∀n ≥ n0 , d (xn , ) < ε (1.1)

Dans l’assertion (1.1) , les deux dernières inégalités peuvent être strictes ou
larges et il est parfois commode de se limiter à ε ∈ ]0, 1[ sans que cela ne soit
restrictif.
Cette notion de convergence dépend de la distance choisie sur E (exercice 1.2
et le paragraphe 2.1).
En utilisant l’inégalité triangulaire, on vérifie facilement que si une suite (xn )n∈N
d’éléments de (E, d) est convergente, sa limite est alors unique, ce qui nous permet
de noter  = lim xn ou xn → .
n→+∞ n→+∞
Une suite convergente est bornée. En effet, si lim xn = , il existe alors un
n→+∞
entier n0 tel que d (xn , xm ) ≤ d (xn , ) +d (xm , ) < 2 pour tout n > n0 et tout
m > n0 , donc sup d (xn , xm ) ≤ max max d (xn , xm ) , 2 , ce qui signifie
(n,m)∈N2 0≤n,m≤n0
que (xn )n∈N est bornée.
6 Espaces métriques

Définition 1.9. On dit qu’une suite (xn )n∈N d’éléments de (E, d) est de
Cauchy si :

∀ε > 0, ∃n0 ∈ N | ∀n ≥ n0 , ∀m ≥ n0 , d (xn , xm ) < ε

Les entiers m et n jouant des rôles symétriques, on peut se limiter à m > n ≥ n0


dans la définition précédente.
Le résultat suivant est souvent utilisé pour montrer qu’une suite est de Cauchy.
Théorème 1.4.
Si (xn )n∈N est une suite d’éléments de (E, d) pour laquelle il existe une
suite (εn )n≥n0 de réels positifs et un entier n0 vérifiant :

∀m > n ≥ n0 , d (xm , xn ) ≤ εn
lim (εn ) = 0
n→+∞

elle est alors de Cauchy.

Preuve. De lim (εn ) = 0, on déduit que pour tout réel ε > 0 on peut trouver
n→+∞
un entier n1 ≥ n0 tel que εn < ε pour tout n ≥ n1 , ce qui entraîne d (xm , xn ) < ε
pour m > n ≥ n1 . 
Théorème 1.5.
Toute suite de Cauchy dans (E, d) est bornée et toute suite convergente
est de Cauchy.

Preuve. La première affirmation est une conséquence directe de la définition et


la deuxième se déduit de l’inégalité triangulaire. 
Dans le cas où toute suite de Cauchy dans (E, d) est convergente, on dit que
l’espace métrique (E, d) est complet.
Les notions d’intérieur et d’adhérence peuvent se définir de façon séquentielle.
Théorème 1.6.
Soit A une partie non vide de (E, d) . L’intérieur de A est l’ensemble
des points x de E tels que pour toute suite (xn )n∈N d’éléments de E qui
converge vers x, il existe un entier n0 tel que xn ∈ A pour tout n ≥ n0 .
L’adhérence de A est l’ensemble des points x de E qui sont limites d’une
suite de points de A.


Preuve. Si x ∈ A, il existe alors un réel ε > 0 tel que B (x, ε) ⊂ A et pour toute
suite (xn )n∈N d’éléments de E qui converge vers x, il existe un entier n0 tel que

d (xn , x) < ε pour tout n ≥ n0 , ce 
qui implique que xn ∈ A. Si x ∈/ A, alors
 pour

1 1
tout entier n ≥ 1, la boule B x, n’est pas contenue dans A (comme B x,
n n
Suites à valeurs dans un espace métrique 7

◦ ◦
 dans A, elle est aussi contenue dans A et x ∈ A),
est ouverte, si elle estcontenue
1
donc il existe xn ∈ B x, \ A, ce qui nous donne une suite qui converge vers x
n
avec tous ses termes en dehors de A. D’où la définition séquentielle de l’intérieur.
L’adhérence de A est A = {x ∈ E | d (x, A) = 0} (théorème 1.3), donc pour tout
1
x ∈ A et tout entier n ≥ 1, il existe xn ∈ A tel que d (xn , x) < , ce qui nous donne
n
une suite de points de A qui converge vers x. Réciproquement si x est la limite
d’une suite (xn )n∈N d’éléments de A, des encadrements 0 ≤ d (x, A) ≤ d (xn , x) ,
on déduit que d (x, A) = 0, soit que x ∈ A. 
De ce théorème, on peut déduire des définitions séquentielles des notions d’ou-
verts et de fermés. Un ensemble O est ouvert dans (E, d) si, et seulement si, pour
toute suite (xn )n∈N d’éléments de E qui converge vers x ∈ O, il existe un entier

n0 tel que xn ∈ O pour tout n ≥ n0 (cela résulte de O = O). Un ensemble F est
fermé dans (E, d) si, et seulement si, toute suite convergente d’éléments de F a sa
la limite dans F (cela résulte de F = F).
On en déduit aussi qu’une partie A de E est dense dans (E, d) si, et seulement
si, tout x ∈ E est la limite d’une suite de points de A.

Définition 1.10. Soit (xn )n∈N une suite d’éléments de (E, d) . On dit qu’un
élément a de E est valeur d’adhérence de (xn )n∈N s’il est limite d’une suite
extraite, ce qui signifie qu’il existe une application ϕ : N → N strictement
croissante telle que a = lim xϕ(n) .
n→+∞

On vérifie facilement par récurrence sur n ≥ 0 que si ϕ : N → N est une fonction


strictement croissante, on a alors ϕ (n) ≥ n pour tout n ∈ N.
Théorème 1.7.
Un élément a de (E, d) est valeur d’adhérence d’une suite (xn )n∈N si :

∀ε > 0, ∀n ∈ N, ∃m ≥ n | d (xm , a) < ε (1.2)

Preuve. Si a = lim xϕ(n) est une valeur d’adhérence de (xn )n∈N , pour tout
n→+∞
réel ε > 0, il existe alors un entier n0 tel que d xϕ(n) , a < ε pour tout n ≥ n0 .
Pour n ∈ N et p = max (n0 , n) , on a m = ϕ (p) ≥ p, donc m ≥ n, p ≥ n0 et
d (xm , a) = d xϕ(p) , a < ε. Réciproquement si a ∈ E vérifie (1.2) , on construit
1
alors par récurrence une suite extraite xϕ(n) n∈N telle que d xϕ(n) , a <
n+1
pour tout n ∈ N. Pour initialisation, on part de m = ϕ (0) ≥ 0 tel que d (xm , a) < 1.
Supposant obtenus, pour n ≥ 0, une suite d’entiers ϕ (0) < · · · < ϕ (n) tels que
1
d xϕ(k) , a < pour tout k compris entre 0 et n, il existe un entier m =
k+1
1
ϕ (n + 1) ≥ ϕ (n) + 1 tel que d (xm , a) < . On a alors lim d xϕ(n) , a = 0,
n+2 n→+∞
ce qui signifie que a est une valeur d’adhérence de (xn )n∈N . 
8 Espaces métriques

Une suite peut être sans valeur d’adhérence comme le montre l’exemple de la
suite réelle (n)n∈N . De manière plus générale, si (xn )n∈N est une suite d’éléments
de (E, d) pour laquelle il existe un réel r > 0 tel d (xi , xj ) ≥ r pour tous i = j
dans N, il est alors impossible d’en extraire une suite convergente.
Théorème 1.8.
Une suite convergente a pour unique valeur d’adhérence sa limite.

Preuve. Soit (xn )n∈N suite d’éléments de (E, d) convergente vers . Pour tout réel
ε > 0, il existe n0 ∈ N tel que d (xn , ) pour tout n ≥ n0 et pour toute application
ϕ : N → N strictement croissante, on a ϕ (n) ≥ n ≥ n0 pour tout n ≥ n0 , ce qui
entraîne que d xϕ(n) ,  < ε. La suite xϕ(n) n∈N est donc convergente vers . 
La réciproque du théorème précédent est fausse comme le montre l’exemple de
la suite réelle (xn )n∈N définie par x2n = n et x2n+1 = 0 (elle est divergente avec 0
pour unique valeur d’adhérence), mais elle vraie pour une suite à valeurs dans un
compact (théorème 1.11).
Étant donnée une suite (xn )n∈N d’éléments de (E, d) , on note V l’ensemble de
ses valeurs d’adhérence et pour tout n ∈ N, Rn = {xk | k ≥ n} l’ensemble des
valeurs de la suite (xk )k≥n .
Théorème 1.9.

Soit (xn )n∈N une suite d’éléments de (E, d) . On a Rn = Rn ∪ V pour



tout n ∈ N et V = Rn .
n∈N

Preuve. Pour toute valeur d’adhérence a = lim xϕ(k) de (xn )n∈N et tout k ∈ N,
k→+∞
on a ϕ (k) ≥ k, donc pour tout n ∈ N, la suite xϕ(k) k≥n
est à valeurs dans Rn
et en conséquence sa limite a est dans Rn . On a donc V ⊂ Rn pour tout n ∈ N et
comme Rn ⊂ Rn , on a Rn ∪ V ⊂ Rn . Tout a ∈ Rn est limite d’une suite de points
(yk )k∈N de Rn . Si a est dans Rn , il est alors dans Rn ∪ V, sinon pour tout ε > 0, il
existe un entier k0 tel que 0 < d (yk , a) < ε pour tout k ≥ k0 . En écrivant chaque
yk sous la forme yk = xψ(k) , on peut trouver pour tout n ∈ N un entier k ≥ k0
tel que m = ψ (k) > n (s’il existe n ∈ N tel que ψ (k) ≤ n pour tout k ≥ k0 , la
suite (yk )k≥k0 ne prend qu’un nombre fini de valeurs et sa limite  est l’une de
ces valeurs, donc dans Rn contrairement à notre hypothèse) ce qui nous donne
d (xm , a) = d (yk , a) < ε. Du théorème (1.7) , on déduit alors que a est valeur
d’adhérence de (xn )n∈N , soit a ∈ V ⊂ Rn ∪ V. D’où l’égalité Rn = Rn ∪ V pour
tout n ∈ N. 
On en déduit que l’ensemble V est contenu dans tous les Rn , donc dans Rn .
n∈N
Du théorème (1.7) , on déduit que pour tout a ∈ E \ V il existe un réel ε > 0 et un
entier n ∈ N tels que d (xm , a) ≥ ε pour
 tout m ≥ n, ce qui implique
 que a n’est
pas dans Rn et en conséquence, a ∈ / Rn . D’où l’égalité V = Rn . 
n∈N n∈N
Du théorème précédent, on déduit que l’ensemble des valeurs d’adhérence de la
suite (xn )n∈N est fermé dans E comme intersection de fermés.
Suites à valeurs dans un espace métrique 9

Définition 1.11. On dit qu’une partie K de (E, d) est compacte si de toute


suite de points de A, on peut extraire une sous-suite qui converge dans K
(propriété de Bolzano-Weierstrass ).

Lemme 1.2 Soit K un compact de (E, d) . Pour tout réel r > 0, il existe une suite

n
finie (ak )1≤k≤n d’éléments de K telle que K ⊂ B (ak , r) .
k=1

Preuve. Supposons qu’il existe r > 0 tel que K ne puisse être recouvert par un
nombre fini de boules ouvertes de rayon r et centrée en a ∈ K. Partant de x0 ∈ K,
il existe x1 ∈ K \ B (x0 , r) (puisque K n’est pas contenu dans B (x0 , r)), donc
d (x0 , x1 ) ≥ r. Supposant obtenus x0 , · · · , xn dans K tels que d (xi , xj ) ≥ r pour
n
tous i = j compris entre 1 et n, comme K n’est pas contenu dans B (xk , r) ,
k=1
il existe xn+1 ∈ K tel que d (xn+1 , xk ) ≥ r pour tout k compris entre 1 et r. On
construit donc ainsi une suite (xn )n∈N d’éléments de K telle que d (xi , xj ) ≥ r
pour tous i = j dans N et d’une telle suite il est impossible d’extraire une suite
convergente, ce qui n’est pas possible pour K compact. 
Théorème 1.10.
Un compact dans un espace métrique est fermé et borné.

Preuve. Soit K un compact de (E, d) . Pour toute suite (xn )n∈N d’éléments de K
qui converge vers  ∈ E, on peut extraire une suite qui converge vers un élément
de K, donc  ∈ K. L’ensemble K est donc fermé. Le lemme précédent nous dit

n
qu’il existe une suite finie (ak )1≤k≤n d’éléments de K telle que K ⊂ B (ak , 1) ,
k=1
donc pour tous x, y dans K il existe j, k compris entre 1 et n tels que (x, y) ∈
B (aj , 1) ∩ B (ak , 1) et en conséquence :
d (x, y) ≤ d (x, aj ) + d (aj , ak ) + d (ak , y) < 2 + d (aj , ak )
ce qui nous donne δ (K) ≤ 2 + max d (aj , ak ) et signifie que K est borné. 
1≤j,k≤n
La réciproque du théorème précédent est fausse en général, mais elle est vraie
dans le cas des espaces vectoriels normés de dimension finie (théorème 2.9).
Théorème 1.11.
Soient K un compact de (E, d) et (xn )n∈N une suite d’éléments de K.
1. Si (xn )n∈N a un nombre fini a1 , · · · , ar de valeurs d’adhérences, alors

r
pour tout réel ε > 0, il existe un entier n0 tel que xn ∈ B (ak , ε) pour
k=0
tout n ≥ n0 .
2. La suite (xn )n∈N est convergente si, et seulement si, elle a un unique
valeur d’adhérence.
10 Espaces métriques

Preuve. Comme K est compact, (xn )n∈N a au moins une valeur d’adhérence.
1. En notant V l’ensemble des valeurs d’adhérence de (xn )n∈N , on suppose que
V = {a1 , · · · , ar } . S’il existe ε > 0 tel que pour tout entier n ∈ N, il existe

r
un entier pn ≥ n tel que xpn ∈ / B (ak , ε) , soit d (xpn , ak ) ≥ ε pour tout k
k=0
compris entre 1 et r, on peut alors construire par récurrence une suite (ϕ (n))n∈N
strictement croissante d’entiers telle que d xϕ(n) , ak ≥ ε pour tout k compris
entre 1 et r et de cette suite dans le compact K, on peut extraire une sous suite
xψ(n) n∈N qui converge vers a ∈ K tel que d (a, ak ) ≥ ε > 0, donc a est une
valeur d’adhérence de (xn )n∈N qui n’est pas dans V, c’est impossible. D’où le
résultat annoncé.
2. On sait déjà que si (xn )n∈N converge, elle a alors une unique valeur d’adhérence
(que cette suite soit à valeurs dans un compact ou pas). Réciproquement, si
V = {} , on déduit alors du premier point que pour tout ε > 0, il existe
n0 ∈ N tel que xn ∈ B (, ε) pour tout n ≥ n0 , ce qui revient à dire que (xn )n∈N
converge vers .

Lemme 1.3 (Lebesgue) Soient K un compact de (E, d) et (Oi )i∈I une famille

d’ouverts de E telle que K ⊂ Oi (on dit qu’on a un recouvrement ouvert de K).
i∈I
Il existe un réel r > 0 tel que toute boule ouverte de centre x ∈ K et de rayon r
soit contenue dans l’un des Oi .
Preuve. Supposons que pour tout réel r > 0, il existe une boule ouverte de
centre x ∈ K et de rayon r qui ne soit contenue dans aucun  des Oi . On peut
∗ 1
alors trouver, pour tout entier n ∈ N , une boule B xn , centrée en xn ∈ K
n
qui ne soit contenue dans aucun des Oi . De la suite (xn )n∈N∗ d’éléments de K,

on peut extraire une suite xϕ(n) n∈N∗ qui converge vers x ∈ K ⊂ Oi . Cette
i∈I
limite étant dans l’un des ouverts Oi , il existe r > 0 tel que B (x, r) ⊂ Oi . Comme
1 1 ε
lim = 0 et lim xϕ(n) = x, il existe un entier n0 tel que < et
n→+∞ ϕ (n) n→+∞ ϕ (n) 2
 
ε 1
d xϕ(n) , x < pour tout n ≥ n0 , donc B xϕ(n) , ⊂ B (x, r) ⊂ Oi (pour
 2  ϕ (n)
1 ε 1
y ∈ B xϕ(n) , , on a d (x, y) ≤ d x, xϕ(n) + d xϕ(n) , y < + < ε),
ϕ (n) 2 ϕ (n)
contrairement à l’hypothèse de départ. 
Théorème 1.12.
Un sous-ensemble K de (E, d) est compact si, et seulement si, de tout
recouvrement ouvert de K, on peut extraire un sous-recouvrement fini.

Preuve. Soient K un compact de (E, d) et (Oi )i∈I une famille d’ouverts de E



telle que K ⊂ Oi . Le lemme de Lebesgue nous dit qu’il existe r > 0 tel que
i∈I
Limites et continuité 11

toute boule ouverte de rayon r et de centre x ∈ K soit contenue dans l’un des Oi
et le lemme 1.2 qu’il existe une suite finie (ak )1≤k≤n d’éléments de K telle que
n
K⊂ B (ak , r) . Chaque boule B (ak , r) étant contenue dans un ouvert Oik , on
k=1

n
en déduit que K ⊂ Oi k .
k=1
Réciproquement, soit K tel que de tout recouvrement ouvert de K, on puisse
extraire un sous-recouvrement fini. S’il existe une suite (xn )n∈N d’éléments de K
sans valeur d’adhérence dans K, on peut alors trouver pour tout x ∈ K, un réel
rx > 0 tel que B (x, rx ) ne contienne qu’un nombre
 fini de valeurs de la suite
(xn )n∈N . Mais du recouvrement ouvert K ⊂ B (x, rx ) , on peut extraire un
x∈K

p
recouvrement fini K ⊂ B aj , raj et la suite (xn )n∈N ne peut prendre qu’un
k=1
nombre fini de valeurs qui en sont des valeurs d’adhérence, ce qui est contraire à
l’hypothèse de départ. L’ensemble K est donc compact. 

1.3 Limites et continuité


Pour ce paragraphe, R est muni de la distance définie par la valeur absolue,
(E, d) , (F, d ) sont deux espaces métriques, I est une partie non vide de E non
réduite à un point et f est une fonction de I dans F.

Définition 1.12. Soit α un point dans l’adhérence de I. On dit que f


admet une limite quand x tend vers α dans I, s’il existe  ∈ F tel que :

∀ε > 0, ∃η > 0 | (x ∈ I \ {α} , d (x, α) < η) ⇒ (d (f (x) , ) < ε)

Comme pour les suites, on peut vérifier en utilisant l’inégalité triangulaire que
si la fonction f admet une limite en α ∈ I, cette dernière est alors unique et on
peut la noter  = lim f (x) .
x→α
Le théorème qui suit nous donne une caractérisation séquentielle de la notion
de limite.
Théorème 1.13.

La fonction f : I → F admet une limite en α ∈ I si, et seulement si,


pour toute suite de points (xn )n∈N de points de I \ {α} qui converge vers
α, la suite (f (xn ))n∈N est convergente.

Preuve. Si f admet une limite  en α, alors pour tout ε > 0 il existe η > 0
tel que d (x, α) < η dans I \ {α} entraîne d (f (x) , ) < ε et si (xn )n∈N est une
suite de points de I \ {α} qui converge vers α, il existe alors un entier n0 tel que
0 < d (xn , α) < η pour tout n ≥ n0 , ce qui implique d (f (xn ) , ) < ε. On a donc
lim f (xn ) = .
n→+∞
12 Espaces métriques

Réciproquement, on suppose que f transforme toute suite d’éléments de I \ {α}


qui converge vers α en une suite convergente. Soient (xn )n∈N , (yn )n∈N deux suite
de points de I \ {α} qui convergent vers α. Les suite (f (xn ))n∈N et (f (yn ))n∈N
convergent respectivement vers  et  . On définit la suite (zn )n∈N de points de
I \ {α} par z2n = x2n , z2n+1 = y2n+1 . Cette suite (zn )n∈N converge vers α, donc
(f (zn ))n∈N converge et on a :

 = lim f (x2n ) = lim f (z2n ) = lim f (z2n+1 ) = lim f (y2n+1 ) = 


n→+∞ n→+∞ n→+∞ n→+∞

Donc toute suite (xn )n∈N de points de I \ {α} convergente vers α est transformée
en une suite (f (xn ))n∈N qui converge vers un même élément  de F. Si f n’admet
pas  pour limite en α, il existe alors un réel ε > 0 tel que pour tout entier n ≥ 1
1
on peut trouver xn ∈ I \ {α} tel que d (xn , α) < et d (f (xn ) , ) ≥ ε. On a donc
n
ainsi une suite (xn )n∈N de points de I \ {α} qui converge vers α pour laquelle la
suite (f (xn ))n∈N ne converge pas vers , ce qui est une contradiction d’après ce
qui précède. 
D’un point de vue pratique, le théorème précédent s’exprime aussi en disant
que lim f (x) =  si, et seulement si, on a lim f (xn ) =  pour toute suite de
x→α n→+∞
points (xn )n∈N de points de I \ {α} qui converge vers α.

Définition 1.13. On dit qu’une fonction f : I → F est continue en α ∈ I


si lim f (x) = f (α) . Dans le cas où f est continue en tout point de I, on
x→α
dit qu’elle est continue sur I.

Considérant que pour x = α, on a d (x, α) = d (f (x) , f (α)) = 0, la continuité


de f en α se traduit par :

∀ε > 0, ∃η > 0 | (x ∈ I, d (x, α) < η) ⇒ (d (f (x) , f (α)) < ε)

Du théorème 1.13, on déduit la caractérisation séquentielle suivante de la notion


de continuité en un point.
Théorème 1.14.
La fonction f : I → F est continue en α ∈ I si, et seulement si, toute
suite (xn )n∈N de points de I qui converge vers α est transformée par f en
une suite convergente dans F.

D’un point de vue pratique, le théorème précédent s’exprime aussi en disant


que f est continue en α si, et seulement si, on a lim f (xn ) = f (α) pour toute
n→+∞
suite de points (xn )n∈N de points de I qui converge vers α.
Théorème 1.15.
La composée de deux fonctions continues f : I → J ⊂ F et g : J → G
(où (G, d ) est un espace métrique) est continue.
Propriétés globales des fonctions continues 13

Preuve. Soit α ∈ I. Pour ε > 0, il existe η  > 0 tel que d (g (y) , g (f (α))) < ε
pour y dans J tel que d (y, f (α)) < η  et il existe η > 0 tel que d (f (x) , f (α)) < η 
pour x dans I tel que d (x, α) < η, ce qui nous donne d (g (f (x)) , g (f (α))) < ε
pour x dans I tels que d (x, α) < η. 

1.4 Propriétés globales des fonctions continues


Le théorème qui suit nous donne une caractérisations topologique de la notion
de continuité sur I.
Théorème 1.16.
La fonction f : I → F est continue sur I si, et seulement si, l’image
réciproque par f de tout ouvert [resp. fermé] de F est un ouvert [resp.
fermé] de I.

Preuve. On rappelle qu’une partie J de I est ouverte [resp. fermée] dans I si


elle s’écrit J = I ∩ O où O est un ouvert [resp. fermé] de E.
Soient f : I → F une fonction continue et O un ouvert de F. Pour tout α dans
f (O ) , on a f (α) ∈ O , donc il existe un réel ε > 0 tel que la boule ouverte
−1

B  (f (α) , ε) soit contenue dans O et avec la continuité de f, on peut trouver un


 
réel η > 0 tel que pour tout x ∈ B (α, η) ∩ I on ait f (x)  ∈ B (f (α) , ε) ⊂ O .
On a donc B (α, η) ∩ I⊂f −1 (O ) et en posant O = B (α, η) , on définit
α∈f −1 (O  )
un ouvert de E tel que f (O ) = I ∩ O, ce qui prouve que f −1 (O ) est ouvert
−1 

dans I. Réciproquement, supposons que l’image réciproque par f de tout ouvert


de F est un ouvert de I. Pour α ∈ I et ε > 0, f −1 (B  (f (α) , ε)) est un ouvert
de I, il existe donc un réel η > 0 tel que B (α, η) ∩ I ⊂ f −1 (B  (f (α) , ε)) , ce qui
signifie que d (f (x) , f (α)) < ε pour tout x ∈ B (α, η) ∩ I. La fonction f est donc
continue en tout point de I.
Pour ce qui est de l’image réciproque des fermés, on utilise le fait qu’un fermé
est le complémentaire d’un ouvert et l’image réciproque du complémentaire est le
complémentaire de l’image réciproque. 

Définition 1.14. On dit que f : I → F est uniformément continue sur I


si :

∀ε > 0, ∃η > 0 | (x, y) ∈ I 2 , d (x, y) < η ⇒ d (f (x) , f (y)) < ε

Une fonction uniformément continue sur I est évidemment continue en tout


point de I, la nuance étant qu’un réel η associé à ε ne dépend que de f, I et ε.
La notion de continuité est une notion ponctuelle alors que celle de continuité
uniforme est globale. On peut aussi remarquer que cette notion de continuité
uniforme est une notion métrique alors que celle de continuité est topologique.
14 Espaces métriques

Théorème 1.17.
La composée de deux fonctions uniformément continues f : I → J ⊂ F et
g : J → G (où (G, d ) est un espace métrique) est uniformément continue.

Preuve. Pour tout ε > 0, il existe η  > 0 tel que d (g (u) , g (v)) < ε pour u, v
dans J tels que d (u, v) < η  et il existe η > 0 tel que d (f (x) , f (y)) < η  pour
x, y dans I tels que d (x, y) < η, ce qui nous donne d (g (f (x)) , g (f (y))) < ε
pour x, y dans I tels que d (x, y) < η. 

Exemples 1.3

1. La fonction x → x est uniformément continue sur R+ . Cela se déduit de :
√ √
∀ (x, y) ∈ R2 , x− y ≤ |x − y|

Cette inégalité est triviale pour x = y et pour y > x ≥ 0 (x, y jouent des rôles
√ √ 2 √
symétriques), on a x − y = y − 2 xy + x > y − x.
2. Une fonction f : I → F lipschitzienne (ce qui signifie qu’il existe λ ≥ 0 tel que
d (f (x) , f (y)) ≤ λd (x, y) pour tous x, y dans I) est uniformément continue
sur I.
3. Si f est une fonction à valeurs réelles et dérivable sur un intervalle réel I avec
f  bornée, le théorème des accroissements finis (chapitre 9) nous dit que cette
fonction est lipschitzienne et en conséquence uniformément continue sur I.

Une fonction f : I ⊂ R → R peut très bien être uniformément continue sur tout
intervalle strictement contenu dans I sans être uniformément continue sur I tout
1
entier. C’est le cas, par exemple, pour la fonction f : x → sur I = ]0, 1] . Elle est
x
lipschitzienne sur tout [a, 1] où 0 < a < 1 (conséquence des accroissements finis), 
1
donc uniformément continue sur ces intervalles. Mais pour tout réel η ∈ 0, ,
2
η 1 1 1 2
x = η, y = x + , on a |y − x| < η avec − = > .
2 x y 3η 3
Le théorème qui suit nous donne une caractérisation séquentielle de l’uniforme
continuité.
Théorème 1.18.
Une fonction f : I → F est uniformément continue si, et seule-
ment si, pour toutes suites (xn )n∈N et (yn )n∈N d’éléments de I telles que
lim d (xn , yn ) = 0, on a lim d (f (xn ) , f (yn )) = 0.
n→+∞ n→+∞

Preuve. Soit f : I → F uniformément continue. Pour tout ε > 0, il existe η > 0


tel que d (f (x) , f (y)) < ε pour tous x, y dans I vérifiant d (x, y) < η. Si (xn )n∈N
et (yn )n∈N sont deux suites d’éléments de I telles que lim d (xn , yn ) = 0, il existe
n→+∞
alors un entier n0 ∈ N tel que d (xn , yn ) < η pour tout n ≥ n0 , ce qui entraîne que
d (f (xn ) , f (yn )) < ε. On a donc lim d (f (yn ) , f (xn )) = 0.
n→+∞
Propriétés globales des fonctions continues 15

Réciproquement, supposons que lim d (f (xn ) , f (yn )) = 0 pour toutes suites


n→+∞
(xn )n∈N , (yn )n∈N d’éléments de I telles que lim d (xn , yn ) = 0. Si f n’est pas
n→+∞
uniformément continue, il existe alors ε > 0 tel que pour tout entier n ≥ 1 on peut
1
trouver xn , yn dans I tel que d (xn , yn ) < et d f (xn ) , f (yn ) ≥ ε, ce qui nous
n
donne deux suites (xn )n∈N et (yn )n∈N de points de I telles que lim d (xn , yn ) = 0
n→+∞
et (d (f (xn ) , f (yn )))n∈N ne converge pas vers 0, ce qui n’est pas possible. 
Ce résultat peut être utilisé pour montrer qu’une fonction n’est pas uniformé-
ment continue sur I.
Par exemple pour la fonction f : x → x2 , en considérant les suites (xn )n∈N
√ √ 1
et (yn )n∈N définies par xn = n + 1, yn = n, on a xn − yn = √ √ ,
n+ n+1
ce qui donne lim (xn − yn ) = 0 avec lim (f (xn ) − f (yn )) = 1 = 0, donc
n→+∞ n→+∞
cette fonction n’est pas uniformément continue sur R. Une démonstration directe
2
de cette non uniforme continuité peut se faire comme suit : pour η > 0, x = ,
η
η η2
y = x + , on a |x − y| < η et y 2 − x2 = 1 + > 1.
2 4
On montre de manière analogue que la fonction f : x → sin x2 n’est pas
uniformément continue sur R. En considérant les mêmes suites, on a :
   
1 1
f (xn ) − f (yn ) = sin (n + 1) − sin (n) = 2 cos n + sin
2 2

et cette suite est divergente.

Définition 1.15. Soit J une partie non vide de F. On dit que f : I → J est
est un homéomorphisme si elle est continue bijective d’inverse f −1 continue.

1.4.1 Continuité et compacité


Une fonction continue n’est pas nécessairement uniformément continue, mais
pour les fonctions définies sur un compact, on a le résultat suivant.
Théorème 1.19. Heine
Si K est un compact de (E, d) , alors toute fonction continue f : K → F
est uniformément continue sur K.

Preuve. Si f : K → F n’est pas uniformément continue, il existe ε > 0 et deux


1
suites (xn )n∈N∗ , (yn )n∈N∗ dans K tels que d (xn , yn ) < et d f (xn ) , f (yn ) ≥ ε
n
pour tout n ∈ N∗ . K étant compact, on peut extraire deux suites xϕ(n) n∈N∗
et yϕ(n) n∈N∗ qui convergent respectivement vers x et y dans K. Mais avec
1 1
d (xn , yn ) < ≤ , on déduit que d (x, y) = lim d xϕ(n) , yϕ(n) = 0,
ϕ (n) n n→+∞
16 Espaces métriques

soit x = y, puis avec la continuité de f on a lim d f xϕ(n) , f yϕ(n) = 0 en


n→+∞

contradiction avec d f xϕ(n) , f yϕ(n) ≥ ε pour tout n ≥ 1. 
Théorème 1.20.
L’image d’un compact par une application continue est un compact, ce
qui signifie que si K est un compact de (E, d) et f : K → F une fonction
continue, alors f (K) est un compact de (F, d ) .

Preuve. Soit (yn )n∈N une suite dans f (K) avec yn = f (xn ) pour tout n ∈ N.
De la suite (xn )n∈N dans le compact K on peut extraire une suite xϕ(n) n∈N
qui converge vers un élément x de K et avec la continuité de f on déduit que
lim yϕ(n) = lim f xϕ(n) = f (x) ∈ f (K) , donc f (K) est compact. 
n→+∞ n→+∞

Théorème 1.21.
Soient K un compact de (E, d) et f : K → R une fonction continue.
Cette fonction est bornée et atteint ses bornes, ce qui signifie qu’il existe
α, β dans K tels que f (α) = inf f (x) et f (β) = sup f (x) .
x∈K x∈K

Preuve. Comme f (K) est compact, il est en particulier borné dans R et étant
non vide, il admet une borne inférieure et une borne supérieure :

m = inf f (x) , M = sup f (x)


x∈K x∈K

Par définition de la borne inférieure m, pour tout entier n > 0 on peut trouver
1
xn dans K tel que m ≤ f (xn ) < m + et de la suite (xn )n∈N ainsi définie dans le
n
compact K on peut extraire une sous-suite xϕ(n) n∈N qui converge vers α ∈ K.
1
On a donc pour tout n > 0, m ≤ f xϕ(n) < m+ avec lim ϕ (n) = +∞, ce
ϕ (n) n→+∞
qui nous donne avec la continuité de f, f (α) = lim f xϕ(n) = m. On procède
n→+∞
de manière analogue pour la borne supérieure. 

1.4.2 Continuité et connexité


Le résultat qui suit ainsi que son corollaire sont souvent utiles pour montrer
qu’un ensemble est connexe.
Théorème 1.22.
Si f est une fonction continue de (E, d) dans (F, d ) , alors pour tout
connexe A de E l’image f (A) est connexe dans F.

Preuve. Soit A une partie connexe de E et A = f (A) . Supposons qu’il existe


deux ouverts de F, O1 , O2 , tels que A ⊂ O1 ∪ O2 et A ∩ O1 ∩ O2 = ∅. On a alors :

A ⊂ f −1 (A ) ⊂ f −1 (O1 ) ∪ f −1 (O2 )


Propriétés globales des fonctions continues 17

avec f −1 (O1 ) , f −1 (O2 ) ouverts dans E et A ∩ f −1 (O1 ) ∩ f −1 (O2 ) = ∅, ce qui


entraîne A∩f −1 (O1 ) = ∅ ou A∩f −1 (O2 ) = ∅ et donc A ∩O1 = ∅ ou A ∩O2 = ∅.
L’ensemble A est donc connexe dans F. 

Corollaire 1.1. Une partie A de (E, d) est connexe si, et seulement si,
toute application continue de A dans {0, 1} est constante.

Preuve. Soient A connexe dans (E, d) et f : A → {0, 1} continue. L’ensemble


f (A) est connexe dans R contenu dans {0, 1} et c’est
 nécessairement
   {0} ou {1}
1 1 3
puisque {0, 1} n’est pas connexe (en effet {0, 1} ⊂ −1, ∪ , ) ce qui signifie
2 2 2
que f est constante. Réciproquement si A n’est pas connexe il existe deux ouverts
O1 , O2 de E tels que A ⊂ O1 ∪ O2 avec A ∩ O1 ∩ O2 = ∅, A ∩ O1 = ∅ et A ∩ O2 = ∅.
La fonction caractéristique de O1 , définie par f (x) = 1 si x ∈ O1 et f (x) = 0
sinon est alors continue de E dans R à valeurs dans {0, 1} (si O est un ouvert de
R, on a f −1 (O) = O1 si 1 ∈ O et f −1 (O) = ∅ ou f −1 (O) = O2 sinon) et non
constante sur A (pour x ∈ A ∩ O1 = ∅ on a f (x) = 1 et pour x ∈ A ∩ O2 = ∅ on
a f (x) = 0). 

Corollaire 1.2. Si A est une partie connexe de E, son adhérence A est


alors connexe.

Preuve. Si f est une application continue de A dans {0, 1} , sa restriction au


connexe A est alors constante (puisque également continue) et par densité la fonc-
tion f est également constante sur A. 
L’intérieur d’un connexe n’est pas nécessairement connexe.
 Par exemple, dans
l’espace euclidien R2 , l’ensemble A = (x, y) ∈ R2 | x = 0 ∪ {(0, 0)} est connexe
(il est connexe par arcs, donc connexe d’après le théorème 2.3) et son intérieur
◦ 
A = (x, y) ∈ R2 | x = 0 est non connexe .
Théorème 1.23.
Une réunion de connexes de E d’intersection non vide est connexe.

Preuve. Soit (Ai )i∈I une famille de connexes de E et A = Ai . Si f : A → R est
i∈I
une application continue à valeurs dans {0, 1} , alors pour tout i ∈ I la restriction
de f à Ai qui est également
 continue est constante égale à γi puisque Ai est
connexe. Pour x ∈ Ai on a f (x) = γi pour tout i ∈ I, les γi sont donc tous
i∈I
égaux et f est constante sur A. L’ensemble A est donc connexe. 
18 Espaces métriques

1.5 Exercices

Exercice 1.1. Donner une condition nécessaire et suffisante sur une


fonction f : R → R, pour que l’application df : (x, y) → |f (y) − f (x)|
définisse une distance sur R.

Solution. La propriété de symétrie et l’inégalité triangulaire sont clairement


satisfaites. L’égalité df (x, y) = 0 équivaut à f (x) = f (y) qui implique x = y si,
et seulement si, f est injective. En conclusion, df est une distance si, et seulement
si, f est injective.

Exercice 1.2. Pour tous polynômes P, Q dans R [X] , on note :



0 si P = Q
d1 (P, Q) = sup |Q (t) − P (t)| , d2 (P, Q) =
1 deg (P − Q) + 1 si P = Q
[0, 2 ]

1. Montrer que d1 et d2 définissent des distances sur R [X] .


2. Étudier la convergence de la suite (X n )n∈N dans (R [X] , d1 ) et dans
(R [X] , d2 ) .

Solution. Les applications d1 et d2 sont à valeurs positives ou nulles.


1. La propriété de symétrie se vérifie aisément pour les deux normes. Par construc-
tion, on a d2 (P, Q) = 0 si, et seulement si P = Q (puisque deg (A) ≥ 0 pour
A ∈ R [X] \ {0}). L’égalité d1 (P, Q) = 0 équivaut à P (t) = Q (t) pour tout
1
t ∈ 0, , ou encore à P = Q (le polynôme P − Q a une infinité de racines).
2
Pour P, Q, R dans
 R [X] , on a |Q (t) − P (t)| ≤ |Q (t) − R (t)| + |R (t) − P (t)|
1
pour tout t ∈ 0, , donc d1 (P, Q) ≤ d1 (P, R) + d1 (R, Q) . Pour P = Q, on
2
a d2 (P, Q) = 0 ≤ d2 (P, R) + d2 (R, Q) . Pour P = Q et P = R on a :

d2 (P, Q) = d2 (R, Q) = deg (R − Q) + 1 = d2 (P, R) + d2 (R, Q)

et pareil pour Q = R. Pour P = Q, P = R et Q = R on a :

d2 (P, Q) = deg (P − R + R − Q) + 1
≤ deg (P − R) + deg (R − Q) + 2 = d2 (P, R) + d2 (R, Q)

En conclusion, d1 , d2 sont des distances sur R [X] .


1
2. Avec lim d1 (X n , 0) = lim n = 0, on déduit que (X n )n∈N converge vers
n→+∞ n→+∞ 2
0 dans (R [X] , d1 ) et avec lim d2 X n+1 , X n = lim (n + 1) = +∞, on
n→+∞ n→+∞
déduit que (X n )n∈N diverge dans (R [X] , d2 ) .
Exercices 19

Exercice 1.3. Soit d une distance sur E.


1. Soit ϕ : R+ → R une fonction croissante non identiquement nulle telle
que ϕ (0) = 0 et ϕ (t + t ) ≤ ϕ (t)+ϕ (t ) pour tous t, t dans R+ . Montrer
que ϕ (t) > 0 pour tout t > 0 et que l’application dϕ = ϕ ◦ d définit une
distance sur E.
2. Soit ϕ : R+ → R une fonction non identiquement nulle, croissante,
continue sur R+ , dérivable sur R+,∗ de dérivée décroissante et telle que
ϕ (0) = 0. Montrer que l’application ϕ ◦ d définit une distance sur E.
d
3. Montrer que les applications 1R+,∗ ◦ d, min (d, 1) , et dα ou α est
1+d
dans ]0, 1[ définissent des distances sur E.
4. On suppose que ϕ est continue en 0. En notant, pour x ∈ E et
r ∈ R+,∗ , Bϕ (x, r) la boule de centre x et de rayon r dans (E, dϕ ) ,
montrer que Bϕ (x, ϕ (r)) ⊂ B (x, r) et qu’il existe r ∈ R+,∗ tel que
B (x, r ) ⊂ Bϕ (x, r) . En déduire que les ouverts de (E, d) sont les ou-
verts de (E, dϕ ) .

Solution.
1.
(a) La fonction ϕ est à valeurs positives puisque croissante avec ϕ (0) = 0.
Comme ϕ n’est pas identiquement nulle avec ϕ (0) = 0, il existe t0 > 0 tel
que ϕ (t0 ) > 0. De la croissance de ϕ, on déduit que ϕ (t) > 0 pour tout
t ≥ t0 . S’il existe t ∈ ]0, t0 [ tel que ϕ (t) = 0, on a alors ϕ (nt) = 0 pour
tout n ∈ N. En effet, c’est vrai pour n ∈ {0, 1} et si c’est vrai pour n ≥ 1,
de 0 ≤ ϕ ((n + 1) t) ≤ ϕ (nt) + ϕ (t) , on déduit que ϕ ((n + 1) t) = 0. Mais
prenant n ∈ N∗ tel que nt > t0 , on aboutit à une contradiction. On a donc
ϕ (t) > 0 pour tout t > 0.
(b) Pour tous x, y, z dans E, on a dϕ (y, x) = ϕ (d (y, x)) = ϕ (d (x, y)) =
dϕ (x, y) ; l’égalité dϕ (x, y) = ϕ (d (x, y)) = 0 est réalisée si, et seulement
si, d (x, y) = 0 d’après la question précédente, ce qui équivaut à x = y ;
dϕ (x, z) = ϕ (d (x, z)) avec d (x, z) ≤ d (x, y) + d (y, z) , donc dϕ (x, z) ≤
dϕ (x, y) + dϕ (y, z) .
2. Pour tout réel t fixé dans R+ , la fonction γ : t → ϕ (t + t ) − ϕ (t) − ϕ (t ) est
dérivable sur R+,∗ avec γ  (t) = ϕ (t + t )−ϕ (t) ≤ 0 (ϕ est décroissante), donc
γ est décroissante sur R+ (elle est continue en 0) et on a γ (t) ≤ γ (0) = 0, soit
ϕ (t + t ) ≤ ϕ (t) + ϕ (t ) . De la question précédente, on déduit que dϕ = ϕ ◦ d
est une distance.
3. Les fonctions 1R+,∗ et t → min (t, 1) vérifiant les hypothèses de la première
question, on en déduit que :
 
0 si y = x 1 si d (x, y) > 1
1R+,∗ ◦d : (x, y) → et min (d, 1) : (x, y) →
1 si y = x d (x, y) si d (x, y) ≤ 1
20 Espaces métriques

t
sont des distances. Les fonctions t → et t → tα pour α ∈ ]0, 1[ vérifiant
1+t
d
les hypothèses de la deuxième question, on en déduit que et dα sont des
1+d
distances.
4.
(a) Pour tout y ∈ Bϕ (x, ϕ (r)) , on a dϕ (y, x) = ϕ (d (y, x)) < ϕ (r) , ce qui
implique que d (y, x) < r puisque ϕ est croissante (si d (y, x) ≥ r, on a alors
ϕ (d (y, x)) ≥ ϕ (r)), soit y ∈ B (x, r) . On a donc Bϕ (x, ϕ (r)) ⊂ B (x, r)
que ϕ soit continue ou pas en 0.
(b) Dans le cas où ϕ est continue en 0, pour r > 0 donné il existe r > 0
tel que |ϕ (t)| = |ϕ (t) − ϕ (0)| < r pour tout réel t tel que |t| < r , donc
pour tout y ∈ B (x, r ) , la condition d (y, x) < r entraîne que dϕ (y, x) =
ϕ (d (y, x)) < r, soit y ∈ Bϕ (x, r) . On a donc B (x, r ) ⊂ Bϕ (x, r) .
(c) Si O ⊂ E est ouvert non vide dans (E, d) et x ∈ O, il existe alors r > 0 tel
que B (x, r) ⊂ O, donc Bϕ (x, ϕ (r)) ⊂ O avec ϕ (r) > 0 et O est ouvert
dans (E, dϕ ) . Réciproquement si O est ouvert dans (E, dϕ ) et x ∈ O, il
existe alors r > 0 tel que Bϕ (x, r) ⊂ O et pour r > 0 tel que B (x, r ) ⊂
Bϕ (x, r) , on a B (x, r ) ⊂ O et O est ouvert dans (E, d) . Les distances d
et dϕ définissent donc la même topologie sur E.

Exercice 1.4. Montrer que tout fermé d’un espace métrique (E, d) peut
s’écrire comme l’intersection d’une suite décroissante d’ouverts et que tout
ouvert peut s’écrire comme la réunion d’une suite croissante de fermés.

Solution. Soit F un fermé dans E. Pour tout entier n ∈ N∗ l’ensemble V n1 (F) =


 
1
x ∈ E | d (x, F) < est un ouvert qui contient F (exemples 1.1) et on a F =
 n
V n1 (F) . En effet, comme F est contenu dans tous les V n1 (F) , il est contenu
n∈N∗

dans l’intersection et pour tout x ∈ V n1 (F) , on a d (x, F) = 0, ce qui équivaut
n∈N∗
à dire que x ∈ F car F est fermé. De plus pour tout n ∈ N∗ , on a V n+1 1 (F) ⊂
V n1 (F) . Par passage au complémentaire, on a le résultat sur les ouverts.

Exercice 1.5. Soient (E, d) , (F, d ) deux espaces métriques, I une partie
non vide de E et Cb (I, F ) l’ensemble des fonctions continues et bornées de
I dans F.
1. Montrer que l’application d∞ définie par :
2
∀ (f, g) ∈ (Cb (I, F )) , d∞ (f, g) = sup d (f (x) , g (x))
x∈I 2

est une distance sur Cb (I, F ) .


2. Dans le cas où (F, d ) est complet, montrer que (Cb (I, F ) , d∞ ) est com-
plet.
Exercices 21

Solution. Dire qu’une fonction f : I → F est bornée signifie que :

δ (f (I)) = sup d (f (x) , f (y)) < +∞


(x,y)∈I 2

1. En se fixant x0 dans I, on a pour toutes fonctions f, g dans Cb (I, F ) et tout


x∈I :

d (f (x) , g (x)) ≤ d (f (x) , f (x0 )) + d (f (x0 ) , g (x0 )) + d (g (x0 ) , g (x))


≤ δ (f (I)) + d (f (x0 ) , g (x0 )) + δ (g (I))

donc le réel d∞ (f, g) est bien défini. Il est clair que pour toutes fonctions f, g, h
dans Cb (I, F ) , on a d∞ (f, g) = d∞ (g, f ) , d∞ (f, h) ≤ d∞ (f, g) + d∞ (g, h)
et l’égalité d∞ (f, g) = 0 équivaut à d (f (x) , g (x)) pour tout x ∈ I, soit à
f (x) = g (x) pour tout x ∈ I, ou encore à f = g. L’application d∞ est donc
bien une distance sur Cb (I, F ) .
2. Soient (fn )n∈N une suite de Cauchy dans l’espace métrique (Cb (I, F ) , d∞ ) et ε
un réel strictement positif. Il existe un entier n0 tel que :

∀m > n ≥ n0 , ∀x ∈ I, d (fn (x) , fm (x)) < ε (1.3)

donc pour x fixé dans I, la suite (fn (x))n∈N est de Cauchy dans (F, d ) et en
conséquence converge vers un élément f (x) de F. Faisant tendre m vers l’infini
dans (1.3) , on en déduit que :

∀n ≥ n0 , ∀x ∈ I, d (fn (x) , f (x)) ≤ ε (1.4)

En effet, pour x ∈ I, n ≥ n0 fixés, on a :

d (fn (x) , f (x)) ≤ d (fn (x) , fm (x)) + d (fm (x) , f (x)) ≤ ε + d (fm (x) , f (x))

pour tout m > n avec lim d (fm (x) , f (x)) = 0, ce qui donne en faisant
m→+∞
tendre m vers l’infini, d (fn (x) , f (x)) ≤ ε. Il en résulte que pour tous x, y
dans I, on a :

d (f (x) , f (y)) ≤ d (f (x) , fn0 (x)) + d (fn0 (x) , fn0 (y)) + d (fn0 (y) , f (y))
< 2ε + δ (fn0 (I)) < +∞

ce qui signifie que f est bornée. Puis avec :

d (f (x) , f (y)) ≤ d (f (x) , fn0 (x)) + d (fn0 (x) , fn0 (y)) + d (fn0 (y) , f (y))
< 2ε + d (fn0 (x) , fn0 (y))

pour tous x, y dans I, on déduit que f est continue sur I. En définitive, f est
dans Cb (I) et de (1.4) , on déduit que d∞ (fn , f ) ≤ ε pour tout n ≥ n0 , ce qui
achève de prouver que (Cb (I, F ) , d∞ ) est complet.

Exercice 1.6. Montrer qu’un espace métrique compact est séparable.


22 Espaces métriques

Solution. Soit (E, d) un espace métrique compact. Pour tout entier n ∈ N∗ , on


  1
peut extraire du recouvrement ouvert E = B x, un sous recouvrement
n
  1
x∈E

fini E = B x, , où Dn est une partie finie de E. On vérifie alors que


n
x∈Dn

l’ensemble dénombrable D = Dn est dense dans E. Pour a ∈ E et ε > 0,
n∈N∗  
∗ 1 1
prenant n ∈ N tel que < ε, il existe x ∈ Dn tel que a ∈ B x, , donc
n n
1
d (x, a) < < ε et x ∈ B (a, ε) ∩ D. On a donc D ∩ B (a, ε) = ∅ pour tout a ∈ E
n
et tout ε > 0, ce qui signifie que D est dense dans E. En conclusion, (E, d) est
séparable.

Exercice 1.7. Soit (un )n∈N une suite dans un espace métrique (E, d) .
1. Montrer que la suite (un )n∈N est convergente si, et seulement si, les
suites extraites (u2n )n∈N et (u2n+1 )n∈N convergent vers une même li-
mite.
2. Montrer que la suite (un )n∈N est convergente si, et seulement si, les
suites extraites (u2n )n∈N et (u2n+1 )n∈N et (u3n )n∈N convergent.
3. Dans le cas où (un )n∈N est une suite périodique, montrer qu’elle converge
si, et seulement si, elle est constante.

Solution.
1. Supposons que (u2k )k∈N et (u2k+1 )k∈N convergent respectivement vers  et  .
Si  =  , alors (un )n∈N a au moins deux valeurs d’adhérence distinctes et en
conséquence ne peut converger. Si  =  , il existe alors, pour tout réel ε > 0,
des entiers k1 et k2 tels que :

∀k ≥ k1 , d (u2k , ) < ε et ∀k ≥ k2 , d (u2k+1 ,  ) < ε

et en notant n0 = max (2k1 , 2k2 + 1) , on a pour tout n ≥ n0 , d (un , ) < ε,


donc (un )n∈N converge vers . La réciproque est évidente.
2. Supposons que (u2k )k∈N , (u2k+1 )k∈N et (u3k )k∈N convergent respectivement
vers ,  et  . La suite (u6k )k∈N qui est extraite de (u2k )k∈N et (u3k )k∈N
converge vers  et  , ce qui impose  =  du fait de l’unicité de la limite. De
même en remarquant que (u6k+3 )k∈N est extraite de (u2k+1 )k∈N et (u3k )k∈N ,
on déduit que  =  et  =  , donc (u2k )k∈N et (u2k+1 )k∈N convergent vers la
même limite, ce qui équivaut à la convergence de la suite (un )n∈N . La réciproque
est évidente.
3. Soit (un )n∈N une suite convergente vers  et périodique de période p où p
est un entier strictement positif. Pour tout entier naturel k, la suite extraite
(upn+k )n∈N est constante de valeur commune uk et convergente vers . On a
donc uk =  pour tout k ∈ N. La réciproque est évidente.
Exercices 23

Exercice 1.8. Soit (un )n∈N une suite dans un espace métrique (E, d) .
1. Montrer que si lim (un ) = , on a alors lim d (un+1 , un ) = 0. La
n→+∞ n→+∞
réciproque est-elle vraie ?
2. Montrer que si lim (un ) = , on a alors pour toute application stric-
n→+∞
tement croissante ϕ : N → N, lim d uϕ(n) , un = 0.
n→+∞
 
n

n
1
3. Montrer que, dans (R, |·|) , les suites ((−1) )n∈N , et
k
k=1 n∈N∗
(ln (n))n≥1 sont divergentes.
4. Montrer que, dans (R, |·|) , la suite réelle (ln (ln (n)))n≥2 est telle que
lim (u2n − un ) = 0 et divergente.
n→+∞

Solution.
1. Si lim (un ) = , on peut alors trouver, pour tout réel ε > 0, un entier n0 tel
n→+∞
que :
∀n > n0 , d (un+1 , un ) ≤ d (un+1 , ) + d (, un ) < ε
ce qui signifie que lim d (un+1 , un ) = 0. La réciproque est fausse comme le
n→+∞

montre l’exemple de la suite ( n)n∈N dans (R, |·|) . Cette suite est divergente
puisque non bornée et pour n ≥ 1, on a :
√ √ 1
lim n+1− n = lim √ √ =0
n→+∞ n→+∞ n+1+ n

On peut aussi considérer, plus généralement, la suite réelle (nα )n∈N avec α dans
]0, 1[ . Cette suite est divergente puisque non bornée et pour n ≥ 1, on a :
 n+1
α n+1 α α
(n + 1) − n = α
[tα ]n = dt ≤ → 0
n t1−α n1−α n→+∞

puisque 1 − α > 0. On peut aussi utiliser le théorème des accroissements finis


α
pour écrire que (n + 1) − nα = αξnα−1 avec ξn compris entre n et n + 1, ce qui
α α
donne αξnα−1 = 1−α ≤ 1−α . Ou encore écrire que :
ξn n
 α   
α 1 1 1
0 < (n + 1) − nα = nα 1+ − 1 ≤ nα 1 + − 1 = 1−α
n n n

2. L’application ϕ étant strictement croissante, on a ϕ(n) ≥ n pour tout entier n


et en conséquence, pour tout réel ε > 0, on peut trouver un entier n0 tel que :

∀n > n0 , d uϕ(n) , un ≤ d uϕ(n) ,  + d (, un ) < ε

ce qui signifie que lim d uϕ(n) , un = 0.


n→+∞
24 Espaces métriques

1
n
n 1
3. Résulte de |un+1 − un | = 2, |v2n − vn | = ≥ = et |w2n − wn | =
n+k 2n 2
k=1
ln (2) , les notations étant évidentes. On peut remarquer que
 pla deuxième
 suite
 1
est telle que pour tout p ≥ 1, lim (vn+p − vn ) = lim = 0.
n→+∞ n→+∞ n+k
k=1
4. On a :
 
ln (n) + ln (2) ln (2)
u2n − un = ln (ln (2n)) − ln (ln (n)) = ln = ln 1 +
ln (n) ln (n)
 
ln (2)
et comme tend vers 0 lorsque n tend vers l’infini, il en est de même
ln (n) n≥2   
ln (2)
pour la suite (u2n − un )n≥2 = ln 1 + . Comme :
ln (n) n≥2
 
2 2 ln (n)
un2 − un = ln (ln n ) − ln(ln (n)) = ln = ln 2
ln (n)

la suite réelle (ln (ln (n)))n≥2 est divergente.

Exercice 1.9. Soient (E, d) un espace métrique complet et (Bn )n∈N =


B (xn , rn ) n∈N une suite de boules fermées dans E telle que :

∀n ∈ N, rn > 0, Bn+1 ⊂ Bn
lim rn = 0
n→+∞

Dans ces conditions l’intersection de toutes les boules Bn est non vide ré-
duite à un point.

Solution. Étant donné un réel ε > 0, il existe un entier n0 tel que 0 < rn < ε
pour tout n ≥ n0 . Du fait que pour m ≥ n, on a xm ∈ Bm ⊂ Bn , on déduit que :

∀m > n ≥ n0 , d (xm , xn ) ≤ rn < ε

ce qui signifie que la suite (xn )n∈N est de Cauchy dans (E, d) . Cet espace métrique
étant complet, la suite (xn )n∈N est convergente dans E. On note x sa limite. Pour
tout entier naturel n et tout entier m ≥ n, on a xm ∈Bn , la boule Bn étant fermée,
il en résulte que x = lim xm ∈ Bn . Donc x ∈ Bn et cette intersection est
m→+∞
n∈N
 m≥n
non vide. Si y ∈ Bn , on a alors d (y, xn ) ≤ rn pour tout entier naturel n et
n∈N
y = lim xn = x, cette intersection est donc réduite au point x.
n→+∞
Chapitre 2

Espaces normés

Pour ce chapitre, E est un espace vectoriel (de dimension finie ou infinie) sur
le corps K des réels ou des complexes.

2.1 Semi-normes et normes

Définition 2.1. Une semi-norme sur E est une application p : E → R


telle que pour tout scalaire λ et tous vecteurs x, y dans E, on ait :
— p (λx) = |λ| p (x) ;
— p (x + y) ≤ p (x) + p (y) (inégalité triangulaire.).

Le résultat qui suit nous dit qu’une semi-norme est nécessairement à valeurs
positives ou nulles et nous donne une formulation équivalente de l’inégalité trian-
gulaire souvent utile.

Lemme 2.1 Soit p une semi-norme sur E.


1. Pour tout x dans E, on a p (x) ≥ 0 ;
2. l’ensemble p−1 {0} = {x ∈ E | p (x) = 0} est un sous-espace vectoriel de E ;
3. pour tous x, y dans E, on a |p (x) − p (y)| ≤ p (x − y) .

Preuve.
1. Pour tout x ∈ E, on a p (0) = p (0 · x) = 0 · p (x) = 0 et 0 = p (x − x) ≤ 2p (x) ,
donc p (x) ≥ 0.
2. L’ensemble p−1 {0} est non vide puisqu’il contient 0 et avec les propriétés d’une
semi-norme, on déduit facilement que c’est un sous-espace vectoriel de E.
3. Cette inégalité se déduit de p (x) = p (x − y + y) ≤ p (x − y) + p (y) et de
p (y) = p (y − x + x) ≤ p (x − y) + p (x) .

On vérifie facilement que l’inégalité 3. du théorème précédent est équivalente à
l’inégalité triangulaire.
Le sous-espace vectoriel p−1 {0} est le noyau de la semi-norme p.
26 Espaces normés

Définition 2.2. Une norme sur E est une semi-norme dont le noyau est
réduit à {0} .

Une norme sur E est notée x → x et le couple (E, ·) est un espace normé.

Exemples 2.1
1. Sur R, une norme est de la forme Nα : x → α |x| , où α est un réel strictement
positif. En effet il est clair que chaque Nα est une norme. Si N est une norme
sur R, on a alors α = N (1) > 0 et pour tout x ∈ R, N (x) = N (x · 1) =
|x| N (1) = α |x| .
2. Pour toute forme linéaire non nulle ϕ sur un R-espace vectoriel E, l’application
x → |ϕ (x)| définit une semi-norme sur E et c’est une norme si, et seulement
si, ker (ϕ) = {0} , ce qui équivaut à dire, en dimension finie, que E est de
dimension 1.
3. Pour toute forme bilinéaire symétrique positive ϕ sur un R-espace vectoriel
E, l’application p définie par p (x) = ϕ (x, x) pour tout x ∈ E définit une
semi-norme sur E et c’est une norme si, et seulement si, ϕ est définie positive
(i. e. est un produit scalaire). Cela résulte de l’inégalité de Cauchy-Schwarz,
|ϕ (x, y)| ≤ p (x) p (y) pour tous x, y dans E (voir le paragraphe 3.1).
4. Soient E un R-espace vectoriel de dimension finie et B = (ei )1≤i≤n une base
de E. Les applications définies par :

 n
n

x∞ = max |xi | , x1 = |xi | , x2 =  x2i
1≤i≤n
i=1 i=1


n
pour tout x = xi ei ∈ E, définissent des normes sur E (l’exercice 3.3).
i=1
5. Pour toute partie non vide I d’un espace normé E, en notant Fb (I) l’espace
des fonctions bornées de I dans R ou C, l’application f → f ∞ = sup |f (x)|
x∈I
définit une norme sur Fb (I) .
6. Sur l’espace vectoriel E = C 0 ([a, b] , K) des applications continues de [a, b] (pour
a < b) dans K = R ou C, les applications définies par :

 b  b
f ∞ = sup |f (x)| , f 1 = |f (t)| dt, f 2 = f 2 (t) dt
x∈I a a

pour tout f ∈ E, définissent des normes sur E.

On vérifie facilement qu’à partir d’une norme · sur E, on définit une distance
en posant d (x, y) = y − x pour tous x, y dans E.
Un espace vectoriel normé est naturellement muni d’une structure d’espace
vectoriel topologique, ce qui signifie que l’on peut associer à une norme sur E une
topologie (i. e. une famille d’ouverts) telle que les applications d’addition interne
et de multiplication externe soient continues.
Semi-normes et normes 27

Nous rappelons brièvement ce que deviennent les notions étudiées dans le cadre

des espaces métriques (chapitre 1), en désignant par (E, ·) et F, · deux
espaces vectoriels normés.
— Pour tout a ∈ E et tout r ∈ R+,∗ , B (a, r) = {x ∈ E | x − a < r} [resp.
B (a, r) = {x ∈ E | x − a ≤ r}] désigne la boule ouverte [resp. la boule
fermée] de centre a et de rayon r. En particulier, B (0, 1) est la boule unité
et S (0, 1) = {x ∈ E | x = 1} est la sphère unité.
— Une partie non vide A de (E, ·) est bornée s’il existe une constante λ > 0
telle que x ≤ λ pour tout x dans A, ce qui revient à dire qu’elle est
contenue dans une boule fermée centrée en 0.
— Un sous-ensemble O de (E, ·) est un ouvert s’il est vide ou s’il est non vide
et pour tout a dans O il existe un réel r > 0 tel que B (a, r) ⊂ O.

— L’intérieur d’une partie A de (E, ·) est le plus grand ouvert A de E contenu
dans A.
— Un sous-ensemble F de (E, ·) est un fermé si son complémentaire dans E
est un ouvert de E.
— L’adhérence d’une partie A de (E, ·) est le plus petit fermé A de E conte-
nant A.
— Une suite (xn )n∈N d’éléments de (E, ·) est convergente s’il existe un élé-
ment  de E tel que lim xn −  = 0, un tel  est unique. La convergence
n→+∞
de (xn )n∈N vers  se traduit par :

∀ε > 0, ∃n0 ∈ N | ∀n ≥ n0 , xn −  < ε

De l’inégalité |x − y| ≤ x − y valable pour tous x, y dans E, on déduit


que si lim (un ) =  dans E, on a alors lim un  =  dans R.
n→+∞ n→+∞
— La divergence d’une suite (xn )n∈N d’éléments de (E, ·) peut se traduire
par :
∀ ∈ E, ∃ε > 0, ∀n0 ∈ N, ∃n ≥ n0 | un −  ≥ ε
— Une partie A de (E, ·) est dense dans E si A = E, ce qui revient à dire
que tout élément de E est limite d’une suite de points de A.
— Une suite (xn )n∈N d’éléments de (E, ·) est une suite de Cauchy si pour
tout réel ε > 0 on peut trouver un entier n0 tel que pour tous entiers n, m
on a :
n ≥ n0 , m ≥ n0 , ⇒ xn − xm  < ε
Une suite de Cauchy est bornée. Une suite convergente est de Cauchy (donc
bornée). Une suite non bornée est divergente.
— Une partie F de (E, ·) est fermée si, et seulement si, pour toute suite
d’éléments de F qui converge vers x dans E on a, x ∈ F.
— Une partie non vide K de (E, ·) est compacte si de toute suite de points
de K on peut extraire une sous-suite qui converge vers un élément de K, ce
qui équivaut à dire que de tout recouvrement ouvert de K on peut extraire
un sous-recouvrement fini. Un compact est fermé et borné.
28 Espaces normés

— Soient I une partie non vide de (E, ·) et f une fonction définie sur I à

valeurs dans F, · . La fonction f est continue en α ∈ I si :

∀ε > 0, ∃η > 0 | (x ∈ I, x − α ≤ η) ⇒ f (x) − f (α) ≤ ε
Elle est continue sur I si elle est continue en tout point de I, ce qui équivaut
à dire que l’image réciproque par f de tout ouvert [resp. fermé] de F est
un ouvert [resp. fermé] de I ou encore que toute suite de points convergente
dans I est transformée par f en une suite convergente dans F.
— Si J est une partie non vide de F, on dit alors que f : I → J est est un
homéomorphisme si elle est continue bijective d’inverse f −1 continue.
— Une fonction f : I → F est uniformément continue sur I si :

∀ε > 0, ∃η > 0 | (x, y) ∈ I 2 , x − y ≤ η ⇒ f (x) − f (y) ≤ ε
ce qui équivaut à dire que pour toutes suites (xn )n∈N et (yn )n∈N d’éléments

de I telles que lim xn − yn  = 0, on a lim f (xn ) − f (yn ) = 0.
n→+∞ n→+∞
— Dans le cas où I est compact, toute fonction continue sur I est uniformément

continue (théorème 1.19), f (I) est un compact de F, · (théorème 1.20)
et f, à valeurs réelles, est bornée et atteint ses bornes (théorème 1.21).
La notion de convergence d’une suite dépend a priori de la norme choisie sur
E. Considérons par exemple, dans C 0 ([0, 1] , R) muni des normes ·∞ et ·1 , la
suite de fonctions (fn )n∈N∗ définie sur [0, 1] par :
⎧  

⎪ 2 1
⎨ n 1 − n x si x ∈ 0, n2

fn (x) =  

⎪ 1

⎩ 0 si x ∈ , 1
n2
 1
n2 1
Pour tout n ∈ N∗ , on a fn 1 = n 1 − n2 t dt = et fn ∞ = n, donc
0 2n
lim fn 1 = 0 et lim fn ∞ = +∞, c’est-à-dire que cette suite converge vers
n→+∞ n→+∞
la fonction nulle pour la norme ·1 et diverge pour la norme ·∞ .
La notion de continuité dépend aussi du choix des normes sur E et F. Par
exemple, la fonction f → f (0) est continue de C 0 ([0, 1] , R) muni de ·∞ dans
(R, |·|) , mais non continue sur C 0 ([0, 1] , R) muni de ·1 . La continuité de cette
application linéaire, pour la norme ·∞ , résulte de l’inégalité |f (0)| ≤ f ∞
vérifiée par toute fonction f dans C 0 ([0, 1] , R) . En considérant la suite de fonctions
(fn )n≥1 définie sur [0, 1] par :
⎧ 1

⎨ −nx + 1 si 0 ≤ x ≤
n
fn (x) =

⎩ 0 si 1 ≤ x ≤ 1
n
on vérifie que lim fn 1 = 0 et lim fn (0) = 1. L’application f → f (0) n’est
n→+∞ n→+∞
pas continue pour ·1 .
Semi-normes et normes 29

Définition 2.3. On dit qu’un espace vectoriel normé (E, ·) est complet,
ou que c’est un espace de Banach, si toute suite de Cauchy dans E est
convergente.

On admet le résultat suivant, où |·| désigne la valeur absolue sur R ou le module


sur C.
Théorème 2.1.
L’espace (K, |·|) est complet.

De ce résultat on déduit que tout espace vectoriel normé de dimension finie est
complet (corollaire 2.5).
On rappelle qu’une partie A d’un espace vectoriel réel E est convexe, si pour
tout couple (a, b) d’éléments de A, le segment [a, b] = {(1 − λ) a + λb | 0 ≤ λ ≤ 1}
est contenu dans A.
Théorème 2.2.
Un convexe dans un espace vectoriel normé est connexe.


Preuve. Si A est convexe dans E, pour a fixé dans A, il s’écrit A = [a, b] , avec
b∈A
[a, b] connexe, pour tout b ∈ A, comme image du connexe [0, 1] par l’application
continue t → (1 − t) a + tb (lemme 1.1 et théorème 1.22). L’ensemble A est donc
connexe comme réunion de connexes d’intersection non vide.
On peut aussi utiliser le corollaire 1.1. Si f : A → {0, 1} est continue, pour tous
x = y dans A la fonction ϕ : t → f ((1 − t) x + ty) est continue du connexe [0, 1]
dans {0, 1} , donc constante et f (x) = ϕ (0) = ϕ (1) = f (y) , donc f est constante
et A est connexe. 

Corollaire 2.1. Les connexes (et convexes) de R sont les intervalles.

Preuve. Soit I un connexe de R non réduit à un point. Si I n’est pas un intervalle,


il alors existe a < b dans I et c ∈ ]a, b[ tel que c ∈
/ I et l’application f définie sur
I par f (x) = 1 si x < c dans I, f (x) = 0 si x > c dans I est continue (l’image
réciproque par f d’un ouvert de R est ]−∞, c[ ∩ I, ]c, +∞[ ∩ I ou ∅) non constante,
ce qui contredit la connexité de I. L’ensemble I est donc un intervalle, il est donc
convexe. Si I est un intervalle, il est convexe, donc connexe. 
Les convexes sont des cas particuliers d’ensembles connexes par arcs.

Définition 2.4. On dit qu’une partie A de E est connexe par arcs, si pour
tout couple (a, b) d’éléments de A il existe une application continue γ de
[0, 1] dans A telle que γ (0) = a et γ (1) = b (deux points quelconques de A
peuvent être joints par un arc continu dans A).
30 Espaces normés

Théorème 2.3.
Un ensemble connexe par arcs dans E est connexe.

Preuve. Si A est connexe par arcs dans E, pour a fixé dans A en désignant
 tout x ∈ A par γx un arc continu joignant a et x dans A, on a alors A =
pour
γx ([0, 1]) , avec γx ([0, 1]) connexe pour tout x ∈ A, comme image du connexe
x∈A
[0, 1] par l’application continue γx . L’ensemble A est donc connexe comme réunion
de connexes ayant tous en commun le point a = γx (0) (théorème 1.23). 

2.2 Applications linéaires continues


L’étude de la continuité est simplifiée dans le cas particulier des applications
linéaires.

(E, ·) , F, · sont des espaces vectoriels normés, S (0, 1) [resp. B (0, 1)] est
la sphère unité [resp. la boule unité] de (E, ·) et u est une application linéaire

de (E, ·) dans F, · .
Théorème 2.4.
Les assertions suivantes sont équivalentes :
1. u est continue en 0 ;
2. u est uniformément continue sur E ;
3. u est continue sur E ;
4. u est bornée sur S (0, 1) [resp. sur B (0, 1)] ;

5. il existe une constante réelle positive λ telle que u (x) ≤ λ x pour
tout x ∈ E.

Preuve. (1) ⇒ (2) Si u est continue en 0, il existe alors, pour tout ε > 0, un réel
η > 0 tel que :

(x ∈ E, x ≤ η) ⇒ u (x) ≤ ε
Utilisant la linéarité de u on déduit que pour x, y dans E tels que x − y ≤ η on

a u (x) − u (y) ≤ ε, ce qui prouve l’uniforme continuité de f sur E.
(2) ⇒ (3) est évidente.
(3) ⇒ (4) Si u est continue sur E elle est en particulier continue en 0 et il existe
un réel η > 0 tel que :

(x ∈ E, x ≤ η) ⇒ u (x) ≤ 1

Pour tout x ∈ S (0, 1) [resp. tout x ∈ B (0, 1)], on a ηx = η [resp. ηx ≤ η] et
 1
avec la linéarité de u on déduit que u (x) ≤ , ce qui signifie que u est bornée
η
sur S (0, 1) [resp. sur B (0, 1)].
(4) ⇒ (5) Si u est bornée sur S (0, 1) [resp. sur B (0, 1)], il existe alors un réel

λ > 0 tel que u (x) ≤ λ pour tout x ∈ E tel que x = 1 [resp. x ≤ 1]. En
Applications linéaires continues 31

1
remarquant que pour tout vecteur x non nul dans E le vecteur x est dans la
x
sphère (et la boule) unité de (E, ·) et en utilisant la linéarité de u on déduit que

u (x) ≤ λ x , cette inégalité étant aussi vérifiée pour x = 0.
(5) ⇒ (1) est évidente. 
Une application linéaire continue est donc caractérisée par le fait d’être bornée
sur la sphère unité. Pour cette raison une telle application est également appelée
opérateur borné et la norme d’un tel opérateur borné est définie par N (u) =

sup u (x) .
x∈S(0,1)

Corollaire 2.2. Pour u surjective, les assertions suivantes sont équiva-


lentes :
1. u est un homéomorphisme ;
2. il existe des constantes réelles strictement positives α et β telles que :

∀x ∈ E, α x ≤ u (x) ≤ β x

3. il existe des constantes réelles strictement positives α et β telles que :



(x ∈ E, x = 1) ⇒ α ≤ u (x) ≤ β

Preuve. (1) ⇒ (2) Si u est un homéomorphisme de E sur F, les applications u


et u−1 sont alors continues et il existe deux constantes β > 0 et γ > 0 telles que :
 
∀x ∈ E, u (x) ≤ β x et ∀y ∈ F, u−1 (y) ≤ γ y
 

Comme tout vecteur x de E s’écrit de manière unique x = u−1 (y) avec y dans F,
on déduit des inégalités précédentes que :
1 
∀x ∈ E, x ≤ u (x) ≤ β x
γ
(2) ⇒ (3) Cette implication est évidente.

(3) ⇒ (1) Les inégalités u (x) ≤ β pour tout x ∈ S (0, 1) signifient que
l’application linéaire u est continue. En remarquant que pour tout vecteur x non
1
nul dans E le vecteur x est dans la sphère unité S (0, 1) et en utilisant la
x
linéarité de u on déduit de l’assertion 3. que :

∀x ∈ E \ {0} , α x ≤ u (x) ≤ β x
ces encadrements étant encore valables pour x = 0. Si u (x) = 0 on a alors né-
cessairement x = 0, (α > 0), c’est-à-dire que l’application linéaire u est injective.
Cette application étant supposée surjective, on déduit que c’est un isomorphisme
de E sur F. Tout vecteur x de E s’écrivant de manière unique x = u−1 (y) avec

y dans F, les inégalités α x ≤ u (x) pour tout x dans E sont équivalentes à
 −1  1
u (y) ≤ y pour tout y dans F, ce qui équivaut à la continuité de u−1 . 
α
Le lemme qui suit nous est utile pour donner une caractérisation des formes
linéaires continues sur (E, ·) .
32 Espaces normés

Lemme 2.2 Si ϕ est une forme linéaire non nulle sur E, il existe alors un vecteur
non nul a dans E tel que E = ker (ϕ) ⊕ Ka.

Preuve. La forme linéaire ϕ étant non nulle, il existe a ∈ E \{0} tel que ϕ (a) = 0.
ϕ (x)
Pour tout vecteur x ∈ E, le vecteur h = x − a, est dans le noyau de ϕ et
ϕ (a)
ϕ (x)
en écrivant que x = h + a on déduit que E = ker (ϕ) + Ka. Si x est dans
ϕ (a)
ker (ϕ) ∩ Ka, on a alors x = λa et λϕ (a) = ϕ (x) = 0 avec ϕ (a) = 0, ce qui
entraîne λ = 0 et x = 0. On a donc ker (ϕ) ∩ Ka = {0} et E = ker (ϕ) ⊕ Ka. 
Théorème 2.5.
Une forme linéaire ϕ sur E est continue si, et seulement si, son noyau
ker (ϕ) est fermé dans (E, ·) .

Preuve. Le résultat étant évident pour ϕ = 0, on suppose que ϕ est non nulle.
Si ϕ est une forme linéaire continue sur E, son noyau ker (ϕ) est alors fermé
comme image réciproque du fermé {0} par l’application continue ϕ. Supposons
réciproquement que ker (ϕ) soit fermé dans (E, ·) . Dire que ϕ est non continue
équivaut à dire qu’elle n’est pas bornée sur la sphère unité S (0, 1) de (E, ·)
(théorème 2.4). Dans ce cas on peut trouver une suite (xn )n∈N d’éléments de
S (0, 1) telle que |ϕ (xn )| ≥ n pour tout n ∈ N. En utilisant une décomposition
E = ker (ϕ) ⊕ Ka où ϕ (a) = 0, on écrit pour tout entier n, xn = yn + λn a
ϕ (xn )
avec yn ∈ ker (ϕ) et λn = ∈ K. Pour n ≥ 1 on a |ϕ (xn )| ≥ n > 0 et
ϕ (a)
1 1
a = xn + zn avec zn = − yn ∈ ker (ϕ) . Mais on a alors pour tout entier
λn λn
xn  1 |ϕ (a)| |ϕ (a)|
n ≥ 1, a − zn  = = = ≤ , ce qui implique que, a qui
|λn | |λn | |ϕ (xn )| n
n’appartient pas à ker (ϕ) , est limite d’une suite de points de ker (ϕ) , soit une
contradiction avec ker (ϕ) fermé. On a donc ainsi montré que si ker (ϕ) est fermé
dans (E, ·) , ϕ est alors continue. 
Le lemme qui suit nous est utile pour donner une caractérisation des application
linéaires de rang fini de E dans F qui sont continues.

Lemme 2.3 L’application linéaire u : E → F est de rang r si, et seulement si,


il existe des formes linéaires sur E, ϕ1 , · · · , ϕr linéairement indépendantes et des
vecteurs de F, a1 , · · · , ar linéairement indépendants tels que :

r
∀x ∈ E, u (x) = ϕi (x) ai
i=1

Preuve. Si u est de rang r, son image Im (u) est alors un sous-espace vectoriel de
F de dimension r et, désignant par (ai )1≤i≤n une base de Im (u) , on peut trouver
pour tout x dans E, des scalaires uniquement déterminés ϕ1 (x) , · · · , ϕr (x) tels

r
que u (x) = ϕi (x) ai . De la linéarité de u et de l’unicité de l’écriture d’un vecteur
i=1
dans une base on déduit que les applications ϕi sont linéaires. Supposons la famille
Applications linéaires continues 33


r
(ϕi )1≤i≤r liée dans le dual algébrique E ∗ de E avec, par exemple, ϕ1 = λ i ϕi .
i=2
On a alors, pour tout x dans E :
 r 
 
r 
r
u (x) = λi ϕi (x) a1 + ϕi (x) ai = ϕi (x) (λi a1 + ai )
i=2 i=2 i=2

ce qui signifie que la famille de r − 1 vecteurs (λi a1 + ai )2≤i≤r engendre Im (u) ,


soit une contradiction avec dim (Im (u)) = r. La famille (ϕi )1≤i≤n est donc libre.
La réciproque est évidente. 

Lemme 2.4 Soit H un sous-espace vectoriel fermé de (E, ·) . Pour tout a ∈ E,
l’espace K = H + Ka est fermé dans (E, ·) .

Preuve. Pour a ∈ H, K = H est fermé par hypothèse. Pour a ∈ / H, on a


K = H ⊕ Ka et tout vecteur x ∈ K s’écrit de manière unique x = y + ϕ (x) a
où y ∈ H et ϕ (x) ∈ K. De l’unicité d’une telle écriture on déduit que ϕ est une
forme linéaire sur K. De plus ker (ϕ) = H qui est fermé dans (E, ·) est aussi
fermé dans (K, ·) , donc ϕ est continue de K dans K (théorème 2.5). De cette
continuité et de la complétude de K on va déduire que K est fermé. Soit donc
(xn )n∈N une suite de points de K qui converge vers x ∈ E. Tout vecteur xn s’écrit
xn = yn + ϕ (xn ) a où (yn )n∈N est une suite de points de H. La suite (xn )n∈N
étant convergente dans E, elle est de Cauchy et avec la continuité de ϕ on déduit
que la suite (ϕ (xn ))n∈N est de Cauchy dans K. Le corps K étant complet, la suite
(ϕ (xn ))n∈N converge vers un scalaire λ. On en déduit alors que la suite (yn )n∈N
converge vers y = x − λa. L’espace H étant fermé on a y ∈ H et x = y + λa est
dans K. On a donc ainsi montré que K est fermé. 
Théorème 2.6.
Soit H un sous-espace vectoriel fermé de (E, ·) . Pour tout sous-espace
vectoriel G de dimension finie de E, le sous-espace vectoriel H + G est
fermé dans (E, ·) .

Preuve. On procède par récurrence sur la dimension p ≥ 0 de G. Pour p = 0, c’est


clair et pour p = 1 c’est le lemme précédent. Supposons le résultat acquis pour
tous les sous-espaces vectoriels de E de dimension p ≥ 1 et soit G de dimension
p + 1. En notant (ai )1≤i≤p+1 une base de G on peut écrire :
⎛ ⎞
p
H + G = ⎝H + Kaj ⎠ + Kap+1
j=1

et on conclut facilement avec l’hypothèse de récurrence et le lemme précédent. 

Corollaire 2.3. Tout sous-espace vectoriel de dimension finie de E est


fermé dans E.

Preuve. Il suffit de prendre H = {0} dans le théorème précédent. 


34 Espaces normés

Théorème 2.7.
Une application linéaire de rang fini u : E → F est continue si, et seule-
ment si, son noyau est fermé dans (E, ·) .

Preuve. Si u est continue, ker (u) est alors fermé dans (E, ·) comme image

réciproque du fermé {0} de F, · par l’application continue u. Réciproquement
supposons que ker (u) soit fermé dans (E, ·) . L’application linéaire u étant de
rang fini, il existe des formes linéaires ϕ1 , · · · , ϕr , linéairement indépendantes dans
r

E et une famille libre (ai )1≤i≤r dans F tels que u = ϕi ai (lemme 2.3). On
i=1

r
a alors ker (u) = ker (ϕj ) ⊂ ker (ϕj ) pour tout j compris entre 1 et r. On
j=1
peut écrire que ker (ϕj ) = ker (u) ⊕ Hj et la restriction de u à Hj est injective
(u (x) = 0 et x ∈ Hj équivaut à x ∈ ker (u) ∩ Hj ) de Hj dans Im (u) qui est
de dimension finie. En définitive, pour tout j compris entre 1 et r le sous-espace
vectoriel Hj est de dimension finie dans E et avec le théorème 2.6 on déduit que
ker (ϕj ) = ker (u) ⊕ Hj est fermé et donc que la forme linéaire ϕj est continue. La
r
continuité de u = ϕi ai en résulte alors immédiatement. 
i=1

Corollaire 2.4. Pour E de dimension finie, toute application linéaire de



(E, ·) dans F, · est continue.

Preuve. Pour E de dimension finie, toute application linéaire u de E dans F est


de rang fini (théorème du rang). De plus ker (u) est de dimension finie comme E,
donc fermé. En définitive, u est continue. 

2.3 Espaces vectoriels normés de dimension finie


Définition 2.5. On dit que deux normes · et · sur E sont équivalentes

si l’application identité est un homéomorphisme de (E, ·) sur E, · .

On définit ainsi une relation d’équivalence sur l’ensemble des normes de E.


Du corollaire 2.2, on déduit le résultat suivant.
Théorème 2.8.

Deux normes · et · sur E sont équivalentes si, et seulement si, il
existe deux constantes réelles α et β strictement positives telles que :

∀x ∈ E, α x ≤ x ≤ β x
Espaces vectoriels normés de dimension finie 35

De ce résultat on déduit que deux normes équivalentes sur E définissent la


même topologie.

Exemples 2.2
1. Les normes ·∞ , ·1 et ·2 sur Rn sont équivalentes.
2. Les normes ·1 et ·∞ sur C 0 ([0, 1] , R) ne sont pas équivalentes car nous
avons trouvé un peu plus haut une suite de fonctions qui converge vers la fonc-
tion nulle pour la norme ·1 et diverge pour la norme ·∞ .

Lemme 2.5 Soient E est un espace vectoriel de dimension n ≥ 1, (ei )1≤i≤n une
base de E et ·∞ la norme définie sur E par :

n
∀x = xi ei ∈ E, x∞ = max |xi |
1≤i≤n
i=1

La boule unité B∞ et la sphère unité S∞ sont compactes dans (E, ·∞ ) .

Preuve. Soit x(k) k∈N une suite dans B∞ [resp. S∞ ] avec, pour tout k ∈ N,
# $  
. Pour tout j compris entre 1 et n on a xj ≤ x(k) ∞ ≤ 1.
(k) (k)
x(k) = xj
1≤j≤n # $ # $
(k) (ϕ (k))
De la suite réelle bornée x1 on peut extraire une sous-suite x1 1
k∈N k∈N
qui converge vers un scalaire
# x$1 vérifiant |x1 | ≤ 1 (Bolzano-Weierstrass).
# Puis$ de
(ϕ1 (k)) (ϕ2 (k))
la suite réelle bornée x2 on peut extraire une sous-suite x2
k∈N k∈N
qui converge vers un scalaire x2 vérifiant |x2 | ≤ 1. En continuant ainsi on extrait
une suite x(ϕ(k)) k∈N telle que :
(ϕ(k))
∀j ∈ {1, 2, · · · , n} , lim xj = xj
k→+∞
 
avec |xj | ≤ 1. On a alors lim x(ϕ(k)) − x∞ = 0 où x = (xj )1≤j≤n est dans B∞
k→+∞
[resp. S∞ ], c’est-à-dire que la suite x(ϕ(k)) k∈N converge vers x dans B∞ [resp.
S∞ ]. On a donc ainsi montré que B∞ [resp. S∞ ] est compacte dans (E, ·∞ ) . 

Lemme 2.6 Soient (E, ·) un espace vectoriel normé et H un sous-espace vec-
toriel fermé de E distinct de E. Pour tout réel ε > 0 il existe un vecteur x dans
la sphère unité S (0, 1) de (E, ·) tel que d (x, H) ≥ 1 − ε.

Preuve. Pour ε ≥ 1 le résultat est évident. On suppose donc que ε ∈ ]0, 1[ . Si


H est fermé dans E, on a alors d (y, H) > 0 pour tout y ∈ E \ H (théorème 1.3).
1
Pour ε ∈ ]0, 1[ on a > 1 et pour y ∈ E \ H on peut trouver z ∈ H tel que :
1−ε
d (y, H)
0 < d (y, H) ≤ y − z <
1−ε
1
Le vecteur x = (y − z) est alors dans la sphère unité de (E, ·) et pour
y − z
1
tout t ∈ H on a x − t = y − (z + y − z t) avec u = z + y − z t
y − z
36 Espaces normés

1 d (y, H)
dans H, de sorte que x − t = y − u ≥ > 1 − ε. On a donc
y − z y − z
d (x, H) = inf x − t ≥ 1 − ε. 
t∈H
Le théorème qui suit donne plusieurs caractérisations des K-espaces vectoriels
de dimension finie.
Théorème 2.9.
Soit E un K-espace vectoriel. Les assertions suivantes sont équivalentes :
1. E est de dimension finie ;
2. toutes les normes sur E sont équivalentes ;
3. quelle que soit la norme choisie sur E toute forme linéaire définie sur
(E, ·) est continue ;
4. quelle que soit la norme choisie sur E, la sphère [resp. boule] unité de
(E, ·) pour cette norme est compacte ;
5. quelle que soit la norme choisie sur E, les compacts de (E, ·) sont les
fermés bornés.

Preuve. (1) ⇒ (2) On suppose que E est de dimension finie et on se donne deux
 
normes · et · sur E. L’application linéaire Id : (E, ·) → E, · [resp.

Id : E, · → (E, ·)] est de rang fini à noyau fermé, elle est donc continue

(théorème 2.7). L’application Id : (E, ·) → E, · est donc un homéomor-

phisme, c’est-à-dire que les normes · et · sont équivalentes sur E.
(2) ⇒ (3) On suppose que toutes les normes sur E sont équivalentes. Si · est
une norme sur E et ϕ une forme linéaire sur E, l’application N : x → x + |ϕ (x)|
définit alors une norme sur E, donc équivalente à · et il existe une constante
α > 0 telle que N (x) ≤ α x pour tout x ∈ E. On a donc |ϕ (x)| ≤ (α − 1) x
pour tout x ∈ E, ce qui équivaut à la continuité de la forme linéaire ϕ.
(3) ⇒ (1) On suppose que quelle que soit la norme choisie sur E toute forme
linéaire sur E est continue. Si (E, ·) est de dimension infinie on peut trouver un
système libre infini dénombrable (en )n∈N tel que en  = 1 pour tout n ∈ N. En
désignant par G un supplémentaire dans E de H = Vect {en | n ∈ N} on définit
la forme linéaire ϕ sur E par ϕ (x) = 0 pour tout x ∈ G et ϕ (en ) = n pour
tout n ∈ N. L’application linéaire ainsi définie n’est pas bornée sur la sphère unité
de (E, ·) et en conséquence n’est pas continue, ce qui est en contradiction avec
l’hypothèse de départ. L’espace vectoriel E est donc de dimension finie.
On a donc ainsi montré que les assertions (1) , (2) et (3) sont équivalentes. En
particulier si (3) est vérifiée alors toutes les normes sur E sont équivalentes et la
compacité de la sphère [resp. boule] unité de (E, ·) résulte de la compacité de la
sphère [resp. boule] unité de (E, ·∞ ) (lemme 2.5).
(4) ⇒ (5) On suppose que quelle que soit la norme choisie sur E, la sphère [resp.
boule] unité de E pour cette norme est compacte. On sait déjà que toute partie
compacte d’un espace vectoriel normé (E, ·) est fermée et bornée (théorème
1.10). Réciproquement soit C une partie non vide fermée et bornée dans (E, ·) .
Il existe une constante λ > 0 telle que x ≤ λ pour tout x dans C et pour
Exercices 37
 
1
toute suite (xn )n∈N de points de C, la suite xn est dans la boule unité de
λ n∈N  
1
(E, ·) , cette boule étant compacte, on peut extraire une sous-suite xϕ(n)
λ n∈N
qui converge vers y ∈ E. La suite xϕ(n) n∈N converge alors vers x = λy et x ∈ C
puisque C est fermé. On a donc ainsi montré que C est compact dans (E, ·) .
(5) ⇒ (1) On suppose que quelle que soit la norme choisie sur E, les compacts
de (E, ·) sont les fermés bornés. Si E est de dimension infinie on peut trouver
un système libre infini dénombrable (en )n∈N . Pour tout entier n, on désigne par
En le sous-espace vectoriel de E engendré par (ek )1≤k≤n . On a alors Ep  Eq
pour q > p. De plus chaque En est de dimension finie dans E, donc fermé dans
E et aussi dans En+1 . En utilisant le lemme 2.6, on peut construire une suite
1
(xn )n≥1 dans la sphère unité de (E, ·) telle que xn ∈ En et d (xn , En−1 ) ≥
2
1
pour tout n ≥ 1. Mais alors, on a xq − xp  ≥ d (xq , Eq−1 ) ≥ pour q > p et il
2
est impossible d’extraire de la suite (xn )n≥1 une sous-suite convergente, ce qui est
en contradiction avec la compacité de la sphère unité (c’est un fermé borné) de
(E, ·) . L’espace vectoriel E est donc nécessairement de dimension finie. 
L’équivalence (1) ⇔ (5) est le théorème de Riesz. De ce résultat et du théorème
1.11, on déduit que dans un espace vectoriel normé de dimension finie, une suite est
convergente si, et seulement si, elle est bornée et a une unique valeur d’adhérence
(une suite bornée est à valeur dans une boule fermée B (0, R) qui est compacte).
On peut donc conclure que sur un espace vectoriel de dimension finie on a une
seule topologie compatible avec la structure d’espace vectoriel.

Corollaire 2.5. Un espace vectoriel normé de dimension finie est complet.

Preuve. En reprenant les notations précédentes il suffit de montrer que (E, ·∞ )
est complet, ce qui se déduit immédiatement du fait que K est complet. 

2.4 Exercices

1 1
Exercice 2.1. Soient p, q deux réels dans R+,∗ tels que + = 1.
p q
1. En utilisant la concavité de la fonction ln, montrer que :

∀λ ∈ [0, 1] , ∀u ∈ R+ , ∀v ∈ R+ , uλ v 1−λ ≤ λu + (1 − λ) v (2.1)


38 Espaces normés

p
1 |xi |
2. Soient x et y dans Rn . En utilisant (2.1) avec λ = , ui = %
n et
p p
|xj |
j=1
q
|yi |
vi = %
n pour x et y non nuls montrer l’inégalité de Hölder :
q
|yj |
j=1

  p1   q1

n 
n
p

n
q
x i yi ≤ |xi | |yi |
i=1 i=1 i=1

Pour p = q = 2 on retrouve l’inégalité de Cauchy-Schwarz et cette in-


égalité est encore valable pour p = 1 et q = +∞.
3. Montrer que pour tous x, y dans Rn on a :
  p1   q1

n
p−1

n
p

n
p
|xi | |xi + yi | ≤ |xi | |xi + yi |
i=1 i=1 i=1

  p1

n
p
4. Montrer que, pour p ≥ 1, l’application x → xp = |xi | définit
i=1
une norme sur Rn .
5. L’application x → xp définit-elle une norme sur Rn pour p ∈ ]0, 1[ ?

Solution.
1. Voir le lemme 8.1.
  p1   q1

n
p

n
q
2. Pour x, y dans Rn on note xp = |xi | et yq = |yi | .
i=1 i=1
1 1 1 1 1 1
Prenant λ = dans (2.1) , on a 1 − λ = et u p v q ≤ u + v pour u, v positifs
p q p q
ou nuls. Si x et y sont deux vecteurs non nuls dans Rn , prenant pour i compris
p p q q
|xi | |xi | |yi | |yi |
entre 1 et n, ui = % = p et v i = % = q dans l’inégalité
n
p xp n
q yq
|xj | |yj |
j=1 j=1
p q
|xi | |yi | 1 |xi | 1 |yi |
précédente on obtient, ≤ p+ . Faisant la somme de toutes
xp yq p xp q yqq
1 n
1  |xi |
n p
1  |yi |
n q
ces inégalités on obtient, |xi | |yi | ≤ + . Puis
xp yq i=1 p i=1 xpp q i=1 yqq
 n
|xi |
p n
|yi |
q
1 1
avec p = q = 1 et + = 1 on déduit que :
i=1
x p i=1
y q p q


n 
n
x i yi ≤ |xi | |yi | ≤ xp yq
i=1 i=1
Exercices 39

cette inégalité étant encore réalisée pour x = 0 ou y = 0.


3. Pour x, y dans Rn on a, en utilisant l’inégalité de Hölder :
  p1   q1

n
p−1

n
p

n
(p−1)q
|xi | |xi + yi | ≤ |xi | |xi + yi |
i=1 i=1 i=1

  p1   q1

n
p−1

n
p

n
p
soit avec (p − 1) q = p, |xi | |xi + yi | ≤ |xi | |xi + yi | .
i=1 i=1 i=1
4. On vérifie facilement que x → x1 définit une norme sur Rn . On suppose donc
1 1
que p > 1 et on note q le réel défini par + = 1. Pour x, y dans Rn on a :
p q

n
p

n
p−1

n
p−1
|xi + yi | ≤ |xi + yi | |xi | + |xi + yi | |yi |
i=1 i=1 i=1

Ce qui donne avec la question précédente :


# $p # $# $ pq
x + yp ≤ xp + yp x + yp

p
soit avec p − = 1, x + yp ≤ xp + yp . On a donc l’inégalité triangulaire
q
pour ·p . Les autres propriétés d’une norme se vérifient facilement.
5. Pour 0 < p < 1, l’inégalité triangulaire n’est pas vérifiée. Notant (ei )1≤i≤n la
1
base canonique de Rn , on a e1 + e2 p = 2 p > e1 p + e2 p = 2.

Exercice 2.2. E = C 0 ([a, b] , K) désigne l’espace vectoriel des applica-


&'K. Pour tout réel p ≥ 1 et toute
tions continues de [a, b] (a < b) dans
b p
fonction tout f ∈ E, on note f p = p a |f (x)| dx.
1. Montrer que l’application f → f p est une norme sur E.
2. Calculer, pour toute fonction f ∈ E, lim f p .
p→+∞
3. On suppose que f est à valeurs positives ou nulleset on se donne une
 1
fonction continue g : [a, b] → R+,∗ . Calculer lim f g p  .
p→+∞ p

Solution.
1. Pour p = 1, on sait déjà que f → f 1 définit une norme sur E. On suppose
donc que p > 1 et on se donne deux fonctions f, g non identiquement nulles
1 1 1 1
dans E. On applique l’inégalité de convexité u p v q ≤ u + v où q est tel que
p q
p q
1 1 |f (t)| |g (t)|
+ = 1, à u = p , v = q pour tout t dans [a, b] , ce qui donne,
p q f p gq
40 Espaces normés

p q
|f (t)| |g (t)| 1 |f (t)| 1 |g (t)|
≤ p + . En intégrant sur [a, b] on obtient :
f p gq p f p q gqq
 b
1 1 1
|f (t)| |g (t)| dt ≤ + = 1
f p gq a p q
 b  b
D’où l’inégalité de Hölder, f (t) g (t) dt ≤ |f (t)| |g (t)| dt ≤ f p gq ,
a a
cette inégalité étant encore réalisée pour f = 0 ou g = 0. Pour f, g dans E on
a, en utilisant l’inégalité de Hölder :
 b  
p−1  p−1 
|f (t)| |f (t) + g (t)| dt ≤ f p (f + g) 
a q
 b p
p−1
soit avec (p − 1) q = p, |f (t)| |f (t) + g (t)| dt ≤ f p f + gpq , cette
a
inégalité étant encore valable en permutant les rôles de f et g. On en déduit
 b # $ p
p p
que f + gp = |f (t) + g (t)| dt ≤ f p + gp f + gpq , soit compte
a
p
tenu de p − = 1, f + gp ≤ f p + gp . On a donc l’inégalité triangulaire
q
pour ·p . Les autres propriétés d’une norme se vérifient facilement.
2. On suppose f non identiquement nulle. On a
1
0 ≤ |f (x)| ≤ f ∞ ⇒ 0 ≤ f p ≤ f ∞ (b − a) p
Soit x0 ∈ [a, b] tel que |f (x0 )| = f ∞ et, pour ε > 0 donné, il existe η > 0 tel
que 0 ≤ |f (x0 )| − |f (x)| < ε pour x ∈ [0, 1] ∩ [x0 − η, x0 + η]. On a alors, en
notant α la longueur de l’intervalle [0, 1] ∩ [x0 − η, x0 + η] :
 b 
p p
|f (x)| dx ≥ |f (x)| dx
a [a,b]∩[x0 −η,x0 +η]

p p
≥ (|f (x0 )| − ε) dx ≥ α (f ∞ − ε)
[a,b]∩[x0 −η,x0 +η]

Ce qui donne en définitive, pour tout ε > 0 :


1 1
(f ∞ − ε) α p ≤ f p ≤ f ∞ (b − a) p
1 1
Comme lim (f ∞ − ε) α p = f ∞ − ε et lim f ∞ (b − a) p = f ∞ , il
p→+∞ n→+∞
existe un entier p0 tel que f ∞ −2ε ≤ f p ≤ f ∞ +2ε pour tout p ≥ p0 . Donc
# $
lim f p = f ∞ .
p→+∞
3. g étant continue et à valeurs strictement positives sur le compact [a, b] , on
a m = inf g (x) > 0 et M = sup g (x) > 0. De plus, f étant à valeurs
x∈[a,b] x∈[a,b]
 1 
1   1
positives, on a mf ≤ gf ≤ M f et m p f p ≤ g p f  ≤ M p f p . On en
p p p
 1 p
 
déduit alors de la question précédente que lim f g p  = f ∞ .
p→+∞ p
Exercices 41

Exercice 2.3. L’espace vectoriel E = C 0 ([0, 1] , R) des applications conti-


nues de [0, 1] dans R est muni de la norme ·∞ . Les ensembles suivants
sont-ils ouverts ou fermés ?
1. l’ensemble A des fonction de E nulles en un point t0 fixé dans [0, 1] ;
2. l’ensemble B des fonctions croissantes ;
3. l’ensemble C des fonctions monotones ;
4. l’ensemble D des fonctions dérivables.

Solution.
1. La forme linéaire ϕ : f ∈ E → f (t0 ) est telle que |ϕ (f )| = |f (t0 )| ≤ f ∞ ,
donc continue. Il en résulte que A = ϕ−1 {0} est fermé dans (E, ·∞ ) comme
image réciproque du fermé {0} de (R, |·|) . Cet ensemble n’est pas ouvert car la
1
suite de fonctions (fn )n∈N définie par fn (t) = est une suite d’éléments
n+1
de E \ A qui converge vers f = 0 ∈/ E \ A.
2. Si (fn )n∈N est une suite de fonctions dans E toutes croissantes qui converge
vers f ∈ E pour ·∞ , on a alors pour tous x ≤ y dans [0, 1] :

f (y) − f (x) = lim (fn (y) − fn (x)) ≥ 0


n→+∞

donc f ∈ B. L’ensemble B est donc fermé. Cet ensemble n’est pas ouvert car la
sin (6t)
suite de fonctions (fn )n∈N définie par fn (t) = est une suite d’éléments
n+1
de E \ B qui converge vers f = 0 ∈ / E \ B. De manière analogue, on vérifie que
l’ensemble B  des fonctions décroissantes est fermé non ouvert dans (E, ·∞ ) .
3. Soit (fn )n∈N est une suite de fonctions dans E toutes monotones qui converge
vers f ∈ E pour ·∞ . S’il n’y a qu’un nombre fini d’indices n pour lesquels
fn est croissante [resp. décroissante], il existe alors un entier n0 tel que la
suite (fn )n≥n0 soit à valeurs dans B  [resp. dans B] et f = lim fn ∈ B  [resp.
n→+∞
n≥n0
f = lim fn ∈ B], donc f est monotone. Dans le cas contraire, on peut extraire
n→+∞
n≥n0
une suite fϕ(n) n∈N à valeurs dans B et une suite fψ(n) n∈N à valeurs dans B 
et f = lim fϕ(n) = lim fψ(n) est à la fois croissante et décroissante, donc
n→+∞ n→+∞
constante et en particulier monotone. L’ensemble C est donc fermé. L’exemple
sin (6t)
de fn (t) = nous montre que cet ensemble n’est pas ouvert.
n+1
 2
1 1
4. La suite (fn )n∈N∗ de fonctions dérivables définies par fn (t) = t− +
2 n
1
sur [0, 1] converge vers f : t → t − dans E, cette fonction n’étant pas
2
1 1 1 1
dérivable en (|fn (t) − f (t)| = & ≤ √ ). Donc D
2 n 1 2 1 1 n
t− 2 + n + t− 2
n’est pas fermé. Cet ensemble n’est pas ouvert car la suite de fonctions (fn )n∈N
42 Espaces normés

t − 12
définie par fn (t) = est une suite d’éléments de E \ D qui converge vers
n+1
f =0∈
/ E \ D.

Exercice 2.4. Cet exercice a pour but de montrer l’existence d’une


meilleure approximation polynomiale uniforme d’une fonction continue sur
un segment. On note E = C 0 ([a, b] , R) l’espace vectoriel des applications
continues sur l’intervalle [a, b] (a < b) et à valeurs dans R et on munit cet
espace de la norme f → f ∞ = sup |f (x)| . Soient f une fonction ap-
x∈[a,b]
partenant à E \ {0} et B (0, 2 f ∞ ) la boule fermée de centre 0 et de rayon
2 f ∞ . Montrer qu’il existe un polynôme P dans Rn [X] ∩ B (0, 2 f ∞ )
tel que f − P ∞ = inf f − Q∞ .
Q∈Rn [X]

Solution. L’ensemble Bn,f = Rn [X] ∩ B (0, 2 f ∞ ) est la boule fermée de centre


0 et de rayon 2 f ∞ dans l’espace vectoriel Rn [X] muni de la norme ·∞ . Cet
espace vectoriel étant de dimension finie (égale à n + 1), on sait que cette boule
est compacte. L’application Q → f − Q∞ étant continue sur le compact Bn,f
de Rn [X] est minorée et atteint sa borne inférieure, c’est-à-dire qu’il existe un
polynôme P dans Bn,f tel que δ = inf f − Q∞ = f − P ∞ . Pour tout
Q∈Bn,f
polynôme Q dans Rn [X] on a soit Q ∈ Bn,f et alors f − Q∞ ≥ δ, soit Q ∈
/ Bn,f et
alors f − Q∞ ≥ Q∞ − f ∞ > 2 f ∞ − f ∞ = f ∞ . Remarquant que 0 ∈
Bn,f , on déduit que f ∞ = f − 0∞ ≥ δ. En définitive on a bien f − Q∞ ≥ δ
pour tout Q dans Rn [X] , donc δ = inf f − Q∞ = f − P ∞ .
Q∈Rn [X]

Exercice 2.5. On note E = C 1 ([0, 1] , R) est l’espace des fonctions conti-


nûment dérivables de [0, 1] dans R et pour toute fonction f ∈ E, on note
f  = |f (0)| + f  ∞ .
1. Montrer que l’application f → f  définit une norme sur l’espace E.
2. Les normes · et ·∞ sont-elles équivalentes sur E ?

Solution.
1. On a f  ≥ 0, λf  = |λ| f  et f + g ≤ f  + g pour tout λ ∈ R et
tous f, g dans E. L’égalité f  = 0 équivaut à f  = 0 et f (0) = 0, donc à
f = f (0) = 0.
2. Pour toute fonction f ∈ E, on a :
 x
|f (x)| = f (0) + f  (t) dt ≤ |f (0)| + f  ∞
0

donc f ∞ ≤ f  . Pour tout entier n ∈ N∗ , on désigne par fn la fonction


définie sur [0, 1] par fn (t) = tn . Comme fn ∞ = 1 et fn  = nfn−1 ∞ = n,
l’application f → f  n’est pas bornée sur la sphère unité de (E, ·∞ ) , donc
les normes · et ·∞ ne sont pas équivalentes.
Exercices 43

Exercice 2.6. On désigne par E1 l’espace des fonctions continûment dé-


rivables de [0, 1] dans R telles que f (0) = 0 et on se donne une fonc-
tion continue a de [0, 1] dans R. Pour toute fonction f ∈ E1 , on note
N1 (f ) = f  ∞ + af ∞ et N2 (f ) = f  + af ∞ .
1. Montrer que les applications N1 et N2 définissent des normes sur E.
2. Montrer que f ∞ ≤ N1 (f ) pour toute fonction f ∈ E.
3. Les normes ·∞ et N1 sont-elles équivalentes ?
4. Soient f ∈ E1 et g la fonction définie sur [0, 1] par g (x) = f (x) eA(x) ,
où A est la primitive nulle en 0 de a. Majorer |g  | en fonction de N2 (f ) ,
puis en déduire une majoration de f ∞ en fonction de N2 (f ) .
5. Montrer que les normes N1 et N2 sont équivalentes.
6. Les normes ·∞ et N2 sont-elles équivalentes ?

Solution.
1. Pour λ ∈ R et f, g dans E1 , on a clairement Nk (λf ) = |λ| Nk (f ) et Nk (f + g) ≤
Nk (f ) + Nk (g) pour k = 1 et k = 2 (linéarité de f → f  et f → af ajoutée
au fait que ·∞ est une norme). L’égalité N1 (f ) = 0 entraîne f  = 0, donc
f = f (0) = 0. L’égalité N2 (f ) = 0 équivaut à f  +af = 0, soit à f (t) = λe−A(t) ,
où A est la primitive nulle en 0 de a et λ = f (0) = 0, donc f = 0.
2. Il existe α ∈ [0, 1] et c ∈ [0, α] tels f ∞ = |f (α)| = |f (α) − f (0)| =
α |f  (c)| ≤ f  ∞ ≤ N1 (f ) (théorème des accroissements finis).
3. En considérant la suite de fonctions (fn )n∈N∗ définie par fn (t) = tn , on a
fn ∞ = 1 et N1 (fn ) ≥ fn ∞ = n, il ne peut donc exister de constante β > 0
telle que N1 ≤ β ·∞ . Les normes ·∞ et N1 ne sont donc pas équivalentes.

4. La fonction g est dans E1 avec  g (t) = e
A(t)
(f (t)+ a (t) f (t)) pour tout
t ∈ [0, 1] , donc |g  (t)| ≤ eA ∞ f  + af ∞ = eA ∞ N2 (f ) . En utilisant
le théorème des accroissements finis, on en déduit que pour tout  x ∈ [0, 1] , il
existe cx ∈ [0, x] tel que |g (x)| = |g (x) − g (0)| = |g  (cx )| ≤ eA ∞ N2 (f ) et
en conséquence, on a :
     
|f (x)| = g (x) e−A(x) ≤ e−A ∞ |g (x)| ≤ e−A ∞ eA ∞ N2 (f )
   
donc f ∞ ≤ e−A ∞ eA ∞ N2 (f ) .
5. Pour tout f ∈ E1 , on a N2 (f ) = f  + af ∞ ≤ f  ∞ + af ∞ = N1 (f ) et :

N1 (f ) = f  ∞ + af ∞ = f  + af − af ∞ + af ∞
   A
≤ f  + af  + 2 a f  ≤ 1 + 2 a e−A 
∞ ∞ ∞ ∞ ∞
e 

N2 (f )

Les normes N1 et N2 sont donc équivalentes.


6. Si ·∞ est équivalente à N2 , elle est alors équivalente à N1 d’après la question
précédente, ce qui n’est pas d’après la question 3.
44 Espaces normés

Exercice 2.7. Soit E = C 0 ([0, 1] , R) muni de la norme définie par :


 1
∀f ∈ E, f  = f ∞ + f 1 = sup |f (t)| + |f (t)| dt
t∈[0,1] 0

1. Montrer que les normes · et ·∞ sont équivalentes, puis que (E, ·)
est un espace de Banach.
2. Montrer que l’ensemble F = {f ∈ E | f (0) = 0} est un sous-espace vec-
toriel fermé de (E, ·) .
3. On désigne par f1 la fonction constante égale à 1 sur [0, 1] . Montrer que
f1 − f  > 1 pour tout f ∈ F, que d (f1 , F ) = inf f1 − f  = 1 et que
f ∈F
cette distance n’est pas atteinte.

Solution.
1. Avec f ∞ ≤ f  ≤ 2 f ∞ pour tout f ∈ E, on déduit que les normes · et
·∞ sont équivalentes. Sachant que (E, ·∞ ) est complet, on en déduit que
(E, ·) est un espace de Banach.
2. Pour f ∈ E, on a |f (0)| ≤ f ∞ ≤ f  , donc la forme linéaire ϕ : f → f (0)
est continue et F = ker (ϕ) = ϕ−1 {0} est un sous-espace vectoriel fermé de
(E, ·) .
3.
(a) Pour toute fonction f ∈ F, on a |f1 − f | = |1 − f | = 0 (puisque f (0) = 0)
 1
la fonction |1 − f | étant continue, donc f1 − f 1 = |1 − f (t)| dt > 0
0
et :

f1 − f  = 1 − f ∞ + 1 − f 1 > sup |1 − f (t)| ≥ |1 − f (0)| = 1


t∈[0,1]

Il en résulte que d (f1 , F ) = inf f1 − f  ≥ 1.


f ∈F

(b) Pour tout réel ε ∈ ]0, 1[ , on désigne par fε la fonction affine par morceaux
et continue définie par :

fε (0) = 0, fε est affine sur [0, ε] , fε (t) = 1 pour tout t ∈ [ε, 1]

Cette fonction est dans F et :


 ε 
1 ε
f1 − fε  = 1 + 1 − t dt = 1 + ≥ d (f1 , F )
0 ε 2

Faisant tendre ε vers 0, on en déduit que d (f1 , F ) ≤ 1 et d (f1 , F ) = 1.


Comme f1 − f  > 1 pour tout f ∈ F, cette distance n’est pas atteinte.
Exercices 45

Exercice 2.8. L’espace vectoriel E = C 0 ([0, 1] , R) des fonctions conti-


nues de [0, 1] dans R est muni de la norme f → f ∞ = sup |f (x)| .
x∈[0,1]
Pour tout n ∈ N∗ et tout entier k compris entre0 et n, on désigne par Bn,k
n k n−k
la fonction polynomiale définie par Bn,k (x) = x (1 − x) pour tout
k
réel x et à toute fonction f ∈ E, on associe la suite (Bn (f ))n∈N∗ de fonc-
n  
k
tions polynomiales de Bernstein définie par Bn (f ) = f Bn,k pour
n
k=0
tout n ∈ N∗ .
1. Montrer que, pour toute fonction f ∈ E et tout n ∈ N∗ , on a :
x (1 − x) 
Bn (xf ) = (Bn (f )) + xBn (f )
n
2. Pour tout k ∈ N, on note ek la fonction polynomiale définie par ek (x) =
xk pour tout réel x.
(a) Calculer Bn (ek ) pour n ∈ N∗ et k ∈ {0, 1, 2} .
(b) Montrer que, pour tout n ∈ N∗ et tout x ∈ R, on a :
n 
   n  2
k k x (1 − x)
− x Bn,k (x) = 0 et − x Bn,k (x) =
n n n
k=0 k=0

3.
(a) Montrer que pour tout réel α > 0 et tout x ∈ [0, 1] , on a :

n
1
Bn,k (x) ≤
4α2 n
k=0
| nk −x|≥α

(la somme étant nulle quand l’ensemble des entiers k compris entre
k
0 et n tels que − x ≥ α est vide).
n
(b) Montrer que, pour toute fonction f ∈ E, la suite (Bn (f ))n∈N∗
converge uniformément vers f sur [0, 1] .
4. Montrer que toute fonction continue, f : [a, b] → R, est limite uniforme
sur [a, b] d’une suite de polynômes (théorème de Weierstrass).
5. Montrer que si une fonction f est limite uniforme sur R d’une suite de
fonctions polynomiales, c’est alors une fonction polynomiale (le théorème
de Weierstrass n’est pas valable sur R).
6.
(a) Montrer qu’une fonction f ∈ E est limite uniforme sur [0, 1] d’une
suite de polynômes à coefficients entiers relatifs si, et seulement si,
f (0) et f (1) sont entiers relatifs.
46 Espaces normés

 
1
(b) En déduire que, pour tout réel δ ∈ , l’anneau Z [x] des
0,
2
fonctions polynomiales à coefficients entiers relatifs est dense dans
C 0 ([δ, 1 − δ]) , ·∞ .

Solution.
1. Pour n ∈ N∗ et 0 ≤ k ≤ n, on a :
⎧ n−1

⎪ −n (1 − x) si k = 0
⎨  
 n k−1 n−k−1
Bn,k (x) = x (1 − x) (k − nx) si 1 ≤ k ≤ n − 1

⎪ k

nxn−1 si k = n

donc x (1 − x) Bn,k (x) = (k − nx) Bn,k (x) . Il en résulte que pour f ∈ E, on
a:
n   n  
x (1 − x)  k k k
(Bn (f )) = f Bn,k (x) − x f Bn,k (x)
n n n n
k=0 k=0
= Bn (xf ) − xBn (f )
2.
(a) Pour tout réel x, on a :
n  
 n n−k n
Bn (e0 ) (x) = xk (1 − x) = (x + 1 − x) = 1
k
k=0

soit Bn (e0 ) = e0 . Il en résulte que :


x (1 − x) 
Bn (e1 ) (x) = (Bn (e0 )) (x) + xBn (e0 ) (x) = x
n
soit Bn (e1 ) = e1 et :
x (1 − x)  x (1 − x)
Bn (e2 ) (x) = (Bn (e1 )) (x) + xBn (e1 ) (x) = + x2
n n
 
1 1
soit Bn (e2 ) = e1 + 1 − e2 .
n n
(b) Pour n ∈ N∗ et x ∈ R, on a :
n 
  n 
n
k k
− x Bn,k (x) = Bn,k (x) − x Bn,k (x)
n n
k=0 k=0 k=0
= Bn (e1 ) (x) − xBn (e0 ) (x) = x − x = 0
et :
 n  2
k
−x Bn,k (x) = Bn (e2 ) (x) − 2xBn (e1 ) (x) + x2 Bn (e0 ) (x)
n
k=0
x (1 − x) x (1 − x)
= + x2 − 2x2 + x2 =
n n
Exercices 47

3.
 2
k 1 k
(a) Pour x ∈ [0, 1] et 0 ≤ k ≤ n tel que x − ≥ α, on a 1 ≤ 2 −x ,
n α n
donc :
n n  2
1 k
Bn,k (x) ≤ 2 − x Bn,k (x)
α n
k=0 k=0
|n |
k
−x ≥α |n |
k
−x ≥α
n  2
1  k 1 x (1 − x) 1
≤ 2 − x Bn,k (x) = 2 ≤
α n α n 4α2 n
k=0

1
(la fonction x → x (1 − x) atteint son maximum en ).
2
(b) En utilisant l’égalité Bn (e0 ) = 1, on a pour tout x ∈ [0, 1] :
n    
k
Bn (f ) (x) − f (x) = f − f (x) Bn,k (x)
n
k=0

La fonction f étant continue sur le compact [0, 1] , elle y est uniformément


continue, donc pour tout réel ε > 0, on peut trouver un réel α > 0 tel que :
# $
2
(x, y) ∈ [0, 1] et |x − y| < α ⇒ (|f (x) − f (y)| < ε)

ce qui nous donne :

|Bn (f ) (x) − f (x)|


     
k k
≤ f − f (x) Bn,k (x) + f − f (x) Bn,k (x)
n n
| nk −x|≥α | nk −x|<α
 
≤ 2 f ∞ Bn,k (x) + ε Bn,k (x)
|n |
k
−x ≥α |n |
k
−x <α

2 f ∞ n
f ∞
≤ +ε Bn,k (x) = +ε
4α2 n 2α2 n
k=0

f ∞
soit Bn (f ) − f ∞ ≤ + ε. Désignant par n0 un entier non nul tel
2α2 n
f ∞
que < ε pour tout n ≥ n0 , on déduit que Bn (f ) − f ∞ < 2ε pour
2α2 n
tout n ≥ n0 , donc (Bn (f ))n∈N∗ converge uniformément vers f sur [0, 1] .
4. Si f est une fonction continue sur [a, b] , la fonction g définie sur [0, 1] par
g (t) = f (a + t (b − a)) est continue, donc la suite de fonctions polynomiales
(Bn (g))n∈N∗ converge uniformément vers g sur [0, 1]  et la suite de fonctions
x−a
polynomiales (Pn )n∈N∗ définie par Pn (x) = Bn (g) converge unifor-
  b−a
x−a
mément vers la fonction x → g = f (x) sur [a, b] .
b−a
48 Espaces normés

5. Si f : R → R est limite uniforme sur R d’une suite (Pn )n∈N de fonctions


polynomiales, cette suite vérifie alors le critère de Cauchy uniforme, c’est-à-dire
que pour ε > 0 donné, il existe un entier naturel n0 tel que :
∀n > m ≥ n0 , ∀x ∈ R, |Pn (x) − Pm (x)| < ε
En particulier, on a |Pn (x) − Pn0 (x)| < ε, c’est-à-dire que pour tout entier n ≥
n0 la fonction polynomiale Pn − Pn0 est bornée sur R, elle est donc constante.
Il existe donc une suite de réels (cn )n≥n0 telle que Pn = Pn0 + cn pour tout
n ≥ n0 . La suite (Pn (0))n∈N étant convergente vers f (0) , on déduit que la
suite (cn )n≥n0 converge vers f (0) − Pn0 (0) et pour tout réel x, on a :
f (x) = lim Pn (x) = Pn0 (x) + lim cn = Pn0 (x) + f (0) − Pn0 (0)
n→+∞ n→+∞
n≥n0 n≥n0

La fonction f est donc polynomiale.


6.
(a) S’il existe une suite (Pn )n∈N∗ de polynômes dans Z [X] qui converge vers f
(même simplement), on a alors f (0) = lim Pn (0) , où (Pn (0))n∈N∗ est
n→+∞
une suite d’entiers relatifs. Comme Z est fermé dans R, on a nécessairement
f (0) ∈ Z. De manière analogue, on voit que f (1) ∈ Z. Réciproquement,
soit f ∈ E telle que f (0) et f (1) soient entiers. En notant [·] la fonction
partie entière, on associe à la fonction f la suite (Pn (f ))n∈N∗ de fonctions
polynomiales à coefficients dans Z définie par :
n     
 k n
∀n ∈ N∗ , ∀x ∈ [0, 1] , Pn (f ) (x) =
n−k
f xk (1 − x)
n k
k=0

Comme f (0) et f (1) sont entiers, on a, pour tout x ∈ [0, 1] :



n−1
n−k
0 ≤ Bn (f ) (x) − Pn (f ) (x) ≤ xk (1 − x)
k=1
  ( n−j
k−1
n
et avec =n ≥ n pour tout k compris entre 1 et n − 1,
k j=1
k−j+1
on déduit que :
n  
1 n k n−k 1
0 ≤ Bn (f ) (x) − Pn (f ) (x) ≤ x (1 − x) =
n k n
k=0

Puis avec :
f − Pn (f )∞ ≤ f − Bn (f )∞ + Bn (f ) − Pn (f )∞
1
≤ f − Bn (f )∞ +
n
et la convergence uniforme de (Bn (f ))n∈N∗ vers f, on déduit que la suite
(Pn (f ))n∈N∗ converge uniformément vers f sur [0, 1] .
(b) Une fonction f ∈ C 0 ([δ, 1 − δ]) se prolongeant en une fonction f ∈ E nulle
en 0 et en 1, on en déduit que Z [x] est dense dans C 0 ([δ, 1 − δ]) , ·∞ .
Chapitre 3

Espaces préhilbertiens

On s’intéresse ici aux espaces vectoriels normés particuliers que sont les espaces
préhilbertiens. Cette étude nous sera utile pour celle des polynômes orthogonaux
(chapitre 15).
Pour ce chapitre, E est un espace vectoriel réel.
On rappelle qu’une forme bilinéaire sur E est une application :

ϕ: E×E → R
(x, y)  → ϕ (x, y)

telle que pour tout x ∈ E l’application y → ϕ (x, y) est linéaire et pour tout y ∈ E
l’application x → ϕ (x, y) est linéaire. On dit que ϕ est :
— symétrique si ϕ (x, y) = ϕ (y, x) pour tous x, y dans E ;
— positive si ϕ (x, x) ≥ 0 pour tout x dans E ;
— définie si pour x dans E l’égalité ϕ (x, x) = 0 équivaut à x = 0.

Définition 3.1. Un produit scalaire sur E est une forme bilinéaire symé-
trique définie positive.

On note (x, y) → x | y un tel produit scalaire.

Définition 3.2. Un espace préhilbertien est un espace vectoriel réel muni


d’un produit scalaire.

Exemples 3.1
1. Soient E de dimension n ≥ 1, (ei )1≤i≤n une base de E et ω = (ωk )1≤k≤n ∈ Rn .

n
L’application x | y = ωk xk yk est un produit scalaire si, et seulement si,
k=1
toutes les composantes de ω sont strictement positives. Pour E = Rn et ωk = 1
pour tout k compris entre 1 et n, le produit scalaire obtenu est le produit scalaire
canonique de Rn .
50 Espaces préhilbertiens
 π
2. L’application (f, g) → f (t) g (t) dt définit un produit scalaire sur l’espace
−π
vectoriel F des fonctions définies sur R à valeurs réelles, continues et pério-
diques de période 2π.
3. On se donne une fonction α définie sur un intervalle réel ouvert I = ]a, b[ ,
avec −∞ ≤ a < b ≤ +∞, continue à valeurs réelles ) strictement positives, et
 b
on note E = f ∈ C 0 (I) | f 2 (x) α (x) dx < +∞ . En utilisant l’inégalité
a
1 2
|f g| ≤ f + g 2 , on vérifie que E est un espace vectoriel et que l’application
2
b
(f, g) → f (x) g (x) α (x) dx définit un produit scalaire sur E.
a

3.1 Inégalités de Cauchy-Schwarz et Minkowski


Théorème 3.1. Inégalité de Cauchy-Schwarz

Si ϕ est une forme bilinéaire positive sur E, on a alors pour tous x, y dans
E, |ϕ (x, y)| ≤ ϕ (x, x) ϕ (y, y). Dans le cas où ϕ est définie positive,
l’égalité est réalisée si, et seulement si, x et y sont liés.

Preuve. La fonction polynomiale P définie sur R par :

P (t) = ϕ (y + tx, y + tx) = ϕ (x, x) t2 + 2ϕ (x, y) t + ϕ (y, y)

est à valeurs positives, donc dans le cas où ϕ (x, x) est non nul, son discriminant
2
est négatif ou nul, ce qui se traduit par ϕ (x, y) ≤ ϕ (x, x) ϕ (y, y) . Dans le cas
où ϕ (x, x) est nul, on a 2ϕ (x, y) t + ϕ (y, y) ≥ 0 pour tout réel t, ce qui impose
ϕ (x, y) = 0 = ϕ (x, x) ϕ (y, y).
Dans le cas où ϕ est définie positive et x non nul, on a ϕ (x, x) = 0 et l’égalité
2
ϕ (x, y) = ϕ (x, x) ϕ (y, y) nous dit que le trinôme P a une racine double t0 , donc
ϕ (y + t0 x, y + t0 x) = 0, ce qui équivaut à y + t0 x = 0. Si x = 0 ou x = 0 et y = λx
avec λ ∈ R, on a alors l’égalité pour tout y ∈ E. 
Avec l’exercice 3.3, on propose une autre démonstration de l’inégalité de Cauchy-
Schwarz pour un produit scalaire.
Sur Rn muni du produit scalaire canonique, l’inégalité de Cauchy-Schwarz prend
la forme suivante :
2  n  n 
 n  
2 2
∀ (x, y) ∈ R × R ,
n n
x k yk ≤ xk yk
k=1 k=1 k=1
 b
Sur C 0 ([a, b] , R) muni du produit scalaire (f, g) → f (t) g (t) dt, elle s’écrit :
a
 2  
b b b
2 2
∀ (f, g) ∈ E , f (t) g (t) dt ≤ f (t) dt g 2 (t) dt
a a a
Inégalités de Cauchy-Schwarz et Minkowski 51

On peut déduire de ces inégalités quelques inégalités intéressantes sur les réels
ou sur les fonctions continues (exercices 3.4 et 3.5).
Pour la suite de ce chapitre, (E, · | ·) désigne un espace préhilbertien et on
note pour tout x dans E, x = x|x.
Une conséquence importante de l’inégalité de Cauchy-Schwarz est l’inégalité
triangulaire de Minkowski.
Théorème 3.2. Inégalité de Minkowski

Pour tous x, y dans (E, · | ·) on a x + y ≤ x + y , l’égalité étant


réalisée si, et seulement si, x = 0 ou x = 0 et y = λx avec λ ≥ 0 (on dit
que x et y sont positivement liés).

Preuve. Pour x = 0, on a l’égalité pour tout y ∈ E. Pour x = 0 et y = λx


avec λ ∈ R, on a x + y = |1 + λ| x ≤ (1 + |λ|) x = x + y , l’égalité
étant réalisée pour λ ≥ 0. Pour λ < 0, l’inégalité est stricte puisque dans ce cas
|1 + λ| < 1+|λ| = 1−λ. Pour x non nul et y non lié à x, on a en utilisant l’inégalité
de Cauchy-Schwarz :
2 2 2 2 2 2
x + y = x + 2 x | y + y < x + 2 x y + y = (x + y)

ce qui équivaut à x + y < x + y . 


L’inégalité de Minkowski ajoutée aux propriétés de positivité (x > 0 pour
tout x = 0) et d’homogénéité (λx = |λ| x pour tout réel λ et tout vecteur x)
se traduit en disant que l’application x → x = x|x définit une norme sur E.
Dans le cas où E muni de cette norme est complet, on dit alors que c’est un
espace de Hilbert.
Sur Rn muni du produit scalaire canonique, l’inégalité de Minkowski prend la
forme suivante :
  
 n  n  n
    
n   xk + 
2 2
∀ (x, y) ∈ R × R ,
n
(xk + yk ) ≤ yk2
k=1 k=1 k=1

 b
Sur C 0 ([a, b] , R) muni du produit scalaire (f, g) → f (t) g (t) dt, elle s’écrit :
a
  
 b  b  b
2
∀ (f, g) ∈ E 2 , (f (t) + g (t)) dt ≤ f 2 (t) dt + g 2 (t) dt
a a a

Les deux égalités qui suivent sont utiles en pratique.


Théorème 3.3.
Pour tous x, y dans (E, · | ·) on a :
1# 2 2 2
$ 1#
2 2
$
x | y = x + y − x − y = x + y − x − y
2 4
# $
2 2 2 2
x + y + x − y = 2 x + y
52 Espaces préhilbertiens

La deuxième identité est l’égalité du parallélogramme. Elle est caractéristique


des normes déduites d’un produit scalaire. Précisément, on a le résultat suivant.
Théorème 3.4.

Étant donné un espace vectoriel normé réel (E, ·) , on note :


2 2
x + y + x − y
μ (E) = sup # $
2 2
(x,y)=(0,0) 2 x + y

Les assertions suivantes sont équivalentes :


# $
2 2 2 2
1. ∀ (x, y) ∈ E 2 , x + y + x − y = 2 x + y ;
2. la norme · dérive d’un produit scalaire sur E ;
3. μ (E) = 1 ;
2
4. pour x, y fixés dans E, x + ty est un trinôme en t.

Preuve. (1) ⇒ (2) On définit la fonction · | · sur E × E par :


2 2
x + y − x − y
x | y =
4
Il est facile de vérifier que cette application est symétrique (x | y = y | x) et
2
définie positive (x | x = x ≥ 0 avec égalité si, et seulement si, x = 0). En
utilisant l’identité du parallélogramme on va montrer que cette application est
bilinéaire. C’est donc un produit scalaire et la norme · en dérive.
Avec l’identité du parallélogramme on a, pour (x, y, z) dans E 3 :

x + z | y + x − z | y
2 2 2 2
x + z + y − x + z − y + x − z + y − x − z − y
=
4
2 2 2 2
x + y + z − x − y − z
= = 2 x | y
2
1 1
ce qui donne pour z = x, 2x | y = 2 x | y . Notant u = (x + y) , v = (x − y) ,
2 2
on a :

x + y | z = 2u | z = 2 u | z = u + v | z + u − v | z = x | z + y | z

et par récurrence, on en déduit que :

∀ (x, y) ∈ E 2 , ∀n ∈ N \ {0} , nx | y = n x | y (3.1)

Avec 0 | y = 0 et −x | y = − x | y*, on déduit


+ que (3.1) est valable pour tout
1
entier n dans Z. Puis avec x | y = n x | y pour tout entier n > 0, on déduit
n
que (3.1) est valable pour tout r ∈ Q. Enfin avec la densité de Q dans R et la
Orthogonalité 53

1# 2 2
$
continuité de l’application (x, y) → x | y = x + y − x − y , on déduit
4
que (3.1) est valable pour tout r ∈ R. Ce qui achève de prouver que l’application
· | · est bilinéaire.
(2) ⇒ (3) Si la norme dérive d’un produit scalaire, on vérifie alors facilement
qu’on a l’identité du parallélogramme et l’égalité μ (E) = 1.
(3) ⇒ (1) Si μ (E) = 1, on a alors :
# $
2 2 2 2
∀ (x, y) ∈ E 2 , x + y + x − y ≤ 2 x + y

En posant u = x + y, v = x − y, on a :
2 2 2 2
2x + 2y = u + v + u − v
# $ # $
2 2 2 2
≤ 2 u + v = 2 x + y + x − y
# $
2 2 2 2
soit 2 x + y ≤ x + y + x − y et l’égalité.
On a donc les équivalences (1) ⇔ (2) ⇔ (3) .
(2) ⇒ (4) Cette implication est évidente.
(4) ⇒ (1) Pour x, y fixés dans E on peut écrire, pour tout réel t, P (t) =
2 2
x + ty = at2 + 2bt + c. Le coefficient c est donné en faisant t = 0, soit c = x
 2
P (t) 1 
= lim  x + y
2
et le coefficient a est donné par a = lim
t→+∞ t 2 t→+∞ t  = y . On
déduit alors que :
# $
2 2 2 2
x + y + x − y = P (1) + P (−1) = 2 (a + c) = 2 x + y

c’est-à-dire l’identité du parallélogramme. 

3.2 Orthogonalité
L’inégalité de Cauchy-Schwarz nous dit que pour tous vecteurs x et y non nuls
x | y
dans E, on a −1 ≤ ≤ 1, ce qui implique qu’il existe un unique réel θ
x y
dans [0, π] tel que x | y = cos (θ) x y . Le réel θ est la mesure dans [0, π] de
l’angle géométrique que font les vecteurs x et y dans E \ {0} . Pour θ ∈ {0, π} , on
a |x | y| = x y , ce qui équivaut à dire que les vecteurs x et y sont liés. Pour
π
θ = , on a x | y = 0.
2

Définition 3.3. On dit que deux vecteurs x et y appartenant à (E, · | ·)


sont orthogonaux si x | y = 0.

Théorème 3.5. Pythagore

Les vecteurs x et y sont orthogonaux dans (E, · | ·) si, et seulement si,
2 2 2
on a x + y = x + y .
54 Espaces préhilbertiens

Preuve. C’est clair. 


2 2 2
De manière générale, on a x + y = x + 2 cos (θ) x y + y .
On vérifie facilement par récurrence sur p ≥ 2, que si x1 , · · · , xp sont deux à
 p 
  2  p
  2
deux orthogonaux, on a alors,  xk  = xk  .
 
k=1 k=1

Définition 3.4. L’orthogonal d’une partie non vide X de (E, · | ·) est
l’ensemble X ⊥ = {y ∈ E | ∀x ∈ X, x | y = 0} .


 de vérifier que X est un sous espace vectoriel de E. En écrivant
Il est facile
que X ⊥ = ϕ−1 ⊥
x {0} , où ϕx : x → x | y est continue, on voit que X est fermé
x∈X
comme intersection de fermés.

Définition 3.5. On appelle famille orthogonale dans (E, · | ·) toute fa-
mille (ei )i∈I de vecteurs de E telle que ei | ej  = 0 pour tous i = j dans
I. Si de plus ei  = 1 pour tout i ∈ I, on dit alors que cette famille est
orthonormée ou orthonormale.

Théorème 3.6.
Une famille orthogonale de vecteurs non nuls de (E, · | ·) est libre.


Preuve. Si (ei )i∈I est une telle famille et si λj ej = 0 où J est une partie finie
, j∈J
-
 2
de I, on a alors pour tout k ∈ J, 0 = λj e j | ek = λk ek  avec ek  = 0 et
j∈J
nécessairement λk = 0. 

Exemples 3.2

n
1. Sur Rn [X] muni du produit scalaire (P, Q) → P (xk ) Q (xk ) , où (xk )0≤k≤n
k=0
est une suite de réels deux à deux distincts, la base de Lagrange correspondante
est orthonormée (l’exercice 3.1).
2. Sur l’espace F des  fonctions continues et 2π-périodiques sur R muni du produit
π . /
scalaire (f, g) → f (t) g (t) dt, la famille cos(nt)

π
, sin(mt)

π
| (n, m) ∈ N × N ∗
−π
est orthonormée (l’exercice 3.2).

3.3 Orthogonalisation de Gram-Schmidt


Pour toute partie non vide A de E, on note Vect (A) le sous-espace vectoriel de
E engendré par A.
Orthogonalisation de Gram-Schmidt 55

Théorème 3.7. Orthonormalisation de Gram-Schmidt


Pour toute famille libre (xi )1≤i≤p de (E, · | ·) , il existe une unique fa-
mille orthonormée (ei )1≤i≤p telle que :

Vect {e1 , · · · , ek } = Vect {x1 , · · · , xk }
∀k ∈ {1, · · · , p} ,
xk | ek  > 0

Preuve. On procède par récurrence sur p ≥ 1. Pour p = 1, on a nécessairement


2 2 1
e1 = λ1 x1 avec λ1 ∈ R∗ et 1 = e1  = λ21 x1  , donc λ21 = 2 , ce qui donne
x1 
deux solutions pour λ1 . La condition supplémentaire x1 | e1  > 0 impose λ1 > 0
1
et on obtient ainsi l’unique solution e1 = x1 . Supposons p ≥ 2 et construite
x1 
la famille orthonormée (ei )1≤i≤p−1 vérifiant les conditions :

Vect {e1 , · · · , ek } = Vect {x1 , · · · , xk }
∀k ∈ {1, · · · , p − 1} ,
xk | ek  > 0

Si e1 , · · · , ep−1 , ep est une solution à notre problème on a alors nécessairement


ek = ek pour tout k compris entre 1 et p − 1 (unicité pour le cas p − 1). La

p−1
condition Vect {e1 , · · · , ep } = Vect {x1 , · · · , xp } entraîne ep = λj e j + λ p x p .
j=1
Avec les conditions d’orthogonalité :

∀j ∈ {1, · · · , p − 1} , ep | ej  = 0

on déduit que λj + λp xp | ej  = 0 pour tout j compris entre 1 et p − 1, donc :


⎛ ⎞

p−1
ep = λp ⎝xp − xp | ej  ej ⎠ = λp fp
j=1

Du fait que xp ∈/ Vect {x1 , · · · , xp−1 } = Vect {e1 , · · · , ep−1 } on déduit que fp = 0
1
et la condition ep  = 1 donne |λp | = . La condition supplémentaire :
fp 
, ⎛ ⎞ -
1 ⎝ 
p−1
1
0 < xp | ep  = ep − λj e j ⎠ | e p =
λp j=1
λ p

impose λp > 0. Ce qui donne en définitive une unique solution pour ep . 


La construction d’une famille orthonormée (ei )1≤i≤p peut se faire en utilisant
l’algorithme suivant :

⎪ 1

⎪ f = x1 , e 1 = f1
⎨ 1 f  1


⎪ %
k−1 1

⎩ f k = xk − xk | ej  ej , ek = fk , (k = 2, · · · , p)
j=1 fk 
56 Espaces préhilbertiens

Le calcul de fk  peut être simplifié en écrivant que :


, - , -
2

k−1 
k−1
fk  = fk | xk − xk | ej  ej = fk | xk  = xk − xk | ej  ej | xk
j=1 j=1

2

k−1
2
= xk  − xk | ej 
j=1

(fk est orthogonal à ej pour 1 ≤ j ≤ k − 1). Les xk | ej  étant déjà calculés
2
(pour obtenir fk ), il suffit donc de calculer xk  . En fait le calcul de fk | xk  est
souvent plus rapide.
 k
1
Dans la base (xi )1≤i≤p , on a ek = μj xj avec μk = > 0.
j=1
f k

Corollaire 3.1. Si F est un sous-espace vectoriel de dimension finie ou


infinie dénombrable de (E, · | ·) , il existe alors une base orthonormée pour
F.

Preuve. Récurrence en utilisant le théorème de Gram-Schmidt. 


Si E est de dimension finie et B = (ei )1≤i≤n est une base orthonormée de E,

n
tout vecteur x ∈ E s’écrit alors x = xk ek avec xk = x | ek  pour tout k compris
k=1
entre 1 et n, et on a pour tous vecteurs x, y dans E, en notant X la matrice de x
dans la base B :

n 
n
x | y = x | ek  y | ek  = xk yk = t XY
k=1 k=1

2

n
2

n
et x = x | ek  = x2k . Ces égalités sont des cas particuliers des égalités
k=1 k=1
de Parseval valables de manière plus générale dans les espaces de Hilbert (voir le
paragraphe 3.5).

3.4 Meilleure approximation dans un espace pré-


hilbertien
Théorème 3.8. Projection orthogonale

Soit F un sous espace vectoriel de dimension finie de (E, · | ·) . Pour


tout vecteur x ∈ E, il existe un unique vecteur y dans F tel que :
x − y = d (x, F ) = inf x − z
z∈F

Ce vecteur est également l’unique vecteur appartenant à F tel que x − y


soit dans F ⊥ . Son expression dans une base orthonormée (ei )1≤i≤n de F
Meilleure approximation dans un espace préhilbertien 57


n
est donnée par y = x | ek  ek et on a :
k=1

2 2 2 2

n
2
x − y = x − y = x − x | ek  (3.2)
k=1

Preuve. Soit (ei )1≤i≤n une base orthonormée de F (le théorème de Gram–
Schmidt nous assure l’existence d’une telle base). Pour x dans E, on définit le
n
vecteur y ∈ F par y = x | ek  ek et on a x − y | ej  = 0 pour tout j compris
k=1
entre 1 et n, c’est-à-dire que x − y ∈ F ⊥ . Le théorème de Pythagore donne alors,
pour tout z ∈ F :
2 2 2 2 2
x − z = (x − y) + (y − z) = x − y + y − z ≥ x − y

et on a bien x − y = d (x, F ) .
S’il existe un autre vecteur u ∈ F tel que x − u = d (x, F ) = δ, de :
2 2 2 2
δ 2 = x − u = x − y + y − u = δ 2 + y − u

on déduit alors que y − u = 0 et y = u.


On sait déjà que le vecteur y ∈ F est tel que x − y ∈ F ⊥ . Supposons qu’il existe
un autre vecteur u ∈ F tel que x − u ∈ F ⊥ , pour tout z ∈ F, on a alors :
2 2 2 2 2
x − z = (x − u) + (u − z) = x − u + u − z ≥ x − u

donc x − u = d (x, F ) et u = y d’après ce qui précède. La dernière égalité se


2 2 2 2
déduit de x = (x − y) + y = x − y + y . 
Il est parfois commode d’exprimer le résultat précédent sous la forme :
 2
 
n  
n
  2 2
∀x ∈ E, inf  x − y k k
e = x − x | ek 
(y1 ,··· ,yn )∈Rn  
k=1 k=1

où (ei )1≤i≤n est un système orthonormé.


Si x est un vecteur de E, le vecteur y de F qui lui est associé dans le théorème
précédent est la meilleure approximation de x dans F. En considérant la caracté-
risation géométrique x − y ∈ F ⊥ , on dit aussi que y est la projection orthogonale
de x sur F. On note y = pF (x) et on dit que l’application pF est la projection
orthogonale de E sur F. On a donc :

(y = pF (x)) ⇔ y ∈ F et x − y ∈ F ⊥ ⇔ (y ∈ F et x − y = d (x, F ))

et dans une base orthonormée de F, une expression de pF est :



n
∀x ∈ E, pF (x) = x | ek  ek
k=1
58 Espaces préhilbertiens

L’égalité pF (x) = x équivaut à dire que x ∈ F et pF (x) = 0 équivaut à dire


que x ∈ F ⊥ .
Dans le cas où E est de dimension finie et F = E, pF est l’application identité.
De l’inégalité (3.2) , on déduit que pour tout vecteur x ∈ E, on a :

2

n
2 2
pF (x) = x | ek  ≤ x
k=1

Cette inégalité est l’inégalité de Bessel.


Pour F = {0} , on peut définir pF et c’est l’application nulle. On suppose donc,
a priori, F non réduit à {0} .

Exemples 3.3
 
1
1. Si D = Ra est une droite vectorielle, une base orthonormée de D est a
a
x | a
et pour tout x ∈ E, on a pD (x) = 2 a.
a
2. Sur l’espace vectoriel F des fonctions
 continues et 2π-périodiques muni du pro-
π
duit scalaire (f, g) → f | g = f (x) g (x) dx, la meilleure approximation,
−π
pour la norme déduite de ce produit scalaire, d’une fonction f ∈ F par un
polynôme trigonométrique de degré inférieur ou égal à n est donnée par :
* + n * + n * +
c0 c0 ck ck sk s
Sn (f ) = f|√ √ + f|√ √ + f|√ √k
2π 2π k=1 π π π π
k=1

1 1
n n
1
= f | c0  c0 + f | ck  ck + f | sk  sk
2π π π
k=1 k=1

où ck : x → cos (kx) pour k ≥ 0 et sk : x → sin (kx) pour k ≥ 1. Soit :

a0 (f )  
n n
Sn (f ) (x) = + ak (f ) cos (kx) + bk (f ) sin (kx)
2
k=1 k=1

où les ak (f ) et bk (f ) sont les coefficients de Fourier trigonométriques de f


définis par :
 
1 π 1 π
ak (f ) = f (t) cos (kt) dt et bk (f ) = f (t) sin (kt) dt
π −π π −π

L’opérateur de projection
 orthogonale de F sur Pn est l’opérateur de Fourier
et la série a0 (f ) + (an (f ) cos (nx) + bn (f ) sin (nx)) est la série de Fourier
de f.

Du théorème de projection orthogonale, on déduit le résultat suivant qui jus-


tifie l’existence du supplémentaire orthogonal d’un sous-espace vectoriel de E de
dimension finie.
Meilleure approximation dans un espace préhilbertien 59

Corollaire 3.2. Pour tout sous espace vectoriel F de dimension finie de


(E, · | ·) , on a E = F ⊕ F ⊥ .

2
Preuve. Pour tout x ∈ F ∩ F ⊥ , on a x = x | x = 0 et x = 0. Donc
F ∩ F ⊥ = {0} .
Soit x ∈ E et y ∈ F sa projection orthogonale dans F. On a x − y ∈ F ⊥ et
x = y + (x − y) ∈ F + F ⊥ . D’où l’égalité E = F ⊕ F ⊥ . 
E est de dimension finie, on a dim F ⊥ = dim (E) − dim (F ) ,
Dans le# cas où $
⊥ ⊥
donc dim F⊥ = dim (F ) et avec l’inclusion F ⊂ F ⊥ , on déduit qu’on a
⊥ ⊥
l’égalité F = F.
Pour F de dimension infinie, on a toujours F ∩ F ⊥ = {0} mais pas nécessaire-
ment E = F ⊕ F ⊥ (exercice 3.9).
Théorème 3.9.
Si F est un sous espace vectoriel de dimension finie de (E, · | ·) , la
projection orthogonale pF de E sur F est alors linéaire et continue avec
pF  = 1.

Preuve. Si (ei )1≤i≤n est une base orthonormée de F, on a alors :


n
∀x ∈ E, pF (x) = x | ek  ek
k=1

La linéarité de pF se déduit alors facilement de cette expression. D’autre part,


avec :
2 2 2 2
∀x ∈ E, pF (x) = x − x − pF (x) ≤ x
et pF (x) = x pour tout x ∈ F, on déduit que pF est continue avec pF  = 1. 
Pour tout x ∈ E la fonction J définie sur E par :
2
∀z ∈ E, J (z) = z − x

est différentiable sur E. En effet, pour z, h dans E, on a :


2
J (z + h) − J (z) = 2 z − x | h + h = J  (z) (h) + o (h)

La meilleure approximation de x dans F est donc définie par :

y ∈ F et ∀h ∈ F, J  (y) (h) = 0

Ce résultat est en fait un cas particulier du résultat suivant.


Théorème 3.10.
Soient (E, ·) un espace vectoriel normé, F un sous-espace vectoriel de
E, J une fonction convexe de E dans R différentiable en un point y ∈ F.
60 Espaces préhilbertiens

Le vecteur y est solution du problème de minimisation :

y ∈ F, J (y) = inf J (z) (3.3)


z∈F

si, et seulement si :

y ∈ F, ∀h ∈ F, J  (y) (h) = 0 (3.4)

où J  (y) désigne la différentielle de J en y.

Preuve. Supposons y solution de (3.3) . Pour tout h ∈ F la fonction ϕ définie sur


R par ϕ (t) = J (y + th) est dérivable en 0 avec ϕ (0) = J  (y) (h) et atteint son
minimum en t = 0, on a donc ϕ (0) = 0, soit J  (y) (h) . On peut remarquer qu’à
ce stade de la démonstration la convexité de J n’intervient pas. Réciproquement
supposons (3.4) vérifié. Pour z ∈ F et tout réel t ∈ ]0, 1] , avec la convexité de la
fonction J, on a J (y + t (z − y)) ≤ J (y) + t (J (z) − J (y)) , soit :
J (y + t (z − y)) − J (y)
∀t ∈ ]0, 1] , ≤ J (z) − J (y)
t
J (y + t (z − y)) − J (y)
et 0 = J  (y) (z − y) = lim ≤ J (z) − J (y) , c’est-à-dire
t→0 t
que J (y) ≤ J (z) pour tout z ∈ F et y est solution de (3.3) . 

3.5 Inégalité de Bessel et égalité de Parseval


On suppose que E est de dimension infinie et on désigne par B = (en )n∈N une
famille orthonormée dans (E, · | ·) (le théorème de Gram-Schmidt nous permet
de construire une telle famille).

Définition 3.6. Pour tout x ∈ E la suite (x | en )n∈N est appelée suite
des coefficients de Fourier de x relativement à B et la série de terme général
x | en  en série de Fourier de x relativement à B.


n
Pour tout x ∈ E et pour tout n ∈ N, on note Sn (x) = x | ek  ek la nème
k=0
somme partielle de la série de Fourier de x relativement à B.
Ces définitions sont données par analogie aux coefficients et séries de Fourier
trigonométriques d’une fonction continue et 2π-périodique sur R (exemples 3.3).
Théorème 3.11. Inégalité de Bessel
2
Pour tout x ∈ E, la série de terme général x | en  est convergente et :
+∞
 2 2
x | en  ≤ x
n=0
Inégalité de Bessel et égalité de Parseval 61

Preuve. Pour tout entier naturel n, Sn (x) est la projection orthogonale de x sur

n
2 2 2 2
Fn = Vect {ek | 0 ≤ k ≤ n} , donc x | ek  = x − x − sn (x) ≤ x , ce
k=0  2
qui entraîne la convergence de la série à termes positifs x | en  avec l’inégalité
n∈N
+∞
 2 2
x | en  ≤ x . 
n=0
En utilisant le fait que le terme général d’une série convergente tend vers 0, on
déduit le résultat suivant.
Théorème 3.12. Riemann-Lebesgue

Pour tout x ∈ E on a lim x | en  = 0.


n→+∞

Exemple 3.1 Dans le cas des séries de Fourier trigonométriques, l’inégalité de


Bessel s’écrit sous la forme :
2 +∞ #
 $ 
a0 (f ) 2 2 1 π 2
+ an (f ) + bn (f ) ≤ f (t) dt
2 n=1
π −π

où les coefficients an (f ) et bn (f ) sont les coefficients de Fourier de la fonction f


et le théorème de Riemann-Lebesgue dit que lim an (f ) = lim bn (f ) = 0.
n→+∞ n→+∞

Définition 3.7. On dit qu’une famille orthonormée B = (en )n∈N est totale
dans E si le sous espace vectoriel de E engendré par B est dense dans
(E, ·) .

Dire que la famille orthonormée B est totale dans E équivaut à dire que pour
tout x dans E et pour tout réel ε > 0 il existeun entier n ∈ N et un (n + 1)-uplet
 
n 
 
(c0 , c1 , · · · , cn ) ∈ Rn+1 tels que x − ck ek  < ε, ce qui équivaut encore à dire
 
k=0
que tout x ∈ E est limite d’une suite d’éléments de Vect (B) .
Théorème 3.13.
Avec les notations qui précédent, les propriétés suivantes sont équiva-
lentes :
1. la famille orthonormée B = (en )n∈N est totale ;
+∞

2. pour tout x ∈ E, on a x = x | en  en (série convergente dans
n=0
(E, ·)) ;

3. pour tous x, y dans E, on a x | en  y | en  = x | y (égalité de
n∈N
Parseval) ;
62 Espaces préhilbertiens

 2 2
4. pour tout x ∈ E, on a x | en  = x (égalité de Parseval).
n∈N

Preuve. Pour tout entier naturel n, on note Fn = Vect {ek | 0 ≤ k ≤ n} .


(1) ⇒ (2) On suppose que la famille B est totale. Pour x ∈ E et tout réel

n0
ε > 0, il existe alors un entier naturel n0 et un vecteur y = ck ek ∈ Fn0 tel
k=0

n
que x − y < ε. Pour tout entier n ≥ n0 , le vecteur Sn (x) = x | ek  ek
k=0
est la projection orthogonale de x sur Fn et en tenant compte de ⊂ Fn , on F n0
déduit que x − Sn (x) = d (x, Fn ) ≤ x − y < ε. On a donc ainsi prouvé que
+∞

lim x − Sn (x) = 0, soit que x = x | en  en dans (E, ·) .
n→+∞
n=0
+∞

(2) ⇒ (3) On suppose que, pour tout x ∈ E, on a x = x | en  en dans
n=0

n
(E, ·) . En utilisant le fait que pour tout x ∈ E on a x − x | ek  ek ∈ Fn⊥ , on
k=0
déduit que pour tout y ∈ E on a :
, -
n 
n 
n
x− x | ek  ek | y − y | ek  ek = x | y − x | ek  y | ek 
k=0 k=0 k=0

et avec l’inégalité de Cauchy-Schwarz on a :


  
n  
n  
n 
  
x | y − x | ek  y | ek  ≤ x − x | ek  ek  y − y | ek  ek 
  
k=0 k=0 k=0


n +∞

donc lim x | y − x | ek  y | ek  = 0, soit x | y = x | en  y | en  .
n→+∞
k=0 n=0
(3) ⇒ (4) Il suffit de faire y = x dans ce qui précède.
+∞

2 2
(4) ⇒ (1) Si x = x | en  , pour tout x ∈ E, en écrivant que :
n=0

 2
 
n  
n
  2 2
0 ≤ x − x | ek  ek  = x − x | ek 
 
k=0 k=0
 

n
on déduit que x = lim x | ek  ek et la densité de Vect (B) dans E. 
n→+∞
k=0

Exemple 3.2 Dans le cas des séries de Fourier trigonométriques, la densité de


l’espace vectoriel P des polynômes trigonométriques dans (F, ·∞ ) entraîne la
Inégalité de Bessel et égalité de Parseval 63

densité de P dans (F, ·) , c’est-à-dire que la famille orthonormée :


 
1 1 1 ∗ ∗
B = √ , √ cos (nt) , √ sin (mt) | (n, m) ∈ N × N
2π π π

est totale et on a l’égalité de Parseval :


2 # +∞ $  π
a0 (f ) 2 2 1
+ an (f ) + bn (f ) = f 2 (t) dt
2 n=1
π −π

+∞
a0 (f ) 
L’égalité f = + (an (f ) cn + bn (f ) sn ) (cn = cos (nx) , sn = sin (nx))
2 n=1
dans (F, ·) s’exprime en disant que la série de Fourier de la fonction f ∈ F
converge en moyenne quadratique.

Définition 3.8. On dit qu’une famille orthonormée B est maximale dans


(E, · | ·) s’il n’est pas possible de trouver un vecteur unitaire e ∈ E tel que
B ∪ {e} soit encore une famille orthonormée dans E.

Théorème 3.14.
Si B = (en )n∈N est une famille orthonormée maximale dans E, pour tout
x ∈ E la condition x | en  = 0 pour tout n ∈ N équivaut alors à x = 0.

Preuve.
  x = 0 dans E est tel que x | en  = 0 pour tout n ∈ N, le système
Si
1
B∪ x est alors orthonormé, ce qui contredit le caractère maximal de B. On
x
a donc nécessairement x = 0. 
Ce théorème peut s’exprimer en disant que si B est une famille orthonormée
maximale dans E, tout x ∈ E est alors uniquement déterminé par ses coefficients
de Fourier relativement à B.
Théorème 3.15.
Une famille orthonormée totale dans E est maximale.

Preuve. On suppose que la famille orthonormée B est totale et qu’il existe un


vecteur e ∈ E tel que la famille B ∪ {e} soit encore orthonormée. Cette famille est
également totale et avec l’identité de Parseval, on a :
+∞
 +∞

2 2 2 2
e = e | en  + e = e | en 
n=0 n=0

et nécessairement e = 0 ce qui est contradictoire avec e = 1. On déduit donc


que la famille orthonormée B est maximale. 
64 Espaces préhilbertiens

Théorème 3.16.
Si l’espace préhilbertien (E, · | ·) est de dimension infinie et complet,
alors une famille orthonormée est totale si, et seulement si, elle est maxi-
male.

Preuve. On sait déjà qu’une famille orthonormée totale est maximale. Supposons
que la famille orthonormée B soit maximale. Pour x ∈ E on note toujours Sn (x)
sa n-ème somme partielle de Fourier. Pour m > n on a :


m +∞

2 2 2
Sn (x) − Sm (x) = x | ek  ≤ x | ek 
k=n+1 k=n+1

et ce reste tend vers 0 quand n tend vers l’infini (inégalité de Bessel). La suite
(Sn (x))n∈N est donc de Cauchy dans E et elle converge si E est complet. On note
y sa limite. Pour m > n on a y − sm (x) | en  = y | en −x | en  et avec l’inégalité
de Cauchy-Schwarz, on a |y | en  − x | en | ≤ y − sm (x) en  = y − sm (x) ,
puis en faisant tendre m vers l’infini on déduit que y | en  = x | en  . Les vecteurs
x et y ont donc mêmes coefficients de Fourier relativement à B, ils sont donc égaux
puisque B est maximale. 

3.6 Déterminants de Gram


Si F est un sous-espace vectoriel de (E, · | ·) de dimension n ≥ 1 et (xi )1≤i≤n
une base de F (non nécessairement orthonormée), la projection orthogonale d’un
 n
vecteur x de E sur F est le vecteur y = yj xj , où les composantes yj , pour j
j=1
compris entre 1 et n, sont solutions du système linéaire :

x − y | xi  = 0 (1 ≤ i ≤ n)

soit :

n
xi | xj  yj = x | xei  (1 ≤ i ≤ n)
j=1

Ce système linéaire est appelé système d’équations normales et sa matrice est


une matrice de Gram. De manière plus générale, on donne la définition suivante.

Définition 3.9. Soit n un entier naturel non nul. La matrice de Gram


d’une famille (xi )1≤i≤n de vecteurs de (E, · | ·) , est la matrice :
⎛ ⎞
x1 | x1  x1 | x2  ··· x1 | xn 
⎜ x2 | x1  x2 | x2  ··· x2 | xn  ⎟
⎜ ⎟
G (x1 , · · · , xn ) = ⎜ .. .. .. .. ⎟
⎝ . . . . ⎠
xn | x1  xn | x2  · · · xn | xn 
Déterminants de Gram 65

et le déterminant de cette matrice, noté g (x1 , · · · , xn ) , est le déterminant


de Gram de cette famille.

Théorème 3.17.
Si n est un entier naturel non nul, alors pour toute famille (xi )1≤i≤n de
vecteurs de (E, · | ·) , on a rg (G (x1 , · · · , xn )) = rg (x1 , · · · , xn ) .

Preuve. Si tous les vecteurs xi sont nuls, la matrice de Gram correspondante


est alors la matrice nulle et le résultat est évident. On suppose donc que les xi ne
sont pas tous nuls et on désigne par F le sous-espace vectoriel de E engendré par
{x1 , · · · , xn } . Le procédé de Gram-Schmidt nous permet de construire une base
orthonormée (ei )1≤i≤p de F, avec 1 ≤ p ≤ n, et dans cette base on écrit :


p
xi = aki ek (1 ≤ i ≤ n)
k=1

Pour i, j compris entre 1 et n, on a alors :


⎛ ⎞
a1j

p
⎜ ⎟
xi | xj  = aki akj = (a1i , · · · , api ) ⎝ ... ⎠
k=1 apj

soit G (x1 , · · · , xn ) = t AA, en notant :


⎛ ⎞
a11 a12 ··· a1n
⎜ a21 a22 ··· a2n ⎟
⎜ ⎟
A=⎜ . .. .. .. ⎟ ∈ Mp,n (R)
⎝ .. . . . ⎠
ap1 ap2 ··· apn

En munissant Rn et Rp de leurs structures euclidiennes canoniques, on a pour


2
tout X ∈ Rn ,  t AAX | XRn = AX | AXRp = AXRp et on en déduit que
t t
ker ( AA) = ker (A) , puis avec le théorème du rang que AA et A ont même rang.
On a donc rg (G (x1 , · · · , xn )) = rg (A) = rg (x1 , · · · , xn ) puisque A est la matrice
du système de vecteurs (xi )1≤i≤n dans la base (ei )1≤i≤p . 

Corollaire 3.3. Si n est un entier naturel non nul, on a alors


g (x1 , · · · , xn ) ≥ 0 pour toute famille (xi )1≤i≤n de vecteurs de (E, · | ·)
et une telle famille est libre si, et seulement si, g (x1 , · · · , xn ) > 0.

Preuve. On reprend les notations de la démonstration du théorème précédent.


Si le système (xi )1≤i≤n est lié, on a alors rg (G (x1 , · · · , xn )) = rg (A) < n et la
matrice G (x1 , · · · , xn ) est non inversible dans Mn (R) , son déterminant est donc
nul. Si le système (xi )1≤i≤n est libre, on a alors rg (G (x1 , · · · , xn )) = rg (A) = n
et la matrice G (x1 , · · · , xn ) est inversible dans Mn (R) , son déterminant est donc
non nul. En considérant que la matrice G (x1 , · · · , xn ) = t AA est symétrique
66 Espaces préhilbertiens

2
positive ( t AAX | XRn = AXRn ≥ 0 pour tout X ∈ Rn ), on déduit que ce
déterminant est strictement positif. 
Dans le cas de deux vecteurs x, y non nuls dans E, on a :
 
x | x x | y 2 2 2
g (x, y) = = x y − x | y
x | y y | y
et la condition g (x, y) ≥ 0 avec égalité si, et seulement si, les vecteurs x et y sont
liés est tout simplement le théorème de Cauchy-Schwarz.
Si x et y sont non nul, en notant θ la mesure dans [0, π] de l’angle que font
2 2 2 2
ces vecteurs, on a g (x, y) = x y 1 − cos2 (θ) = x y sin2 (θ) et il en
2 2
résulte que g (x, y) ≤ x y , l’égalité étant réalisée si, et seulement si, ces deux
vecteurs sont orthogonaux.
Le théorème qui suit généralise cette remarque en donnant une interprétation
géométrique du déterminant de Gram.
Si x, y sont deux vecteurs non nuls dans E, on note (x, y) la mesure dans [0, π]
de l’angle que font ces vecteurs.
Théorème 3.18.
Soient n un entier naturel supérieur ou égal à 2, (xi )1≤i≤n une famille
libre de vecteurs dans (E, · | ·) , F = Vect {x1 , · · · , xn } et (ei )1≤i≤n la
base orthonormée de F déduite par le procédé de Gram-Schmidt avec la
condition xk | ek  > 0 pour tout k compris entre 1 et n. On a alors :

(
n (
n
2
g (x1 , · · · , xn ) = cos2 (xk , ek ) xk 
k=2 k=1
(
n (
n
2
= sin2 (x1 , x2 ) cos2 (xk , ek ) xk  si n ≥ 3
k=3 k=1

1
Preuve. On a vu (démonstration du théorème 3.7) que ek = yk pour tout k
yk 

k−1
compris entre 1 et n, où y1 = x1 et yk = xk − xk | ej  ej pour k compris entre
j=1
2 et n. La matrice de passage de (ei )1≤i≤n à (xi )1≤i≤n est alors donnée par :
⎛ ⎞
y1  0 ··· 0
⎜ .. .. ⎟
⎜ a21 y2  . . ⎟
A=⎜ ⎜ .


⎝ .. .. ..
. . 0 ⎠
an1 · · · an,n−1 yn 

2 2
n
2

k−1
et g (x1 , · · · , xn ) = det (A) = yk  . De xk = yk  ek + xk | ej  ej , pour
k=1 j=1
k compris entre 2 et n, et de l’orthogonalité des ej , on déduit que :
yk  = xk | ek  = xk  cos (xk , ek )
Déterminants de Gram 67

ce qui donne en tenant compte de y1  = x1  :


(
n (
n
2
g (x1 , · · · , xn ) = cos2 (xk , ek ) xk 
k=2 k=1

Pour n ≥ 3, en écrivant que :


2 2 2 2
y2  = x2 − x2 | e1  e1  = x2  − x2 | e1 

avec x2 | e1  = x2  cos (x2 , e1 ) = x2  cos (x2 , x1 ) , on obtient :


2 2 2
y2  = x2  1 − cos2 (x2 , x1 ) = x2  sin2 (x1 , x2 )

(
n (
n
2
2 2
et g (x1 , · · · , xn ) = sin (x1 , x2 ) cos (xk , ek ) xk  . 
k=3 k=1

Corollaire 3.4. Inégalité de Hadamard. Si n est un entier naturel


supérieur ou égal à 2, pour toute famille (xi )1≤i≤n de vecteurs non nuls de
(E, · | ·) , on a :
(
n
2
0 ≤ g (x1 , · · · , xn ) ≤ xk 
k=1

La borne inférieure est atteinte si, et seulement si, la famille (xi )1≤i≤n est
liée et la borne supérieure est atteinte si, et seulement si, la famille (xi )1≤i≤n
est orthogonale.

Preuve. Si la famille (xi )1≤i≤n est liée, on a alors g (x1 , · · · , xn ) = 0. On suppose


donc cette famille libre et dans ce cas, on a g (x1 , · · · , xn ) > 0 et le théorème
(
n
2
précédent nous dit que g (x1 , · · · , xn ) ≤ xk  , l’égalité étant réalisée si, et
k=1
seulement si, on a cos2 (xk , ek ) = 1 pour tout k compris entre 2 et n, ce qui
2 2 2

k−1
2
compte tenu de yk  = cos2 (xk , ek ) xk  = xk  − xk | ej  équivaut à
j=1
xk | ej  = 0 pour tout j compris entre 1 et k − 1, soit à xk = yk = yk  ek pour
tout k compris entre 1 et n et le système (xi )1≤i≤n est orthogonal. 
Les déterminants de Gram nous permettent de donner une expression du degré
d’approximation d’un élément x de E par des éléments d’un sous-espace vectoriel
F de dimension finie ainsi qu’une expression de la projection orthogonale de x sur
F. Précisément, on a le résultat suivant.
Théorème 3.19.
Soient F un sous-espace vectoriel de dimension finie de (E, · | ·)
et (xi )1≤i≤n une base de F. Pour tout x ∈ E, on a d (x, F ) =

g (x1 , · · · , xn , x)
et la meilleure approximation de x par des éléments
g (x1 , · · · , xn )
68 Espaces préhilbertiens

n
gj,x (x1 , · · · , xn )
de F est le vecteur y = xj , où gj,x (x1 , · · · , xn ) est le
j=1
g (x1 , · · · , xn )
la matrice de⎞Gram G (x1 , · · · , xn ) en
déterminant de la matrice déduite de ⎛
x1 | x
⎜ .. ⎟
remplaçant sa colonne numéro j par ⎝ . ⎠.
xn | x

Preuve. En notant y la projection orthogonale de x sur F, on a :


2 2 2 2
d (x, F ) = x − y = x − y

et pour tout i compris entre 1 et n, xi | x = xi | x − y + xi | y = xi | y du


fait que x − y ∈ F ⊥ et xi ∈ F. En utilisant la linéarité du déterminant par rapport
à la dernière colonne, on en déduit que :
⎛ ⎞
x1 | x1  · · · x1 | xn  x1 | y
⎜ .. .. .. ⎟
⎜ . . ··· . ⎟
g (x1 , · · · , xn , x) = ⎜ ⎟
⎝ xn | x1  · · · xn | xn  xn | y ⎠
2 2
x | x1  · · · x | xn  d (x, F ) + y
2
= d (x, F ) g (x1 , · · · , xn ) + g (x1 , · · · , xn , y)
2
= d (x, F ) g (x1 , · · · , xn )

(le système{x1 , · · · , xn , y} est lié, puisque y ∈ F, donc g (x1 , · · · , xn , y) = 0), soit


g (x1 , · · · , xn , x)
d (x, F ) = . D’autre part, la projection orthogonale y de x sur
g (x1 , · · · , xn )
%n
F s’écrit y = aj xj , les coefficients aj étant solutions du système d’équations
j=1
normales : ⎛ ⎞ ⎛ ⎞
a1 x1 | x
⎜ ⎟ ⎜ ⎟
G (x1 , · · · , xn ) ⎝ ... ⎠ = ⎝ ..
. ⎠
an xn | x
et en utilisant les formules de Cramer, on obtient, pour j compris entre 1 et n,
gj,x (x1 , · · · , xn )
aj = . 
g (x1 , · · · , xn )
(
n
2
Si la base (xi )1≤i≤n est orthonormée, on a alors g (x1 , · · · , xn ) = xk  = 1,
k=1
donc d (x, F ) = g (x1 , · · · , xn , x) et aj = xj | x pour tout j compris entre 1 et
n.
 1
0
Exemple 3.3 On se place sur C ([0, 1]) avec f | g = f (x) g (x) dx. Pour
 0
g 1, X, · · · , X n−1 , X n
tout entier naturel non nul n, on a d (X n , Rn−1 [X]) =
g (1, X, · · · , X n−1 )
Les théorèmes de Müntz 69

avec :
1 1
1 2 ··· n 2 2
1 1 1 (j − i)
2 3 ··· n+1 0≤i<j≤n−1
g 1, x, · · · , xn−1 = .. .. .. .. = 2
. . . . (i + j + 1)
1 1 1 0≤i,j≤n−1
n n+1 ··· 2n−1

(voir le lemme 3.1), ce qui peut aussi s’écrire :


 3
2
n−1
j!
j=0
g 1, X, · · · , X n−1
=
2
n−1
(n + j)!
j=0

2
(n!)
On en déduit alors que d (X n , Rn−1 [X]) = √ , ce qui signifie que pour
(2n)! 2n + 1
tout P ∈ Rn−1 [X] , on a :
 1 4
2 2 (n!)
X n − P  = (xn − P (x)) dx ≥ 2
0 ((2n)!) (2n + 1)

l’égalité étant réalisée pour la projection orthogonale de X n sur Rn−1 [X] .

3.7 Les théorèmes de Müntz


Pour ce paragraphe, on se place sur E = C 0 ([0, 1]) muni du produit scalaire :
 1
(f, g) → f | g = f (x) g (x) dx
0

On note ·∞ la norme de la convergence uniforme sur l’intervalle [0, 1] .


Pour tout entier naturel non nul n, on note en la fonction x → xn .
Le théorème de Weierstrass nous dit que R [X] = Vect {en | n ∈ N} est dense
dans (E, ·∞ ) (exercice 2.8) et avec f  ≤ f ∞ pour toute fonction f ∈ E,
on déduit que R [X] est également dense dans (E, ·) . Les théorèmes de Müntz
permettent de caractériser les suites strictement
 croissantes de réels positifs pour
lesquelles l’espace vectoriel Vect xλn | n ∈ N est dense dans E, muni respective-
ment des normes · et ·∞ .
Comme conséquence du théorème de Weierstrass on a le premier résultat de
densité suivant.
70 Espaces préhilbertiens

Théorème 3.20.
Soit {θn | n ∈ N} un système libre dans (E, · | ·) . L’espace vectoriel
F = Vect {θn | n ∈ N} est dense dans (E, ·) si, et seulement si, pour
g (θ0 , · · · , θn , ep )
tout entier naturel p, on a lim = 0.
n→+∞ g (θ0 , · · · , θn )

Preuve. En notant, pour tout entier naturel n, Fn = Vect {θk | 0 ≤ k ≤ n} , on


a g (θ0 , · · · , θn ) > 0 puisque le système {θk | 0 ≤ k ≤ n} est libre et pour tout
g (θ0 , · · · , θn , ep )
entier naturel p, = d (ep , Fn ) . Supposons que F soit dense dans
g (θ0 , · · · , θn )
(E, ·) et soit p un entier naturel. Pour tout réel ε > 0, on peut alors trouver un
entier n0 et une fonction P ∈ Fn0 tels que ep − P  < ε. On a alors d (ep , Fn0 ) =
inf ep − Q ≤ ep − P  < ε. De plus pour tout entier n ≥ n0 , on a Fn0 ⊂ Fn
Q∈Fn0
et donc d (ep , Fn ) ≤ d (ep , Fn0 ) , ce qui permet de déduire que :

∀n ≥ n0 , d (ep , Fn ) < ε

On a ainsi montré que pour tout entier naturel p, on a lim d (ep , Fn ) = 0. Ré-
n→+∞
ciproquement si cette condition est vérifiée, avec la bilinéarité du produit scalaire
et la linéarité du déterminant par rapport à la dernière colonne, on déduit que :

∀P ∈ R [X] , lim d (P, Fn ) = 0


n→+∞

Avec la densité de R [X] dans (E, ·) , on déduit que pour toute fonction f ∈ E
et pour tout réel ε strictement positif il existe une fonction polynomiale P telle
que f − P  < ε. En désignant par n0 un entier naturel tel que d (P, Fn0 ) < ε et
en notant P0 ∈ Fn0 la projection orthogonale de P sur Fn0 , on a :

f − P0  ≤ f − P  + P − P0  = f − P  + d (P, Fn0 ) < 2ε

et d (f, Fn0 ) ≤ f − P0  < 2ε. En écrivant que d (f, Fn0 ) = f − Q0  , où Q0 dans


Fn0 est la projection orthogonale de f sur Fn0 , on a donc f − Q0  < 2ε. Ce qui
montre bien la densité de F dans (E, ·) . 

Lemme 3.1 Si p est un entier naturel non nul, λ0 , λ1 , · · · , λp et x0 , x1 , · · · , xp


des réels tels que xj + λi = 0 pour tous i, j compris entre 1 et p, on a alors :
2
  (xj − xi ) (λj − λi )
1 0≤i<j≤p
det = 2
xj + λi 0≤i,j≤p (xj + λi )
0≤i,j≤p

(déterminant de Cauchy).

Preuve.  deux indices i = j tels que xj = xi [resp. λj = λi ], la matrice


 S’il existe
1
Ap = a alors deux colonnes [resp. deux lignes] identiques et
xj + λi 0≤i,j≤p
son déterminant est nul. L’égalité annoncée est donc vérifiée. On suppose que les
Les théorèmes de Müntz 71

xi , ainsi que les λi sont deux à deux distincts et on désigne par Fp la fonction
2
p−1
(x − xj )
j=0
rationnelle définie sur R \ {−λ0 , · · · , −λp } par Fp (x) = . Le numé-
2
p
(x + λi )
i=0
rateur de Fp est de degré p et son dénominateur de degré p + 1, on a donc une
p
αi
décomposition en éléments simples de la forme Fp (x) = , les coefficients
i=0
x + λi
αi étant donnés par :

2
p−1
(λi + xj )
j=0
αi = lim (x + λi ) Fp (x) =
x→−λi 2
p
(λi − λj )
j=0
j =i

En développant le déterminant :
1 1 1
x0 +λ0 ··· xp−1 +λ0 xp +λ0
.. .. .. ..
Dp = . . . .
1 1 1
x0 +λp−1 ... xp−1 +λp−1 xp +λp−1
Fp (x0 ) ··· Fp (xp−1 ) Fp (xp )

suivant la dernière ligne, en tenant compte de Fp (xj ) = 0 pour tout j compris


entre 0 et p − 1, on obtient Dp = Fp (xp ) det (Ap−1 ) . D’autre part, en écrivant
 p
αi
que Fp (xj ) = et en utilisant le fait que le déterminant est une forme
x + λi
i=0 j
multilinéaire alternée, on a aussi Dp = αp det (Ap ) . On a donc Fp (xp ) det (Ap−1 ) =
αp det (Ap ) et :

2
p−1
(xp − xj ) (λp − λj )
Fp (xp ) j=0
det (Ap ) = det (Ap−1 ) = p det (Ap−1 )
αp 2 2
p−1
(xp + λi ) (xj + λp )
i=0 j=0

On conclut alors par récurrence sur p ≥ 1. Pour p = 1, on a :


1 1
x0 +λ0 x1 +λ0 (x1 − x0 ) (λ1 − λ0 )
det (A1 ) = =
1 1 (x1 + λ0 ) (x1 + λ1 ) (x0 + λ0 ) (x0 + λ1 )
x0 +λ1 x1 +λ1
72 Espaces préhilbertiens

Et supposant le résultat acquis pour p − 1, on a :


2
p−1 2
(xp − xj ) (λp − λj ) (xj − xi ) (λj − λi )
j=0 0≤i<j≤p−1
det (Ap ) = 2
2
p 2
p−1 (xj + λi )
(xp + λi ) (xj + λp ) 0≤i,j≤p−1
i=0 j=0
2
(xj − xi ) (λj − λi )
0≤i<j≤p
=
2
p 2p 2
p
(xp + λi ) (xp−1 + λi ) · · · (x0 + λi )
i=0 i=0 i=0
2
(xj − xi ) (λj − λi )
0≤i<j≤p
= 2
(xj + λi )
0≤i,j≤p


Dans ce qui suit, on se donne une suite strictement croissante de réels positif :
0 ≤ λ0 < λ1 < · · · < λn < λn+1 < · · ·
et pour tout entier naturel n, on note θn la fonction définie par :
∀x ∈ [0, 1] , θn (x) = xλn
Lemme 3.2 Pour tout entier naturel non nul n, on a :
j−1 
2
n 2 2
(λj − λi )
j=0 i=0
g (θ0 , · · · , θn ) = n  n 
2 2
(λj + λi + 1)
j=0 i=0

et pour tout entier naturel p :

1 (n
λi − p
d (ep , Vect {θk | 0 ≤ k ≤ n}) = √
2p + 1 i=0 λi + p + 1

Preuve. Pour tout réel positif ou nul, on note simplement xλ la fonction x → xλ .


3 4 1
Pour tous réels positifs ou nuls λ et μ, on a xλ | xμ = et :
λ+μ+1
2 2
  (λj − λi )
1 0≤i<j≤n
g (θ0 , · · · , θn ) = det = 2
λj + λi + 1 0≤i,j≤n (λi + λj + 1)
0≤i,j≤n

ce qui peut aussi s’écrire :


j−1 
2
n 2 2
(λj − λi )
j=0 i=0
g (θ0 , · · · , θn ) =  
2
n 2
n
(λj + λi + 1)
j=0 i=0
Les théorèmes de Müntz 73

On a aussi :
j−1 
2
n 2 2 2
n
2
(λj − λi ) (λi − p)
j=0 i=0 i=0
g (θ0 , · · · , θn , ep ) =   n
2
n 2
n 2
(λj + λi + 1) (λj + p + 1) (λi + p + 1) (2p + 1)
j=0 i=0 i=0

soit :
j−1 
2
n 2 2
n
22
(λj − λi ) (λi − p)
j=0 i=0 i=0
g (θ0 , · · · , θn , ep ) = n  n  n
2 2 2 2
(λj + λi + 1) (λi + p + 1) (2p + 1)
j=0 i=0 i=0

et en notant Fn = Vect {θk | 0 ≤ k ≤ n} , on en déduit que :



g (θ0 , · · · , θn , ep ) 1 (n
λi − p
d (ep , Fn ) = =√
g (θ0 , · · · , θn ) 2p + 1 i=0 λi + p + 1

Exemple 3.4 En utilisant la suite (λn )n∈N = (n)n∈N , on retrouve :

1 ( n−i
n−1
(n!)
2
d (X n , Rn−1 [X]) = √ = √
2n + 1 i=0 n + i + 1 (2n)! 2n + 1
(exemple 3.3).
De ces calculs on déduit, avec les notations qui précèdent, le premier résultat
de densité suivant.
Théorème 3.21.
L’espace vectoriel F = Vect {θn | n ∈ N} est dense dans (E, ·2 ) si, et
seulement si :
(n
λi − p
∀p ∈ N, lim =0
n→+∞
i=0
λ i +p+1

Et de ce résultat on déduit le premier théorème de Müntz.


Théorème 3.22.
L’espace vectoriel F = Vect {θn | n ∈ N} est dense dans (E, ·) si, et
+∞
 1
seulement si, = +∞.
λ
n=1 n

1
Preuve. On a λn > λ0 ≥ 0 pour tout entier naturel non nul, donc est bien
λn
défini pour n ≥ 1. Supposons F dense dans (E, ·) , on a alors :
(
n
λi − p
∀p ∈ N, lim =0
n→+∞ λ
i=0 i
+p+1
74 Espaces préhilbertiens

Si la suite (λn )n∈N est bornée, étant croissante positive, elle converge alors vers
+∞
 1
un réel λ > 0 et la série est divergente. Si cette suite n’est pas bornée,
λ
n=1 n
étant croissante, elle diverge alors vers l’infini. Si N ⊂ {λk | k ∈ N} , on a alors
+∞
 +∞

1 1
≥ = +∞. Dans le cas contraire il existe un entier naturel p tel que
λ
n=1 n n=1
n
p = λk pour tout k ∈ N et avec lim λn = +∞ on déduit qu’il existe un entier
n→+∞
i0 tel que λi > p pour tout i > i0 . De :

(
n
λi − p (i0
λi + p + 1 (n
λi − p
lim = lim =0
n→+∞
i=i0
λ
+1 i
+ p + 1 i=0
λ i − p n→+∞ λ
i=0 i
+p+1

+∞
  
λi − p
on déduit que ln = −∞ et du fait que :
i=i0 +1
λi + p + 1
   
λi − p 2p + 1 2p + 1 2p + 1
ln = ln 1 −  −  −
λi + p + 1 λi + p + 1 i→+∞ λi + p + 1 i→+∞ λi
+∞
 +∞

1 1
cela équivaut à = ∞. Réciproquement supposons que = +∞.
λ
i=i0 +1 i
λ
n=1 n
(n
λi − p
Pour p, n dans N, on note un,p = . Si p ∈ {λk | k ∈ N} , on a alors
λ
i=0 i
+p+1
un,p = 0 à partir d’un certain rang. Si p ∈/ {λk | k ∈ N} , on distingue deux cas. Si
la suite (λn )n∈N est bornée, elle converge alors vers un réel λ > 0 et :

λi − p λ−p
lim = =μ<1
i→+∞ λi + p + 1 λ+p+1

λi − p
on peut donc trouver un entier i0 tel que ≤ μ + ε < 1 pour tout
λi + p + 1
i ≥ i0 et :
n−i0
∀n > i0 , |un,p | ≤ |ui0 ,p | (μ + ε)
ce qui entraîne lim un,p = 0. Si la suite (λn )n∈N n’est pas bornée, elle diverge
n→+∞
alors vers l’infini et λi − p est strictement positif à partir d’un rang i0 avec :
   
λi − p 2p + 1 2p + 1
ln = ln 1 −  −
λi + p + 1 λi + p + 1 i→+∞ λi
+∞
 
λi − p
ce qui entraîne ln = −∞, équivalent à lim un,p = 0. Dans
i=i0 +1
λi + p + 1 n→+∞

tous les cas, on a lim un,p = 0 pour tout p ∈ N, ce qui équivaut à la densité de
n→+∞
F dans (E, ·) . 
De ce théorème on déduit le résultat de densité suivant dans (E, ·∞ ) .
Exercices 75

Théorème 3.23. Müntz


Si avec les notations qui précèdent, on suppose que λ0 = 0 et λ1 ≥ 1,
alors l’espace vectoriel F = Vect {θn | n ∈ N} est dense dans (E, ·∞ ) si,
+∞
 1
et seulement si, = +∞.
λ
n=1 n

Preuve. Si F est dense dans (E, ·∞ ) , il est alors dense dans (E, ·2 ) et le
% 1
+∞
théorème précédent nous dit que = +∞. Réciproquement, on suppose que
n=1 λn
+∞
 +∞

1 1
= +∞. Pour tout entier n ≥ 2 on a λn − 1 > 0 et donc = +∞,
λ
n=1 n
λ n−1
 n=2
ce qui équivaut à la densité de G = Vect xλn −1 | n ≥ 1 dans (E, ·) (on note xλ
la fonction x → xλ ). Pour toute fonction polynomiale P et pour tout réel ε > 0,
n
on peut trouver une fonction ϕ = ak xλk −1 dans G telle que P  − ϕ < ε,
k=1
où P  désigne le polynôme dérivé de P. On désigne alors par θ la primitive sur
 n
a k λk
[0, 1] de la fonction ϕ telle que ϕ (0) = P (0) , soit θ = P (0) + x ∈ F
λk
k=1
(l’hypothèse λ0 = 0 nous dit que 1 ∈ F ) et pour tout réel x ∈ [0, 1] avec l’inégalité
de Cauchy-Schwarz, on a :
 x

|P (x) − θ (x)| = (P  (t) − ϕ (t)) dt ≤ P  − ϕ x ≤ P  − ϕ < ε
0

soit P − θ∞ < ε. On a donc ainsi montré que toute fonction polynomiale peut
être uniformément approchée sur [0, 1] par des éléments de F. Avec le théorème de
Weierstrass (exercice 2.8), on en déduit alors que F est dense dans (E, ·∞ ) . 

Exemple 3.5 Si (pn )n≥1 est la suite des nombres premiers positifs rangés dans
+∞
 1
l’ordre croissant, on sait que = +∞ et on en déduit que l’espace vectoriel
p
n=1 n
Vect {1, xpn | n ≥ 1} est dense dans (E, ·∞ ) .

3.8 Exercices

Exercice 3.1. Soient n un entier naturel non nul, x0 , · · · , xn des réels


deux à deux distincts et ω = (ωi )0≤i≤n ∈ Rn+1 . À quelle condition, né-

n
cessaire et suffisante sur ω, l’application ϕ : (P, Q) → ωi P (xi ) Q (xi )
i=0
définit-elle un produit scalaire sur l’espace vectoriel Rn [X] ?
76 Espaces préhilbertiens

Solution. L’application ϕ définit une forme bilinéaire symétrique sur Rn [X] pour
tout ω ∈ Rn . Si ϕ est un produit scalaire, en désignant par (Li )0≤i≤n la base de
(n
X − xk
Lagrange de Rn [X] définie par Li (X) = pour i compris entre 0 et n,
xi − xk
k=0
k=i
on a alors ωj = ϕ (Lj , Lj ) > 0 pour tout j compris entre 1 et n. Réciproquement

n
si tous les ωj sont strictement positifs, on a ϕ (P, P ) = ωi P 2 (xi ) ≥ 0 pour tout
i=1
x ∈ Rn et ϕ (P, P ) = 0 équivaut à ωi P 2 (xi ) = 0 pour tout i, ce qui équivaut à
P (xi ) = 0 pour tout i compris entre 0 et n soit à P = 0 (P est un polynôme dans
Rn [X] qui a n + 1 racines distinctes, c’est donc le polynôme nul). En conclusion, ϕ
définit un produit scalaire sur Rn [X] si, et seulement si, tous les ωi sont strictement
positifs.

Exercice 3.2. F est l’espace des fonctions réelles, continues et 2π-


π
périodiques muni du produit scalaire (f, g) → f (x) g (x) dxn et pour
−π
tout n ∈ N∗ , on note Pn le sous espace F formé de de ensemble des po-
lynômes trigonométriques de degré inférieur ou égal à n, c’est-à-dire l’en-
semble des fonctions de R dans R la forme :

n
P : x → P (x) = a0 + (ak cos (kx) + bk sin (kx))
k=1

1. Notant ck , sk les fonctionsx → cos (kx) pour k ∈ N, x → sin 


(kx) pour
c 0 c n s m
k ∈ N∗ , montrer que B = √ , √ , √ | (n, m) ∈ N∗ × N∗ est une
2π π π
famille orthonormée dans F.
2. Montrer que Pn est un espace vectoriel et préciser sa dimension.
3. Montrer que si P ∈ Pn s’annule en 2n + 1 points deux à deux distincts
dans [−π, π[ , on a alors P = 0.
4. Montrer que si x0 , · · · , x2n sont des réels deux à deux distincts dans
2n

[−π, π[ , l’application ϕ : (P, Q) → P (xi ) Q (xi ) définit alors un pro-
i=0
duit scalaire sur Pn .

Solution.
1. Pour n = m dans N, on a :
 π
cos ((n + m) t) + cos ((n − m) t)
cn | cm  = dt = 0
−π 2

pour n = m dans N∗ , on a :
 π
cos ((n − m) t) − cos ((n + m) t)
sn | sm  = dt = 0
−π 2
Exercices 77

et pour (n, m) ∈ N × N∗ , on a :
 π
sin ((n + m) t) − sin ((n − m) t)
cn | sm  = dt = 0
−π 2
 π  
 c0 
Pour n = 0, on a dt = 2π, donc  √ 
 2π  = 1 et pour n ≥ 1 :
−π
 π  π  π
1 − cos (2nt)
cos2 (nt) dt = sin2 (nt) dt = dt = π
−π −π −π 2
   
 c n   sn 

donc  √  =  √ 
  = 1. La famille B est donc orthonormée et en conséquence
π π
libre.
2. Pn est un sous-espace vectoriel de F de dimension 2n + 1 car engendré par la
famille libre Bn = {ck | 0 ≤ k ≤ n} ∪ {sk | 1 ≤ k ≤ n} .
3. Notant z = eix pour tout réel x, on a :
n 
 
zk + zk zk − zk
P (x) = a0 + ak + bk
2 2i
k=1
    
1
n
1 1
= a0 + ak z + k − ibk z − k
k k
2 z z
k=1
n  
1 1
= a0 + (ak − ibk ) z k + (ak + ibk ) k
2 z
k=1

1
n
ou encore z n P (x) = a0 z 2n + (ak − ibk ) z n+k + (ak + ibk ) z n−k = Q (z) .
2
k=1
Il en résulte que si P s’annule en 2n+1 points deux à deux distincts, x0 , · · · , x2n ,
dans [−π, π[ , le polynôme complexe Q ∈ C2n [z] s’annule alors en 2n + 1 points
distincts du cercle unité, eix0 , · · · , eix2n , ce qui revient à dire que c’est le poly-
nôme nul et P = 0.
4. On vérifie facilement que ϕ est une forme bilinéaire symétrique et positive.
L’égalité ϕ (P, P ) = 0 entraîne que P ∈ Pn s’annule en 2n + 1 points deux à
deux distincts dans [−π, π[ et en conséquence P = 0.

Exercice 3.3. Soit (E, · | ·) un espace préhilbertien. Pour u, v dans E


tels que u = v = 1, on note ε le signe de u | v (où u = u | u).
2
Montrer que u − εv = 2 (1 − |u | v|) , en déduire que |u | v| ≤ 1, puis
que |x | y| ≤ x y pour tous x, y dans E, l’égalité étant réalisée si, et
seulement si, x et y sont liés (inégalité de Cauchy-Schwarz).

Solution. Pour tous u, v dans E tels que u = v = 1, on a :


2 2 2
u − εv = u + v − 2ε u | v = 2 (1 − |u | v|) ≥ 0
78 Espaces préhilbertiens

donc |u | v| ≤ 1, l’égalité étant réalisée si, et seulement si, u = εv, ce qui revient

1 1
à dire que u et v sont liés. Pour x, y non nuls dans E et (u, v) = x, y ,
x y
cela donne |x | y| ≤ x y , l’égalité étant réalisée si, et seulement si, x et y sont
liés. Pour x ou y nul, ces vecteurs sont liés et on a l’égalité |x | y| ≤ x y = 0.

Exercice 3.4.
n
√ n (n + 1) √
∗ √
1. Montrer que pour tout n ∈ N , on a k k≤ 2n + 1.
k=1
2 3
2. On se donne un entier n ∈ N∗ et des réels x1 , · · · , xn .
 n 2
 n
(a) Montrer que xk ≤ n x2k . Dans quel cas a-t’on égalité ?
k=1 k=1
(b) En déduire une condition nécessaire et suffisante, sur les réels a

n 
et b, pour que l’application ϕ : (x, y) → a xi yi + b x i yj
i=1 1≤i=j≤n
définissent un produit scalaire sur Rn pour n ≥ 2.
3. On se donne un entier n ∈ N∗ et des réels x1 , · · · , xn strictement positifs.
 n  n 
  1
(a) Montrer que xk ≥ n2 . Dans quel cas a-t’on éga-
xk
k=1 k=1
lité ?
n
1 6n
(b) Montrer que ≥ .
k2 (n + 1) (2n + 1)
k=1

Solution.
 
   n
n
√  n 
1. L’inégalité de Cauchy-Schwarz nous donne k k ≤  k  k avec
2

k=1 k=1 k=1



n
n (n + 1) 
n
n (n + 1) (2n + 1)
k= et k2 = , ce qui donne :
2 6
k=1 k=1


n √ 2
n2 (n + 1) (2n + 1) n (n + 1) √
k k≤ = √ 2n + 1
12 2 3
k=1

2.
(a) L’inégalité de Cauchy-Schwarz nous donne :
 2   

n 
n 
n 
n
2
xk · 1 ≤ 1 x2k =n x2k
k=1 k=1 k=1 k=1

l’égalité étant réalisée si, et seulement si, tous les xk sont égaux.
Exercices 79

(b) L’application ϕ est bilinéaire et symétrique. Pour x ∈ Rn , on a :



n 
q (x) = ϕ (x, x) = a x2i + 2b xi xj
i=1 1≤i<j≤n
⎛ 2 ⎞  n 2

n 
n 
n 
n 
=a x2i + b ⎝ xi − x2i ⎠ = (a − b) x2i + b xi
i=1 i=1 i=1 i=1 i=1
 n 

Si ϕ est un produit scalaire, on a alors a−b = q (e1 − e2 ) > 0 et q ei =
i=1
n (a + (n − 1) b) > 0. Réciproquement si a − b > 0 et a + (n − 1) b > 0, on
a alors pour x ∈ Rn \ {0} ayant au moins deux composantes distinctes :
 n 2  n 2
n  1 
2
q (x) = (a − b) xi + b xi > (a + (n − 1) b) xi ≥0
i=1 i=1
n i=1

(l’inégalité de la question précédente est stricte) et q (x) > 0. Si x ∈


Rn \ {0} a toutes ses composantes égales à λ = 0, on a alors q (x) =
nλ2 (a + (n − 1) b) > 0. Donc ϕ est un produit scalaire.
3.
 
  
n
√ 1  n  n 1
(a) On a n = xk √ ≤  xk  , ce qui est encore équivalent à
xk xk
k=1 k=1 k=1
l’inégalité proposée. L’égalité est réalisée si, et seulement si, il existe un réel
√ 1
λ tel que xk = λ √ pour tout k compris entre 1 et n, ce qui équivaut
xk
à xk = λ pour tout k compris entre 1 et n, où λ est un réel strictement
positif.
Prenantxk = k 2pour tout k compris entre 1 et n, on en déduit que
(b) 
n n
1 n
n (n + 1) (2n + 1)
k2 ≥ n 2
et avec k2 = , on en déduit
k2 6
k=1 k=1 k=1
n
1 6n
que 2
≥ .
k (n + 1) (2n + 1)
k=1

Exercice 3.5. Soit f ∈ C 0 ([a, b] , R) .


 2  b
b
1. Montrer que f (t) dt ≤ (b − a) f 2 (t) dt. Dans quel cas a-t’on
a a
égalité ?
2. 
En supposant  f à valeurs  strictement positives, montrer que
 b b
1 2
dt f (t) dt ≥ (b − a) . Dans quel cas a-t’on égalité ?
a f (t) a
80 Espaces préhilbertiens

3. En supposant f de classe C 1 telle que f (a) = 0, montrer que :


 2 
b
2 (b − a) b
2
|f (t)| dt ≤ |f  (t)| dt
a 2 a

Solution.
1. L’inégalité de Cauchy-Schwarz nous donne :
 2   
b b b b
2
f (t) · 1dt ≤ f (t) dt 1dt = (b − a) f 2 (t) dt
a a a a

l’égalité étant réalisée si, et seulement si, la fonction f est constante.


2. L’inégalité de Cauchy-Schwarz nous donne :
 2  
b b b
2 1 1
(b − a) = f (t) · √ dt ≤ f (t) dt dt
a f (t) a a f (t)

√ 1
l’égalité étant réalisée si, et seulement si, il existe un réel λ tel que f = λ√ ,
f
ce qui équivaut à dire que f est constante.
3. Pour tout t ∈ ]a, b] , on a :
 t 2  t  t  b
2 2 2
|f (t)| = f  (x) dx ≤ 1dx |f  (x)| dx ≤ (t − a) |f  (t)| dt
a a a a

et en intégrant :
   2 
b
2
b
2
b
(b − a) b
2
|f (t)| dt ≤ |f  (t)| dt (t − a) dt = |f  (t)| dt
a a a 2 a

Pour f ∈ C 1 ([a, b] , R) sans hypothèse sur f (a) , la fonction g : x →  f (x) −


f (a) vérifie les hypothèses de l’exercice et avec g (a) = 0, g  = f  , on obtient
 b 2 b
2 (b − a) 2
l’inégalité |f (t) − f (a)| dt ≤ |f  (t)| dt.
a 2 a

+∞

Exercice 3.6. Soit f (z) = αn z n une fonction développable en sé-
n=0
rie entière sur D (0, R) avec 0 < R ≤ +∞. Montrer que si |f | admet un
maximum local en 0, elle est alors constante (principe du maximum).
Exercices 81

Solution. Si |f | admet un maximum local en 0, il existe alors un réel r0 ∈ ]0, R[ tel


que |f (0)| = sup |f (z)| . On a alors, en utilisant l’inégalité de Cauchy-Schwarz :
|z|≤r0
 2π  2π
1 1
|f (0)| = f r0 e dt ≤
it
f r0 eit · 1dt
2π 0 2π 0
 2π  12  2π  12  2π  12
1 it 2 1 2
≤ f r0 e dt dt =√ f r0 eit dt
2π 0 0 2π 0
 2π  12
1 2
≤√ |f (0)| dt = |f (0)|
2π 0

 2π  12
1 2
donc |α0 | = |f (0)| = √ f r0 e it
dt , soit αn = 0 pour tout n ≥ 1 et
2π 0
 +∞

2 1 2π 2 2
|α0 | = f r0 eit dt = |αn | r02n , ce qui signifie que f est constante.
2π 0 n=0

Exercice 3.7. Montrer que pour tout entier n ≥ 2 et tout n-uplet


(x1 , · · · , xn ) de vecteurs de (E, · | ·) , on a :
 # $
2 2 2
ε1 x1 + · · · + εn xn  = 2n x1  + · · · + xn 
ε∈{−1,1}n

(identité généralisée du parallélogramme).

Solution. On procède par récurrence sur n ≥ 2. Pour n = 2, c’est l’égalité


du parallélogramme classique. Supposons le résultat acquis pour n ≥ 2. Pour
n
x1 , · · · , xn , xn+1 dans E et ε ∈ {−1, 1} , on a :
 2  n 2 ⎛ 2 ⎞
 n    n 
      2
 εk xk + xn+1  +  εk xk − xn+1  = 2 ⎝ εk xk  + xn+1  ⎠
     
k=1 k=1 k=1

donc :
n+1 2 n+1 2
     
   
 εk x k  =  εk x k 
   
ε∈{−1,1}n+1 k=1 (ε,εn+1 )∈{−1,1}n ×{−1,1} k=1
⎛ 2  2 ⎞
  n   n 
= ⎝


εk xk + xn+1  + 
 
εk xk − xn+1  ⎠
n
   
ε∈{−1,1} k=1 k=1
⎛ 2 ⎞
  n 
⎝  2
=2  εk xk  + xn+1  ⎠
n
 
ε∈{−1,1} k=1
 n 2
  

 2

n+1
2
=2  εk xk  + 2 · 2n xn+1  = 2n+1 xk 
n
 
ε∈{−1,1} k=1 k=1
82 Espaces préhilbertiens

Exercice 3.8.
 2
1. Montrer que l’application (P, Q) → P | Q = (2 − t) P (t) Q (t) dt
0
définit un produit scalaire sur R [X] . Donner une base orthonormée de
R2 [X] .
 +1
P (t) Q (t)
2. Montrer que l’application (P, Q) → P | Q = √ dt définit
−1 1 − t2
un produit scalaire sur R [X] . Donner une base orthonormée de R2 [X] .

Solution.
1. La fonction t → 2 − t étant à valeurs strictement positives sur ]0, 2[ , il est facile
de vérifier que · | · est un produit scalaire sur R [X] . En utilisant l’algorithme
de Gram-Schmidt, on définit la base orthonormée (Pi )0≤i≤2 par :
⎧  2

⎪ 2 1

⎪ Q 0 = 1, Q0  = (2 − t) dt = 2, P0 = √

⎪ 2


0

⎪ 2

⎪ Q1 = X − X | P0  P0 = X −
⎨ 3
2 4 3
⎪ Q1  = Q1 | X = , P1 = X − 1

⎪ 3 4
9
3
2
4

⎪ 8 2

⎪ Q2 = X 2 − X 2 | P0 P0 − X 2 | P1 P1 = X 2 − X +

⎪ √ 5 5

⎪ 3 4
⎪ 2
⎩ Q2  = Q2 | X = 2 8 6 2
, P2 = 5X − 8X + 2
75 4
# √ $
Une base orthonormée de R2 [X] est donc √12 , 32 X − 1, 46 5X 2 − 8X + 2 .
2. Il est facile de vérifier que · | · est un produit scalaire sur R [X] . Pour tout
 1
t2n
entier naturel n, on note Tn = √ dt. La fonction à intégrer est positive
0 1 − t2
1
et équivalente au voisinage de 1 à la fonction √ √ , elle est donc intégrable
 1 2 1−t
1 π
sur [0, 1] . On a T0 = √ dt = arcsin (1) = et pour n ≥ 1, une
1 − t 2 2
0
intégration par parties donne :
 1  1
2n−1 t
Tn = t √ dt = (2n − 1) x2n−2 1 − t2 dt
0 1 − t2 0
 1 2(n−1)
t
= (2n − 1) √ 1 − t2 dx = (2n − 1) (Tn−1 − Tn )
0 1 − t2
2n − 1
On a donc la relation de récurrence Tn = Tn−1 pour tout n ≥ 1 et avec
2n
la valeurs initiale T0 , on déduit que :

2n − 1 2n − 3 31π (2n)! π
Tn = ··· = 2
2n 2 (n − 1) 422 2n
2 (n!) 2
Exercices 83
 1  1
2 1 1
On pose Q0 = 1 et on a Q0  = √ dt = 2 √ dt = π. Donc
−1 1 − t2 0 1 − t2
1 1
P0 = Q0 = √ . Puis Q1 (X) = X − λP0 où λ est tel que P0 | Q0  = 0,
Q0  π
 1
t
ce qui donne λ = P0 | X = √ dt = 0 par parité. On a Q1 (X) = X
2
−1 1 − t
et :  1  1
2 t2 t2 2 π
Q1  = √ dt = 2 √ dt = 2 π =
2 2
−1 1 − t 0 1−t 2 2
5
1 2
Donc P1 = Q1 = X. Puis Q2 (X) = X 2 − λP0 − μP1 où λ, μ sont tels
Q1  π
que P0 | Q2  = P1 | Q2  = 0, ce qui donne :
 1 √
3 4 1 t2 1 π π
λ = P0 | X 2 = √ √ dt = √ =
π −1 1 − t 2 π2 2
5  1
3 4 2 t3
et μ = P1 | X 2 = √ dt = 0 par parité. On a Q2 (X) = X 2 −
π 1 − t 2
√ −1
π 1 1
λP0 = X 2 − √ = X 2 − et :
2 π 2
2 3 4 3 4
Q2  = Q2 | X 2 − λP0 = Q2 | X 2
 1 
t4 1 1 t2 4! 1π π
= √ dt − √ dt = 4 2 π − =
2 2
−1 1 − t 2 −1 1 − t 2 2 22 8
5
1 2
donc P2 = Q2 = 2X 2 − 1 . En conclusion, une base orthonormée
Q2  π  
5 5
1 2 2
de R2 [X] est donnée par (P0 , P1 , P2 ) = √ , X, 2X 2 − 1 .
π π π

Exercice 3.9. On se place sur l’espace vectoriel E = C 0 ([0, 1] , R) muni


 1
du produit scalaire défini par f | g = f (t) g (t) dt.
0

1. En notant F = R [X] , montrer que F ⊥ = {0} et E = F ⊕ F ⊥ .


2. En notant F le sous-espace vectoriel de E constitué des fonctions conti-
nues sur [0, 1] nulles en 0, montrer que F ⊥ = {0} et E = F ⊕ F ⊥ .

Solution.
 1
1. Une fonction f ∈ F ⊥ est telle que pour tout P ∈ F on a f (x) P (x) dx = 0.
0
En écrivant que la fonction f est limite uniforme sur le compact [0, 1] d’une
suite (Pn )n∈N de polynômes (théorème de Weierstrass), on peut écrire que :
 1  1
2
f (x) dx = lim f (x) Pn (x) dx = 0
0 n→+∞ 0
84 Espaces préhilbertiens

et avec la continuité et la positivité de f 2 , il en résulte que f est identiquement


nulle.
 1

2. Une fonction f ∈ F est telle que pour tout g ∈ F on a f (x) g (x) dx =
0
0. En en prenant g = f − f (0) (qui est bien continue et nulle en 0), on a
 1  1  1
2
f (x) (f (x) − f (0)) dx = 0, soit f (x) dx = f (0) f (x) dx et il nous
0 0 0
suffit de montrer que f (0) = 0. Supposons que f (0) = 0. En remplaçant au
besoin f par −f, on peut supposer que f (0) > 0. Comme f est continue en 0,
il existe un réel η > 0 tel que f (x) > 0 pour tout x ∈ [0, η] . En désignant, pour
1
n > par gn la fonction définie par :
η
⎧    

⎪ 1 1
⎨ x n − x si x ∈ 0, n

gn (x) =  

⎪ 1

⎩ 0 si x ∈ , 1
n
 1  1
n
on a gn ∈ F et f (x) gn (x) dx = f (x) gn (x) dx = 0 avec f (x) gn (x) > 0
0  0  
1 1
pour tout x ∈ 0, , la fonction f gn étant continue sur 0, . Il en résulte
n   n
1
que f (x) gn (x) = 0 pour tout x ∈ 0, , ce qui est contradictoire. On a donc
n
 1
f (0) = 0 et f 2 (x) dx, donc f 2 = 0 par continuité et positivité et f est
0
identiquement nulle.

Exercice 3.10. On munit l’espace vectoriel R [X] du produit scalaire :


 +∞
(P, Q) → P | Q = P (t) Q (t) e−t dt
0

1. Justifier la convergence des intégrales P | Q pour tous P, Q dans R [X]


et le fait qu’on a bien un produit scalaire.
2. Construire une base orthonormée de R3 [X] .
3. Soit P = 1 + X + X 3 . Déterminer Q ∈ R2 [X] tel que P − Q soit
minimal.

Solution.
 +∞
1. On vérifie par récurrence que tk e−t dt = k! pour tout k ∈ N et de ce
0
résultat on déduit que l’application · | · est bien définie sur R [X] . On vérifie
ensuite facilement que c’est un produit scalaire.
Exercices 85

2. En utilisant le procédé de Gram-Schmidt sur la base 1, X, X 2 , X 3 de R3 [X] ,


on a :

⎪ 2 Q0

⎪ Q0 = 1, Q0  = 1, P0 = =1

⎪ Q0 



⎪ Q1


2
P1 = X − X | P0  P0 = X − 1, Q1  = 1, P1 = =X −1

⎪ Q 1

⎪ 3 4 3 4


⎪ Q2 = X 2 − X 2 | P0 P0 − X 2 | P1 P1 = X 2 − 4X + 2

2 Q2 1
⎪ Q2  = 4, P2 = = X 2 − 4X + 2

⎪ Q 2  2



⎪ 3 3 4 3 3 4 3 3 4

⎪ Q 3 = X 3
− X | P0 P 0 − Xx | P 1 P1 − X | P2 P2



⎪ 3 2
= X − 9X + 18X − 6



⎪ Q3 1

⎩ Q3 2 = 36, P3 = = X 3 − 9X 2 + 18X − 6
Q3  6

3. Le polynôme Q est la projection orthogonale de P sur F = R2 [x] donnée par


 2
Q= P | Pk  Pk . Le calcul des P | Pk  peut être évité en remarquant que
k=0
dans la base orthonormée (P0 , P1 , P2 , P3 ) de E = R3 [x] , on a :
3

P = P | Pk  Pk = Q + P | P3  P3
k=0

le coefficient P | P3  s’obtenant en identifiant les coefficients de x3 dans cette


égalité (P est de degré 2 au plus), soit P | P3  = 6. On a donc :

Q = P − P | P3  P3 = 9x2 − 17x + 7

et d (P, R2 [x]) = P − Q = |P | P3 | = 6.

Exercice 3.11. Calculer :


 1  1
2 2
inf 2 x2 − ax − b dx et inf x2 (ln (x) − ax − b) dx
(a,b)∈R −1 (a,b)∈R2 0

Solution.
 1
1. En munissant l’espace C 0 ([−1, 1]) du produit scalaire f, g = f (x) g (x) dx,
−1
 1
2 2
on a M = inf 2 x2 − ax − b dx = inf f − Q , où f (x) = x2 . Le
(a,b)∈R −1 Q∈R1 [x]
2 2 2
théorème de projection orthogonale donne M = f − P  = f  − P  , où
P est la projection orthogonale de f sur R1 [x] , soit P = f, P0  P0 + f, P1  P1
√ de R1 [x] . Le procédé de Gram-Schmidt
où (P0 , P1 ) est une base orthonormée
1 3 2 1
donne P0 (X) = √ , P1 (X) = √ X et on a f, P0  = √ , f, P1  = 0,
2 2 3 2
86 Espaces préhilbertiens

1 2 2 8
donc P (X) = et M = − = . En utilisant la base canonique (1, X) de
3 5 9 45
R1 [X] , le système d’équations normales est :
 3 4
1 | 1 y1 + 1 | X y2 = X3 2 | 1 4
X | 1 y1 + X | X y2 = X 2 | X

2 2 1 1
soit 2y1 = et y2 = 0, ce qui donne y1 = et y2 = 0, soit P = et
3 3 3 3
2 2 8
M = f  − P  = .
45
 1
0
2. L’espace C ([0, 1]) est muni du produit scalaire f | g = f (x) g (x) dx et on
0
note f la fonction définie sur [0, 1] par :

x ln (x) si x ∈ ]0, 1]
f (x) =
0 si x = 0.

Avec lim x ln (x) = 0, on déduit que f ∈ E. Avec ces notations il s’agit donc de
x→0
 2 
calculer δ 2 = d (f, F ) = inf 2 f − aX 2 − bX  , où F = Vect X, X 2 . On
2
(a,b)∈R
sait que si (P1 , P2 ) est une base orthonormée de F, on a alors :
2 2 2 2
δ 2 = f − f | P1  P1 − f | P2  P2  = f  − f | P1  − f | P2 

Une telle base


√ orthonormée√s’obtient avec le procédé de Gram-Schmidt qui nous
donne P1 = 3X et P2 = 5 4X 2 − 3X . Puis avec :
⎧  1

⎪ 1
⎨ ∀n ∈ N, f | X n  = xn+1 ln (x) dx = − 2
 1 0 (n + 2)

⎪ 2
⎩ f 2 = x2 ln2 (x) dx =
0 27
√ √
3 5 1 1
on obtient f | P1  = − , f | P2  = et δ 2 = 4 3 = . La projection
9 12 2 3 432
orthogonale de f sur F étant donnée par :
5 2 19
P = f | P  P1 + f | P2  P2 = X − X
3 12
On peut aussi déterminer cette projection orthogonale P3= aX 2 + bX4 en uti-
lisant le système d’équations normales f − P | X = 0, f − P | X 2 = 0 qui
5 19 2 2 2 31 1
nous donne a = , b = − et δ 2 = f  − P  = − = .
3 12 27 432 432
Chapitre 4

Suites numériques

On reprend avec ce chapitre l’étude des suites amorcée dans le cadre des espaces
métriques (paragraphe 1.2) en se plaçant dans le cas particulier des suites de
nombres complexes ou réels.
Les résultats classiques sur les fonctions continues ou dérivables d’une variable
réelle sont supposés acquis de même que les fonctions usuelles exp, ln, sin, · · ·
Nous utiliserons l’expression « suite numérique » pour les notions valables sur
R ou C et préciserons « suite réelle » quand cela est nécessaire.

4.1 Suites numériques convergentes


On note K le corps R des nombres réels ou C des nombres complexes et les
résultats du paragraphe 2.1 concernant les suites sont valables pour l’espace normé
(K, |·|) , où |·| désigne la valeur absolue ou le module.
Dans le cas particulier des suites réelles, on a les résultats suivants qui font
intervenir la structure de corps ordonné de R.
Théorème 4.1.
Soit (un )n∈N une suite réelle telle que lim (un ) = .
n→+∞

1. Si  > 0 [resp.  < 0] on a alors un > 0 [resp. un < 0] à partir d’un


certain rang.
2. Si un est positif [resp. négatif] à partir d’un certain rang, on a alors
 ≥ 0 [resp.  ≤ 0].

Preuve.
 
1. Il existe n0 ∈ N tel que − +  < un < + , pour tout n ≥ n0 , ce qui nous
2 2

donne un > > 0 pour tout n ≥ n0 . Pour  < 0, on travaille avec la suite
2
(−un )n∈N .
2. Se déduit facilement du premier point.

88 Suites numériques

Théorème 4.2.
Soient (un )n∈N et (vn )n∈N deux suites réelles telles que lim (un ) = 
n→+∞

et lim (vn ) =  .
n→+∞

1. Si  >  , on a alors un > vn à partir d’un certain rang.


2. Si un ≤ vn à partir d’un certain rang, on a alors  ≤  .
3. Si M est un majorant de la suite (un )n∈N , on a alors  ≤ M.
4. Si m est un minorant de la suite (un )n∈N , on a alors  ≥ m.

Preuve. On applique le théorème 4.1 aux suites (vn − un )n∈N , (M − un )n∈N et


(un − m)n∈N . 
Théorème 4.3.
Soient (un )n∈N , (vn )n∈N et (wn )n∈N trois suites réelles telles que l’on ait
vn ≤ un ≤ wn à partir d’un certain rang. Si lim (vn ) = lim (wn ) = ,
n→+∞ n→+∞
on a alors lim (un ) = .
n→+∞

Preuve. Soit ε > 0. Il existe un entier naturel n0 tel que :

∀n ≥ n0 ,  − ε ≤ vn ≤ un ≤ wn ≤  + ε

donc |un − | ≤ ε pour tout n ≥ n0 , ce qui signifie que la suite (un )n∈N est
convergente vers . 
Théorème 4.4.
Soient (un )n∈N , (vn )n∈N deux suites numériques convergentes vers  et
 respectivement.
1. Les suites (un + vn )n∈N et (un vn )n∈N convergent vers  +  et  · 
respectivement.
2. Si  = 0,
 il existe
 alors un entier n0 tel que vn = 0 pour tout n ≥ n0 et
un 
la suite converge vers  .
vn n≥n0 
3. Dans le cas réel, les suites (min (un , vn ))n∈N et (max (un , vn ))n∈N
convergent vers min (,  ) et max (,  ) respectivement.
4. Dans le cas réel, si  > 0, il existe un entier n
√0 tel que un > 0 pour tout

n ≥ n0 et la suite un n≥n converge vers .
0

Preuve.
1. Pour tout réel ε > 0, il existe n0 ∈ N tel que |un − | < ε et |vn −  | < ε pour
tout n ≥ n0 , ce qui entraîne que |(un + vn ) − ( +  )| ≤ |un − |+|vn −  | < 2ε
et signifie que la suite (un + vn )n∈N converge vers  +  . Par ailleurs, comme la
suite convergente (vn )n∈N est bornée, il existe un réel M > 0 tel que |vn | ≤ M
Suites numériques convergentes 89

pour tout n ∈ N et pour tout n ≥ n0 , on a :


|un vn −  | ≤ |un vn − vn | + |vn −  | ≤ M |un − | + || |vn −  |
≤ (M + ||) ε
ce qui signifie que la suite (un vn )n∈N est convergente vers  ·  .
| |
2. Dans le cas où  = 0, il existe un entier n0 tel que |vn | > pour tout n ≥ n0 ,
2
ce qui entraîne que :
1 1  − vn 2 
∀n ≥ n0 , −  = ≤ 2 |vn −  |
vn   vn | |
 
1 1
et lim = . En utilisant le résultat sur le produit, on en déduit que
n→+∞
 vn 
un 
lim = .
n→+∞ vn 
1 1
3. Se déduit de min (a, b) = (a + b − |a − b|) et max (a, b) = (a + b + |a − b|) .
2 2

4. Si  > 0, il existe alors n0 ∈ N tel que un ≥ pour tout n ≥ n0 et avec
4
√ √ |un − | 2 √ √
un −  = √ √ ≤ √ |un − | , on déduit que lim un = .
un +  3  n→+∞


Parmi les suites réelles divergentes, on traite à part celles qui tendent vers
l’infini.

Définition 4.1. Soit (un )n∈N une suite réelle. On dit que :
— (un )n∈N tend vers +∞ si :

∀M ∈ R, ∃n0 ∈ N | ∀n ≥ n0 , un > M

Dans ce cas, on note lim un = +∞ ou un → +∞.


n→+∞ n→+∞
— (un )n∈N tend vers −∞ si :

∀m ∈ R, ∃n0 ∈ N | ∀n ≥ n0 , un < m

Dans ce cas, on note lim un = −∞ ou un → −∞.


n→+∞ n→+∞

Dans la définition ci-dessus, les inégalités peuvent être larges ou strictes et on


peut se limiter à M > 0 et m < 0 sans que cela ne soit restrictif.
Une suite qui tend vers +∞ est nécessairement positive à partir d’un certain
rang.
On peut remarquer que lim un = −∞ si, et seulement si lim (−un ) = +∞.
n→+∞ n→+∞
1
Si un = avec vn > 0 pour tout n ∈ N, on a alors lim un = 0 si, et
vn n→+∞
seulement si, lim vn = +∞.
n→+∞
90 Suites numériques

Une suite qui tend vers l’infini (i. e. vers +∞ ou −∞) est non bornée, donc
divergente.
Théorème 4.5.
Si (un )n∈N est une suite numérique pour laquelle on peut trouver une
suite (vn )n∈N de réels positifs telle que lim vn = +∞ et |un | ≥ vn à
n→+∞
partir d’un certain rang, la suite (un )n∈N est alors divergente.

Preuve. On a :

∀M ∈ R, ∃n0 ∈ N | ∀n ≥ n0 , |un | ≥ vn > M

donc lim |un | = +∞ est (un )n∈N est divergente. 


n→+∞
Pour étudier une suite numérique, il est parfois commode de la comparer à une
suite de référence. Les suites géométriques (exercice 4.5) font parties de ces suites
de référence.
Théorème 4.6.
Soit (un )n∈N une suite numérique.
1. S’il existe un réel λ ∈ [0, 1[ tel que |un+1 | ≤ λ |un | à partir d’un certain
rang n0 , on a alors lim (un ) = 0.
n→+∞
2. S’il existe un indice n0 tel que un0 = 0 et s’il existe un réel λ > 1 tel
que |un+1 | ≥ λ |un | pour tout n ≥ n0 , alors (un )n∈N diverge.
 
un+1
3. Si un = 0 à partir d’un certain rang n0 , et lim = λ ∈ [0, 1[ ,
n→+∞ un
on a alors lim (un ) = 0.
n→+∞
 
un+1
4. Si un = 0 à partir d’un certain rang n0 , et lim = λ > 1,
n→+∞ un
alors (un )n∈N diverge.

Preuve.
1. Si λ = 0, la suite (un )n∈N est alors stationnaire sur 0 à partir du rang n0 + 1.
On suppose donc que λ ∈ ]0, 1[ . Montrons par récurrence sur n ≥ n0 que
|un | ≤ un0 λn−n0 . C’est vrai pour n = n0 . Supposons que pour une valeur n ≥ n0
on ait |un | ≤ un0 λn−n0 , comme |un+1 | ≤ λ |un | , on a |un+1 | ≤ un0 λn+1−n0 .
un
Pour λ ∈ ]0, 1[ la suite géométrique de terme général n00 λn converge vers 0, et
λ
comme cette suite majore la suite positive (|un |)n∈N on peut affirmer que cette
dernière converge aussi vers 0 et il en est de même de (un )n∈N .
2. Si un0 = 0, on vérifie alors par récurrence que un =0 pour tout n ≥ n0 .
1
En appliquant le résultat précédent à la suite , on déduit que
|un | n≥n0
 
1
lim = 0, ce qui équivaut à lim (|un |) = +∞ et (un )n∈N diverge.
n→+∞ |un | n→+∞
Suites numériques convergentes 91
 
un+1
3. Si lim = λ, on a alors :
n→+∞ un

un+1
∀ε > 0, ∃n0 ∈ N | ∀n ∈ N, n > n0 ⇒ <λ+ε
un

Dans le cas où λ ∈ [0, 1[ , on peut choisir ε assez petit pour que ρ = λ + ε soit
strictement inférieur à 1 et on a alors |un+1 | ≤ ρ |un | pour tout n ≥ n0 avec
ρ ∈ ]0, 1[ , ce qui implique lim (un ) = 0.
n→+∞
1
4. Le résultat précédent appliqué à la suite (vn )n∈N définie par vn = pour n
|un |
assez grand, nous dit que lim (vn ) = 0, donc lim (|un |) = +∞ et (un )n∈N
n→+∞ n→+∞
diverge.

Théorème 4.7.
Soit (un )n∈N une suite numérique.
1. S’il existe un réel λ ∈ [0, 1[ tel que n
|un | ≤ λ à partir d’un certain rang
n0 , on a alors lim (un ) = 0.
n→+∞

2. S’il existe un réel λ > 1 tel que n |un | ≥ λ à partir d’un certain rang
n0 , alors (un )n∈N diverge.
# $
3. Si lim n
|un | = λ ∈ [0, 1[ , on a alors lim (un ) = 0.
n→+∞ n→+∞
# $
4. Si lim n
|un | = λ > 1, alors (un )n∈N diverge.
n→+∞

Preuve.
1. Résulte de 0 ≤ |un | ≤ λn pour n ≥ n0 avec lim (λn ) = 0 (λ ∈ [0, 1[).
n→+∞
2. Résulte de |un | ≥ λn pour n ≥ n0 avec lim (λn ) = +∞ (λ > 1).
n→+∞
# $
3. Si lim n
|un | = λ, on a alors :
n→+∞

∀ε > 0, ∃n0 ∈ N | ∀n ∈ N, n > n0 ⇒ λ − ε < n


|un | < λ + ε

Dans le cas où λ ∈ [0, 1[ , on peut choisir ε assez petit pour que ρ = λ + ε


soit strictement inférieur à 1 et on a alors n |un | ≤ ρ pour tout n ≥ n0 avec
ρ ∈ [0, 1[ , ce qui implique lim (un ) = 0.
n→+∞
1
4. Le résultat précédent appliqué à la suite (vn )n∈N définie par vn = pour
|un |
n assez grand (pour ε > 0 assez petit et n ≥ n0 , on a n |un | > λ − ε > 0
et un = 0) nous dit que lim (vn ) = 0, donc lim (|un |) = +∞ et (un )n∈N
n→+∞ n→+∞
diverge.
92 Suites numériques

  # $ 
un+1
On peut vérifier que si lim = λ, on a alors lim n
|un | = λ
n→+∞ un n→+∞
(exercice 4.21).

Définition 4.2. Soient (un )n∈N et (vn )n∈N deux suites numériques. On dit
que :
— (un )n∈N est dominée par (vn )n∈N s’il existe un entier n0 ≥ 0 et une
suite bornée (ϕn )n≥n0 tels que un = ϕn vn pour tout n ≥ n0 ;
— (un )n∈N est négligeable devant (vn )n∈N , s’il existe un entier n0 ≥ 0 et
une suite (εn )n≥n0 convergente vers 0 tels que un = εn vn pour tout
n ≥ n0 ;
— (un )n∈N est équivalente à (vn )n∈N , s’il existe un entier n0 ≥ 0 et
une suite (ϕn )n≥n0 convergente vers 1 tels que un = ϕn vn pour tout
n ≥ n0 .

On notera un = O (vn ) pour signifier que (un )n∈N est dominée par (vn )n∈N ,
n→+∞
un = o (vn ) pour signifier que (un )n∈N est négligeable devant (vn )n∈N et
n→+∞
un  vn pour signifier que (un )n∈N est équivalente à (vn )n∈N .
n→+∞
On vérifie facilement que la relation ∼ définit une relation d’équivalence
n→+∞
sur l’ensemble des suites réelles.
Dire que un  vn revient aussi à dire que un − vn = o (vn ) .
n→+∞ n→+∞
Si la suite (un )n∈N converge vers un scalaire  = 0, on a alors un   (il
n→+∞
un
suffit d’écrire un = ). Mais ce résultat est faux pour  = 0. Dire que (un )n∈N

est équivalente à 0 signifie que les un sont tous nuls à partir d’un certain rang et

 une limite nulle en étant à valeurs dans K comme le montre
une suite peut avoir
1
l’exemple de .
n n∈N∗
Ces relations peuvent aussi se définir dans le cadre des suites à valeurs dans un
espace normé (E, ·) .

Définition 4.3. Soient (un )n∈N une suite d’éléments d’un espace normé
(E, ·) et (vn )n∈N une suite réelle. On dit que :
— (un )n∈N est dominée par (vn )n∈N , si un  = O (|vn |) , ce qui si-
n→+∞
gnifie qu’il existe un réel M > 0 et un entier n0 tels que :
∀n ≥ n0 , un  ≤ M |vn |
on note alors un = O (vn ) ;
n→+∞
— (un )n∈N est négligeable devant (vn )n∈N si un  = o (|vn |) , ce qui
n→+∞
signifie que pour tout ε > 0, il existe un entier n0 tels que :
∀n ≥ n0 , un  ≤ ε |vn |
Suites réelles monotones, adjacentes 93

on note alors un = o (vn ) .


n→+∞

Définition 4.4. Soient (un )n∈N et (vn )n∈N deux suites d’éléments d’un
espace normé (E, ·) . On dit que (un )n∈N est équivalente à (vn )n∈N si
un − v n = o (vn ) , ce qui signifie que pour tout ε > 0, il existe un
n→+∞
entier n0 tels que :

∀n ≥ n0 , un − vn  ≤ ε vn 

on note alors un  (vn ) .


n→+∞

La relation ∼ définit une relation d’équivalence sur l’ensemble des suites


n→+∞
à valeurs dans (E, ·) . Pour vérifier la symétrie, on écrit ε > 0 sous la forme
ε
ε= où ε ∈ ]0, 1[ et de un − vn  ≤ ε vn  pour n ≥ n0 , on déduit que
1 − ε
un − vn  ≤ ε vn − un  + ε vn  , soit un − vn  ≤ ε un  .
Théorème 4.8.
Si (un )n∈N et (vn )n∈N sont deux suites d’un espace normé (E, ·) équiva-
lentes, elles sont alors de même nature, ce qui signifie que (un )n∈N converge
si, et seulement si (vn )n∈N converge. En cas de convergence de l’une des
deux suites, on a lim un = lim vn .
n→+∞ n→+∞

Preuve. Supposons que un  (vn ) et lim vn =  dans E. Pour tout ε > 0,


n→+∞ n→+∞
il existe un entier n0 tels que un − vn  ≤ ε vn  et vn −  ≤ ε pour tout n ≥ n0 ,
donc un −  ≤ un − vn  + vn −  ≤ ε (vn  + 1) , la suite (vn )n∈N étant
bornée, ce qui suffit à prouver que lim un = . Par symétrie, on a aussi que
n→+∞
lim un =  entraîne lim vn = . 
n→+∞ n→+∞
Au paragraphe 6.7, on définit ces relations de comparaison sur les fonctions
et les résultats relatifs aux opérations algébriques qui y sont prouvés sont aussi
valables pour les suites. On pourra se reporter à ce paragraphe pour les détails.

4.2 Suites réelles monotones, adjacentes

Définition 4.5. On dit qu’une suite réelle (un )n∈N est :


— croissante si, un+1 ≥ un pour tout n ∈ N ;
— décroissante si, un+1 ≤ un pour tout n ∈ N ;
— monotone si elle est croissante ou décroissante.
94 Suites numériques

En remplaçant les inégalités larges par des inégalités strictes on parle de suites
strictement monotones.
Pour étudier la monotonie d’une suite, on peut étudier le signe de un+1 − un
un+1
ou, si un > 0 à partir d’un certain rang n0 , le signe de − 1 pour n ≥ n0 .
un
Une suite réelle (un )n∈N est décroissante si, et seulement si, (−un )n∈N est crois-
sante. Il suffit donc de s’intéresser aux suites croissantes.
Du théorème de la borne supérieure sur R, on déduit le résultat suivant.
Théorème 4.9.
Une suite réelle croissante [resp. décroissante] (un )n∈N est convergente
si, et seulement si, elle est majorée [resp. minorée] et dans ce cas on a
lim un = sup un [resp. lim un = inf un ]. Sinon on a lim un = +∞
n→+∞ n∈N n→+∞ n∈N n→+∞
[resp. lim un = −∞].
n→+∞

Preuve. Considérons une suite (un )n∈N croissante. Si elle est majorée, l’ensemble
non vide majoré {un | n ∈ N} admet alors une borne supérieure . Soit ε un réel
strictement positif. Il existe un entier n0 tel que  − ε ≤ un0 ≤ . La suite étant
croissante et  étant un majorant de la suite, on a  − ε ≤ un ≤ , soit |un − | ≤ ε
pour tout n ≥ n0 . La suite (un )n∈N est donc convergente vers . Si elle n’est pas
majorée, pour tout réel M > 0, il existe alors un entier n0 tel que un0 ≥ M
et avec la croissance, on déduit que un ≥ M pour tout n ≥ n0 . Cette suite est
donc divergente vers +∞. On procède de même pour les suites décroissantes et
minorées. 
Le théorème précédent associé au résultat qui suit nous donne une démonstra-
tion du théorème de Bolzano-Weierstrass.
Théorème 4.10.
De toute suite réelle on peut extraire une suite monotone.

Preuve. Soit A = {n ∈ N | ∀m > n, um ≤ un } (A est éventuellement vide). Si A


est fini, il admet alors un majorant n0 ∈ / A et il existe un entier n1 > n0 tel que
un1 > un0 . Comme n1 ∈ / A, il existe n2 > n1 tel que un2 > un1 et ainsi de suite,
on construit par récurrence une suite strictement croissante d’entiers (nk )k∈N telle
que unk+1 > unk pour tout k ∈ N. La suite (unk )k∈N est alors extraite de (un )n∈N
et strictement croissante. Si A est infini, on peut alors ranger ses éléments dans
l’ordre croissant, soit A = {nk | k ∈ N} avec nk < nk+1 pour tout k ∈ N et par
construction, on a unk+1 ≤ unk pour tout k ∈ N. La suite (unk )k∈N est alors
extraite de (un )n∈N et décroissante. 
Théorème 4.11. Bolzano-Weierstrass
De toute suite bornée de nombres réels on peut extraire une sous-suite
convergente.

Preuve. Résulte immédiatement du théorème précédent et du théorème 4.9. 


De ce théorème on déduit immédiatement le corollaire suivant.
Suites réelles monotones, adjacentes 95

Corollaire 4.1. Les compacts de R sont les fermés bornés.

De manière générale dans un espace métrique un compact est fermé borné


(théorème 1.10). La réciproque est vraie si, et seulement si, E est de dimension
finie (théorème 2.9).
Une conséquence importante du théorème de Bolzano-Weierstrass est la sui-
vante (voir aussi le théorème 1.11 dans le cadre d’un espace métrique).
Théorème 4.12.
Une suite réelle est convergente si, et seulement si, elle est bornée et n’a
qu’une seule valeur d’adhérence.

Preuve. On sait déjà qu’une suite convergente est bornée et qu’elle n’a qu’une
seule valeur d’adhérence (théorème 1.8). Réciproquement, supposons que la suite
bornée (un )n∈N admette  pour seule valeur d’adhérence. Si cette suite ne converge
pas vers , on peut alors trouver un réel ε > 0 tel que pour tout entier n, il
existe p > n avec |up − | ≥ ε. Par récurrence on peut alors construire une suite
strictement croissante d’entiers (ϕ (n))n∈N telle que uϕ(n) −  ≥ ε pour tout n. De
la suite bornée uϕ(n) n∈N on peut extraire une sous suite uψ(n) n∈N qui converge
vers  et par passage à la limite dans l’inégalité uψ(n) −  ≥ ε on déduit que
| − | ≥ ε > 0, c’est-à-dire que  est une valeur d’adhérence de (un )n∈N distincte
de , ce qui contredit l’hypothèse de départ. 

Définition 4.6. Deux suites réelles (un )n∈N et (vn )n∈N sont dites adja-
centes si la suite (un )n∈N est croissante, la suite (vn )n∈N est décroissante
et la suite (vn − un )n∈N est convergente vers 0.

Lemme 4.1 Si (un )n∈N et (vn )n∈N sont deux suites réelles adjacentes, on a alors
un ≤ vm pour tout (n, m) ∈ N2 .

Preuve. Supposons qu’il existe n, m tels que un > vm . Comme (un )n∈N est
croissante, et (vn )n∈N décroissante, on a alors pour tout k ≥ max (n, m) , uk ≥ un
et vk ≤ vm , donc uk − vk ≥ un − vm > 0 et 0 = lim (uk − vk ) ≥ un − vm > 0,
k→+∞
ce qui est impossible. 
Théorème 4.13.
Deux suites réelles adjacentes (un )n∈N et (vn )n∈N convergent vers la
même limite  et on a un ≤  ≤ vm pour tout (n, m) ∈ N2 .

Preuve. En utilisant le lemme précédent et la monotonie des suites (un )n∈N et


(vn )n∈N , on a u0 ≤ un ≤ un+1 ≤ vn+1 ≤ vn ≤ v0 pour tout n ∈ N, c’est-à-dire
que (un )n∈N est croissante majorée par v0 et (vn )n∈N est décroissante minorée par
u0 . Ces deux suites sont donc convergentes et avec lim (vn − un ) = 0, on déduit
n→+∞
qu’elles convergent vers la même limite  = sup (un ) = inf (vn ) . 
n∈N n∈N
96 Suites numériques

Une majoration de l’erreur d’approximation de  par les un est donnée par


0 ≤  − un ≤ vn − un pour tout n ∈ N.
Le théorème des suites adjacentes est équivalent au théorème des segments
emboîtés qui suit.
Théorème 4.14. Segments emboîtés

Si ([an , bn ])n∈N est une suite de segments emboîtés (c’est-à-dire que


l’on a an < bn et [an+1 , bn+1 ] ⊂ [an , bn ] pour tout  n ∈ N) telle que
lim (bn − an ) = 0, il existe alors un réel  tel que [an , bn ] = {} .
n→+∞
n∈N

Preuve. Il est facile de vérifier que les suites (an )n∈N et (bn )n∈N sont adjacentes
et  = sup (an ) = lim (an ) = lim (bn ) = inf (bn ) . 
n∈N n∈N n∈N n∈N
Le théorème précédent est un cas particulier du théorème des boules emboîtées
sur un espace métrique complet (exercice 1.9).
Le théorème des suites adjacentes nous permet de retrouver le théorème de
Bolzano-Weierstrass (théorème 4.11) en utilisant une méthode de dichotomie.
Théorème 4.15. Bolzano-Weierstrass
De toute suite bornée de nombres réels on peut extraire une sous-suite
convergente.

Preuve. Si [a0 , b0 ] est un intervalle réel qui contient tous les éléments de la suite
(un )n∈N on le coupe en deux parties égales et on garde une de ces parties qui
contient des un pour une infinité d’indices n. En réitérant ce procédé on construit
deux suites adjacentes (an )n∈N et (bn )n∈N et une application ϕ strictement crois-
sante de N dans N telles que chaque intervalle [an , bn ] contient un terme uϕ(n) . La
suite uϕ(n) n∈N est alors convergente. 
Le théorème des suites adjacentes permet également de montrer que R n’est
pas dénombrable en utilisant une méthode de trichotomie.
Théorème 4.16.
R n’est pas dénombrable.

Preuve. Il suffit de montrer que [0, 1] n’est pas dénombrable. Supposons qu’il
existe une application bijective ϕ : N → [0, 1] . En coupant I = [0, 1] en trois
segments de même longueur, il en existe un que l’on note I0 qui ne contient pas
ϕ (0) . On coupe ensuite I0 en trois segments de même longueur en notant I1 l’un
de ces segments qui ne contient par ϕ (1) . Par récurrence, on construit ainsi une
suite de segments emboîtés (In )n∈N telle que, pour tout n ∈ N, In ne contient pas
1
ϕ (n) et In est de longueur n , on déduit alors du théorème des segments emboîtés
 3
que In = {x} avec x ∈ [0, 1] et x = ϕ (n) pour tout n ∈ N, ce qui contredit la
n∈N
définition de ϕ. 
Suites réelles monotones, adjacentes 97

Une autre application importante du théorème des segments emboîtés (ou des
suites adjacentes) est le théorème des valeurs intermédiaires qui fournit de plus une
méthode dichotomique d’approximation d’une solution d’une équation f (x) = 0
(voir aussi le paragraphe 6.5).
Théorème 4.17.
Si I = [a, b] est un intervalle réel fermé borné et f une fonction continue
de I dans R telle que f (a) f (b) < 0, alors l’équation f (x) = 0 admet au
moins une solution α ∈ ]a, b[ .

Preuve. Supposons que f (a) < 0 < f (b) (en remplaçant au besoin f par −f on
se ramène toujours à ce cas). On construit, par récurrence, une suite ([an , bn ])n∈N
d’intervalles emboîtés dans [a, b] de la manière suivante :
— [a0 , b0 ] = [a, b] ;
— en⎧ supposant
 construit
 [an , bn ] ⊂ [a, b] pour n ≥ 0, on pose :[an+1 , bn+1 ] =

⎪ a n + b n a n + b n

⎨ an , si f >0
2 2
 

⎪ an + bn

⎩ , bn sinon
2
bn − an
On a alors [an+1 , bn+1 ] ⊂ [an , bn ] avec bn+1 − an+1 = pour tout n ≥ 0,
2
b−a
ce qui entraîne bn − an = n pour tout n ≥ 0.
2 
([an , bn ])n∈N est alors une suite de segments emboîtés et on a [an , bn ] = {α}
n∈N
avec α ∈ [a, b] . De plus, par construction, on a f (an ) ≤ 0 ≤ f (bn ) pour tout
n ≥ 0. En effet, c’est vrai pour n = 0 et en  supposantcet encadrement vérifié au
a n + bn a n + bn
rang n ≥ 0, on a f (an+1 ) = f (an ) ≤ 0 si f > 0 avec bn+1 =
  2 2
a n + bn a n + bn
et f (bn+1 ) = f (bn ) ≥ 0 si f ≤ 0 avec an+1 = . Puis avec
2 2
α = lim (an ) = lim (bn ) et la continuité de f, on déduit que :
n→+∞ n→+∞

f (α) = lim (f (an )) ≤ 0 ≤ lim (f (bn )) = f (α)


n→+∞ n→+∞

ce qui équivaut à f (α) = 0. Comme de plus on a supposé que f (a) f (b) < 0, α
 b.
est différentde a et de 
an + bn
La suite converge également vers α.
2 n∈N
Pour chacune des trois suites, on la majoration de l’erreur d’approximation :
b−a
∀n ∈ N, |α − xn | ≤
2n
ce qui permet de déterminer un nombre suffisant d’itérations
 pour atteindre une

b−a
précision ε > 0 donnée. On peut prendre n0 = log2 . En pratique on
ε
préfère utiliser le test d’arrêt |bn − an | < ε.
98 Suites numériques

La méthode converge toujours, mais cette convergence peut être lente. De plus
elle ne se généralise pas au cas des systèmes non linéaires d’équations.

Exemple 4.1 Pour obtenir des approximations numériques de 2, on utilise la
fonction f définie par f (x) = x2 − 2 sur [0, 2] (on a f (0) = −2 < 0 < f (2) = 2),
ce qui conduit aux suites (an )n∈N et (bn )n∈N définies par [a0 , b0 ] = [1, 2] et :
⎧    2

⎪ a n + bn a n + bn

⎨ an , si >2
2 2
[an+1 , bn+1 ] =
⎪  

⎪ an + b n
⎩ , bn sinon
2
 
a n + bn √
La suite (un )n∈N = permet d’approximer 2 avec pour majoration
2 n∈N
√ 1
de l’erreur, un − 2 ≤ bn − an = n .
2

4.3 Développement décimal d’un réel


Le corps Q des nombres rationnels est construit comme le corps des fractions
de l’anneau Z des entiers relatifs (voir [9], volume 1) puis le corps des réels est
construit comme le complété de Q (voir [9], volume 2). Dans ce paragraphe ces
constructions sont supposées acquises et on s’intéresse aux approximations ration-
nelles des nombres réels.
On note D l’ensemble des nombres décimaux, c’est-à-dire l’ensemble des ration-
a
nels de la forme m où a est un entier relatif et m un entier naturel.
10
Une construction de R peut aussi se faire à partir des nombres décimaux. On
peut consulter [ ?], annexe 3 ou [14], chapitre 1.
Il est facile de vérifier que D est un anneau commutatif unitaire, mais cet en-
a
semble n’est pas un corps. Un rationnel r = m est inversible dans D si, et seule-
10
a b
ment si, il existe un entier relatif b et un entier naturel n tels que m n = 1,
10 10
ce qui revient à dire que ab = 10n+m ou encore que 2 et 5 sont les seuls diviseurs
premiers possibles de a et b. En définitive l’ensemble
 D∗ des nombres décimaux
∗ 2
inversibles est D = r = ±2 5 | (α, β) ∈ Z .
α β

Une propriété importante de l’ensemble R des nombres réels est la propriété


d’Archimède conséquence du théorème de la borne supérieure.
Théorème 4.18.
L’ensemble R des nombres réels est archimédien, ce qui signifie que :

∀ (a, b) ∈ R+,∗ × R+ , ∃n ∈ N∗ | na > b

Preuve. Si na ≤ b pour tout n ∈ N∗ , alors A = {na, n ∈ N∗ } est une partie


de R non vide et majorée (par b), elle admet donc une borne supérieure α. On a
alors (n + 1) a ≤ α pour tout n ∈ N, ce qui entraîne na ≤ α − a pour tout n ∈ N∗
Développement décimal d’un réel 99

et α − a est un majorant de A strictement inférieur à α, ce qui est impossible. Il


existe donc un entier n ∈ N∗ tel que na > b. 
De ce théorème on déduit le résultat important suivant.
Théorème 4.19.
Pour tout réel x il existe un unique entier relatif n tel que n ≤ x < n + 1.

Preuve. Pour x entier relatif, il suffit de prendre n = x. On suppose donc x non


entier. Supposons d’abord que x est strictement positif. En prenant a = 1 dans le
théorème 4.18 on déduit que :

∀x > 0, ∃m ∈ N − {0} | m > x

et en conséquence, l’ensemble des entiers m > 0 vérifiant m > x est non vide. Il
admet donc un plus petit élément p qui vérifie p > x et p − 1 ≤ x. Il suffit alors de
poser n = p − 1. Pour x < 0 en raisonnant avec −x on aboutit à l’existence d’un
entier p vérifiant p ≤ −x < p + 1. On a alors − (p + 1) < x < p (x n’est pas entier)
et n = − (p + 1) convient.
Si pour x réel il existe deux entiers n, p tels que n ≤ x < n + 1 et p ≤ x < p + 1,
on a alors n − p < 1, soit n − p ≤ 0 et n − p > −1, donc n = p. 

Définition 4.7. Avec les notations du théorème précédent, l’entier n est


appelé la partie entière de x. On le note [x] ou E (x) .

À tout réel x, on associe les suites (rn )n∈N et (sn )n∈N définies par :

[10n x] 1
∀n ∈ N, rn = , sn = rn + n
10n 10

Théorème 4.20.
Les suites (rn )n∈N et (sn )n∈N sont des suites adjacentes de nombres dé-
cimaux qui convergent vers x avec rn ≤ x < sn pour tout n ∈ N.

Preuve. Il est clair que pour tout n ∈ 6N, rn et7sn sont des nombres décimaux. 6 7
Pour n ∈ N on a 10 [10n x] ≤ 10n+1 x < 10n+1 x + 1, soit 10 [10n x] ≤ 10n+1 x
et divisant
6 n+1par7 10
n+1
, on obtient rn ≤ rn+1 . La suite (rn )n∈N
6 n+1 7 est donc croissante.
Avec 10 x ≤ 10 · 10n6x < 10 ([10
7
n
x] + 1) , soit 10 x ≤ 10 ([10 n
x] + 1) − 1,
10n+1 x + 1 n
10 ([10 x] + 1)
on déduit que sn+1 = ≤ = sn . La suite (sn )n∈N
10n+1 10nn+1
est donc décroissante. Enfin avec [10 x] ≤ 10 x < [10n x] + 1, on déduit que
n
1
rn ≤ x < sn , soit 0 ≤ x − rn < , ce qui entraîne la convergence des suites
10n
(rn )n∈N et (sn )n∈N vers x. 
La démonstration précédente montre que pour tout n ∈ N on a :
1 1
x− < rn ≤ x et x < sn ≤ x + n
10n 10
100 Suites numériques

Pour ces raisons rn est appelée l’approximation décimale par défaut à 10−n près
de x et sn l’approximation décimale par excès à 10−n près.
Ce théorème peut aussi s’exprimer comme suit.
Théorème 4.21.
L’ensemble D des nombres décimaux est dense dans R.

De l’inclusion D ⊂ Q, on déduit le résultat suivant.

Corollaire 4.2. L’ensemble Q des nombres rationnel et l’ensemble R \ Q


des nombres irrationnels sont denses dans R.

Preuve. La densité de Q dans R se déduit de la densité de D dans R et de


l’inclusion D ⊂ Q. Pour tout réel x il existe une suite (rn )n∈N de rationnels qui
√ √
converge vers x + 2 et la suite de nombres irrationnels rn − 2 n∈N converge
vers x. 
On peut également vérifier que l’ensemble D∗ des nombres décimaux inversibles
est dense dans R (exercice 4.15).
La base de numération 10 . peut
a / par n’importe quelle base b ≥ 2,
être remplacée
c’est-à-dire que l’ensemble | a ∈ Z, m ∈ N est dense dans R.
bm . a /
Pour b = 2, on en déduit que l’ensemble | m ∈ N, a ∈ N, 0 ≤ a ≤ 2 m
est
2m
dense dans [0, 1] . Ce résultat est utilisé pour montrer qu’une fonction continue
f : I → R est convexe si, et seulement si :
 
x+y f (x) + f (y)
∀ (x, y) ∈ I 2 , f ≤
2 2
(théorème 8.6).
Les valeurs décimales approchées par défaut et par excès peuvent être utilisées
pour comparer deux réels.
Théorème 4.22.
Soient x, y deux réels et (rn )n∈N , (rn )n∈N les suites d’approximations
décimales par défaut associées. On a alors x < y si, et seulement si, il
existe un entier n tel que rn < rn .

Preuve. Si x < y on peut alors trouver un entier naturel n tel que 10n (y − x) > 1,
soit 10n y > 10n x + 1 et on a :
10n rn + 1 = [10n x] + 1 ≤ 10n x + 1 < 10n y < [10n y] + 1 = 10n rn + 1
donc rn < rn . Réciproquement s’il existe n ∈ N tel que rn < rn , on a alors
[10n x] < [10n y] , donc [10n x] ≤ [10n y] − 1 et 10n x < [10n x] + 1 ≤ [10n y] ≤ 10n y,
soit x < y. 
À tout réel x, on associe la suites (rn )n∈N de ses approximations décimales par
défaut et la suite (an )n∈N définie par :

a0 = [x] 6 7 (4.1)
∀n ∈ N∗ , an = [10n x] − 10 10n−1 x
Développement décimal d’un réel 101

Lemme 4.2 Pour tout entier naturel non nul n, on a an = 10n (rn − rn−1 ) et an
est un entier compris entre 0 et 9.

Preuve. Pour n ∈ N∗ , il est clair que an est un entier et :


6 7
an = [10n x] − 10 10n−1 x = 10n rn − 10 · 10n−1 rn−1 = 10n (rn − rn−1 )

ce qui entraîne an ≥ 0 du fait de6 la croissance


7 de la suite (rn )n∈N . D’autre part,
avec [10n x] ≤ 10n x et 10n−1 x < 10n−1 x + 1, on déduit que :
6 7
an = [10n x] − 10 10n−1 x < 10n x − 10 10n−1 x − 1 = 10

soit an ≤ 9. 

n
ak
Lemme 4.3 Pour tout entier naturel n, on a = rn .
10k
k=0

Preuve. Pour n = 0, on a bien a0 = [x] = r0 et pour n ≥ 1 :


n
ak 
n
= r0 + (rk − rk−1 ) = rn
10k
k=0 k=1


Du théorème 4.20 on déduit le résultat suivant.
Théorème 4.23.
+∞
 ak
Pour tout réel x on a x = .
10k
k=0

On dit alors que cette écriture est un développement décimal illimité du réel x.
Par exemple pour x = 32, 456, on vérifie que :

⎨ a0 = [x] = 32, a1 = [10x] − 10 [x] = 4
a2 = [100x] − 10 [10x] = 5, a4 = [1000x] − 10 [100x] = 6

ak = 0, pour k ≥ 5,

c’est-à-dire que pour k ≥ 1, ak est la k-ème décimale de x après la virgule.


Mais pour x < 0, ce résultat n’est plus vrai. Par exemple pour x = −32, 456,
on a : ⎧

⎪ a0 = [x] = −33, a1 = [10x] − 10 [x] = −325 + 330 = 5

a2 = [100x] − 10 [10x] = −3246 + 3250 = 4
⎪ a4 = [1000x] − 10 [100x] = −32456 + 32460 = 4


ak = 0, pour k ≥ 5
ce qui correspond à x = −33 + 0, 544.
+∞
 ak
Pour x > 0 le développement x = est noté x = a0 , a1 a2 · · · an · · · et
10k
k=0
pour x < 0, on écrit x = − (−x) = −a0 , a1 a2 · · · an · · · où a0 , a1 a2 · · · an · · · est le
102 Suites numériques

développement décimal illimité de −x obtenu par le procédé précédent, c’est-à-dire


que : 
a0 = [−x] 6 7
∀n ∈ N∗ , an = [−10n x] − 10 −10n−1 x
Une question que l’on peut naturellement se poser est celle de l’unicité d’un
tel développement. Plus précisément, on a défini une application δ de R+,∗ dans
l’ensemble D des suites réelles (an )n∈N telles que a0 ∈ N et ak ∈ {0, 1, · · · , 9} pour
tout k ≥ 1 en associant à tout réel x positif ou nul la suite (an )n∈N définie par
(4.1) et la question est de savoir si cette application est bijective. Le résultat qui
suit nous dit que cette application n’est pas surjective.

Lemme 4.4 Pour tout réel x la suite (an )n∈N définie par (4.1) ne peut pas être
stationnaire sur 9 à partir d’un certain rang.

Preuve. Supposons qu’il existe un entier n0 ≥ 1 tel que an = 9 pour tout n ≥ n0 .


On a alors pour tout n > n0 :


n 
n−n 0 −1
ak 9 1
rn − rn0 = = n0 +1
10k 10 10k
k=n0 +1 k=0
1
9 1−
= 10n−n0 = 1 − 1
10n0 +1 1 10n0 10n
1−
10
1 1
soit sn = rn + = rn0 + n0 = sn0 et x = lim (sn ) = sn0 , ce qui contredit
10n 10 n→+∞
x < s n0 . 
On déduit donc, par exemple, que la suite (0, 9, 9, · · · , 9, · · · ) comportant une
infinité de 9 consécutifs n’a pas d’antécédents par l’application δ.
Si D désigne le sous-ensemble de D formé des suites qui ne sont pas station-
naires sur 9 à partir d’un certain rang, l’application δ réalise alors une bijection
de R+ sur D .

Définition 4.8. On appelle développement décimal illimité propre du réel


+∞
 ak
x toute égalité x = où (an )n∈N est une suite dans D . Un tel déve-
10k
k=0
loppement est noté x = a0 , a1 a2 · · · an · · · .

La suite (an )n∈N définie par (4.1) , fournit un développement décimal illimité
propre de x.
Le réel x = 1 a pour développement propre 1 = 1, 00 · · · 0 · · · , mais on peut
+∞
 9
aussi écrire que 1 = 0, 99 · · · 9 · · · = . Ce deuxième développement est un
10k
k=1
développement impropre de 1.
Développement décimal d’un réel 103

Théorème 4.24.
Le développement décimal illimité propre d’un réel positif est unique et
l’application δ réalise une bijection de R+ sur D .

Preuve. Soit x ∈ R+ . On a déjà le développement x = a0 , a1 · · · an · · · où (an )n∈N


est la suite définie par (4.1) . Supposons que l’on ait un autre développement :
+∞
 bk
x = b0 , b1 · · · bn · · · =
10k
k=0

avec (bn )n∈N ∈ D . On a b0 ∈ N et du fait que la suite (bn )n∈N∗ n’est pas station-
naire sur 9 à partir d’un certain rang, on a :
+∞
 +∞

bk 9
0 ≤ x − b0 = < =1
10k 10k
k=1 k=1

soit b0 ≤ x < b0 
+ 1, ce qui signifie que b0 = [x] = a0 . Plus généralement, pour
bn−1 bn+1
n ≥ 1 on a 10 x − b0 − · · · − n−1 = bn +
n
+ · · · et le raisonnement
10 10
précédent nous dit que :
  
bn−1
bn = 10 x − b0 − · · · − n−1
n
= [10n x] − 10 b0 10n−1 + · · · + bn−1
10
bn 6 7
avec 10n−1 x = b0 10n−1 + · · · + bn−1 + + · · · et b0 10n−1 + · · · + bn−1 = 10n−1 x .
6 7
10
On a donc bn = [10n x] − 10 10n−1 x = an . Le développement décimal illimité
propre d’un réel positif x est donc bien unique.
Le lemme 4.4 nous dit que δ est bien une application de R+ dans D . L’injectivité
se déduit immédiatement du théorème 4.23.
+∞
 ak
Si (an )n∈N ∈ D , on peut poser x = (avec ak ≥ 0 pour tout k ≥ 1
10k
k=0  n 
n
ak 
n
9  ak
et ≤ < 1, on déduit que la suite est croissante
10k 10k 10k
k=1 k=1 k=1 n≥1
majorée, donc convergente) et l’unicité du développement propre nous dit que
δ (x) = (an )n∈N . L’application δ est donc surjective. 
Ce résultat permet de donner une démonstration relativement simple du fait
que R n’est pas dénombrable.

Corollaire 4.3. R est non dénombrable.

Preuve. Si R est dénombrable il en est alors de même de l’ensemble :


A = {x = 0, a1 a2 · · · an · · · | ∀k ≥ 1, 0 ≤ ak ≤ 8}
On peut donc écrire que :
A = {xp = 0, ap,1 ap,2 · · · ap,n · · · | p ∈ N∗ , ∀k ≥ 1, 0 ≤ ap,k ≤ 8}
104 Suites numériques

Le réel b = 0, b1 b2 · · · bn · · · défini par 0 ≤ bi ≤ 8 et bi = aii pour tout i ∈ N∗


est dans A et distinct de tous les xp (b = xp entraîne bp = xp,p ) ce qui est
contradictoire. En définitive R est non dénombrable. 
Une conséquence de ce résultat est l’existence de nombres transcendants.
On rappelle qu’un réel α est algébrique s’il existe un polynôme P non nul à
coefficients entiers relatifs tel que P (α) = 0 et qu’un réel est transcendant s’il
n’est pas algébrique.
Théorème 4.25.
L’ensemble des nombres algébriques est dénombrable et il existe une in-
finité de nombres transcendants.


Preuve. En écrivant que Z [X] = Zn [X] , on déduit que Z [X] est dénom-
n∈N
brable, soit Z [X] = {Pk | k ∈ N} , les Pk étant des polynômes à coefficients
 entiers.
Il en résulte que l’ensemble des nombres réels algébriques A = Pk−1 {0} est dé-
k∈N
nombrable et l’ensemble des réels transcendants R \ A est infini non dénombrable
comme R. 
Le théorème de Liouville (théorème 9.34) permet de construire une infinité de
nombres transcendants.
Les développement décimaux illimités propres permettent de caractériser les
nombres décimaux et les nombres rationnels.
Comme x est décimal [resp. rationnel] si, et seulement si, −x l’est, il nous suffit
de considérer les réels positifs et même strictement positifs.
Théorème 4.26.
Un réel strictement positif est décimal si, et seulement si, son développe-
ment décimal illimité propre est fini, c’est-à-dire que la suite des décimales
après la virgule est nulle à partir d’un certain rang.

a
Preuve. Si x = est décimal, on a alors a = q10m + r avec 0 ≤ r < 10m
10m
r
(division euclidienne) et x = q + m . L’écriture en base 10 de r est de la forme
10
n n
rk
r = k
rk 10 avec n < m, ce qui donne x = q + = q, a1 · · · am avec
10m−k
k=0 k=0
am = r0 . La réciproque est évidente. 

Définition 4.9. On dit que le développement décimal illimité propre d’un


réel x est périodique à partir d’un certain rang s’il existe un entier p ≥ 0 et
un entier q ≥ 1 tels que x = a0 , a1 · · · ap b1 · · · bq b1 · · · bq · · · b1 · · · bq · · ·
Développement décimal d’un réel 105

Théorème 4.27.
Un réel positif x est rationnel si et seulement son développement décimal
illimité propre est périodique à partir d’un certain rang.

Preuve. Le réel x > 0 est rationnel si, et seulement si, x − [x] est rationnel. On
peut donc se limiter à x ∈ ]0, 1[ . Si le développement décimal illimité propre de
x ∈ ]0, 1[ est périodique à partir d’un certain rang, on a alors :
a1 ap b1 bq b1 bq
x= + · · · + p + p+1 + · · · + p+q + p+q+1 + · · · + p+2q + · · ·
10 10 10 10 10 10
a1 ap
soit en notant r = + ··· + p ∈ Q :
10 10
   
1 b1 bq 1 b1 bq
x=r+ p + · · · + q + p+q + ··· + q + ···
10 10 10 10 10 10

b1 bq
et en notant s = + · · · + q ∈ Q, on a :
10 10
 
s 1 1 10q s
x = r + p 1 + q + 2q + · · · = r + p ∈Q
10 10 10 10 (10q − 1)
a
Réciproquement supposons que x = avec 0 < a < b dans N. Pour tout entier
b
k compris entre 0 et b, on a la division euclidienne 10k a = bqk + rk , les restes rk
étant compris entre 0 et b−1, ces restes forment une famille de b+1 entiers à valeurs
dans un ensemble à b éléments, il y en a donc forcément deux qui sont égaux, c’est-
à-dire qu’il existe deux entiers p < q compris entre 0 et b tels que 10p a = bqp + r
10q a 10p a
et 10q a = bqq + r et b divise la différence 10q a − 10p a. On a donc − ∈N
b b
10q a 10p a
et les rationnels et ont les mêmes décimales après la virgule (unicité
b b
a
du développement décimal illimité propre). Si = 0, a1 a2 · · · an · · · on a alors :
b

⎪ 10p a
⎨ = m0 + 0, ap+1 ap+2 · · · ap+n · · ·
b
q

⎩ 10 a = m1 + 0, aq+1 aq+2 · · · aq+n · · ·
b
et il en résulte que ap+n = aq+n pour tout n ≥ 1, soit :
a
= 0, a1 · · · ap ap+1 · · · aq ap+1 · · · aq · · · ap+1 · · · aq · · ·
b
c’est-à-dire que le développement est périodique à partir du rang p + 1. 

Exemples 4.1 x = 0, 0100100010 · · · , où le nombre de 0 qui suivent le chiffre


ak = 1 est augmenté de 1 à chaque étape, est irrationnel. x = 0, 011010100010 · · · ,
où ak = 0 si k n’est pas premier et ak = 1 si k est premier, est irrationnel (exercice
4.14).
106 Suites numériques

4.4 Fractions continues


Pour tout réel x, la partie fractionnaire x − [x] est un réel dans [0, 1[ et ce réel
est nul si, et seulement si, x est un entier relatif. On peut donc définir la fonction :

ϕ: R\Z → ]1, +∞[


1
x  →
x − [x]

Pour un réel x donné dans R \ Z, on note x0 = x et x1 = ϕ (x0 ) . Si x1 est dans


R \ Z, on peut définir x2 = ϕ (x1 ) , sinon on arrête le processus. On a alors deux
cas de figure, soit il existe un entier n0 ≥ 1 tel que, pour tout entier n compris
entre 1 et n0 − 1, xn = ϕ (xn−1 ) est bien définis dans R \ Z et xn0 = ϕ (xn0 −1 )
est dans Z, soit pour tout entier n ≥ 1, le réel xn = ϕ (xn−1 ) est bien défini dans
R \ Z. Nous allons vérifier que ce processus itératif est fini si x est rationnel non
entier et infini si x est irrationnel.
p
Lemme 4.5 Soit x = un nombre rationnel avec p entier relatif non nul, q
q
entier naturel différent de 0 et 1 et premier avec p (x est rationnel non entier).
r1 r2
En notant y = ϕ (x) dans ]1, +∞[ , on a alors x = [x] + et y = [y] + avec
r0 r1
0 ≤ r2 < r1 < r0 = q dans N.

p − q [x] r1
Preuve. On a x − [x] = = ∈ ]0, 1[ ∩ Q du fait que x n’est pas entier
q r0
et nécessairement 0 < r1 < r0 = q dans N. De même :

1 r0 r0 − r1 [y] r2
y − [y] = − [y] = − [y] = = ∈ [0, 1[ ∩ Q
x − [x] r1 r1 r1

et 0 ≤ r2 < r1 . 
Théorème 4.28.
Si x est un nombre rationnel non entier, il existe alors un entier naturel
non nul n tel que la suite (xk )0≤k≤n soit définie par x0 = x et xk = ϕ (xk−1 )
pour tous k compris entre 1 et n−1, les xk étant rationnels non entiers pour
k compris entre 0 et n − 1, et xn étant entier. De plus en posant ak = [xk ]
pour tout k compris entre 0 et n, on a :
1
x = a0 +
1
a1 +
1
a2 +
1
a3 +
· · · .. 1
. an−1 +
an
Fractions continues 107

p
Preuve. On note x = avec p entier relatif non nul, q entier naturel différent
q
de 0 et 1 et premier avec q. En utilisant le lemme précédent, on a :
⎧ r1 r1

⎨ x0 = [x] + r = a0 + r
0 0

⎩ x1 = ϕ (x0 ) = [x1 ] + r2 = a1 + r2
r1 r1
avec 0 ≤ r2 < r1 < r0 = q dans N. Si x1 ∈ Z, il est alors nécessairement dans N
(x1 = ϕ (x0 ) > 1), r2 = 0 et le processus s’arrête à n = 1. Sinon en supposant
construit xj = ϕ (xj−1 ) , pour j compris entre 1 et k, n’appartenant pas à Z, avec
rj+1
k ≥ 1 et xj = aj + , 0 < rj+1 < rj dans N, on peut définir xk+1 = ϕ (xk ) et le
rj
rk+2
lemme précédent nous dit que xk+1 = ak+1 + avec 0 ≤ rk+2 < rk+1 dans N.
rk+1
La suite des rk étant strictement décroissante dans N, il existe nécessairement un
entier n ≥ 1 tel que rn > 0 et rn+1 = 0, ce qui signifie que les xj sont rationnels
non entiers pour j compris entre 0 et n − 1 et que xn est entier. On a donc :
⎧ r1

⎪ x = x0 = a0 +

⎪ r


0

⎪ 1 r0 r2



⎪ x1 = = = a1 +

⎨ . x 0 − a 0 r 1 r 1
..



⎪ 1 rn−2 rn

⎪ xn−1 = = = an−1 +

⎪ x − a r r


n−2 n−2 n−1 n−1

⎪ 1 rn−1

⎩ xn = = = an
xn−1 − an−1 rn

ce qui donne :
r1 1 1
x = a0 + = a0 + r2 = a 0 +
r0 a1 + 1
r1 a1 +
1
a2 +
1
a3 +
· · · .. 1
. an−1 +
an


rk−1 rk+1
À chaque étape, on a xk = = ak + , la partie entière ak = [xk ] étant
rk rk
obtenue en effectuant la division euclidienne de rk−1 par rk . Par exemple, pour
19
x= , on a :
7


⎪ 19 = 2 × 7 + 5, donc a0 = 2, r0 = 7, r1 = 5

7 = 1 × 5 + 2, donc a1 = 1, r2 = 2

⎪ 5 = 2 × 2 + 1, donc a2 = 2, r3 = 1

2 = 2 × 1 + 0, donc a3 = 2, r4 = 0
108 Suites numériques

19 1
ce qui donne =2+ .
7 1
1+
1
2+
2

Définition 4.10. On appelle fraction continue régulière limitée toute ex-


pression de la forme :
1
Rn = a0 +
1
a1 +
1
a2 +
1
a3 +
· · · .. 1
. an−1 +
an

où n est un entier naturel non nul, a0 un réel et, pour k compris entre 1 et
n, ak un réel non nul. On note Rn = [a0 , a1 , · · · , an ] .

Le théorème précédent s’exprime en disant que tout nombre rationnel non entier
peut s’écrire sous forme d’une fraction continue limitée à coefficients entiers. Un
tel développement n’est pas unique. En effet, si an ≥ 2, on a :

[a0 , a1 , · · · , an−1 , an ] = [a0 , a1 , · · · , an−1 , an − 1, 1]

et pour an = 1, [a0 , a1 , · · · , an−1 , 1] = [a0 , a1 , · · · , an−2 , an−1 + 1] .


Pour les fractions continues à coefficients réels, on peut remarquer que :
 
1
[a0 , a1 , · · · , an−1 , an ] = a0 , a1 , · · · , an−2 , an−1 +
an

ou plus généralement, pour m compris entre 1 et n :

[a0 , a1 , · · · , an−1 , an ] = [a0 , a1 , · · · , am−1 , [am , · · · , an ]]

Théorème 4.29.
Pour tout entier naturel non nul n et pour tout (n + 1)-uplet
Pn (a0 , · · · , an )
(a0 , a1 , · · · , an ) dans R × (R∗ ) , on a [a0 , a1 , · · · , an ] =
n
,
Qn (a0 , · · · , an )
ou Pn et Qn sont des fonctions polynomiales de a0 , · · · , an définies par les
relations de récurrence P0 = a0 , Q0 = 1, P1 = a0 a1 + 1, Q1 = a1 et pour
n≥2: 
Pn = an Pn−1 + Pn−2
(4.2)
Qn = an Qn−1 + Qn−2

1 a 0 a1 + 1 P1
Preuve. Pour n = 1, on a [a0 , a1 ] = a0 + = = . En supposant le
a1 a1 Q1
résultat acquis au rang n, pour tout (n + 1)-uplet (a0 , a1 , · · · , an ) dans R × (R∗ ) ,
n
Fractions continues 109

on a :
 
1
Rn+1 = [a0 , · · · , an+1 ] = a0 , · · · , an−1 , an +
an+1
 
1
Pn a0 , · · · , an−1 , an +
an+1
=  
1
Qn a0 , · · · , an−1 , an +
an+1
et avec l’hypothèse de récurrence, on a :
# $
1
an + an+1 Pn−1 (a0 , · · · , an−1 ) + Pn−2 (a0 , · · · , an−2 )
Rn+1 = # $
1
an + an+1 Pn−1 (a0 , · · · , an−1 ) + Pn−2 (a0 , · · · , an−2 )

soit, en notant Xk = Xk (a0 , · · · , ak ) pour X ∈ {P, Q} , k ∈ {n − 1, n − 2} :


an+1 (an Pn−1 + Pn−2 ) + Pn−1
Rn+1 =
an+1 (an Qn−1 + Qn−2 ) + Qn−1
an+1 Pn + Pn−1 Pn+1 (a0 , · · · , an+1 )
= =
an+1 Qn + Qn−1 Qn+1 (a0 , · · · , an+1 )

On peut remarquer que si les an sont strictement positifs pour n ≥ 1, alors il
en est de même des Qn pour n ≥ 0 (récurrence immédiate).
Dans le cas particulier où les ak sont entiers les quantités Pn et Qn sont égale-
ment des entiers.
Théorème 4.30.
Avec les notations précédentes, les fonctions polynomiales Pn et Qn vé-
rifient les relations :
 n−1
Pn Qn−1 − Pn−1 Qn = (−1) (n ≥ 1)
n
Pn Qn−2 − Pn−2 Qn = (−1) an (n ≥ 2)

Preuve. En éliminant an dans (4.2) on a, pour n ≥ 1 :



an Pn−1 Qn−1 = Pn Qn−1 − Qn−1 Pn−2
an Qn−1 Pn−1 = Qn Pn−1 − Pn−1 Qn−2

et Pn Qn−1 − Qn Pn−1 = − (Pn−1 Qn−2 − Qn−1 Pn−2 ) , puis par récurrence :


n−1 n−1
Pn Qn−1 − Qn Pn−1 = (−1) (P1 Q0 − Q1 P0 ) = (−1)

Toujours avec (4.2) , on obtient, pour n ≥ 2 :



Pn Qn−2 = an Pn−1 Qn−2 + Pn−2 Qn−2
Qn Pn−2 = an Qn−1 Pn−2 + Qn−2 Pn−2
n
ce qui donne Pn Qn−2 − Qn Pn−2 = an (Pn−1 Qn−2 − Qn−1 Pn−2 ) = an (−1) . 
110 Suites numériques

n−1
Dans le cas où les ak sont entiers, la relation Pn Qn−1 − Pn−1 Qn = (−1)
traduit le fait que les entiers Pn et Qn sont premiers entre eux (théorème de
Bézout).
La notion de fraction continue illimitée va nous donner un autre procédé effectif
d’approximation rationnelle des réels.
Théorème 4.31.
Si a0 est un entier relatif et (an )n≥1 une suite d’entiers naturels non
nuls, alors la suite de fractions continues limitées ([a0 , a1 , · · · , an ])n≥1 est
convergente.

pn
Preuve. On note r0 = a0 et rn = [a0 , a1 , · · · , an ] pour tout n ≥ 1 et on a rn =
qn
où (pn )n≥1 et (qn )n≥1 sont les suites d’entiers définies avec le théorème 4.29. Le
théorème 4.30 nous dit que les qn sont tous strictement positifs et :
⎧ n−1

⎪ (−1)
⎪ rn − rn−1 =
⎨ (n ≥ 1)
qn qn−1


n
(−1) an

⎩ rn − rn−2 = (n ≥ 2)
qn qn−2
Il en résulte que r2p − r2p−1 < 0, r2p − r2p−2 > 0 et r2p+1 − r2p−1 < 0 pour p ≥ 1,
ce qui signifie que la suite (r2p )p≥1 est strictement croissante, la suite (r2p+1 )p≥0
est strictement décroissante avec r2p < r2p−1 pour tout p ≥ 1. D’autre part avec
an ≥ 1 pour tout n ≥ 1, qn ≥ 1 pour tout n ≥ 0 (les an et qn sont entiers naturels
non nuls) et qn = an qn−1 + qn−2 pour n ≥ 2, on déduit que qn ≥ qn−1 + 1 et par
récurrence que qn ≥ n pour tout n ≥ 1. En conséquence on a lim qn = +∞ et
n→+∞
−1
avec r2p − r2p−1 = , on déduit que lim (r2p − r2p−1 ) = 0. En définitive,
q2 q2p−1 n→+∞
les suites (r2p )p≥1 et (r2p+1 )p≥0 sont adjacentes. Elles convergent donc vers une
même limite, ce qui signifie que la suite (rn )n≥1 est convergente. 
La limite de la suite ([a0 , a1 , · · · , an ])n≥1 est notée [a0 , a1 , · · · , an , · · · ] et on dit
que c’est une fraction continue régulière illimitée.
La démonstration précédente est en fait valable pour a0 réel et (an )n≥1 suite
de réels tous supérieurs ou égaux à 1.
On a déjà vu que tout nombre rationnel peut s’écrire comme une fraction conti-
nue limitée à coefficients entiers. Dans ce qui suit on montre que tout nombre ir-
rationnel peut s’écrire comme une fraction continue illimitée à coefficients entiers,
ce qui donnera une preuve constructive de la densité de Q dans R.
En reprenant les notations du début de ce paragraphe, on a le résultat suivant.

Lemme 4.6 Si x est un nombre irrationnel, on peut alors définir la suite (xn )n∈N
1
par x0 = x et xn = ϕ (xn−1 ) = pour tout n ≥ 1, chaque xn , pour
xn−1 − [xn−1 ]
n ≥ 1, étant irrationnel.

Preuve. Pour n = 1, on a x1 = ϕ (x0 ) puisque x0 = x n’est pas entier. De plus


x1 est irrationnel comme x0 . En supposant les xk construits et irrationnels pour k
Fractions continues 111

1
compris entre 1 et n ≥ 1, on peut définir xn+1 = et ce réel est irrationnel
xn − [xn ]
comme xn . 
Dans ce qui suit on se donne un nombre irrationnel x et on définit les suites
(xn )n∈N et (an )n∈N par x0 = x, a0 = [x0 ] , xn = ϕ (xn−1 ) et an = [xn ] pour n ≥ 1.
Les xn sont irrationnels avec xn > 1 pour tout n ≥ 1, les an sont entiers avec
pn
an ≥ 1 pour tout n ≥ 1 et rn = [a0 , a1 , · · · , an ] = , où (pn )n∈N et (qn )n∈N
qn
sont des suites d’entiers définies par les relations de récurrence p0 = a0 , q0 = 1,
p1 = a0 a1 + 1, q1 = a1 et :
pn = an pn−1 + pn−2 , qn = an qn−1 + qn−2 (n ≥ 2)
De qn = an qn−1 + qn−2 avec an positif pour n ≥ 1 et q0 , q1 positifs, on déduit
que les entiers qn sont tous positifs non nuls. On a également qn ≥ qn−1 +1, la suite
(qn )n≥1 est donc strictement croissante et par récurrence on vérifie facilement que
qn ≥ n pour tout n ≥ 1.
n−1
Des relations pn qn−1 − pn−1 qn = (−1) pour n ≥ 1 (théorème 4.30), on
déduit que les entiers pn et qn sont premiers entre eux.
1 qn−1
De ces relations on déduit que |rn+1 − rn | = = |rn − rn−1 | et avec
qn qn+1 qn+1
qn+1 = an+1 qn + qn−1 ≥ qn + qn−1 > 2qn−1 on obtient :
|rn − rn−1 |
|rn+1 − rn | < (n ≥ 1)
2
pn−1 xn + pn−2
Lemme 4.7 Pour tout entier n supérieur ou égal à 2, on a x = .
qn−1 xn + qn−2
Preuve. On procède par récurrence sur n ≥ 2. Pour n = 2, on a :
p 1 x 2 + p0 P1 (a0 , a1 ) x2 + P0 (a0 ) P1 (a0 , a1 , x2 )
= =
q1 x2 + q0 Q1 (a0 , a1 ) x2 + Q0 (a0 ) Q1 (a0 , a1 , x2 )
1
= [a0 , a1 , x2 ] = a0 +
1
a1 +
x2
1 1 1
avec x2 = ϕ (x1 ) = , ou encore a1 + = x1 = , ce qui donne
x1 − a1 x2 x − a0
p1 x2 + p0 1
= a0 + = x. En supposant le résultat acquis au rang n ≥ 2, on a :
q1 x 2 + q0 x1
pn xn+1 + pn−1 Pn (a0 , · · · , an ) xn+1 + Pn−1 (a0 , · · · , an−1 )
=
qn xn+1 + qn−1 Qn (a0 , · · · , an ) xn+1 + Qn−1 (a0 , · · · , an−1 )
Pn (a0 , · · · , an , xn+1 )
= = [a0 , · · · , an , xn+1 ]
Qn (a0 , · · · , an , xn+1 )
 
1
= a0 , · · · , an−1 , an +
xn+1
1
avec an + = xn , ce qui donne :
xn+1
pn xn+1 + pn−1 pn−1 xn + pn−2
= [a0 , · · · , an−1 , xn ] = =x
qn xn+1 + qn−1 qn−1 xn + qn−2
112 Suites numériques


Théorème 4.32.
1 1
Pour x irrationnel, on a |rn − x| < 2
≤ 2 pour tout n ≥ 1 et :
qn n

x = lim [a0 , a1 , · · · , an ] = [a0 , a1 , · · · , an , · · · ]


n→+∞

pn−1 an + pn−2
Preuve. Pour n ≥ 2, on a rn = et, avec le lemme 4.7 et le
qn−1 an + qn−2
théorème 4.30, on déduit que :
pn−1 an + pn−2 pn−1 xn + pn−2 (pn−1 qn−2 − pn−2 qn−1 ) (an − xn )
rn − x = − =
qn−1 an + qn−2 qn−1 xn + qn−2 (qn−1 an + qn−2 ) (qn−1 xn + qn−2 )
n
(−1) (an − xn )
=
(qn−1 an + qn−2 ) (qn−1 xn + qn−2 )
Puis avec 0 ≤ xn − an < 1 (an = [xn ]), qn−1 an + qn−2 = qn ≥ n (récurrence) et
1 1
qn−1 xn + qn−2 ≥ qn−1 an + qn−2 = qn , on déduit que |rn − x| ≤ 2 ≤ 2 et que
qn n
lim rn = x. 
n→+∞
Dans la démonstration du théorème 4.31, on a vu que la suite (r2p )p≥1 est
strictement croissante et la suite (r2p+1 )p≥0 est strictement décroissante, ce qui
implique que r2p < x < r2p+1 pour tout p ≥ 1.

Exemples 4.2

1. Pour x = 2, on a :
⎧ √ 6√ 7

⎪ x0 = 2, a0 = 2 =1



⎨ x =√ 1 √ 6√ 7
1 = 2 + 1, a1 = 2+1 =2
2−1

⎪ √ 6√ 7

⎪ 1

⎩ x2 = √ = 2 + 1, a2 = 2+1 =2
2+1 −2

et par récurrence, xn = 2 + 1, an = 2 pour tout n√≥ 1. Ce qui donne le
développement en fraction continue régulière illimitée 2 = [1, 2, 2, · · · , 2, · · · ]
√ pn
et les approximations rationnelles de 2, [1, 2, 2, · · · , 2] = où les suites
qn
(pn )n∈N et (qn )n∈N sont définies par les relations de récurrence :

pn = 2pn−1 + pn−2 , qn = 2qn−1 + qn−2 (n ≥ 2)

avec p0 = q0 = 1 et p1 = 3, q1 = 2 pour valeurs initiales. Pour n allant de 1 à


5 on obtient les approximations :
⎧ √ 3 √ 7 √ 17

⎨ 2  = 1.5, 2  = 1.4 ; 2  = 1.4166 · · · 6 · · ·
2 5 12
⎩ √2  41 = 1.41379310344828 · · · ; √2  99 = 1.41428571428571 · · ·

29 70
Fractions continues 113

5+1
2. Le nombre d’or est défini par ϕ = et on a :
2
1
x0 = ϕ, a0 = [ϕ] = 1, x1 = = ϕ, a1 = [ϕ] = 1
ϕ−1
puis par récurrence, xn = ϕ, an = 1 pour tout n √ ≥ 0. Ce qui donne le dévelop-
pement en fraction continue régulière illimitée, 2 = [1, 1, 1, · · · , 1, · · · ] et les
pn
approximations rationnelles de ϕ, [1, 1, 1, · · · , 1] = où les suites (pn )n∈N et
qn
(qn )n∈N sont définies par les relations de récurrence :

pn = pn−1 + pn−2 , qn = qn−1 + qn−2 (n ≥ 2)

avec p0 = q0 = 1 et p1 = 2, q1 = 1 pour valeurs initiales. On a donc qn = Fn ,


pn = Fn+1 , où (Fn )n∈N est la suite de Fibonacci définie par Fn = Fn−1 + Fn−2
Fn+1 1
pour n ≥ 2 et F0 = F1 = 1. On a donc ϕ − < 2 pour tout n ≥ 1.
Fn Fn
pn
Chaque rn = [a0 , a1 , · · · , an ] =
est une approximation du nombre irrationnel
qn
x et cette approximation a le plus petit numérateur et le plus petit dénominateur
pour une précision donnée. De manière plus précise, on a le résultat suivant.
Théorème 4.33.
p
Soit x un nombre irrationnel positif. Si r = est une fraction rationnelle
q
irréductible (p, q premiers entre eux dans N∗ ) telle que |x − r| ≤ |x − rn |
pour un entier n ≥ 0, on a alors p ≥ pn et q ≥ qn .

p0
Preuve. Pour n = 0, on a r0 = = [x] et avec :
q0
x − r ≤ |x − r| ≤ |x − r0 | = x − [x]

on déduit que p ≥ r ≥ [x] = p0 et q ≥ 1 = q0 . Supposons que n ≥ 1. Si r = rn


alors le résultat est évident. Si r = rn+1 , on a alors :

p = pn+1 = an+1 pn + pn−1 ≥ pn
q = qn+1 = an+1 qn + qn−1 ≥ qn

(pour x > 0, les an sont entiers naturels non nuls, donc les suites (pn )n∈N et
(qn )n∈N sont croissantes). Si r est dans l’intervalle ouvert d’extrémités rn et rn+1 ,
1 q
on a alors 0 < |r − rn | < |rn+1 − rn | = , soit 1 ≤ |pqn − pn q| < et
qn qn+1 qn+1
q ≥ qn+1 ≥ qn . D’autre part, pour n pair [resp. n impair] on a rn < r < rn+1
[resp. rn+1 < r < rn ] ce qui entraîne pqn ≥ pn q + 1 ≥ pn qn+1 + 1 = pn+1 qn
n
(pn+1 qn −pn qn+1 = (−1) = 1) et p ≥ pn+1 ≥ pn [resp. pqn+1 > pn+1 q ≥ pn+1 qn+1
et p ≥ pn+1 ≥ pn ]. Il reste à considérer le cas où r est en dehors de l’intervalle
fermé d’extrémités rn et rn+1 . Si n est pair alors rn < r < rn+1 et les conditions
r∈/ [rn , rn+1 ] , |x − r| ≤ |x − rn | entraînent r > rn+1 ≥ rn et avec r − x ≤ x − rn
114 Suites numériques

rn−1 − rn
on a r ≤ 2x − rn < 2rn+1 − rn puis tenant compte de rn+1 − rn < ,
2
on déduit que r < rn−1 . En définitive, r est dans l’intervalle ]rn , rn−1 [ et ce qui
précède nous dit que p ≥ pn , q ≥ qn . Le cas où n est impair se traite de manière
analogue. 

4.5 Sous-groupes additifs de R

Définition 4.11. On dit qu’un sous-groupe H de (R, +) est discret si son


intersection avec toute partie bornée de R est finie (éventuellement vide),
ce qui revient à dire que pour tout réel R > 0, l’ensemble H ∩ [−R, R] est
fini.

Théorème 4.34.
Les sous-groupes additifs de R discrets sont les sous-groupes monogènes,
à savoir de la forme Zα = {pα | p ∈ Z} où α est un réel. Un tel sous-groupe
est fermé dans R.

Preuve. Il est clair qu’un sous-groupes monogènes H = Zα de (R, +) est discret.


En effet pour α = 0, on a H = {0} et pour α = 0 toute partie bornée K de R est
contenue dans un intervalle [a, b] avec a < b et il n’y a qu’un nombre fini d’entiers
p vérifiant a ≤ pα ≤ b. Réciproquement si H est un sous-groupe discret de (R, +)
non réduit à {0} , il existe alors un réel a dans H ∩ R+,∗ (0 = a ∈ H ⇒ −a ∈ H) et
]0, a] ∩ H est fini non vide, il admet donc un plus petit élément α > 0. De α ∈ H
on déduit que Zα ⊂ H. De#plus, pour tout x ∈ H il existe un entier relatif k tel
x$
que 0 ≤ x−kα < α (k = E ) et avec x−kα ∈ H ∩[0, a[ on déduit du caractère
α
minimal de α que x − kα = 0, soit x = kα ∈ Zα. On a donc en définitive H = Zα.
Un tel sous-groupe est fermé dans R puisque R \ Zα = ]kα, (k + 1) α[ est
k∈Z
ouvert comme réunion d’ouverts. 
Théorème 4.35.
Un sous-groupe additif de R est dense ou discret.

Preuve. Soit H un sous-groupe additif de R. Si H = {0} , il est alors discret,


sinon l’ensemble K = H ∩ R+,∗ est minoré par 0, donc admet une borne inférieure
α. Si α est strictement positive, elle est alors dans K. En effet dans le cas contraire,
par définition de la borne inférieure, on peut trouver x ∈ K tel que α < x < 2α
(on a supposé que α ∈ / H). Pour la même raison, on peut trouver y ∈ K tel que
α < y < x. On a alors 0 < x−y < α avec x−y ∈ H ∩R+,∗ , ce qui est contradictoire
avec la définition de la borne inférieure α. On a donc α ∈ K et avec la structure de
groupe additif de H, on déduit alors que H = Zα, c’est-à-dire que H et discret. En
effet, on a Zα ⊂ H du fait que α appartient au groupe H et pour tout x dans H,
il existe k dans Z tel que 0 ≤ x − kα < α, donc x − kα = 0 et x ∈ Zα, c’est-à-dire
Sous-groupes additifs de R 115

que H ⊂ Zα. Si α = 0, alors H est dense dans R. En effet pour x < y dans R,
y x
il existe z dans H ∩ R+,∗ tel que 0 < z < y − x soit 1 < − , donc l’intervalle
8x y 9 8x y 9 z z
, contient au moins un entier et pour n ∈ , ∩ Z, on a x < nz < y avec
z z z z
nz ∈ H. 
La démonstration précédente montre en fait le résultat suivant : si G est un
sous-ensemble de R stable par addition contenant au moins un élément strictement
positif et au moins un élément strictement négatif, il est alors dense ou discret.
Le.théorème précédent peut / être utilisé pour prouver la densité de l’ensemble
a
D = | (a, m) ∈ Z × N des nombres décimaux et de l’ensemble Q des ra-
10m
tionnels dans R. Ces deux ensembles sont des sous-groupes additifs de R. Si D
[resp. Q] est discret il existe alors un réel strictement positif α ∈ D [resp. α ∈ Q]
α 5α α
tel que D = Zα [resp. Q = Zα] et avec = ∈ D [resp. ∈ Q] on déduit
2 10 2
α
qu’il existe un entier relatif k tel que = kα, ce qui est impossible (2k = 1 dans
2
Z). Il en résulte que D [resp. Q] est dense dans R. On peut aussi remarquer que
1
inf (D ∩ R+,∗ ) = 0 (pour tout ε > 0, il existe un entier n ≥ 0 tel que 0 < n < ε).
10
Le théorème précédent peut aussi être utilisé pour obtenir des critères d’irra-
tionalité.
2
Corollaire 4.4. Soit  (a, b) ∈ (R∗ ) et H = Za + Zb =
2
pa + qb | (p, q) ∈ Z le sous-groupe additif de R engendré par a et b. H est
a
discret [resp. dense] si, et seulement si, est rationnel [resp. irrationnel].
b

Preuve. Si H est discret, il existe alors α ∈ R+,∗ tel que H = Zα, donc a = pα,
a p
b = qα avec p et q non nuls dans Z et en conséquence = ∈ Q. Réciproquement,
b q
a p
en supposant = rationnel avec p et q entiers premiers entre eux dans Z∗ ,
 b q
p b
on a H = Z + Z b = (Zp + Zq) et le théorème de Bézout nous dit que
q q
a
Zp + Zq = Z, donc H = Z est discret. 
p
Dans le cas particulier où a et b sont des entiers relatifs, on a H = Z (a ∧ b) par
définition du pgcd .

Corollaire 4.5. Soient n ≥ 2 un entier naturel, (ak )1≤k≤n ∈ (R∗ ) et


n
 n )
 n 
H = Zak = pk ak | (pk )1≤k≤n ∈ Z n
le sous-groupe additif de R
k=1 k=1
engendré par les ak . Les assertions suivantes sont équivalentes :
1. H est discret ;
2. H est fermé ;
aj
3. pour tous j = k compris entre 1 et n, est rationnel.
ak
116 Suites numériques

Preuve. (1) ⇒ (2) Si H est discret, il est alors fermé.


aj
(2) ⇒ (3) S’il existe deux indices j = k compris entre 1 et n tels que soit
ak
irrationnel, le groupe Hj,k = Zaj + Zak est alors dense dans R et il en est de
même de H qui contient Hj,k , ce qui implique que H ne peut être fermé car il est
dénombrable, alors que R ne l’est pas.
aj
(3) ⇒ (1) Si tous les , pour j = k compris entre 1 et n sont rationnels, on
ak
vérifie alors par récurrence sur n ≥ 2 que H est discret. En effet c’est vrai pour
n
n = 2 et supposant le résultat acquis pour n − 1 ≥ 2, on a Zak = Zαn−1 + Zan
k=1

n−1
αn−1  ak
n−1
où αn−1 = pk ak , les pk étant entiers et comme = pk est rationnel,
an an
k=1 k=1
le groupe H est discret. 

Corollaire 4.6. Un réel θ est irrationnel si et seulement si il existe deux


suites (pn )n∈N et (qn )n∈N d’entiers relatifs telles que qn θ − pn = 0 pour tout
n ∈ N et lim (qn θ − pn ) = 0.
n→+∞

Preuve. Si θ ∈ R est irrationnel, le groupe Hθ = Zθ+Z est alors dense dans R et 0


est limite d’une suite de points de Hθ , ce qui signifie qu’il existe deux suites (pn )n∈N
et (qn )n∈N d’entiers relatifs telles que lim (qn θ − pn ) = 0. Comme θ ∈ / Q, on a
n→+∞
qn θ − pn = 0 pour tout n ∈ N. Réciproquement, soit θ ∈ R pour lequel il existe
deux suites (pn )n∈N et (qn )n∈N d’entiers relatifs telles que qn θ − pn = 0 pour
p
tout n ∈ N et lim (qn θ − pn ) = 0. Si θ = avec p et q entiers relatifs on a
n→+∞ q
alors qn p − pn q = q (qn θ − pn ) = 0 dans Z, donc |qn p − pn q| ≥ 1 et |qn θ − pn | =
1 1
|qn p − pn q| ≥ , ce qui est en contradiction avec lim (qn θ − pn ) = 0. En
|q| |q| n→+∞
conclusion, on a θ ∈ / Q. 
L’étude des sous-groupes additifs de R peut également être appliquée à l’étude
des fonctions périodiques (voir le paragraphe 6.3).
Pour l’étude des sous-groupes additifs de Rn , on peut consulter [23].

4.6 Moyennes de Cesàro


Pour ce paragraphe, (E, ·) est un espace vectoriel normé réel ou complexe.
Pour rester dans le cadre des suites numériques, on peut se placer sur (K, |·|) avec
K = R ou K = C.
Si (un )n∈N est une suite d’éléments de (E, ·) qui converge vers  ∈ E, les un
seront proches de  pour n assez grand et il semble naturel qu’il en soit de même
1
n−1
des moyennes arithmétiques uk . C’est ce que nous dit le théorème de Cesàro.
n
k=0
Un peu plus généralement, on a le résultat suivant.
Moyennes de Cesàro 117

Théorème 4.36. Cesàro


+∞

Soit (αn )n∈N une suite de réels strictement positifs telle que αn =
n=0
+∞. Si (un )n∈N est une suite convergente d’éléments de (E, ·) [resp. une

n−1
suite réelle divergente vers −∞ ou +∞], on a alors en notant An = αk
  k=0
1 
n−1

pour tout entier n ∈ N , lim αk uk = lim (un ) .
n→+∞ An n→+∞
k=0

1 
n−1

Preuve. Notons pour tout entier n ∈ N , vn = αk uk (suite des moyennes
An
k=0
pondérées de Cesàro).
Dans le cas où (un )n∈N est une suite d’éléments de (E, ·) convergente vers
 ∈ E, on a :
∀ε > 0, ∃n0 ∈ N | ∀n ≥ n0 , un −  < ε
donc pour tout n > n0 :
n−1 
 
1  
vn −  =  αk (uk − )
An  
k=0
n 
1 

 
0 n−1
 1
≤  αk (uk − ) + αk uk − 
An   An
k=0 k=n0 +1

C0 1 
n−1
C0
≤ + αk ε ≤ +ε
An An An
k=n0 +1

C0
Si de plus lim (An ) = +∞, on a alors lim = 0 et on peut trouver un
n→+∞ n→+∞ An
entier n1 > n0 tel que vn −  ≤ 2ε pour tout n ≥ n1 . D’où le résultat annoncé.
Dans le cas où (un )n∈N est une suite réelle divergente vers −∞ ou +∞, quitte
à remplacer (un )n∈N par (−un )n∈N , on peut supposer que lim (un ) = +∞. On
n→+∞
a alors :
∀M > 0, ∃n0 ∈ N | ∀n ≥ n0 , un > M
donc pour tout n > n0 :

1  1  
n−1 n0 n−1
1
vn = α k uk = α k uk + α k uk
An An An
k=0 k=0 k=n0 +1
C0 An − An0 C0 − An0 M
> + M =M+
An An An
118 Suites numériques
 
C0 − An0 M
avec lim = 0 et on peut alors trouver un entier n1 > n0 tel
n→+∞ An
C 0 − An0 M M M
que >− pour tout n ≥ n1 , ce qui nous donne vn > pour tout
An 2 2
n ≥ n1 , et le résultat annoncé. 
Ce théorème est souvent utilisé en considérant les moyennes arithmétiques,
c’est-à-dire avec la suite (αn )n∈N stationnaire sur 1. Précisément, on a :
     
1
n−1
lim (un ) =  ⇒ lim uk =
n→+∞ n→+∞ n
k=0

Définition 4.12.On dit qu’une suite (un )n∈N d’éléments de (E, ·)
 n−1 
1
converge au sens de Cesàro vers  ∈ E, si la suite uk est
n ∗ k=0 n∈N
convergente vers .

n
En considérant les suites réelles définies par αn = 1 et un = (−1) , on voit que
la réciproque du théorème de Cesàro est fausse. Toutefois, on a le résultat suivant.
Théorème 4.37.
 
1
Une suite (un )n∈N dans (E, ·) telle que un − un−1 = est o
n→+∞ n
convergente si, et seulement si, elle est convergente au sens de Cesàro.

Preuve. La condition nécessaire est déjà prouvé (que la suite (n (un − un−1 ))n∈N
converge vers 0 ou non). Pour tout entier n ∈ N∗ , on a :


n 
n 
n 
n 
n−1
k (uk − uk−1 ) = kuk − kuk−1 = kuk − (k + 1) uk
k=1 k=1 k=1 k=1 k=0

n−1
= nun − uk
k=0

1 1
n−1 n
(transformation d’Abel), soit un − uk = k (uk − uk−1 ) , ce qui donne
n n
k=0 k=1
en appliquant le théorème de Cesàro à la suite (n (un − un−1 ))n∈N∗ (qui converge
 
1
n−1
vers 0), lim un − uk = 0 et dans le cas où (un )n∈N converge au sens de
n→+∞ n
k=0
Cesàro vers , on en déduit que lim un = . 
n→+∞
Le théorème précédent est encore valable pour une suite réelle divergente vers
−∞ ou +∞.
Ce théorème est un cas particulier du théorème suivant.
Moyennes de Cesàro 119

Théorème 4.38. Hardy


 
1
Une suite (un )n∈N dans (E, ·) telle que un − un−1 = O est
n→+∞ n
convergente si, et seulement si, elle est convergente au sens de Cesàro.

Preuve. On a déjà la condition nécessaire (que (n (un − un−1 ))n∈N soit bornée
1
n−1
ou non). En notant vn = uk pour tout entier n ∈ N∗ , on a pour m > n :
n
k=0

1  1  1 
n−1 m−1 m−1
n
vm = uk + uk = v n + uk
m m m m
k=0 k=n k=n

et :

1 
m−1
n
u m − v m = um − vn − uk
m m
k=n

n 1 
m−1
m−n
= um − vn − (uk − um ) − um
m m m
k=n

1 
m−1
n
= (um − vn ) + (um − uk )
m m
k=n

1 
m−1
n n
soit um − vm = (um − vm ) + (vm − vn ) + (um − uk ) , ou encore :
m m m
k=n

1 
m−1
m−n n
(um − vm ) = (vm − vn ) + (um − uk )
m m m
k=n

1 
m−1
n
donc um − vm = (vm − vn ) + (um − uk ) . Dans le cas où la suite
m−n m−n
k=n
(n (un − un−1 ))n∈N est bornée, en désignant par M un majorant de cette suite, on
a pour m > n et k compris entre n et m − 1 :

m 
m
1 m−k m−n
um − uk  ≤ uj − uj−1  ≤ M ≤M ≤M
j k+1 n+1
j=k+1 j=k+1

ce qui nous donne :

M  m−n
m−1
n
um − vm  ≤ vm − vn  +
m−n m−n n+1
k=n
n m−n
≤ vm − vn  + M
m−n n+1
120 Suites numériques

Dans le cas où la suite (vn )n∈N est convergente, elle est en particulier de Cauchy,
1
donc pour tout réel ε > 0, on peut trouver un entier n0 > (ce choix sera justifié
ε
plus loin) tel que :
∀m > n ≥ n0 , vm − vn  < ε2
ce qui donne :
n m−n
∀m > n ≥ n0 , um − vm  ≤ ε2 + M
m−n n+1
Pour m > n0 assez grand, on cherche un entier n compris entre n0 et m tel que
n 1 m−n m−ε m
< et < ε, ou encore <n< . Pour ce faire, il suffit de
m−n ε n+1   ε + 1 ε +1
m−ε
prendre n tel que n = E + 1 où m est choisi tel que m > n0 + ε (n0 + 1) .
ε+1
m−ε m−ε m+1
En effet, on a n − 1 ≤ < n, donc n ≤ +1 = < m puisque
ε+1 ε+1 ε+1
1 m−ε
m > n0 > et n > ≥ n0 si m > ε (n0 + 1) + n0 . On a donc pour ε > 0
ε ε+1  
m−ε
donné et m > n0 + ε (n0 + 1) , en prenant n = E +1 :
ε+1
n m−n
um − vm  ≤ ε2 + M < (M + 1) ε
m−n n+1
On a ainsi prouvé que lim (um − vm ) = 0 et lim um = lim vm = . 
m→+∞ m→+∞ m→+∞
Le théorème précédent est encore valable pour une suite réelle divergente vers
−∞ ou +∞.

4.7 Limites supérieure et inférieure


Soit (un )n∈N une suite réelle bornée. Pour tout n ∈ N, on pose vn = sup up et
p≥n
wn = inf up .
p≥n
La suite (un )n∈N étant bornée, il en est de même de chaque ensemble En =
{up | p ≥ n} et en conséquence En admet une borne supérieure vn et une borne
inférieure wn (ce qui justifie la définition des suites (vn )n∈N et (wn )n∈N ) et on a
wn = inf (En ) ≤ vn = sup (En ) .

Lemme 4.8 La suite (vn )n∈N est décroissante minorée et la suite (wn )n∈N crois-
sante majorée.

Preuve. La suite (un )n∈N étant bornée, en notant m = inf un et M = sup un ,


n∈N n∈N
on a :
∀n ∈ N, ∀p ≥ n, m ≤ up ≤ M
c’est-à-dire que, pour tout n ∈ N, m est un minorant de En et M un majorant de
En , ce qui entraîne :

∀n ∈ N, m ≤ wn = inf (En ) ≤ vn = sup (En ) ≤ M


Limites supérieure et inférieure 121

Les suites (vn )n∈N et (wn )n∈N sont donc bornées. En écrivant, pour tout n ∈ N,
que En+1 ⊂ En = {un } ∪ En+1 , on déduit que :

wn = inf (En ) ≤ wn+1 = inf (En+1 )
vn+1 = sup (En+1 ) ≤ vn = sup (En )

c’est-à-dire que (vn )n∈N est décroissante et (wn )n∈N croissante. 


On en déduit que ces deux suites sont convergentes et on note :

lim sup un = lim vn , lim inf un = lim wn


n→+∞ n→+∞ n→+∞ n→+∞

ces limites étant respectivement appelées la limite supérieure et la limite inférieure


de la suite (un )n∈N . On les note aussi parfois lim (un ) et lim (un ) . On a donc :
n→+∞ n→+∞
   
1 = lim inf un = sup inf up , 2 = lim sup un = inf sup up
n→+∞ n∈N p≥n n→+∞ n∈N p≥n

Lemme 4.9 Avec les notations qui précèdent, 1 et 2 sont des valeurs d’adhérence
de la suite (un )n∈N .

Preuve. De 1 = sup (wn ) avec (wn )n∈N croissante, on déduit que pour tout réel
n∈N
ε > 0 il existe un entier nε tel que :

∀n ≥ nε , 1 − ε < wn = inf up ≤ 1
p≥n

et par définition de la borne inférieure, pour tout n ≥ nε , il existe un entier p ≥ n


tel que wn ≤ up < wn + ε ≤ 1 + ε. On a donc montré que pour tout réel ε > 0
et tout entier n ∈ N, il existe un entier p ≥ n tel que 1 − ε < up < 1 + ε (pour
ε donné, on a soit n ≥ nε et on trouvé un tel entier p ≥ n, soit 0 ≤ n < nε
et on prend alors p qui correspond à nε ). On peut alors extraire de (un )n∈N une
sous-suite qui converge vers 1 en procédant comme suit : prenant ε = 1 et n = 0,
1
on a p = ϕ (0) ≥ 0 tel que 1 − 1 < uϕ(0) < 1 + 1, puis pour ε = et n = ϕ (0) + 1
2
1 1
on a p = ϕ (1) > ϕ (0) tel que 1 − < uϕ(1) < 1 + et continuant ainsi de
2 2
suite on construit une suite strictement croissante d’entiers naturels (ϕ (n))n∈N
1 1
telle que 1 − < uϕ(n) < 1 + (les entiers ϕ (0) < · · · < ϕ (k) étant
n+1 n+1
1
construit en prenant ε = et n = ϕ (k) + 1 on obtient ϕ (k + 1)). On a alors
k+2
lim uϕ(n) = 1 .
n→+∞
On montre de manière analogue que 2 est valeur d’adhérence de (un )n∈N . 

Lemme 4.10 Pour toute valeur d’adhérence  de (un )n∈N , on a 1 ≤  ≤ 2 .


C’est-à-dire que lim sup un est plus grande valeur d’adhérence et lim inf un la plus
n→+∞ n→+∞
petite valeur d’adhérence de la suite bornée (un )n∈N .
122 Suites numériques

Preuve. Soit  = lim uϕ(n) une valeur d’adhérence de la suite (un )n∈N où
n→+∞
(ϕ (n))n∈N est une suite strictement croissante d’entiers naturels (l’existence de
valeurs d’adhérence d’une suite bornée est assurée par le théorème de Bolzano-
Weierstrass). En passant à la limite dans l’encadrement :

∀n ∈ N, wϕ(n) ≤ uϕ(n) ≤ vϕ(n)

on obtient l’encadrement 1 ≤  ≤ 2 . 
Dans le cas où la suite (un )n∈N n’est pas bornée, soit elle n’est pas majorée et
+∞ est valeur d’adhérence, soit elle n’est pas minorée et −∞ est valeur d’adhé-
rence. Donc une suite réelle a toujours des valeurs d’adhérence dans R et on peut
définir sa limite supérieure [resp. inférieure] dans R comme la plus grand [resp.
petite] de ses valeurs d’adhérence.
Théorème 4.39.
La suite (un )n∈N converge si, et seulement si, lim inf un = lim sup un .
n→+∞ n→+∞

Preuve. Si la suite (un )n∈N est convergente, sa limite  est l’unique valeur d’adhé-
rence et 1 = 2 . Réciproquement, si 1 = 2 , toute valeur d’adhérence de (un )n∈N
étant comprise entre 1 et 2 , il ne peut y en avoir qu’une et comme (un )n∈N est
bornée, elle est nécessairement convergente (théorème 4.12). 

4.8 Exercices

Exercice 4.1. Cet exercice nous fournit une démonstration relativement


simple de la densité de Q dans R. Montrer que pour tout réel x, la suite
2
n
réelle définie par un = 2 [kx] , où [·] désigne la partie entière, converge
n
k=1
vers x. En déduire la densité de Q dans R.

Solution. Pour tout entier k compris entre 1 et n, on a 0 ≤ kx − [kx] < 1, donc


n 
n
n (n + 1)
n
0≤ kx − [kx] = x− [kx] < n
2
k=1 k=1 k=1

n+1 2
ce qui nous donne 0 ≤ x − un < et en conséquence, lim un = x. Les un
n n n→+∞
étant des nombres rationnels, la densité de Q dans R s’en suit.

Exercice 4.2. Montrer qu’une suite à valeurs dans Z converge si, et


seulement si, elle est stationnaire.
Exercices 123

Solution. Soit (un )n∈N une suite à valeurs dans Z convergente vers  ∈ R. Il
existe un entier n0 tel que :
1
∀n ≥ n0 , |un − un0 | ≤ |un − | + | − un0 | <
2
ce qui implique que un = un0 pour tout n ≥ n0 , puisque les un sont entiers. La
suite (un )n∈N est donc stationnaire et  ∈ Z. La réciproque est évidente.

Exercice 4.3. Soit (un )n∈N une suite de réels positifs.


1
1. On suppose que un+1 ≤ un + 2 pour tout n ∈ N∗ . Montrer que (un )n∈N
n
est convergente.
2. On suppose qu’il existe λ ∈ [0, 1[ et une suite (εn )n∈N de réels positifs
tels que un+1 ≤ λun + εn pour tout n ∈ N et lim εn = 0. Montrer que
n→+∞
lim un = 0.
n→+∞

Solution.
1 1 1 1
1. Pour tout n ∈ N∗ , on a un+1 ≤ un + 2 ≤ un + = un + − , donc
  n n (n − 1) n − 1 n
1
la suite un + est décroissante minorée par 0 et en conséquence
n − 1 n≥2
convergente, ce qui entraîne la convergence de (un )n∈N .
2. Par récurrence, on a pour tout entier n0 ∈ N :

∀n ≥ n0 , un+1 ≤ λn−n0 +1 un0 + λn−n0 εn0 + λn−n0 −1 εn0 +1 + · · · + λεn−1 + εn

Pour tout réel ε > 0, on peut trouver un entier n0 tel que :

∀n ≥ n0 , 0 ≤ εn < ε, 0 ≤ λn−n0 +1 < ε

ce qui nous donne pour n ≥ n0 :

0 ≤ un+1 ≤ λn−n0 +1 un0 + λn−n0 + λn−n0 −1 + · · · + λ + 1 ε


 
1 − λn−n0 +1 1
≤ εun0 + ε ≤ un0 + ε
1−λ 1−λ
et prouve que lim un = 0.
n→+∞

Exercice 4.4. Étudier les suites (sin (nθ))n∈N , (cos (nθ))n∈N , einθ n∈N
et (tan (n))n∈N , où θ est un réel fixé.

Solution. Pour θ = kπ avec k ∈ Z, on a pour tout n ∈ N, sin (nθ) = 0 et


nk
cos (nθ) = einθ = (−1) , donc la suite (sin (nθ))n∈N est convergente et les suites
(cos (nθ))n∈N , einθ n∈N sont convergentes pour k pair et divergentes pour k im-
pair. On suppose donc que θ ∈/ πZ.
124 Suites numériques

1. Si lim (sin (nθ)) = , avec sin ((n + 1) θ) + sin ((n − 1) θ) = 2 sin (nθ) cos (θ) ,
n→+∞
on déduit alors que 2 = 2 cos (θ) et  = 0 puisque cos (θ) = 1 pour θ ∈ /
πZ. Puis avec sin ((n + 1) θ) = cos (nθ) sin (θ) + sin (nθ) cos (θ) , on déduit que
lim (cos (nθ) sin (θ)) = 0, qui entraîne lim (cos (nθ)) = 0 puisque sin (θ) =
n→+∞ n→+∞
0 pour θ ∈ / πZ, ce qui est incompatible avec cos2 (nθ) + sin2 (nθ) = 1. Donc
(sin (nθ))n∈N diverge.
2. Si lim (cos (nθ)) = , avec cos ((n + 1) θ) = cos (nθ) cos (θ) − sin (nθ) sin (θ) ,
n→+∞
 (cos (θ) − 1)
on déduit que lim sin (nθ) = , ce qui contredit la divergence de
n→+∞ sin (θ)
(sin (nθ))n∈N . Donc (cos (nθ))n∈N diverge.
3. Si einθ converge, il en est alors de même de e−inθ n∈N , ce qui entraîne
n∈N  inθ 
e + e−inθ
la convergence de (cos (nθ))n∈N = , soit une impossibilité.
2 n∈N
Donc einθ n∈N diverge.
2 tan (n)
4. Avec sin (2n) = , on déduit que si lim (tan (n)) = , on a alors
1 + tan2 (n) n→+∞
2
lim sin (2n) = , ce qui n’est pas possible d’après ce qui précède. Donc
n→+∞ 1 + 2
(tan (n))n∈N diverge.

Exercice 4.5. Étudier la suite géométrique (an )n∈N pour a ∈ C.

Solution. Pour a = 0, la suite est stationnaire sur 0. Pour |a| > 1, la formule
n
du binôme de Newton nous dit que |an | ≥ 1 + n (|a| − 1) , donc lim |a| = +∞
n→+∞
n 1
et la suite (a )n∈N diverge. Pour 0 < |a| < 1, en écrivant que |a| = #
n $n avec
1
|a|
1
> 1, on déduit que lim an = 0. Pour |a| = 1, on a a = eiθ avec θ ∈ [0, 2π[ .
|a| n→+∞
Pour θ = 0, on a a = 1, donc (an )n∈N est stationnaire 1, pour θ = π, on a a = −1 et
(an )n∈N est divergente (deux valeurs d’adhérence distinctes), pour θ ∈ ]0, 2π[\{π} ,
(an )n∈N diverge d’après l’exercice précédent.

n
Exercice 4.6. Montrer que la suite (un )n∈N = n(−1) n∈N
admet 0
comme unique valeur d’adhérence et est divergente.

1
Solution. De lim u2n+1 = lim = 0, on déduit que 0 est une valeur
n→+∞ 2n + 1
n→+∞
d’adhérence de (un )n∈N . Si  = lim uϕ(n) est une valeur d’adhérence non nulle
n→+∞
de (un )n∈N , où ϕ : N → N est strictement croissante, on a alors  > 0 et :

ϕ(n)
|ln ()| = lim ln uϕ(n) = lim (−1) ϕ (n) = lim ϕ (n) = +∞
n→+∞ n→+∞ n→+∞
Exercices 125

ce qui est impossible. Donc 0 est l’unique valeur d’adhérence de (un )n∈N . Cette
suite est divergente puisque non majorée (u2n = 2n).

 
pn
Exercice 4.7. Soit x un nombre irrationnel. Montrer que si
qn n∈N
est une suite de nombres rationnels convergente vers x, où pour tout n ∈ N,
pn est un entier relatif et qn un entier naturel non nul, on a lim qn = +∞
n→+∞
et lim pn = +∞ pour x > 0, lim pn = −∞ pour x < 0.
n→+∞ n→+∞

Solution. Dire que la suite (qn )n∈N ne converge pas vers l’infini signifie qu’il existe
une réel α > 0 tel que pour tout entier n ∈ N, il existe un entier kn > n tel que
0 < qkn ≤ α. On peut alors extraire de (qn )n∈N une sous-suite qϕ(n) n∈N à valeurs
dans [0, α] comme suit : pour n = 0 il existe ϕ (0) > 0 tel que 0 < qϕ(0) ≤ α et en
supposant construits les entiers ϕ (0) < ϕ (1) < · · · < ϕ (n) tels que 0 < qϕ(k) ≤ α
pour tout k compris entre 0 et n, on peut trouver ϕ (n + 1) > ϕ (n) tel que
0 < qϕ(n+1) ≤ α. De cette suite bornée on peut alors extraire une sous-suite
pψ(n)
qψ(n) n∈N qui converge vers un entier q ≥ 1, mais alors avec pψ(n) = qψ(n) ,
qψ(n)
on déduit que la suite pψ(n) n∈N est également convergente et sa limite p = xq est
pn
également un entier, ce qui est en contradiction avec x irrationnel. Avec pn = qn
qn
pn
et lim = x = 0, on déduit que lim pn = ±∞, le signe étant celui de x.
n→+∞ qn n→+∞

Exercice 4.8. Montrer que les suites (un )n∈N et (vn )n∈N définies par
n
1 1
un = et vn = un + pour tout n ∈ N convergent vers la même
k! n!
k=0
limite irrationnelle notée e.

Solution.
1. Il est clair que (un )n∈N est croissante et pour n ≥ 1, on a :

1 1 1 n−1
vn+1 − vn = + − =− ≤0
(n + 1)! (n + 1)! n! (n + 1)!
 
1
donc (vn )n≥1 est décroissante. Avec lim (vn − un ) = lim = 0, on
n→+∞ n→+∞ n!
déduit que ces suites sont adjacentes. Elles convergent donc vers la même limite
e > 0 (on a e ≥ u0 = 1).
p
2. Supposons que e = où p, q sont deux entiers strictement positifs premiers
q
entre eux. Pour tout n > q, le nombre pn = n! (r − un ) = n! lim (um − un )
m→+∞
126 Suites numériques

est un entier strictement positif et on a :


1 1 1
0 < n! (um − un ) = + + ··· +
n + 1 (n + 2) (n + 1) m · · · (n + 1)
1
1 1 1 1 1 − (n+1)m−n
≤ + + · · · + =
n + 1 (n + 1)2 (n + 1)
m−n
n + 1 1 − n+1 1

1 1 1 1
≤ 1 = ≤
n + 1 1 − n+1 n 2

pour m > n ≥ 2, ce qui implique que 0 < pn < 1, soit une impossibilité sur N.
3. Les encadrements un ≤ e ≤ vm , nous permettent de donner des valeurs appro-
chées de e par défaut et par excès. Par exemple, pour n = m = 10, on obtient
u10 ≈ 2.7183 ≤ e ≤ v10 ≈ 2.7183, avec une majoration de l’erreur d’approxi-
1
mation donnée par 0 ≤ e − u10 ≤ v10 − u10 = ≈ 2.755 · 10−7 . On peut aussi
10!
1
utiliser la suite v = (vn )n≥1 définie par vn = un + (les suites u et v sont
n · n!
encore adjacentes) et on a en fait :
1
0 ≤ e − u10 ≤ v10 − u10 = ≈ 2.755 · 10−8
10 · 10!

Exercice 4.9. Montrer que les suites réelles (un )n∈N et (vn )n∈N définies
n
1 n
1
par un = − ln (n) et vn = − ln (n + 1) convergent vers une même
k k
k=1 k=1
limite γ (la constante d’Euler).

1
Solution. La fonction t → étant décroissante positive sur R+,∗ , on a pour tout
t
entier n ∈ N∗ :
 n+1  
1 1 1
un+1 − un = − (ln (n + 1) − ln (n)) = − dt < 0
n+1 n n+1 t

donc la suite (un )n∈N∗ est strictement décroissante. De manière analogue, pour
n ≥ 1, on a :
   n+2  
1 n+2 1 1
vn+1 − vn = − ln = − dt
n+1 n+1 n+1 n+1 t
 n+2
t − (n + 1)
= dt > 0
n+1 (n + 1) t

c’est-à-dire que (vn )n∈N est croissante. Puis avec :


  
n+1
lim (un − vn ) = lim ln = ln (1) = 0
n→+∞ n→+∞ n
Exercices 127

on conclut que ces deux suites sont adjacentes et en conséquence convergentes vers
une même limite γ. Les encadrements vn ≤ γ ≤ um , nous permettent de donner
des valeurs approchées de γ. Par exemple, pour n = m = 10, on obtient :

v10  0.53107 ≤ γ ≤ u10  0.62638

Exercice 4.10. Soient 0 < a < b deux réels et (un )n∈N , (vn )n∈N les
suites définies par u0 = a, v0 = b et :

⎪ 2
⎨ un+1 = 1 1 (moyenne harmonique)
∀n ∈ N, un + vn

⎩ vn+1 = un + vn (moyenne arithmétique)
2

Montrer que ces suites convergent vers la même limite ab (moyenne géo-
métrique).√Pour b = 1, ces suites nous donnent des approximations numé-
riques de a.

Solution. On vérifie facilement, par récurrence, que un > 0 et vn > 0 pour tout
un − v n
n ∈ N. Pour n ∈ N, on a vn+1 − vn = avec u0 − v0 = a − b < 0 et pour
2
n≥1:
2
2un−1 vn−1 un−1 + vn−1 (un−1 − vn−1 )
un − v n = − =− ≤0
un−1 + vn−1 2 2 (un−1 + vn−1 )

Il en résulte que (vn )n∈N est décroissante. Avec :

2un vn un (vn − un )
un+1 − un = − un =
un + vn un + v n
on déduit que (un )n∈N est croissante. Enfin avec un > 0 on obtient :
2
(un − vn ) vn − un
0 ≤ vn+1 − un+1 = ≤
2 (un + vn ) 2
b−a
et par récurrence, 0 ≤ vn − un ≤ , ce qui implique que lim (vn − un ) = 0.
2n n→+∞
Les suites (un )n∈N et (vn )n∈N sont adjacentes et en conséquence convergent vers
une même limite λ ≥ 0. D’autre part avec un+1 vn+1 = un vn , on déduit que
√ un vn =

u0 v0 pour tout n et λ2 = u0 v0 . Donc lim un = lim vn = u0 v0 = ab.
n→+∞ n→+∞

Exercice 4.11. Soient 0 < a < b deux réels et (un )n∈N et (vn )n∈N les
suites définies par u0 = a, v0 = b et :
 √
un+1 = un vn (moyenne géométrique)
∀n ∈ N, un + vn
vn+1 = (moyenne arithmétique)
2
128 Suites numériques

Montrer que ces suites convergent vers une même limite. Cette limite est
appelée moyenne arithmético-géométrique de a et b.

Solution. On vérifie facilement, par récurrence, que un > 0 et vn > 0 pour tout
√ un + v n
n ∈ N. De l’inégalité un+1 = un vn ≤ = vn+1 , on déduit que un ≤ vn ,
2
√ un + vn
un ≤ un vn = un+1 et vn+1 = ≤ vn pour tout n ∈ N. Donc la suite
2
(un )n∈N est croissante et (vn )n∈N est décroissante. Enfin avec :
vn − u n
0 ≤ vn+1 − un+1 ≤ vn+1 − un =
2
b−a
on déduit par récurrence sur n ≥ 0 que 0 ≤ vn −un ≤ et lim (vn − un ) = 0.
2n n→+∞
Les suites (un )n∈N et (vn )n∈N sont donc adjacentes et en conséquence convergent
π
vers une même limite  > 0. On peut montrer que cette limite est  = ,
2 · E (a, b)
où E (a, b) est l’intégrale elliptique définie par :
 +∞
dt
E (a, b) =
0 (t + a2 ) (t2 + b2 )
2

(voir l’épreuve 1 du Capes Externe 1995).

Exercice 4.12. Soient 0 < a < b deux réels et (un )n∈N et (vn )n∈N les
suites définies par u0 = a, v0 = b et :

⎨ un+1 = un + vn
∀n ∈ N, 2
⎩ √
vn+1 = un+1 vn

sin (θ)
Montrer que ces suites convergent vers la même limite  = b où
θ
a
cos (θ) = .
b

Solution. On vérifie par récurrence, que


∀n ∈ N, 0 < un < un+1 < vn+1 < vn
Pour n = 0, on a 0 < u0 = a < b = v0 et :
5 &
u 0 + v0 u0 + v0
u1 = > u0 > 0, v1 = v0 < v02 = v0
2 2

√ √ √ u1
v 1 − u1 =u1 ( v 0 − u1 ) = √ √ (v0 − u1 )
v 0 + u1
√   √  
u1 u0 + v 0 u1 v 0 − u0
=√ √ v0 − =√ √ > 0.
v 0 + u1 2 v 0 + u1 2
Exercices 129

On a donc bien 0 < u0 < u1 < v1 < v0 . En supposant le résultat acquis au rang
n ≥ 0, on a :
un+1 + vn+1
un+2 = > un+1 > 0
2
5 &
un+1 + vn+1 2
vn+2 = vn+1 < vn+1 = vn+1 > 0
2

√ √ √ un+2
vn+2 − un+2 = un+2 vn+1 − un+2 = √ √ (vn+1 − un+2 )
vn+1 + un+2
√  
un+2 un+1 + vn+1
=√ √ vn+1 −
vn+1 + un+2 2
√  
un+2 vn+1 − un+1
=√ √ > 0.
vn+1 + un+2 2

La suite (un )n∈N est donc croissante et la suite (vn )n∈N est décroissante. La der-
nière égalité donne pour n ≥ 0 :
√  
un+1 v n − un v n − un
0 < vn+1 − un+1 = √ √ <
vn + un+1 2 2

b−a
et par récurrence 0 < vn − un ≤ , ce qui entraîne lim (vn − un ) = 0. Les
2n n→+∞
suites (un )n∈N et (vn )n∈N sont donc adjacentes et en conséquence convergent
8 π 9vers
a
une même limite  > 0. Comme 0 < < 1, il existe un unique réel θ ∈ 0, tel
b 2
que a = b cos (θ) . On a donc u0 = b cos (θ) et v0 = b. Pour n = 1, on a ;
 
u0 + v 0 b (1 + cos (θ)) 2 θ
u1 = = = b cos
2 2 2
 
√ θ
et v1 = u1 v0 = b cos . De même pour n = 2, on a :
2
     
u1 + v 1 θ 1 + cos θ2 θ 2 θ
u2 = = b cos = b cos cos
2 2 2 2 22
   
√ θ θ
et v2 = u2 v1 = b cos cos . Par récurrence, on vérifie que pour tout
2 22
n ≥ 1, on a :
       
θ θ θ 2 θ
un = b cos cos · · · cos cos
2 22 2n−1 2n
130 Suites numériques
       
θ θ θ θ
et vn = b cos cos 2
· · · cos n−1
cos . En effet, c’est vrai pour
2 2 2 2n
n = 1 et le supposant acquis pour n ≥ 1, on a :
un + vn
un+1 =
2
       
θ θ θ θ 1 + cos 2θn
= b cos cos · · · cos cos
2 22 2n−1 2n 2
       
θ θ θ θ
= b cos cos · · · cos cos2
2 22 2n 2n+1
       
√ θ θ θ θ
et vn+1 = un+1 vn = b cos cos · · · cos cos . On a donc
2  22 2n 2n+1
2n θ
pour tout n ≥ 1, vn = b cos k
. En remarquant que :
k=1 2
 
θ cos θ2 sin (θ)
cos = sin (θ) θ θ
=
2 2 sin 2 cos 2 2 sin θ2

     
θ θ sin (θ) θ
cos cos 2
= cos
2 2 2 sin 2θ 22
 
sin (θ) θ cos 2θ2 sin (θ)
= sin =
2 sin θ2 2 2 sin 2θ2 cos θ
22 22 sin 2θ2

b sin (θ)
on vérifie facilement par récurrence que, pour tout n ≥ 1, on a vn = n .
  2 sin 2θn
θ θ b sin (θ)
Puis avec sin n
 n
, on déduit que lim un = lim vn = .
2 n→+∞ 2 n→+∞ n→+∞ θ
1 π
Pour a = √ , b = 1, on a θ = et ces suites donnent des approximations
2 √ 4
2 2
numériques de .
π

Exercice 4.13. Montrer que pour tout n ∈ N∗ , le premier


√ chiffre après
la virgule du développement décimal illimité propre de n2 + n est 4.
6 √ 7 6√ 7
Solution. Ce premier chiffre est a1 = 10 n2 + n − 10 n2 + n . Puis avec
√ 1 6√ 7 √
n < n2 + n < n+ , on déduit que n2 + n = n et avec 10n+4 ≤ 10 n2 + n <
6 √ 2 7
10n+5 que 10 n2 + n = 10n+4. Le résultat en découle alors. Une autre solution

consiste à utiliser des développements limités en 0 de 1 + x.

Exercice 4.14.
1. Montrer que le réel x = 0, 0100100010 · · · , où le nombre de 0 qui suivent
le chiffre ak = 1 est augmenté de 1 à chaque étape, est irrationnel.
Exercices 131

2. Montrer qu’il n’est pas possible de trouver un polynôme P non constant


à coefficients entiers relatifs tel que P (n) soit premier pour tout entier
n assez grand.
3. Montrer que le réel x = 0, 011010100010 · · · , où ak = 0 si k n’est pas
premier et ak = 1 si k est premier, est irrationnel.

Solution.
+∞
 1
1. On a x = avec p0 = 2 et pour k ≥ 1, pk = pk−1 + k + 2, soit :
10pk
k=0

k (k + 1) (k + 1) (k + 4)
pk = p0 + 1 + 2 + · · · + k + 2k = + 2 (k + 1) =
2 2
Si x est rationnel, alors son développement décimal est de la forme :

x = a 0 , a 1 · · · a p b1 · · · b q b1 · · · b q · · · b 1 · · · b q · · ·

avec l’un des bj = 1 pour j compris entre 1 et q et à partir du rang p + 1 l’écart


entre deux 1 consécutifs serait majoré, ce qui contredit pk − pk−1 = k + 2 pour
tout k ∈ N.
 p
2. Soit P (X) = ak X k , avec p ≥ 1, les coefficients aj étant entiers relatifs et le
k=0
coefficient ap entier naturel non nul. Supposons qu’il existe un entier naturel non
nul n0 tel que P (n) soit premier pour tout n ≥ n0 . Avec lim P (n) = +∞,
n→+∞
on déduit qu’il existe un entier n ≥ n0 tel que m = P (n) ≥ 2, mais alors pour
tout j ≥ 0 l’entier :


p
j

p
P (n + jm) = ak (n + jm) = ak nj + mq = m (q + 1)
k=0 k=0

est premier et produit de deux entiers au moins égaux à 2, ce qui est impossible.
3. Si x est rationnel, alors son développement décimal est de la forme :

x = a 0 , a 1 · · · a p b1 · · · b q b1 · · · b q · · · b 1 · · · b q · · ·

avec l’un des bj = 1 pour j compris entre 1 et q, ce qui signifie que p + j + kq


est premier pour tout k ≥ 0 ou encore que la fonction polynomiale P (X) =
p + j + qX est telle que P (k) est premier pour tout entier naturel k, ce qui est
impossible.

Exercice 4.15. Avec cet exercice on se propose de montrer que l’ensemble


D∗ des nombres décimaux inversibles est dense dans R.
1. Montrer que H = Z ln (2) + Z ln (5) est dense dans R.
132 Suites numériques

2. Soit x0 un réel strictement positif. Montrer que pour tout réel ε > 0 il
existe un réel η > 0 tel que x > 0 et |ln (x) − ln (x0 )| < η entraînent
|x − x0 | < ε.
3. Montrer que D∗ est dense dans R.

Solution.
1. Si H n’est pas dense dans R, il est nécessairement discret, c’est-à-dire qu’il
existe un réel α tel que H = Zα. Il existe alors des entiers relatifs p, q, r tels que
ln (5) ln (5) a
α = p ln (2) + q ln (5) et ln (2) = rα, ce qui entraîne ∈ Q, soit =
ln (2) ln (2) b
avec a, b entiers naturels non nuls et 5b = 2a , ce qui est impossible.
2. Se déduit de la continuité de la fonction exponentielle en ln (x0 ) .
3. Il s’agit de montrer que pour tout réel x0 et tout réel ε > 0 il existe un décimal
inversible d tel |x0 − d| < ε. On rappelle que les décimaux inversibles s’écrivent
d = ±2p 5q avec p, q entiersrelatifs.
 Pour x0 = 0, cela se déduit immédiatement
1 1
de lim n = 0, la suite étant à valeurs dans D∗ . Pour x0 > 0, du
n→+∞ 2 2n n≥1
fait de la densité de H dans R, pour tout réel η > 0 on peut trouver deux entiers
relatifs p, q tels que |p ln (2) + q ln (5) − ln (x0 )| < η, soit |ln (2p 5q ) − ln (x0 )| < η
et avec le résultat de la deuxième question on déduit que pour tout réel ε > 0
on peut trouver d = 2p 5q dans D∗ tel que |x0 − d| < ε. Enfin pour x0 < 0 et
ε > 0, si d ∈ D∗ est tel que |−x0 − d| < ε, en posant d = −d ∈ D∗ , on a
|x0 − d | < ε.

Exercice 4.16. On note Γ = {z ∈ C | |z| = 1} le cercle unité dans le plan


complexe.
1. Montrer que l’ensemble des valeurs d’adhérence de ein n∈N
est Γ.
2. Montrer que l’ensemble des valeurs d’adhérence de (cos (n))n∈N est
[−1, 1] .

Solution.
1. Comme 2π est irrationnel, le groupe H = Z2π + Z est dense dans R. Avec la
2π-périodicité, la continuité et la surjectivité de l’application f : x → eix de R
sur Γ, on déduit alors que l’ensemble :
. / 
f (H) = e(2πm+n)i | (m, n) ∈ Z × Z = ein | n ∈ Z

est dense dans Γ, ce qui signifie l’ensemble des valeurs d’adhérence de la suite
ein n∈N est Γ.
2. Avec la continuité et la surjectivité de la projection p : z →  (z) de Γ sur
[−1, 1] , on déduit que l’ensemble {cos (n) | n ∈ Z} est dense dans [−1, 1] , puis
par parité que l’ensemble {cos (n) | n ∈ N} est dense dans [−1, 1] , ce qui signifie
l’ensemble des valeurs d’adhérence de la suite (cos (n))n∈N est [−1, 1] .
Exercices 133

Exercice 4.17. Soit (qn )n∈N une suite d’entiers naturels non nuls telle
que :
— pour tous k, n dans N tels que k ≤ n, qk divise qn ;
1
— la série de terme général est convergente et le reste d’ordre n,
qn
+∞
 1 1
Rn = , est négligeable devant .
qk qn
k=n+1
+∞
 1
1. Montrer que θ = est irrationnel.
qk
k=0
+∞
 1
2. Montrer que e = est irrationnel.
k!
k=0
1
3. Montrer que la série de terme général est convergente et que sa
22 k − 1
somme est irrationnelle.
1
4. Montrer que la série de terme général (nombres de Fermat) est
+1 22k
convergente et que sa somme est irrationnelle.

Solution.
n
1
1. Pour tout entier naturel n, on note pn = qn . Pour tout n ∈ N, on a
qk
k=0
pn ∈ N∗ (qn est un entier multiple de qk pour tout k compris entre 0 et n) et :
0 < qn θ − pn = qn Rn
1
avec lim qn Rn = 0 (Rn est négligeable devant ), ce qui implique que θ est
n→+∞ qn
irrationnel (théorème 4.6).
2. Le résultat précédent avec qk = k! nous donne l’irrationalité de e. En effet, il
est clair que qk divise qn pour k compris entre 0 et n, le critère de d’Alembert
+∞
 1
nous assure la convergence de la série et enfin :
k!
k=0
+∞
 +∞

 1 1  1
Rn = = 1+
k! (n + 1)! (n + 2) · · · (n + k)
k=n+1 k=2

1 1
avec ≤ pour tout k ≥ 2 nous donne :
(n + 2) · · · (n + k) k!
 
1 1
0 < Rn ≤ e= o
(n + 1)! n→+∞ n!
k
3. On prend ici qk = 22 − 1 pour tout k ∈ N. Avec :
k k
qk 22 − 1 22 1
0< = 2k+1  2k+1 = < 1
qk+1 2 −1 2 4
134 Suites numériques

+∞
 1
on déduit que la série est convergente (critère de d’Alembert). Avec :
qk
k=0

xkp − 1 = xk − 1 Q (x)

on déduit que si k divise n alors xk − 1 divise xn − 1 et en particulier, qk divise


qn pour tout k compris entre 0 et n.
On vérifie facilement par récurrence que pour tous k, n dans N on a :
n+k
# n+1 $k
22 − 1 ≥ 22 −1

ce qui implique que :


+∞
  
1 1 1 1
Rn ≤ = ∼ = o
22n+1 − 1
k 22n+1 − 2 n→+∞ 22n+1 n→+∞ 22n − 1
k=1

+∞
 1
On peut donc conclure à l’irrationalité de θ = 2k − 1
.
k=0
2
+∞

1
4. En utilisant le critère de d’Alembert, on vérifie que la série ϕ = est
k=0
+1 22k
convergente. Puis avec θ−ϕ = 2 (θ − 1) , on déduit que ϕ = 2−θ est irrationnel.

Exercice 4.18. Soient (un )n∈N une suite réelle monotone et (vn )n∈N∗ la
1
n−1
suite de ses moyennes de Cesàro définie par vn = uk pour tout n ∈ N∗ .
n
k=0

1. Montrer que la suite (vn )n∈N est monotone de même sens de variation
que (un )n∈N .
2. Montrer que lim un =  dans R = R ∪ {−∞ + ∞} si, et seulement si,
n→+∞
lim vn = .
n→+∞

Solution. Remplaçant éventuellement (un )n∈N par (−un )n∈N , on suppose que
cette suite est croissante.
n un 1
1. On a vn+1 = vn + = vn + (un − vn ) , soit :
n+1 n+1 n+1
 
1
n−1
1 1
vn+1 − vn = (un − vn ) = un − uk
n+1 n+1 n
k=0
  n−1 
1 
n−1
1 
= nun − uk = (un − uk ) ≥ 0
n (n + 1) n (n + 1)
k=0 k=0

ce qui signifie que (vn )n∈N est croissante.


Exercices 135

2. La condition nécessaire est le théorème de Cesàro. Comme (un )n∈N est crois-
sante elle a une limite  dans R donc (vn )n∈N a la même limite (théorème de
Cesàro) et lim vn =  entraîne  =  .
n→+∞

Exercice 4.19. Soit (un )n∈N une suite d’éléments d’un espace normé
(E, ·) .
1. Montrer que si lim (un+1 − un ) =  (avec  éventuellement infini pour
n→+∞
1
une suite réelle), on a alors lim un = .
n→+∞ n
2. Soit (γn )n∈N une suite réelle strictement
 croissante non majorée avec
1
γ0 > 0. Montrer que si lim (un+1 − un ) =  ( éven-
n→+∞ γn+1 − γn
 
1
tuellement infini pour une suite réelle), on a alors lim un = .
n→+∞ γn

Solution.
1
n−1
1 1
1. Il suffit d’écrire que un = (uk+1 − uk ) + u0 et d’utiliser le théorème
n n n
k=0
de Cesàro.
2. Soit (αn )n∈N la suite réelle définie par αn = γn+1 − γn . Comme (γn )n∈N est
strictement croissante avec γ0 > 0, les suites (γn )n∈N et (αn )n∈N sont à va-
leurs strictement positives. Side plus (γn )n∈N est non majorée, elle diverge
n
alors vers +∞ et on a lim αk = lim (γn+1 − γ0 ) = +∞. En écri-
n→+∞ n→+∞
k=0

n−1
αk 1
1
vant que (uk+1 − uk ) = (un − u0 ) , on déduit du

n−1
αk k=0 γ k+1 − γ k γ n − γ0
k=0  
1
théorème de Cesàro que si lim (un+1 − un ) = , on a alors
n→+∞ γn+1 − γn
1 1
lim (un − u0 ) = , soit lim un =  car lim γn = +∞.
n→+∞ γn − γ0 n→+∞ γn − γ0
  n→+∞
1 1 1
Avec un  un , on déduit que lim un = .
γn − γ0 n→+∞ γn n→+∞ γn

Exercice 4.20. Soient α > 0 et (un )n∈N la suite de réels définie par
1
u0 > 0 et un+1 = un + α pour tout n ∈ N.
un
1. Montrer que lim un = +∞.
n→+∞
2. Montrer que pour tout β > 0 on a
  
β 1
uβn+1 = uβn 1 + α+1 + o
un n→+∞ uα+1
n
136 Suites numériques

3. Donner un équivalent de un à l’infini.

Solution.
1. La suite (un )n∈N est strictement croissante (par récurrence). Si elle était bornée,
1
elle serait alors convergente de limite  vérifiant  = + α , ce qui est impossible

pour α > 0. Donc lim un = +∞.
n→+∞
 β   
1 β 1
2. On a uβn+1 = uβn 1 + α+1 = uβn 1 + α+1 + o puisque
un un n→+∞ uα+1 n
1
lim = 0.
n→+∞ uα+1n
3. Pour β = α + 1, on a lim uα+1 n+1 − un
α+1
= α + 1. Le théorème de Cesàro
n→+∞
uα+1 1
entraîne alors que lim n
= α + 1, soit que un ∼ ((α + 1) n) α+1 .
n→+∞ n n→+∞

Exercice 4.21. Soit (un )n∈N une suite numérique telle


 que un soit non
un+1
nul à partir d’un certain rang. Montrer que si lim = , on a
# $ n→+∞ un
alors lim n
|un | = . La réciproque est-elle vraie ?
n→+∞

Solution. On peut supposer,  quitte à réindéxer la suite, 


que tous les
 un sont
un+1 un+1
non nuls. Si lim =  ≥ 0, on a alors lim ln = λ où
n→+∞ un n→+∞ un
λ = ln () pour  réel et λ = −∞ pour  = 0, soit lim (ln |un+1 | − ln |un |) = λ
n→+∞
et en utilisant le théorème de Cesàro, on obtient :
 n−1   
1 1
lim (ln |uk+1 | − ln |uk |) = lim (ln |un | − ln |u0 |) = λ
n→+∞ n n→+∞ n
k=0
# # $$ # $
ce qui est encore équivalent à lim ln n |un | = λ ou à lim n
|un | =
n→+∞ n→+∞
eλ = . La réciproque est fausse comme le montre l’exemple de la suite (un )n∈N
définie par :  n n
a 2 b 2 si n est pair
un = n+1 n−1
a 2 b 2 si n est impair
avec 0 < a < b. On a :
⎧ 1 √
√ ⎨ a n2 b n2 n = ab si n est pair √
n
un = # n+1 n−1 $ n1 √ # a $ 2n 1 → ab
⎩ a 2 b 2 = ab si n est impair n→+∞
b
et : ⎧ n+2 n

⎪ a 2 b2
un+1 ⎨ n n = a si n est pair
= an+1
2 b2
n+1
un ⎪
⎪ a 2 b 2 = b si n est impair
⎩ n+1 n−1
a 2 b 2
Exercices 137
 
un+1
donc n’a pas de limite
un n∈N

Exercice 4.22. Soit (un )n∈N une suite de réels strictement positifs qui
converge vers .
⎛  n1 ⎞
(
n−1
1. Montrer que la suite ⎝ uk ⎠ des moyennes géométriques
k=0
n∈N∗
converge vers .
⎛ ⎞
⎜ n ⎟
2. Montrer que la suite ⎜
⎝ n−1
⎟ des moyennes harmoniques
% 1 ⎠
k=0 uk n∈N∗
converge vers .

Solution.
1. Si lim (un ) =  ≥ 0, on a alors lim (ln (un )) = ln () ∈ [−∞, +∞[
n→+∞
 n−1 
n→+∞

1 
et en conséquence lim ln (uk ) = μ avec μ = ln () pour  réel
n→+∞ n
k=0 ⎛ ⎛  n1 ⎞⎞
(
n−1
et μ = −∞ pour  = 0. On a donc lim ⎝ln ⎝ uk ⎠⎠ = μ et
n→+∞
k=0
⎛  n1 ⎞
(
n−1
lim ⎝ uk ⎠ = eμ = .
n→+∞
k=0
1 1
2. On a lim = ∈ [0, +∞] et le théorème de Cesàro nous assure que
n→+∞un 
1 
n−1
1 1 n
lim = , ou encore que lim n−1 = . En utilisant l’encadre-
n→+∞ n uk  n→+∞ % 1
k=0
k=0 uk
ment Hn ≤ Gn ≤ An , où Hn , Gn et An désigne respectivement les moyennes
harmonique, géométrique et arithmétique de la suite (un )n∈N , la convergence
de (Gn )n∈N∗ vers  se déduit de celle des suites (Hn )n∈N∗ et (An )n∈N∗ .

Exercice 4.23. Soient (un )n∈N∗ et (vn )n∈N∗ deux suites numériques
convergentes respectivement vers  et  . Montrer que la suite (wn )n∈N∗
1
n
définie par wn = uk vn−k pour tout n ∈ N∗ , converge vers  .
n
k=1

Solution. On a, pour tout n ≥ 1 :


1 1
n n
wn −  = (uk vn−k −  ) = (uk (vn−k −  ) +  (uk − ))
n n
k=1 k=1
138 Suites numériques

sup |un | 
| | 
n n
 n∈N∗ 
et |wn −  | ≤ |vn−k −  | + |uk − | (la suite (un )n∈N∗ est
n n
k=1 k=1
bornée puisque convergente). On conclut alors avec le théorème de Cesàro.

Exercice 4.24. Soient (un )n∈N et v = (vn )n∈N deux suites réelles bor-
nées.
1. On suppose que un ≤ vn pour tout n ∈ N. Montrer que :

lim inf (un ) ≤ lim inf (vn ) et lim sup un ≤ lim sup vn
n→+∞ n→+∞ n→+∞ n→+∞

2. Comparer lim inf (un + vn ) et lim inf (un ) + lim inf (vn ) . Donner un
n→+∞ n→+∞ n→+∞
exemple de suites (un )n∈N , (vn )n∈N telles que l’égalité n’ait pas lieu.

Solution.
1. Si un ≤ vn pour tout n ∈ N, on a alors inf un ≤ un ≤ vn pour tout m ∈ N
n≥m
et tout n ≥ m, donc inf un ≤ inf vn pour tout m ∈ N et passant à la limite
n≥m n≥m
quand m tend vers l’infini, on en déduit que lim inf (un ) ≤ lim inf (vn ) . De
n→+∞ n→+∞
manière analogue, on vérifie que lim sup un ≤ lim sup vn .
n→+∞ n→+∞
2. Pour tout m ∈ N et tout n ≥ m, on a inf un + inf vn ≤ un + vn , donc
n≥m n≥m
inf un + inf vn ≤ inf (un + vn ) et passant à la limite quand m tend vers
n≥m n≥m n≥m
l’infini, on en déduit que lim inf (un ) + lim inf (vn ) ≤ lim inf (un + vn ) . Pour
n→+∞ n→+∞ n→+∞
n
(un )n∈N = ((−1) )n∈N et (vn )n∈N = −u, on a lim inf (un ) = lim inf (vn ) = −1
n→+∞ n→+∞
et lim inf (un + vn ) = 0, donc l’égalité n’a pas lieu.
n→+∞
Chapitre 5

Vitesse et accélération de la
convergence des suites
réelles

Pour tout ce chapitre, on désigne par (xn )n∈N une suite réelles qui converge
vers un réel  et telle que xn =  pour tout n ∈ N.

5.1 Vitesse de convergence


 
xn+1 − 
Si la suite converge, sa limite est alors nécessairement dans
xn −  n∈N
xn+1 − 
[0, 1] . En effet, dans le cas contraire, on a lim > 1 et la suite (xn )n∈N
n→+∞ xn − 
diverge (théorème 4.6).
 
xn+1 − 
Définition 5.1. Si la suite est convergente de limite λ,
xn −  n∈N
on dit alors que la convergence de la suite (xn )n∈N vers  est :
— lente, pour λ = 1 ;
— géométrique de rapport λ, pour λ ∈ ]0, 1[ ;
— rapide pour λ = 0.

On dit que le réel λ qui intervient dans la définition précédente, quand il existe,
est le coefficient de convergence de la suite (xn )n∈N .
Dans le cas où λ ∈ ]0, 1[ (convergence géométrique), pour tout ε > 0 tel que
0 < λ + ε < 1, on peut trouver un entier naturel nε tel que :
xn+1 − 
∀n ≥ nε , 0 < <λ+ε
xn − 
ce qui nous donne pour n ≥ nε :
n−nε |xnε − | n
|xn − | < (λ + ε) |xnε − | = n (λ + ε)
(λ + ε) ε
140 Vitesse et accélération de la convergence des suites réelles

n
donc la suite (|xn − |)n≥nε est dominée par la suite géométrique ((λ + ε) )n≥nε .

Exemples 5.1
1. Le nombre e peut être défini comme la limite de la suite (xn )n∈N∗ définie par
 n
1
xn = 1 + pour tout n ∈ N∗ . Le développement limité à l’ordre 2 de
n   
1 1
ln (1 + x) au voisinage de 0 nous donne xn = e 1 − + o , ou
2n n→+∞ n
e e − xn+1
encore e − xn ∼ et lim = 1, ce qui signifie que la conver-
n→+∞ 2n n→+∞ e − xn
gence est lente.
e
2. En utilisant la suite (yn )n∈N = (x2n )n∈N , on a e − yn ∼ et en consé-
n→+∞ 2n+1
e − yn+1 1
quence, lim = , c’est-à-dire que la convergence est géométrique.
n→+∞ e − yn 2
On a ainsi accéléré la convergence de la suite (xn )n∈N∗ .
3. De manière plus générale, dès que l’on a un développement asymptotique de la
forme xn = +βλn + o (λn ) avec β non nul et λ dans ]−1, 1[ , la convergence
n→+∞
de la suite (xn )n∈N vers  est géométrique de rapport |λ| . En considérant les
λn
suites (nλn )n∈N ou , on constate que la réciproque est fausse.
n n∈N∗
 n 
1
4. La convergence de la suite (xn )n∈N = vers e est rapide. En effet,
k!
k=0 n∈N
la formule de Taylor-Lagrange nous dit que pour tout n ∈ N∗ , il existe un réel
e cn
cn ∈ ]0, 1[ tel que e − xn = , ce qui nous donne :
n!
e − xn+1 1 ecn+1 1
0< = < e → 0
e − xn n+1 e c n n + 1 n→+∞
et la convergence est rapide.
+∞
 1
5. Considérons la somme d’une série de Riemann ζ (p) = p
où p est un réel
n=1
n
strictement supérieur à 1. Pour tout n ∈ N∗ , on a :

n +∞

1 1
ζ (p) − xn = ζ (p) − =
kp kp
k=1 k=n+1
 k+1
1 dt 1
Des encadrements p ≤ ≤ p , on déduit que :
(k + 1) k tp k
 +∞
1 1 1
∀n ≥ 2, ζ (p) − xn ≤ dt = ≤ ζ (p) − xn−1
n t p p−1n p−1

ou encore :
1 1
∀n ∈ N∗ , p−1 ≤ (p − 1) (ζ (p) − xn ) ≤ (5.1)
(n + 1) np−1
Vitesse de convergence 141

1 1 ζ (p) − xn+1
ce qui nous donne ζ (p) − xn ∼ et lim = 1,
n→+∞ p − 1 np−1 n→+∞ ζ (p) − xn
c’est-à-dire que la convergence est lente.

Il ne faut pas croire au vu de l’exemple 2. que l’on peut toujours accélérer


la convergence d’une suite (on précisera
 cette
 notion  au paragraphe
  suivant) par
1 1 1
extraction. Par exemple les suites , et
ln (n) n≥2 n
ln (2 ) n≥1 ln (n2 ) n≥2
convergent toutes lentement.  Par contre un développement asymptotique de la
β 1
forme xn =  + p + o avec β non nul et p > 0 qui assure une conver-
n n→+∞ np
 
β 1
gence lente nous donne x2n =  + np + o qui assure une convergence
2 n→+∞ 2np
1
géométrique de rapport p de la suite extraite (x2n )n∈N .
2
1 2
En considérant la suite définie par x2p = et x2p+1 = , on constate
2p 2p + 1
qu’une suite convergente n’a pas nécessairement de vitesse de convergence. En
2
effet, avec |xn | ≤ pour tout n ≥ 1, on voit que cette suite converge vers 0 et
n
avec : ⎧ 2n
xn+1 ⎨ n+1 si n = 2p
= n
xn ⎩ si n = 2p + 1
2 (n + 1)
 
xn+1
on voit que la suite est divergente. Cet exemple montre également
xn n∈N
C
qu’une majoration du type |xn − | ≤ p avec p > 0, ne permet pas nécessairement
n
d’avoir des informations sur la vitesse de convergence de la suite.
De même en considérant la suite définie par x2p = λ2p et x2p+1 = 2λ2p+1 , où
0 < λ < 1, on a |xn | ≤ 2λn → 0 et avec :
n→+∞


xn+1 ⎨ 2λ si n = 2p
=
xn ⎩ λ si n = 2p + 1
2
 
xn+1
on voit que la suite est divergente.
xn n∈N
Dans la pratique, on ne connaît pas la limite de la suite (xn )n∈N , mais dans
certains cas, on peut calculer le coefficient de convergence λ sans connaître expli-
citement cette limite .
xn+1 − 
Lemme 5.1 Si lim = λ ∈ ]−1, 1[ \ {0} (convergence géométrique de
n→+∞ xn − 
 |λ|) et s’il existe un entier n0 ≥ 1 tel que xn = xn−1 pour tout n ≥ n0 , la
rapport
xn+1 − xn
suite converge alors vers λ.
xn − xn−1 n≥n0
142 Vitesse et accélération de la convergence des suites réelles

Preuve. Pour tout n ≥ n0 , on a :

xn+1 − xn xn+1 −  − (xn − )


=
xn − xn−1 xn −  − (xn−1 − )
xn+1 − 
1−
xn −  xn −  1−λ
= → λ =λ
xn−1 −  xn −  n→+∞ 1−λ
1−
xn−1 − 

xn − 
(de xn = xn−1 , on déduit que = 1) 
xn−1 − 
xn+1 − 
Le fait que lim = μ n’entraîne pas nécessairement la convergence
 n→+∞ xn  −
xn+1 − xn
de la suite . Par exemple pour la suite (xn )n∈N définie par
xn − xn−1 n≥n0
x2p = (−1) λ2p et x2p+1 = (−1) λ2p+1 avec 0 < λ < 1, on a  = lim |xn | = 0,
p p
n→+∞
xn+1 − 
= λ, xn = xn−1 pour tout n ≥ 1 et :
xn − 

(−1) λ2p+1 − (−1) λ2p


p p
x2p+1 − x2p λ (1 − λ)
= =−
x2p − x2p−1 p 2p
(−1) λ − (−1)
p−1
λ 2p−1 λ+1

λ2p+2 − (−1) λ2p+1


p+1 p
x2p+2 − x2p+1 (−1) λ (λ + 1)
= p 2p+1 p =
x2p+1 − x2p (−1) λ − (−1) λ2p 1−λ
 
xn+1 − xn
donc la suite est divergente.
xn − xn−1 n∈N∗

Définition 5.2. Soit r ≥ 2 un entier naturel. On dit que la convergence


de la suite (xn )n∈N vers  est d’ordre r s’il existe une constante λ = 0 telle
|xn+1 − |
que lim r = λ.
n→+∞ |xn − |

Une convergence lente ou géométrique est dite d’ordre 1. On dit aussi que la
convergence est super-linéaire si elle est d’ordre r ≥ 2.
Si la convergence de (xn )n∈N vers  est d’ordre r ≥ 1, cet entier r est alors
|xn+1 − | |xn+1 − |
uniquement déterminé. En effet si lim r = λ et lim s = μ
n→+∞ |xn − | n→+∞ |xn − |
s−r λ λ
avec s > r ≥ 1, on a alors lim |xn − | = avec = 0, s − r > 0 et
n→+∞ μ μ
lim (xn − ) = 0, ce qui est impossible.
n→+∞
xn+1 − 
Si la convergence de (xn )n∈N vers  est d’ordre r ≥ 2, est alors
xn − 
r−1
équivalent à λ |xn − | qui converge vers 0, c’est-à-dire que la convergence est
rapide. Mais réciproquement une convergence rapide n’est pas obligatoirement
Accélération de la convergence 143
 

n
1
super-linéaire comme le montre l’exemple de la suite (xn )n∈N = .
k!
k=0 n∈N
1
Cette suite converge rapidement vers e avec e − xn ∼ , de sorte que
n→+∞ (n + 1)!
pour tout entier r ≥ 2, on a :
r r−1
e − xn+1 ((n + 1)!) ((n + 1)!)
r ∼ = → +∞
|e − xn | n→+∞ (n + 2)! (n + 2) n→+∞

et la convergence ne peut être d’ordre r.

5.2 Accélération de la convergence

Définition 5.3. Si (yn )n∈N est une autre suite convergente vers  avec
yn =  pour tout n ∈ N, on dit que la convergence de cette suite vers  est
yn − 
plus rapide que celle de (xn )n∈N si lim = 0.
n→+∞ xn − 

Accélérer la convergence d’une suite consiste à construire à partir de cette der-


nière une autre suite qui converge plus rapidement vers la même limite.

Exemples 5.2
1. On reprend l’exemple d’une série de Riemann convergente. De l’encadrement
(5.1) on déduit que :
p−1
1 1 1 (n + 1) − np−1
∀n ≥ 1, 0 ≤ ζ (p) − xn − ≤
p − 1 (n + 1)p−1 p − 1 np−1 (n + 1)p−1

1 1
ce qui entraîne que la suite (yn )n∈N∗ définie par yn = xn +
p − 1 (n + 1)p−1
converge vers ζ (p) plus rapidement que la suite (xn )n∈N∗ . En effet, il est clair
que la suite (yn )n∈N∗ converge vers ζ (p) et pour tout n ≥ 1, on a :
p−1
ζ (p) − yn (n + 1) − np−1 p−1
0≤ ≤ ∼ → 0
ζ (p) − xn np−1 n→+∞ n n→+∞

 
β 1
2. Un développement asymptotique de la forme xn =  + + o avec
np  n→+∞
 n p

β 1
β non nul et p > 0 donne yn = x2n =  + np + o et en consé-
2 n→+∞ 2np
yn −  np
quence, lim = lim = 0. Mais une extraction ne permet pas
n→+∞ xn −  n→+∞ 2np
 
1
toujours d’accélérer la convergence d’une suite. Par exemple pour
ln (n) n≥2
 
1 yn 1
et , on a lim = .
ln (n2 ) n≥2 n→+∞ xn ln (2)
144 Vitesse et accélération de la convergence des suites réelles

L’exercice 5.6 nous donne un procédé élémentaire, mais peu performant, d’ac-
célération de la convergence, l’idée étant de remplacer chaque xn par une moyenne
pondérée de xn et xn+1 . Ce procédé sera affiné par la méthode de Richardson.
Dans le cas où on dispose d’un encadrement de la forme εn ≤ xn −  ≤ εn ,
où (εn )n∈N et (εn )n∈N sont des suites convergentes vers 0, la suite (yn )n∈N définie
par yn = xn − εn converge aussi vers  avec 0 ≤ yn −  ≤ εn − εn , ce qui fournit
parfois une suite accélératrice. Avec l’exercice 5.8, on trouvera des exemples de
telle situation.

5.3 Méthode d’accélération d’Aitken


Pour ce paragraphe, on suppose que suite (xn )n∈N converge vers un réel  (tou-
xn+1 − 
jours avec xn =  pour tout n ∈ N) et que lim = λ ∈ ]−1, 1[ \ {0}
n→+∞ xn − 
(convergence géométrique de rapport |λ|). On suppose de plus que xn+1 = xn pour
tout n ∈ N.
Avec l’exercice 5.6, on vérifie que la suite (yn )n∈N des moyennes pondérées
xn+1 − λxn
définie par yn = est une suite accélératrice de (xn )n∈N .
1−λ
La méthode d’Aitken permet de construire une suite de réels (λn )n∈N qui va
converger vers λ et on définira une suite accélératrice par les moyennes pondérées
xn+1 − λn xn
vn = .
1 − λn
xn+1 − xn
On rappelle que la suite (λn )n∈N∗ définie par λn = pour tout n dans
xn − xn−1

N , converge vers λ (lemme 5.1).
Comme λ < 1, il existe un entier n0 tel que l’on ait λn < 1 pour tout n ≥ n0 .
xn+1 − λn xn
On peut donc définir la suite (yn )n≥n0 par yn = pour tout n ≥ n0 .
1 − λn
Théorème 5.1.
La suite (yn )n≥n0 converge vers  plus rapidement que la suite (xn )n∈N .

Preuve. Pour tout n ≥ n0 , on a :


xn+1 −λn xn
yn −  1−λn − 1 xn+1 − λn xn −  (1 − λn )
= =
xn −  xn −  1 − λn xn − 
 
1 xn+1 − 
= − λn → 0
1 − λn xn −  n→+∞


En utilisant la définition des λn , on peut écrire chaque terme de la suite accé-
lératrice de Aitken (yn )n≥n0 sous la forme :
2
xn+1 xn−1 − x2n (xn − xn−1 )
yn = = xn−1 −
xn+1 − 2xn + xn−1 xn+1 − 2xn + xn−1
Méthode d’accélération d’Aitken 145

xn+1 − xn
(comme λn = < 1, on a (xn+1 − xn ) − (xn − xn−1 ) = 0 et le dénomi-
xn − xn−1
nateur de yn est bien non nul).
En introduisant les opérateurs de Aitken Δ et Δ2 définis par :

Δxn = xn+1 − xn
Δ2 xn = Δ (Δxn ) = xn+2 − 2xn+1 + xn
2
(Δxn )
on a yn+1 = xn −
Δ2 x n
Pour la programmation de la méthode de Aitken on peut remarquer que les yn
 −1
1 1
s’écrivent aussi yn = xn + − . En effet, on a :
xn+1 − xn xn − xn−1

xn+1 xn−1 − x2n (xn+1 − xn ) (xn − xn−1 )


yn = = xn −
xn+1 − 2xn + xn−1 (xn+1 − xn ) − (xn − xn−1 )
1
= xn + 1 1
xn+1 −xn − xn −xn−1

Dans le cas où la suite (xn )n∈N est une suite d’approximations successives définie
1
par xn+1 = f (xn ) , en définissant la fonction g par g (x) = pour tout
f (x) − x
x ∈ I \ {} , les yn peuvent se calculer comme suit :
1
xn = f (xn−1 ) , yn = xn +
g (xn ) − g (xn−1 )

Exemple 5.1 On s’intéresse aux points fixes de la fonction f : x → e−x sur


[0, +∞[ . Cette fonction est indéfiniment dérivable, strictement décroissante
6 −1 7 sur
[0, +∞[ avec f  (x) = −e−x et9 f ([0, +∞[)
8 = ]0, 1] . En posant I = e , 1 avec
−1
e−1  0.367 88, on a f (I) = e−1 , e−e ⊂ I et 0 < |f  (x)| ≤ λ = e−1 < 1 pour
tout x ∈ I. La suite (xn )n∈N définie par x0 = 0.5 et xn+1 = f (xn ) pour tout n ≥ 0
converge donc vers l’unique point fixe  ∈ I, la convergence étant géométrique. Le
programme Maple qui suit nous donne les valeurs des xn et yn pour n compris
entre 1 et 15 :
restart ; f :=x->exp(-x) ; g :=x->1/(f(x)-x) ; i :=0 ; x :=0.5 ;
for n from 1 to 15 do
i :=i+1 ; z :=f(x) ; y :=z+1/(g(z)-g(x)) ; x :=z ;
od ;
Ce qui donne les valeurs suivantes :
  
x1 = 0.6065306597 x14 = 0.5671188642 x15 = 0.5671571437
y1 = 0.5676238764 y14 = 0.5671432906 y15 = 0.5671432905

La convergence de la suite (yn )n∈N vers le point fixe de f,   0.567143290409,


est plus rapide que celle de la suite (xn )n∈N . En utilisant f  = −f, f  = f et
146 Vitesse et accélération de la convergence des suites réelles

f () = , on a ici :

⎪ f  () f  () 2 2 2

⎨ yn −  n→+∞
∼ (x n−1 − ) = (xn−1 − )
2 (1 − f  ()) 2 (1 + )
⎪ yn+1 − 

⎩ ∼ (f  ()) = 2
2
yn −  n→+∞

2
avec 2  0.321651511855947 et  0.102623516887215.
2 (1 + )

Dans le cas d’un point fixe super-attractif (c’est-à-dire que f  () = 0), en
supposant de plus que f  () = 0, on a, pour f de classe C 4 , le développement
asymptotique suivant de l’erreur d’approximation en = xn −  :

en = λ2 e2n−1 + λ3 e3n−1 + λ4 e4n−1 + o e4n−1


n→+∞

f  () f (3) () f (4) ()


où on a noté λ2 = , λ3 = et λ4 = , ce qui donne :
2 3! 4!
⎧ 2

⎪ (en − en−1 ) = e2n−1 − 2λ2 e3n−1 + λ22 − 2λ3 e4n−1 + o e4n−1

⎪ n→+∞

⎪ 2
e2n − en
⎨ en+1 − en = λ2 en + n→+∞
⎪ o
= −λ2 e2n−1 − λ3 e3n−1 + λ32 − λ4 e4n−1 + o e4n−1

⎪ n→+∞

⎪ en+1 − 2en + en−1



⎩ = en−1 − 2λ2 e2n−1 − 2λ3 e3n−1 + λ32 − 2λ4 e4n−1 + o e4n−1
n→+∞

−λ22 + o (1)  
n→+∞
et yn −  = e3n−1 = −λ22 + o (1) e3n−1 , soit
1 − 2λ2 en−1 + o (en−1 ) n→+∞
n→+∞
2
(f  ()) 3
yn −  ∼ (un − ) . Avec :
n→+∞ 4
⎧  


⎨ yn −  = −λ22 + o (1) e3n−1
 n→+∞
  


⎩ yn+1 −  = −λ2 + o (1) e3n = −λ52 +
2
o (1) e6n−1
n→+∞ n→+∞

yn+1 −  f  ()
on déduit que 2  . La convergence vers  de (yn )n≥n0 est donc
(yn − ) n→+∞ 2
d’ordre 2 comme celle de (xn )n∈N , mais quand même plus rapide.

5.4 Méthode d’accélération de Richardson


On se place dans un premier temps dans le cas où on dispose d’un développe-
ment asymptotique de la forme xn =  + βλn + γμn + o (μn ) avec β, γ non
n→+∞
nuls et 0 < |μ| < |λ| < 1. La suite (xn )n∈N converge donc vers  et la convergence
est géométrique de rapport |λ| .
Méthode d’accélération de Richardson 147

Dans le cas où on connaît explicitement les coefficients β et λ, on peut accélérer


la convergence de la suite (xn )n∈N en la remplaçant par la suite (yn )n∈N définie par
yn = xn − βλn pour tout n ∈ N. Cette suite converge vers  avec yn −  ∼ γμn ,
n→+∞
la convergence est donc géométrique de rapport |μ| et on a :
yn −  γ # μ $n
∼ → 0
xn −  n→+∞ β λ n→+∞

ce qui confirme bien que la suite (yn )n∈N converge vers  plus vite que la suite
(xn )n∈N .
Si on connaît explicitement le coefficient λ, mais pas le coefficient β, on peut
définir un barycentre de xn+1 et xn où le terme βλn a été éliminé. Pour ce faire,
on écrit que :
⎧  


⎨ xn+1 =  + βλ n+1
+μ n+1
γ + o (1)
 
n→+∞


⎩ xn =  + βλ + μ γ + o (1)
n n
n→+∞

 
et on a xn+1 − λxn = (1 − λ)  + μn (μ − λ) γ + o (1) , ce qui nous conduit
n→+∞
xn+1 − λxn
à introduire la suite (yn )n∈N définie par yn = pour tout n ∈ N. On
  1−λ
μ−λ μ−λ n
a alors yn −  = μn γ + o (1) ∼ γμ , c’est-à-dire que la
1−λ n→+∞ n→+∞ 1 − λ
convergence est géométrique de rapport |μ| et :
yn −  μ − λ γ # μ $n
∼ → 0
xn −  n→+∞ 1−λ β λ n→+∞

On est donc ainsi passé de la suite (xn )n∈N qui converge vers  avec une vitesse
de convergence géométrique de raison |λ| à la suite (yn )n∈N qui converge aussi vers
 avec une vitesse de convergence géométrique de raison |μ| < |λ| .
Les exercices 5.6 et 5.7 nous donnent des exemples de cette situation où on
approxime respectivement les nombres e et π.  
β γ 1
Si on a un développement asymptotique du type xn = + + 2 + o
n n n→+∞ n2
avec β et γ non nuls, on utilise alors la suite (yn )n∈N = (x2n )n∈N pourlaquelle
β γ 1
on a le développement asymptotique yn =  + n + n + o et une
2 4 n→+∞ 4n
β
suite accélératrice est définie par zn = 2yn+1 − yn . On a alors yn −  ∼
n→+∞ 2n
1 γ
et zn −  ∼ − n , c’est-à-dire qu’on passe d’une convergence géométrique de
n→+∞ 24
1 1
raison à une convergence géométrique de raison (voir l’exercice 5.6).
2 4
La méthode de Richardson consiste à itérer le procédé précédent si on dispose

p+1
d’un développement asymptotique de la forme xn =  + βj λnj + o λnp+1 ,
n→+∞
j=1
148 Vitesse et accélération de la convergence des suites réelles

où p est un entier naturel non nul, les coefficients βj sont tous non nuls et les
coefficients λj tels que 0 < |λp+1 | < |λp | < · · · < |λ1 | < 1.
Si tous les coefficients βj et λj sont connus, on peut accélérer la convergence

p+1
de cette suite en introduisant la suite (yn )n∈N définie par yn = xn − βj λnj pour
j=1
tout n ∈ N. Ce cas se présente pour les sommes de séries numériques de la forme
+∞

f (n) , où la fonction f est indéfiniment dérivable sur R+,∗ . Le développement
n=0
asymptotique est obtenu en utilisant la formule d’Euler et Mac-Laurin en suppo-
sant le calcul explicite des dérivées de la fonction f facilement réalisable. C’est le
cas par exemple pour les séries de Riemann convergentes.
Si les coefficients λj sont tous connus, mais pas les coefficients βj , on va les
éliminer progressivement en itérant le procédé barycentrique décrit précédemment,
ce qui nous amène à introduire, pour tout k compris entre 0 et p, les suites (xn,k )n∈N
xn+1,k−1 − λk xn,k−1
définies par xn,0 = xn et les formules de récurrence xn,k = .
1 − λk
Lemme 5.2 Avec les notations et hypothèses qui précèdent, on a pour tout entier
k compris entre 0 et p, le développement asymptotique :


p+1
xn,k =  + βk,j λnj + o λnp+1
n→+∞
j=k+1

les coefficients βk,j étant tous non nuls.

Preuve. On procède par récurrence finie sur k. Pour k = 0 c’est l’hypothèse. En


supposant le résultat acquis au rang k − 1 < p, on a :


⎪ %
p+1
⎪ xn+1,k−1 =  +
⎪ βk−1,j λn+1 + o λn+1
⎨ j=k
j n→+∞ p+1


⎪ %
p+1

⎪ βk−1,j λnj + o λnp+1
⎩ xn,k−1 =  + n→+∞
j=k

l’élimination du coefficient βk−1,k entre ces deux équations se faisant avec :

xn+1,k−1 − λk xun,k−1 
p+1
=+ βk,j λnj + o λnp+1
1 − λk n→+∞
j=k+1

λj − λk
où βk,j = βk−1,j = 0 pour tout j compris entre k + 1 et p + 1. 
1 − λk
Théorème 5.2. Richardson
Avec les notations et hypothèses qui précèdent, pour tout entier k com-
pris entre 1 et p, la suite (xn,k )n∈N converge vers  plus rapidement que la
suite (xn,k−1 )n∈N , la convergence de la suite (xn,k )n∈N étant géométrique
Méthode d’accélération de Richardson 149

de raison |λk+1 | . Plus précisément, pour tout k compris entre 0 et p, on a


(k
λk+1 − λj
xn,k −  ∼ βk,k+1 λnk+1 avec βk,k+1 = βk+1 .
n→+∞
j=1
1 − λj

Preuve. Avec l’hypothèse 0 < |λp+1 | < · · · < |λk+1 | < |λk | et lemme précédent,
on déduit que, pour k compris entre 1 et p, on a :

⎨ xn,k −  n→+∞
⎪ ∼ βk,k+1 λnk+1
 n
⎪ x n,k −  β k,k+1 λ k+1
⎩ ∼ → 0
xn,k−1 −  n→+∞ βk−1,k λk n→+∞

λk+1 − λk λk+1 − λk−1 λk+1 − λ1


avec βk,k+1 = ··· βk+1 , ce qui est le résultat
1 − λk 1 − λk−1 1 − λ1
annoncé. 
L’exercice 5.12 peut se ramener à la situation suivante. On dispose d’une fonc-
tion f définie sur I = ]−1, 1[ et admettant un développement limité d’ordre p + 1

p+1
en 0, f (x) =  + βj xj + o xp+1 , où p est un entier naturel non nul et
n→+∞
j=1
les coefficients βj sont tous non nuls. On associe à cette fonction la suite (xn )n∈N∗
définie par xn = f (rn ) pour tout n ∈ N∗ , où r est un réel non nul dans ]−1, 1[ . On

p+1
a alors le développement asymptotique xn =  + βj λnj + o λnp+1 , où les
n→+∞
j=1
coefficients λj = r vérifient bien l’hypothèse 0 < |λp+1 | < |λp | < · · · < |λ1 | < 1.
j

On peut donc définir les suites accélératrices (xn,k )n∈N∗ par :




⎨ xn,0 = xn = f (r )
n

⎪ x − rk x
⎩ xn,k = n+1,k−1 k n,k−1 (1 ≤ k ≤ p)
1−r
Les coefficients βk,k+1 sont alors donnés par :

(k
rk+1 − rj (k k+1−j
−1
jr
βk,k+1 = βk+1 = β k+1 r
j=1
1−r j
j=1
1 − rj

rk − 1 rk−1 − 1 · · · (r − 1) (k
= β k+1 rj
(1 − r) · · · (1 − rk−1 ) (1 − rk ) j=1
k(k+1)
= (−1) r(1+2+···+k) βk+1 = (−1) r
k k 2 βk+1

k (k+1)(2n+k)
On a donc, pour k compris entre 0 et p, xn,k −  ∼ (−1) βk+1 r 2 .
n→+∞
150 Vitesse et accélération de la convergence des suites réelles

#π$  
n 1
Pour la suite d’Archimède de l’exercice 5.12, on a xn = 2 sin n = f
2 2n
sin (πx)
pour tout n ∈ N∗ , où f (x) = et en écrivant f (x) = g x2 , où :
x

p+1
j π 2j+1 j
g (t) = π + (−1) t + o xp+1
j=1
(2j + 1)! n→+∞

1
on se ramène à la situation précédente avec r = . On a alors, pour tout k compris
4
π 2k+3 1
entre 0 et p, π − xn,k ∼ .
n→+∞ (2k + 3)! 2(2n+k)(k+1)
On a, par exemple, pour les trois premières suites :
#π$ 4xn+1 − xn 16xn+1,1 − xn,1
xn = 2n sin n , xn,1 = , xn,2 =
2 3 15
avec :
π3 1 π5 4 π7 1
π − xn ∼ , π − xn,1 ∼ , π − xn,2 ∼
n→+∞ 6 4n n→+∞ 5! 16n+1 n→+∞ 7! 64n+1
Si on reprend l’exemple du nombre e approché par la suite (xn )n≥0 définie par
 2 n  
1 1
xn = 1 + n pour tout n ∈ N, on a xn = f , où f est la fonction
2 2n
définie sur ]−1, 1[ par :
 1 ln(1+x)

f (x) = (1 + x) x = e x si 0 < |x| < 1


0 si x = 0
Cette fonction est indéfiniment dérivable sur ]−1, 1[ comme composée des fonc-
+∞

ln (1 + x) n−1 xn−1
tions g : x → = (−1) n et t → et , elle admet donc des dé-
x
k=1
ln(1+x)
veloppements limités à tous ordres en 0. Par exemple, à l’ordre 3, on a e x =
e 11e 2 7e 3
e− x+ x − x + o x3 . On peut donc utiliser le procédé d’accélération
2 24 16
1
de Richardson avec r = , ce qui donne les suites accélératrices définies par :
2
⎧  2 n

⎪ 1

⎨ xn,0 = xn = 1 + n (n ≥ 0)
2


⎩ xn,k = 2 xn+1,k−1 − xn,k−1 (k ≥ 1)
k

2k − 1
k 1
et on a xn,k − e ∼ (−1) βk+1 k+1 . Ce qui donne, par exemple, pour
n→+∞ 2 (2n+k) 2
les trois premières suites :
 2 n
1 4xn+1,1 − xn,1
xn = 1 + n , xn,1 = 2xn+1 − xn , xn,2 =
2 3
e 1 11e 1 7e 1
avec e − xn ∼ , e − xn,1 ∼ , e − xn,2 ∼ .
n→+∞ 2 2n n→+∞ 24 22n+1 n→+∞ 16 23[n+1]
Exercices 151

5.5 Exercices

Exercice 5.1. Étudier la vitesse de convergence des suites (xn )n≥2 défi-
1 1 1
nies par xn = p où p > 0, xn = , xn = an où 0 < |a| < 1, xn =
n ln (n) n!
n!
et xn = n .
n

Solution. Chacune de ces suites converge vers 0 et :


 b
1 xn+1 n
— pour xn = b , on a = → 1, donc la convergence est
n xn n+1 n→+∞
lente ;
1
— pour xn = , on a :
ln (n)
 
xn+1 ln (n) n 1
= = ln +1 → 1
xn ln (n + 1) n + 1 ln (n + 1) n→+∞

donc la convergence est lente ;


xn+1
— pour xn = an , on a = |a| → λ = |a| , donc la convergence est
xn n→+∞
géométrique de rapport |a| ;
1 xn+1 1
— pour xn = , on a = → 0, donc la convergence est rapide ;
n! xn n + 1 n→+∞
 n
n! xn+1 n 1
— pour xn = n , on a = → < 1, donc la convergence
n xn n+1 n→+∞ e
1
est géométrique de rapport .
e
D’un point de vue pratique, onpeututiliserles critères
 suivants où l’on compare
1 1
la suite (|xn − |)n∈N aux suites , ou (λn )n∈N :
nb n∈N∗ ln (n) n≥2
C
— si |xn − | ∼ où C > 0, p > 0, la convergence est lente ;
n→+∞ np
C
— si |xn − | ∼ où C > 0, la convergence est lente ;
n→+∞ ln (n)
— si |xn − | ∼ Cλn , où C > 0, λ ∈ ]0, 1[ , la convergence est géométrique
n→+∞
de rapport λ.

Exercice 5.2. Montrer que la convergence de la suite (xn )n∈N∗ définie



n
1
par xn = − ln (n + 1) pour tout n ∈ N∗ est lente.
k
k=1
152 Vitesse et accélération de la convergence des suites réelles

Solution. La suite (xn )n∈N∗ converge vers γ (constante gamma d’Euler). Pour
tout n ≥ 1, on a :
  k+1   n  k+1   n  k+1
 n
1 dt 1 1  t−k
xn = − = − dt = dt
k k t k k t k kt
k=1 k=1 k=1

+∞ 
 n+1
t−n
ce qui fait apparaître γ comme somme d’une série, soit γ = dt et :
n=1 n
nt

+∞ 
 k+1
t−k
γ − xn = dt
k kt
k=n+1

En utilisant les inégalités :


   
k+1
t−k 1 k+1
1 1 1 1
dt ≤ 2 (t − k) dt = 2
≤ −
k kt k k 2k 2 k−1 k
et :
   
k+1
t−k 1 k+1
1 1 1 1 1
dt ≥ (t − k) dt = = −
k kt k (k + 1) k 2 k (k + 1) 2 k k+1

1 1 1
on en déduit que < γ − xn < et γ − xn ∼ . La convergence
2 (n + 1) 2n n→+∞ 2n
est donc lente.

Exercice 5.3. Soient I = [a, b] un intervalle réel fermé non réduit à un


point et f : I → I de classe C 1 telle que 0 < |f  (x)| < 1 pour tout x ∈ I.
1. Montrer que f admet un unique point fixe  ∈ I.
2. Pour x0 ∈ I\{} , on définit la suite (xn )n∈N par xn+1 = f (xn ) . Montrer
que cette suite converge vers  et que la convergence est géométrique de
rapport |f  ()| .

Solution.
1. Avec la continuité de f et f (I) ⊂ I, on déduit que f admet au moins un point
fixe. En effet, la fonction g définie sur I par g (x) = f (x) − x étant continue
telle que g (a) = f (a) − a ≥ 0 et g (b) = f (b) − b ≤ 0 (puisque f (a) et f (b)
sont dans I = [a, b]), le théorème des valeurs intermédiaires nous dit qu’elle
s’annule sur I. De plus l’hypothèse −1 < f  < 1 entraîne g  = f  − 1 < 0
sur I, c’est-à-dire que g est strictement décroissante sur I, donc injective, et la
solution  de g (x) = 0 sur I est unique. Ce réel  est l’unique point fixe de f
sur I.
2. Si x0 = , on a alors xn =  pour tout n ∈ N. En effet, le résultat est vrai
pour n = 0 et en le supposant vrai pour n ≥ 0, le théorème des accroissements
finis nous permet d’écrire xn+1 −  = f (xn ) − f () = (xn − ) f  (cn ) avec cn
Exercices 153

strictement compris entre xn et  et f  (xn ) = 0, ce qui entraîne xn+1 = . Le


développement limité qui précède nous permet également de déduire que :
xn+1 − 
= f  (cn ) → f  () ∈ ]−1, 1[ \ {0}
xn −  n→+∞

ce qui implique que la suite (xn )n∈N converge vers  et que la convergence est
géométrique de rapport |f  ()| ( est un point fixe attractif de f ).

Exercice 5.4. Soient I = [a, b] un intervalle réel fermé non réduit à un


point et f : I → I de classe C r avec r ≥ 2 telle que |f  (x)| < 1 pour tout
x ∈ I.
1. Montrer que f admet un unique point fixe  ∈ I.
2. On suppose que f (k) () = 0 pour tout k compris ente 1 et r − 1 et
f (r) (x) = 0 pour tout x ∈ I. Pour x0 donné dans I \ {} , on définit la
suite (xn )n∈N par xn+1 = f (xn ) . Montrer que cette suite converge vers
 et que la convergence est d’ordre r ( est un point fixe super-attractif
de f ).

Solution.
1. Voir l’exercice 5.3.
2. La formule de Taylor-Lagrange à l’ordre r permet d’écrire que :

r f (r) (cn )
xn+1 −  = f (xn ) − f () = (xn − )
r!
avec cn strictement compris entre xn et , ce qui entraîne xn =  pour tout
xn+1 −  f (r) ()
n ≥ 0 (par récurrence) et lim r = = 0, ce qui implique que
n→+∞ (xn − ) r!
la suite (xn )n∈N converge vers  puisque :
(r)
|xn+1 − | r−1 f (cn )
lim = lim |xn − | =0
n→+∞ |xn − | n→+∞ r!
et la convergence est d’ordre r.

Exercice 5.5. On se donne une fonction g de classe C 3 sur un intervalle


fermé I = [a, b] telle que g (a) g (b) < 0, g  (x) = 0 et g  (x) = 0 pour tout
x ∈ I.
1. Montrer que l’équation g (x) = 0 admet une unique solution  ∈ ]a, b[ .
g (x)
2. On note f la fonction définie sur I par f (x) = x −  . Montrer que
g (x)
f  () = 0 et f  () = 0.
3. On désigne par J = [ − η,  + η] un intervalle contenu dans I, avec
η > 0, tel que f  (x) = 0 pour tout x ∈ J. Montrer que la suite (xn )n∈N
154 Vitesse et accélération de la convergence des suites réelles

g (xn )
définie par x0 ∈ J \ {} et xn+1 = xn − pour tout n ≥ 0 (méthode
g  (xn )
de Newton) converge vers  et que la convergence est d’ordre 2.

Solution.
1. Le théorème des valeurs intermédiaires nous dit que l’équation g (x) = 0 a au
moins une solution dans I et l’hypothèse g  (x) = 0 pour tout x ∈ I avec g 
continue nous dit que g  > 0 ou g  < 0 (théorème des valeurs intermédiaires
pour g  ) ce qui implique que g est strictement monotone, donc injective. Cette
solution  est donc unique.
g (x)
2.  est l’unique point fixe dans I de f définie sur I par f (x) = x −  . Cette
g (x)

g (x) g (x)
fonction est de classe C 2 sur I avec f  (x) = 2 . De g () = 0 on déduit
(g  (x))
f  (x) g (x) g  (x) g  ()
que f  () = 0 et f  () = lim = lim 2 =  = 0.
x→ x −  x→ x −  (g  (x)) g ()
3. Par continuité de f  on peut trouver un voisinage J de  tel que f  (x) = 0
pour tout x ∈ J. La formule de Taylor-Lagrange à l’ordre 2 permet d’écrire que

2 f (cn )
xn+1 −  = f (xn ) − f () = (xn − ) , avec cn strictement compris entre

r!
xn et  et f (cn ) = 0, ce qui entraîne xn =  pour tout n ≥ 0 (par récurrence)
xn+1 −  f  () g  ()
et lim 2 = =  = 0, ce qui implique que la suite (xn )n∈N
n→+∞ (x − ) 2 2g ()
n
|xn+1 − | |f  (cn )|
converge vers  puisque lim = lim |xn − | = 0 et que
n→+∞ |xn − | n→+∞ 2
la convergence est d’ordre 2.

Exercice 5.6. Soit λ un réel différent de 1 et (yn )n∈N la suite définie par
xn+1 − λxn
yn = pour tout n ∈ N (yn est un barycentre de xn+1 et xn ).
1−λ
1. Préciser pour quelles valeurs de λ et à quelles conditions sur (xn )n∈N la
suite (yn )n∈N converge vers  plus rapidement que (xn )n∈N .
 2 n 
1
2. Appliquer ce procédé à la suite 1+ n en précisant la vitesse
2
n∈N
de convergence de la suite accélératrice obtenue.

Solution. Pour λ = 0, on a yn = xn+1 , ce qui n’a pas beaucoup d’intérêt.


1. Pour tout réel λ différent de 1, la suite (yn )n∈N converge vers  et :
yn −  xn+1 −  − λ (xn − ) 1 xn+1 −  λ
= = −
xn −  (1 − λ) (xn − ) 1 − λ xn −  1−λ
yn −  xn+1 − 
de sorte que lim = 0 si, et seulement si, lim = λ. On a
xn − 
n→+∞ n→+∞ xn − 
vu que la convergence de (xn )n∈N vers  impose λ ∈ [−1, 1] et comme λ = 1,
Exercices 155

on déduit que la suite (yn )n∈N converge vers  plus rapidement que (xn )n∈N
xn + xn+1
si, et seulement si, λ ∈ [−1, 1[ . Pour λ = −1, on a yn = et cette
2
suite accélère (xn )n∈N si, et seulement si, (xn )n∈N converge lentement avec
xn+1 − 
lim = −1. Pour 0 < |λ| < 1, la suite (yn )n∈N accélère (xn )n∈N si,
n→+∞ xn − 
et seulement si, la convergence de (xn )n∈N est géométrique de rapport |λ| avec
xn+1 − 
lim = λ.
n→+∞ xn − 
2. On a vu que la convergence de la suite (xn )n∈N vers e ≈ 2.718281828 est
1
géométrique de rapport λ = , ce qui donne la suite (yn )n∈N définie par
2  
ln (1 + x)
yn = 2xn+1 − xn . Le développement limité à l’ordre 2 de exp
x
au voisinage de 0 nous donne le développement asymptotique :
 n   
1 1 11 1 1
1+ =e 1− + 2
+ o
n 2n 24 n n→+∞ n2
   
xn 1 11 1 1 yn 11 1 1
et = 1 − n+1 + + o , = 1 − + o .
e 2 24 22n n→+∞ 22n e 48 22n n→+∞ 22n
11 e 1
Donc e − yn ∼ 2n
et la convergence est géométrique de rapport .
n→+∞ 48 2 4

Exercice 5.7. Considérons l’approximation du nombre π par la méthode


d’Archimède des polygones réguliers. Cette
# π $méthode consiste à introduire la
suite (xn )n∈N∗ définie par xn = 2 sin n pour tout n ∈ N∗ .
n
2
1. Montrer que la suite (xn )n∈N∗ est aussi définie par x1 = 2 et :
 5
√ # x $2
∗ n
∀n ∈ N , xn+1 = 22n 1− 1−
2n

Cette relation de récurrence permet un calcul itératif des xn sans utiliser


le nombre π que l’on veut approcher.
2. Montrer que la convergence de cette suite vers π est géométrique.
3. Utiliser le procédé décrit à l’exercice précédent pour accélérer la conver-
gence de cette suite en précisant la vitesse de convergence de la suite
accélératrice (yn )n∈N obtenue.

Solution.
5 #π$
#π$
# π $ 1 − cos n 1− 1 − sin2
2 2n
1. Avec sin2 n+1 = = , on déduit que :
2 2 2
 5
√ # x $2
∀n ∈ N∗ , xn+1
n
= 22n 1− 1−
2n
156 Vitesse et accélération de la convergence des suites réelles

x3
2. Le développement limité sin (x) = x − + o x3 nous donne le développement
3!  
π3 1 1 π3 1
asymptotique, xn = π − + o et π − x n ∼ . Cette
3! 22n n→+∞ 22n n→+∞ 3! 22n
1
suite converge donc vers π et la convergence est géométrique de raison .
4
3. Utilisant le procédé décrit à l’exercice précédent, on accélère la convergence de
4xn+1 − xn
cette suite en posant yn = pour n ∈ N∗ . Poussant le développement
3
x3 x5
limité précédent un peu plus loin, on a sin (x) = x − + + o x5 et le
3! 5!  
π3 1 π5 1 1
développement asymptotique xn = π − + + o , qui
 3! 22n
 5! 24n n→+∞ 24n
π5 3 1 1 π5 3 1
donne yn = π − + o , soit π − yn ∼ . Cette
5! 4 24n n→+∞ 24n n→+∞ 5! 4 24n
1
suite converge donc vers π et la convergence est géométrique de raison .
16

Exercice 5.8.
1. Utilisant l’encadrement obtenu avec les exemples 5.1, montrer que la
n
1 1
suite (yn )n∈N∗ définie par yn = + , accélère la convergence
k! n · n!
k=0
n
1
de la suite (xn )n∈N∗ définie par xn = pour n ∈ N∗ .
k!
k=0
2. Utilisant l’encadrement obtenu avec les exemples 5.1, montrer que la

n
1 1 1
suite (yn )n∈N∗ définie par yn = + , accélère la
kα α − 1 (n + 1)α−1
k=1
n
1
convergence de la suite (xn )n∈N∗ définie par xn = pour n ∈ N∗ .

k=1
3. Utilisant l’encadrement obtenu avec l’exercice 5.2, montrer que la suite
 n
1 1
(yn )n∈N∗ définie par yn = − ln (n + 1) + , accélère la
k 2 (n + 1)
k=1
n
1
convergence de la suite (xn )n∈N∗ définie par xn = − ln (n + 1)
k
k=1
pour n ∈ N∗ .

Solution.
1 1
1. On a l’encadrement < e − xn < , qui donne :
(n + 1)! n · n!
1 1 1
0 < yn − e < − =
n · n! (n + 1)! n · (n + 1)!
Exercices 157

15
yn − e 1
et 0 < ≤ → 0. On a par exemple x5 =  2.7167 et
e − xn n n→+∞ k!
k=0
1
y 5 = x5 +  2.7183.
5 ∗ 5!
1 1
2. On a l’encadrement α−1 ≤ (α − 1) ( − xn ) ≤ nα−1 , qui donne :
(n + 1)
α−1
1 (n + 1) − nα−1
0 ≤  − yn ≤
α − 1 nα−1 (n + 1)α−1
α−1
 − yn (n + 1) − nα−1 α−1
et 0 ≤ ≤ ∼ → 0.
 − xn nα−1 n→+∞ n n→+∞
1 1 1
3. L’encadrement < γ − xn < nous donne 0 < γ − yn <
2 (n + 1) 2n 2n (n + 1)
γ − yn 1
et 0 ≤ ≤ → 0.
γ − xn n n→+∞

Exercice 5.9. Soit (xn )n∈N une suite arithmético-géométrique définie par
x0 ∈ R et xn+1 = axn + b où a, b sont des réels donnés avec 0 < |a| < 1.
b
1. Montrer que (xn )n∈N converge ver  = et préciser sa vitesse de
1−a
convergence dans le cas où u0 = .
2. Décrire la suite accélératrice de Aitken correspondante.

Solution.
1. Si cette suite converge, alors sa limite est solution de l’équation x = ax + b
b
qui a pour unique solution  = . De xn+1 = axn + b et  = a + b,
1−a
on déduit que xn+1 −  = a (xn − ) et par récurrence xn −  = an (x0 − ) ,
soit xn =  + an (x0 − ) et lim xn =  avec xn =  pour tout n ≥ 0 et
n→+∞
xn+1 − 
= a, c’est-à-dire que la convergence est géométrique de rapport |a|
xn − 
(ce qui n’est pas étonnant).
2. On a xn+1 − xn = an (x0 − ) (a − 1) et xn+1 − axn = b =  (1 − a) , de sorte
xn+1 − xn xn+1 − λn xn
que λn = = a et yn = = . La suite (yn )n∈N est donc
xn − xn−1 1 − λn
stationnaire sur .

Exercice 5.10. On reprend la situation de l’exercice 5.3 avec I = [a, b]


et f : I → I de classe C 2 telle que 0 < |f  (x)| < 1 pour tout x ∈ I. On a vu
que cette fonction admet un unique point fixe (attractif)  ∈ I et que la suite
(xn )n∈N définie par x0 ∈ I \ {} et xn+1 = f (xn ) pour tout n ≥ 0 converge
vers  avec xn =  pour tout n ∈ N, la convergence étant géométrique de
158 Vitesse et accélération de la convergence des suites réelles

rapport |f  ()| . Montrer que, si f  () = 0, alors la convergence de la suite


2
accélératrice de Aitken correspondante est géométrique de rapport (f  ()) .

Solution. Un développement limité à l’ordre 2 en  nous donne, en tenant compte


de f () =  :
f  () # $
2 2
xn −  = f  () (xn−1 − ) + (xn−1 − ) + o (xn−1 − )
2 n→+∞

f  ()
En notant en = xn − , λ = f  () et μ = , cela s’écrit :
2
en = λen−1 + μe2n−1 + o e2n−1
n→+∞

et, en désignant par (yn )n≥n0 la suite accélératrice de Aitken, on a :


2
(Δxn−1 )
yn −  = xn−1 −  −
Δ2 xn−1
avec : 
Δxn−1 = xn − xn−1 = en − en−1
Δ2 xn−1 = xn+1 − 2xn + xn−1 = en+1 − 2en + en−1
2
(en − en−1 )
ce qui donne yn −  = en−1 − avec :
en+1 − 2en + en−1


⎪ en − en−1 = (λ − 1) en−1 + μe2n−1 + o e2n−1

⎪ n→+∞

⎪ 2 2 2 3
e3n−1
⎨ (en − en−1 ) = (λ − 1) en−1 + 2μ (λ − 1) en−1 + n→+∞
⎪ o
en+1 − en = λ (λ − 1) en−1 + (λ − 1) μ + λ2 μ e2n−1 + o e2n−1

⎪ n→+∞
⎪ e

⎪ n+1 − 2en + en−1 = (en+1 − en ) − (en − en−1 )

⎪ = (λ − 1)2 e
⎩ + (λ − 1) (λ + 2) μe2 + o
n−1 n−1e2 n−1
n→+∞

et donc :
(λ − 1) en−1 + 2μe2n−1 + o e2n−1
n→+∞
yn −  = en−1 −
(λ − 1) + μ (λ + 2) en−1 + o (en−1 )
n→+∞
λμ + o (1)
n→+∞
= e2n−1
(λ − 1) + o (1)
n→+∞

yn −  λμ
ou encore lim = . Comme f  () = 0, on a μ = 0 et :
n→+∞ e2n−1 λ−1
λμ 2 f  () f  () 2
yn −  ∼ en−1 = e
n→+∞ 1 − λ 2 (1 − f  ()) n−1
 2
yn+1 −  en 2
On a donc ∼ ∼ λ2 = (f  ()) . En définitive, on
yn −  n→+∞ en−1 n→+∞
est passé d’une convergence géométrique de rapport |f  ()| à une convergence
Exercices 159

2
géométrique de rapport (f  ()) , ce qui confirme l’accélération de la convergence
puisque |f  ()| < 1.
Désignant par Mn le point de R2 de coordonnées (xn , f (xn )) = (xn , xn+1 ) dans la
xn+2 − xn+1 Δn+1
base canonique, la pente de la droite (Mn Mn+1 ) est δn = = et
xn+1 − xn Δn
Δxn+1
l’équation de cette droite est y = xn+1 + (x − xn ) . Le point d’intersection
Δxn
de cette droite avec la première bissectrice est le point Mn de coordonnées (zn , zn )
Δxn+1 Δxn+1
où zn est solution de z = xn+1 + (z − xn ) = Δxn + xn + (z − xn ) ,
  Δx n Δxn
Δxn+1
soit de (z − xn ) 1 − = Δxn , ce qui donne :
Δxn
2 2
Δxn (Δxn ) (Δxn )
zn = xn + Δxn+1
= xn − = xn − = yn+1
1− Δxn+1 − Δxn Δ2 xn
Δxn

Exercice 5.11. Donner une expression de la suite accélératrice de Aitken


 n
1
pour la suite (xn )n∈N∗ définie par xn = pour tout n ∈ N∗ , où α > 1.

k=1
Préciser la vitesse de convergence de cette suite accélératrice.

1 2 1 1
Solution. On a Δxn = α , Δ xn = α − α et :
(n + 1) (n + 2) (n + 1)
2 α
(Δxn ) (n + 2)
yn+1 = xn − = xn + α α α
Δ2 x n (n + 1) ((n + 2) − (n + 1) )
2
(n + 2)
Par exemple, pour α = 2, on a yn+1 = xn + 2 . Reprenant les
(n + 1) (2n + 3)
1 1 1 1
calculs des exemples 5.1, on a ≤  − xn ≤ pour tout
α − 1 (n + 1)α−1 α−1n α−1

n ≥ 1, donc :
 α 
1 (α − 1) (n + 2)
1− α α ≤  − yn+1
(α − 1) (n + 1)
α−1
(n + 1) ((n + 2) − (n + 1) )
 α 
1 nα−1 (α − 1) (n + 2)
≤ 1 − α α α
(α − 1) nα−1 (n + 1) ((n + 2) − (n + 1) )
soit :
 
1 (α−1)
(α−1)(n+1)α−1
1−    
n+1 α ≤  − yn+1
(n+1) 1− n+2
 
1 nα−1 (α−1)
≤ (α−1)nα−1 1− (n+1)α (1−( n+1
α
n+2 ) )
160 Vitesse et accélération de la convergence des suites réelles

avec :
 α   α  
n+1 1 1 1
1− =1− 1− =1− 1−α + o
n+2 n+2 n + 2 n→+∞ n
 
1 1 α
=α + o ∼
n + 2 n→+∞ n n→+∞ n

nα−1 (α − 1) nα−1 (α − 1) α−1


ce qui donne # # $α $ ∼ α = et :
α
(n + 1) 1 − n+1 n→+∞
nα α
n+2 n
(α − 1) α−1 α−1
# # $α $ ∼ α = α
n→+∞
(n + 1) 1 − n+1
n+2
n
n
 
1 α−1 1
Il en résulte que  − yn+1 ∼ α−1 1− = et la
n→+∞ (α−1)n α α (α − 1) nα−1
convergence de la suite (yn )n∈N∗ est lente.

Exercice 5.12. On reprend l’exemple de la suite d’Archimède (xn )n∈N∗


permettant #d’approcher le nombre π. On rappelle qu’elle est définie par
π$
xn = 2 sin n pour tout n ∈ N∗ (exercice 5.7).
n
2
1. En utilisant, pour p ≥ 1, le développement limité à l’ordre 2p de la fonc-
tion sin, donner un développement asymptotique de la suite (xn )n∈N∗ .
2. En déduire les suites accélératrices correspondantes à la méthode de Ri-
chardson.

Solution.
sin (πx) 
p+1
π 2j
x2j + o x2p+2 , on
j
1. Du développement limité = (−1)
πx j=0
(2j + 1)!
déduit le développement asymptotique :


p+1  n  n 
π 4j+1
j 1 1
xn = π + (−1) + o
j=1
(2j + 1)! 4j n→+∞ 4p+1

2. Les suites accélératrices correspondantes à la méthode de Richardson sont donc


données par :
⎧ #π$

⎪ xn,0 = xn = 2n sin n , (n ≥ 1)
⎨ 2

⎪ xn+1,k−1 − 41k xn,k−1 4k xn+1,k−1 − xn,k−1
⎩ xn,k = 1 = (1 ≤ k ≤ p, n ≥ 1)
1 − 4k 4k − 1
Chapitre 6

Limites et continuité des


fonctions d’une variable
réelle

6.1 Limite et continuité en un point


On reprend, dans le cadre des fonctions d’une variable réelle et à valeurs réelles,
l’étude des notions de limites et de continuité déjà vues dans le cadre des espaces
métriques (voir le paragraphe 1.3). Dans ce cadre réel, on exploite la structure
d’ordre sur R et on définit la notion de limite à l’infini.
I désigne un intervalle réel d’extrémités a < b dans R = R ∪ {−∞, +∞} .
On rappelle tout d’abord les notions de limite en un point α adhérent à I
(c’est-à-dire que α est un réel dans I ou l’une des extrémités de I).

Définition 6.1. On dit que la fonction f : I → R a pour limite  en α si :

∀ε > 0, ∃η > 0 | ∀x ∈ (I \ {α}) ∩ ]α − η, α + η[ , |f (x) − | < ε

dans le cas où α est réel,

∀ε > 0, ∃η > 0 | ∀x > η, |f (x) − | < ε

dans le cas où α = +∞,

∀ε > 0, ∃η > 0 | ∀x < −η, |f (x) − | < ε

dans le cas où α = −∞.

Une telle limite étant unique, quand elle existe, on la note  = lim f (x) .
x→α
Prenant en considération la structure d’ordre sur R, on peut définir les notions
de limite à gauche ou à droite en un point, ce qui permettra de distinguer deux
types de discontinuités.
On suppose que α est réel dans l’adhérence de l’intervalle I.
162 Limites et continuité des fonctions d’une variable réelle

Définition 6.2. On dit que la fonction f : I → R a pour limite à gauche


[resp. à droite]  en α si :

∀ε > 0, ∃η > 0 | ∀x ∈ I ∩ ]α − η, α[ , |f (x) − | < ε

[resp. ∀ε > 0, ∃η > 0 | ∀x ∈ I ∩ ]α, α + η[ , |f (x) − | < ε]

De manière équivalente on peut dire que f a une limite à gauche [resp. à droite]
en α si la restriction de f à I ∩ ]−∞, α[ [resp. à I ∩ ]α, +∞[] a une limite en α.
Si f admet une limite à gauche [resp. à droite] en α, cette limite est alors unique
et on la note f (α− ) = lim f (x) [resp. f (α+ ) = lim f (x)].
x→α− x→α+
Des définitions précédentes, on déduit facilement le résultat suivant.
Théorème 6.1.
Si α est intérieur à I, la fonction f : I → R a pour limite  en α si, et
seulement si, elle a une limite à gauche et à droite en α, ces limites étant
égales à .

Le cas des fonctions monotones définies sur un intervalle ouvert (pour simplifier)
est particulièrement intéressant.
Théorème 6.2.
Si f est une fonction monotone de l’intervalle ouvert I dans R, elle admet
alors une limite à gauche et à droite en tout point. Dans le cas où f est
croissante, on a pour tout x ∈ I :

f x− = sup f (t) ≤ f (x) ≤ f x+ = inf f (t)


t∈I, t<x t∈I, x<t

De plus pour x < y dans I, on a f (x+ ) ≤ f (y − ) .

Preuve. Quitte à remplacer f par −f, on peut supposer f croissante. Pour


x ∈ I, l’ensemble Ax = {f (t) | t ∈ I, t < x} est non vide majoré par f (x) , il
admet donc une borne supérieure μ = sup f (t) ≤ f (x) . Par définition de la
t∈I, t<x
borne supérieure, pour tout réel ε > 0, il existe x0 ∈ ]a, x[ tel que μ−ε < f (x0 ) ≤ μ
et avec la croissance de f, on a μ − ε < f (x0 ) ≤ f (t) ≤ μ pour tout t ∈ ]x0 , x[ .
On a donc ainsi montré que μ = lim− f (t) = f (x− ) . On procède de même pour
t→x
l’existence de la limite à droite f (x+ ) . Pour x < y dans I, on a :

f x+ = inf f (t) = inf f (t) , f y − = sup f (t) = sup f (t)


t∈I, x<t x<t<y t∈I, t<y x<t<y

ce qui entraîne f (x+ ) ≤ f (y − ) . 

Définition 6.3. On dit que la fonction f : I → R est continue [resp.


continue à gauche, resp. à droite] au point α ∈ I si, et seulement si,
Limite et continuité en un point 163

lim f (x) = f (α) [resp. lim f (x) = f (α) , resp. lim f (x) = f (α)].
x→α x→α− x→α+
On dit que la fonction f : I → R est continue sur I si elle est continue en
tout point de I.

La fonction f est continue [resp. continue à gauche, resp. à droite] au point


α ∈ I si :

∀ε > 0, ∃η > 0 | ∀x ∈ I ∩ ]α − η, α + η[ , |f (x) − f (α)| < ε

resp. ∀ε > 0, ∃η > 0 | ∀x ∈ I ∩ ]α − η, α[ , |f (x) − f (α)| < ε


resp. ∀ε > 0, ∃η > 0 | ∀x ∈ I ∩ ]α, α + η[ , |f (x) − f (α)| < ε
Des définitions, on déduit immédiatement les résultats suivants.
Théorème 6.3.
Si f est continue en α ∈ I, elle est alors bornée dans un voisinage de ce
point.

Théorème 6.4.
Si α est un point intérieur à l’intervalle I, la fonction f est alors continue
en α si, et seulement si, elle est continue à gauche et à droite en α.

Une fonction f : I → R est discontinue en α intérieur à I si, et seulement si,


l’une des deux situations suivantes se produit :
— soit f n’a pas de limite à gauche ou à droite en α ;
— soit ces deux limites existent et l’une d’elles est distincte de f (α) .

Définition 6.4. Si α est intérieur à I et si la fonction f : I → R est


discontinue en α avec des limites à droite et à gauche en ce point, on dit
alors que f a une discontinuité de première espèce en α.

Si f est discontinue en α et que cette discontinuité n’est pas de première espèce,


on dit alors qu’elle est de deuxième espèce.
Théorème 6.5.
Une fonction monotone de I dans R ne peut avoir que des discontinuités
de première espèce.

Preuve. Résulte du théorème 6.2. 


De ce résultat et du théorème 6.7 on déduit que l’ensemble des points de dis-
continuité d’une fonction monotone est dénombrable. Ce résultat peut aussi se
démontrer directement comme suit.
164 Limites et continuité des fonctions d’une variable réelle

Théorème 6.6.
Si f est une fonction monotone d’un intervalle ouvert I dans R, l’en-
semble de ses points de discontinuité est alors dénombrable.

Preuve. Supposons f croissante et l’ensemble D des points de discontinuité de f


non vide. Pour tout x ∈ D, on a f (x− ) < f (x+ ) et on peut trouver un rationnel
r (x) ∈ ]f (x− ) , f (x+ )[ . De plus pour x < y dans D avec f (x+ ) ≤ f (y − ) , on
déduit que r (x) < r (y) . L’application r définit donc une injection de D dans Q,
il en résulte que D est dénombrable. 
En général une fonction monotone f définie sur un intervalle I n’est pas né-
cessairement continue, mais nous verrons plus loin que si de plus f (I) est un
intervalle, elle est alors continue (théorème 6.25).
1
Exemple 6.1 La fonction f définie sur [0, 1] par f (0) = 0 et f (x) = 6 1 7 est
x
croissante avec une infinité de points de discontinuité.

De manière plus générale, on peut montrer le résultat suivant.


Théorème 6.7.
Si I est un intervalle ouvert et f : I → R, alors l’ensemble des points de
discontinuité de première espèce de f est au plus dénombrable.

Preuve. Voir [24], chapitre 4, exercice 17. 

Exemples 6.1
1. Une fonction constante est continue sur R.
2. Pour tout entier naturel n, la fonction x → xn est continue sur R et pour tout
nombre rationnel r, la fonction x → xr est continue sur R+,∗ (exercice 6.2).
3. À partir de la continuité de fonction sin en 0 (qui se déduit de |sin (x)| ≤ |x|
pour tout réel x), on déduit que :
— la fonction cos est continue en 0 ; il suffit d’écrire que :
#x$ x2
|cos (x) − 1| = 2 sin2 ≤
2 2
— la fonction sin est continue en tout point α ∈ R ; il suffit d’écrire que :
   
x+α x−α
|sin (x) − sin (α)| = 2 cos sin ≤ |x − α| → 0
2 2 x→α

— la fonction cos est continue en tout point α ∈ R ; il suffit d’écrire que :


   
x+α x−α
|cos (x) − cos (α)| = 2 sin sin ≤ |x − α| → 0
2 2 x→α

On a aussi les caractérisations topologique et séquentielle de la notion de conti-


nuité (voir les théorèmes 1.14 et 1.16).
Limite et continuité en un point 165

Théorème 6.8.
La fonction f : I → R est continue en α ∈ I si, et seulement si, toute
suite (xn )n∈N de points de I qui converge vers α est transformée par f en
une suite convergente vers f (α) .

Dans le théorème précédent, on peut se contenter de dire que la suite (f (xn ))n∈N
est convergente, sans préciser que c’est vers f (α) .
Théorème 6.9.
La fonction f : I → R est continue sur I si, et seulement si, l’image
réciproque par f de tout ouvert [resp. fermé] de R est un ouvert [resp.
fermé] de I.

La caractérisation séquentielle de la continuité peut être utilisée pour montrer


qu’une fonction n’est pas continue en un point.

Exemples 6.2
 
1
1. La fonction définie sur R par f (0) = 0 et f (x) = cos si x = 0, n’est pas
   x
1 1 n
continue en 0 puisque lim = 0 et la suite f = ((−1) )n≥1
n→+∞ nπ nπ ∗
n∈N
est divergente.
2. La fonction caractéristique de Q définie par f (x) = 1 si x ∈ Q et f (x) = 0
sinon est discontinue en tout
 point de R. En effet, r ∈ Q est limite de la suite
√ 
2
d’irrationnels (xn )n∈N∗ = r + avec lim f (xn ) = 0 = f (r) , et un
n ∗
n→+∞
n∈N
irrationnel x ∈
/ Q étant limite d’une suite (rn )n∈N∗ de rationnels, on a encore
lim f (rn ) = f (x) .
n→+∞
3. La fonction définie sur R par f (x) = x si x ∈ Q et f (x) = 0 sinon est
continue en 0 et discontinue en tout point de R∗ . La discontinuité en tout
point de R∗ se montre comme dans l’exemple précédent. Pour la continuité en
0 il suffit de remarquer que pour tout ε > 0 la condition |x| < ε entraîne
|f (x) − f (0)| = |f (x)| < ε puisque f (x) vaut x ou 0.

Une application importante de la caractérisation séquentielle de la continuité


est le résultat de point fixe suivant.
Théorème 6.10.
Si f : I → R est telle que f (I) ⊂ I et si la suite (xn )n∈N de points de I
définie par la donnée de x0 ∈ I et la relation de récurrence xn+1 = f (xn )
converge vers un point α ∈ I en lequel la fonction f est continue, on a alors
f (α) = α, c’est-à-dire que α est un point fixe de f.

Le chapitre 12 est consacré à l’étude de ces problèmes de points fixes.


166 Limites et continuité des fonctions d’une variable réelle

Une autre application importante est le principe de prolongement des identités


[resp. des inégalités] : si f, g sont deux fonctions continues en tout point d’un
intervalle I qui coïncident [resp. telles que f (x) ≤ g (x)] en tout point d’une partie
D dense dans I (par exemple les nombres rationnels ou les nombres décimaux),
elles sont alors égales [resp. f (x) ≤ g (x) pour tout x ∈ I].
Un exemple d’utilisation de ce principe est donné par le résultat suivant.
Théorème 6.11.
Si f : R → R vérifie l’équation fonctionnelle de Cauchy :

∀ (x, y) ∈ R, f (x + y) = f (x) + f (y)

et est continue en un point, elle est alors continue en tout point et on a


f (x) = f (1) x pour tout réel x.

Preuve. Si f est continue en α, en écrivant que :


f (x0 + h) − f (x0 ) = f (h) = f (h + α) − f (α)
on déduit que f est continue en x0 . On vérifie ensuite facilement que f (r) = f (1) r
pour tout r ∈ Q et la densité de Q dans R permet de conclure. 
Le chapitre 13 est consacré à une étude détaillée des équations fonctionnelles.
Si α est un réel adhérent à I et si f a une limite finie en ce point on peut alors
prolonger f par continuité en ce point. Précisément on a le résultat suivant.
Théorème 6.12.
Si α est un réel adhérent à I n’appartenant pas à I (un point frontière)
et si la fonction f : I → R a une limite  en α, il existe alors un unique
prolongement de f à I ∪{α} qui est continu en α, ce prolongement est défini
par f:(x) = f (x) si x ∈ I et f:(α) = .

Preuve. Il est clair que la fonction f: est un prolongement de f continu en α.


Réciproquement si g est un tel prolongement, on a g = f sur I et par continuité
en α, g (α) = x→α lim f (x) =  = f:(α) . D’où l’unicité.
lim g (x) = x→α 
x=α x=α
La fonction f définie par le théorème précédent est appelée le prolongement par
continuité de f en α. On le note souvent f au lieu de f:.
Exemples 6.3
 
1
1. Pour α > 0 et β > 0, la fonction f : x → xα sin définie sur R∗ se

prolonge par continuité en 0 en posant f (0) = 0.
 
1
2. La fonction f : x → sin définie sur R∗ ne peut pas se prolonger par
x
continuité en 0 du fait qu’elle n’a pas de limite en ce point.
On rappelle qu’une fonction f : I → R est uniformément continue sur I si :
2
∀ε > 0, ∃η > 0 | ∀ (x, y) ∈ (I ∩ ]α − η, α + η[) , |f (x) − f (α)| < ε
Opérations sur les fonctions continues 167

ce qui équivaut à dire que pour toutes suites (xn )n∈N et (yn )n∈N d’éléments de I
telles que lim |xn − yn | = 0, on a lim |f (xn ) − f (yn )| = 0.
n→+∞ n→+∞
Dans le cas où I est un segment, donc un compact, toute fonction continue sur
I est uniformément continue (théorème 1.19).

6.2 Opérations sur les fonctions continues


Les résultats relatifs à la continuité et les opérations usuelles sur les fonctions
sont résumés par le théorème qui suit.
Théorème 6.13.
Soient f, g deux fonctions définies sur I, à valeurs réelles et continues en
α ∈ I. Les fonctions |f | , f + g, f g, min (f, g) et max (f, g) sont continues
en α.

Preuve. La continuité de |f | résulte de :

||f (x)| − |f (α)|| ≤ |f (x) − f (α)| → 0


x→α

Pour la somme, la continuité se déduit de l’inégalité triangulaire :

|(f + g) (x) − (f + g) (α)| ≤ |f (x) − f (α)| + |g (x) − g (α)| → 0


x→α

Pour le produit, la continuité se déduit de l’inégalité triangulaire et du fait que


f (ou g) est bornée au voisinage de α :

|(f g) (x) − (f g) (α)| ≤ |f (x)| |g (x) − g (α)| + |g (α)| |f (x) − f (α)|


≤ M |g (x) − g (α)| + |g (α)| |f (x) − f (α)| → 0
x→α

où M est un majorant de |f | au voisinage de α. Enfin la continuité de min (f, g)


et max (f, g) se déduit de :
1 1
min (f, g) = (f + g − |f − g|) et max (f, g) = (f + g + |f − g|)
2 2

Avec la continuité de la fonction constante égale à 1 et de la fonction x → x en
tout point de R, on en déduit la continuité des fonctions polynomiales.
Pour les quotients de fonctions continues, on a besoin du résultat suivant.

Lemme 6.1 Si f : I → R est continue en α ∈ I avec f (α) > 0 [resp. f (α) < 0],
il existe alors un voisinage V de α dans I tel que f (x) > 0 [resp. f (x) < 0] pour
tout x ∈ V.

Preuve. Supposons f (α) > 0. Pour ε ∈ ]0, f (α)[ on peut trouver η > 0 tel que
|x − α| < η dans I entraîne |f (x) − f (α)| < ε, ce qui implique f (x) > f (α)−ε > 0
pour tout x dans ce voisinage. 
168 Limites et continuité des fonctions d’une variable réelle
 b
De ce résultat on déduit que la forme linéaire positive ϕ → ϕ (t) dt, définie
a
sur l’espace vectoriel E = C 0 ([a, b] , R) des applications continues sur l’intervalle
 b
[a, b] (a < b) et à valeurs dans R, est telle que l’égalité ϕ (t) dt = 0 équivaut
a
à ϕ = 0 si ϕ ∈ E est à valeurs positives ou nulles, ce qui permet de montrer
 b
que l’application f → f 1 = |f (t)| dt définit une norme sur E (norme de la
a
convergence en moyenne).
Théorème 6.14.
1
Si f : I → R est continue en α ∈ I avec f (α) = 0, la fonction est
f
alors définie dans un voisinage de α et est continue en ce point.

Preuve. En supposons f (α) > 0 et en gardant les notations précédentes, on a


f (x) > f (α) − ε > 0 pour x voisin de α et :

1 1 f (x) − f (α) |f (x) − f (α)|


− = ≤ → 0
f (x) f (α) f (x) f (α) (f (α) − ε) f (α) x→α


f
De ce résultat on déduit la continuité de en α si f, g sont continues en ce
g
point avec g (α) = 0.
De la continuité des fonctions polynomiales, on déduit la continuité des fonctions
rationnelles en tout point de leur domaine de définition.
De la continuité
8 πdesπ fonctions
9 sin et cos sur R, on déduit la continuité de la
fonction tan sur − , .
2 2
Pour la composition des applications, on a le résultat suivant.
Théorème 6.15.
Si f : I → R est continue en α ∈ I, J est un intervalle réel contenant
f (I) et g : J → R est continue en β = f (α) , g ◦ f est alors continue en α.

Preuve. Pour ε > 0 donné, on peut trouver un réel η > 0 tel que |y − β| < η
dans J entraîne |g (y) − g (β)| < ε et il existe η  > 0 tel que |x − α| < η  dans
I entraîne |f (x) − f (α)| < η, ce qui implique |(g ◦ f ) (x) − (g ◦ f ) (α)| < ε pour
tout x dans I tel que |x − α| < η  . 
1
La continuité de peut se retrouver en composant la fonction f dans un voi-
f
1
sinage de α où elle est non nulle avec y → .
y
Fonctions périodiques continues 169

6.3 Fonctions périodiques continues


Si f est une fonction de R dans R, on dit que T ∈ R est une période de f si
f (x + T ) = f (x) pour tout réel x. On vérifie facilement que l’ensemble P (f ) de
toutes les périodes de f est un sous-groupe additif de (R, +) . Un tel sous-groupe
est alors dense ou discret (théorème 4.35).
Une fonction f de R dans R est dite périodique si P (f ) n’est pas réduit à {0} .

Exemples 6.4
1. Une fonction f : R → R est constante si, et seulement si, P (f ) = R (qui est
dense dans R). En effet, si f est constante égale à λ, on a alors pour tous réels
T et x, f (x + T ) = λ = f (x) et T ∈ P (f ) , donc P (f ) = R. Réciproquement
si P (f ) = R, tout réel x est une période et f (x) = f (0 + x) = f (0) , donc f
est constante.
2. Si f = 1G est la fonction caractéristique d’un sous-groupe additif G de R, on a
alors P (f ) = G. En effet, pour tout T ∈ G et tout x ∈ G, on a x + T ∈ G et
f (x + T ) = 1 = f (x) . Pour tout x ∈ R \ G, on a x + T ∈ R \ G (sinon x =
(x + T ) − T ∈ G) et f (x + T ) = 0 = f (x) . Donc T ∈ P (f ) . Réciproquement
si T ∈ P (f ) , on a alors 1 = f (0) = f (T ) et T ∈ G. D’où l’égalité P (f ) = G.

Théorème 6.16.
Si f : R → R est une fonction continue non constante, son groupe des
périodes P (f ) est alors fermé dans R et f est périodique si, et seulement
si, P (f ) est discret non réduit à {0} .

Preuve. Soit (Tn )n∈N une suite d’éléments de P (f ) convergente vers un réel T.
Par continuité de f on a pour tout réel x, f (x + T ) = lim f (x + Tn ) = f (x) ,
n→+∞
c’est-à-dire que T ∈ P (f ) . L’ensemble P (f ) est donc fermé dans R. On peut aussi
procéder  comme suit. En notant fa (t) = f (a + t) − f (t) pour tout réel a, on a
P (f ) = fa−1 {0} et pour f continue, cet ensemble est fermé comme intersection
a∈R
de fermés.
Comme f est continue non constante, P (f ) est un sous-groupe fermé de R
distinct de R et en conséquence, il ne peut être dense dans R, donc il est discret
de la forme P (f ) = ZT. Dans le cas où f est périodique, on a P (f ) = {0} et
T > 0 (T est la plus petite période de f ). La réciproque résulte de la définition
d’une fonction périodique. 

6.4 Propriétés globales des fonctions continues


On peut se reporter au paragraphe 1.4 pour les propriétés globales des fonctions
continues entre espaces métriques.
Un résultat important relatif aux fonctions continues sur un compact de R est
le suivant.
170 Limites et continuité des fonctions d’une variable réelle

Théorème 6.17.
Si K est un compact de R, toute fonction continue de K dans R est alors
uniformément continue sur K.

Preuve. Voir le théorème 1.19. 


Comme première application de ce résultat, on peut montrer que toute fonc-
tion f continue sur un segment [a, b] est limite uniforme d’une suite de fonctions
continues affines par morceaux. De manière plus précise, soit f continue sur [a, b] .
Pour tout entier n ≥ 1 on définit une subdivision de [a, b] en notant :

b−a
xk = a + k (0 ≤ k ≤ n)
n
et à cette subdivision on associe la fonction fn définie par :
x − xk
fn (x) = f (xk ) + (f (xk+1 ) − f (xk ))
xk+1 − xk

(fn coïncide avec f aux xk et est affine sur [xk , xk+1 ]). Cette fonction est affine
par morceaux et continue sur [a, b] .

Lemme 6.2 La suite (fn )n≥1 converge uniformément vers f sur [a, b] .

Preuve. La fonction f continue sur le compact [a, b] y est uniformément continue,


donc pour ε > 0 donné on peut trouver un réel η > 0 tel que si x, y dans [a, b] sont
b−a
tels que |x − y| ≤ η, on a alors |f (x) − f (y)| < ε. Pour tout entier n ≥ et
η
b−a
tout entier k compris entre 0 et n − 1 on a xk+1 − xk = ≤ η. Sachant qu’un
n
b−a
réel x ∈ [a, b] est dans l’un des intervalles [xk , xk+1 ] , on obtient pour n ≥ :
η

x − xk
|f (x) − fn (x)| = f (x) − f (xk ) − (f (xk+1 ) − f (xk ))
xk+1 − xk
x − xk
≤ |f (x) − f (xk )| + |f (xk+1 ) − f (xk )|
xk+1 − xk
x − xk
≤ε+ ε ≤ 2ε
xk+1 − xk

ce qui prouve la convergence uniforme sur [a, b] de (fn )n∈N∗ vers f. 


Ce résultat peut être utilisé pour prouver, sans théorie de l’intégration, que
toute fonction f continue sur un intervalle compact admet une primitive.
On vérifie tout d’abord qu’une fonction affine par morceaux et continue sur
[a, b] admet une primitive, ce qui n’est pas difficile.
Si, avec les notations qui précèdent, on désigne pour tout n ≥ 1 par Fn la
primitive de fn nulle en a, on constate que la suite (Fn )n≥1 converge uniformément
sur [a, b] vers f et que la suite (Fn (a))n≥1 converge vers 0. On déduit alors du
théorème 9.30, que la suite (Fn )n≥1 converge uniformément sur [a, b] vers une
Propriétés globales des fonctions continues 171

fonction dérivable F et que F  = f, c’est-à-dire que F est une primitive de f sur


[a, b] . On peut alors définir l’intégrale d’une fonction f continue sur [a, b] par :
 b
f (x) dx = F (b) − F (a)
a

où F est une primitive de f sur cet intervalle.


Une deuxième application est relative aux fonctions périodiques.
Théorème 6.18.
Toute fonction continue sur R périodique de période 2T > 0 et à valeurs
réelles est uniformément continue.

Preuve. Toute fonction f continue sur R périodique de période 2T est unifor-


mément continue sur le compact J = [−T − 1, T + 1] . Donc pour tout ε > 0, on
peut trouver un réel η ∈ ]0, 1[ tel que :

(t, x) ∈ J 2 , |t − x| ≤ η =⇒ (|f (t) − f (x)| ≤ ε)

Pour x ∈ [−T, T ] et t ∈ R tels que |t − x| ≤ η on a nécessairement t ∈ J (η ∈ ]0, 1[)


2
et |f (t) − f (x)| ≤ ε. Pour (t, x) ∈ R tels que |t − x| ≤ η et n ∈ Z tel que
x+T
x − 2nT ∈ [−T, T ] (n = E ) on a |(t − 2nT ) − (x − 2nT )| ≤ η et :
2T

|f (t) − f (x)| = |f (t − 2nT ) − f (x − 2nT )| ≤ ε

On a donc ainsi prouvé que f est uniformément continue sur R. 


Une troisième application importante est le résultat suivant de continuité d’une
fonction définie par une intégrale sur un segment.
Théorème 6.19.
Soit f une fonction à valeurs réelles définie et continue sur I × [a, b] , où
I est un intervalle réel non réduit à un point et a < b dans R. La fonction
 b
ϕ définie sur I par ϕ (x) = f (x, t) dt pour tout x ∈ I est continue sur I.
a

Preuve. On se fixe x0 dans I et un intervalle [α, β] contenu dans I, contenant


x0 , avec α < β. La fonction f étant continue sur le compact K = [α, β] × [a, b] ,
elle y est uniformément continue, donc pour tout réel ε > 0 on peut trouver
un réel η > 0 tel que |f (x, t) − f (u, v)| < ε pour tous (x, t) et (u, v) dans
K tels que (x, t) − (u, v)∞ < η. Pour x dans I tel que |x − x0 | < η, on a
(x, t) − (x0 , t)∞ < η pour tout t ∈ [a, b] et :
 b
|ϕ (x) − ϕ (x0 )| ≤ |f (x, t) − f (x0 , t)| dt < (b − a) ε
a

ce qui prouve la continuité de ϕ en x0 . 


La version réelle du théorème 1.21 est la suivante.
172 Limites et continuité des fonctions d’une variable réelle

Théorème 6.20.
Toute fonction définie sur un intervalle réel fermé borné [a, b] à valeurs
réelles et continue est bornée et atteint ses bornes.

Ce résultat permet de définir sur C 0 ([a, b] , R) la norme de la convergence uni-


forme par f ∞ = sup |f (x)| pour tout f ∈ C 0 ([a, b] , R) .
x[a,b]
En utilisant le théorème précédent et le théorème des valeurs intermédiaires
(théorème 6.23), on obtient le résultat suivant.
Théorème 6.21. Formules de la moyenne

Soient f, g deux fonctions à valeurs réelles définies et continues sur [a, b] .


1. Dans le cas où la fonction g est de signe constant, il existe un réel
c ∈ [a, b] tel que :
 b  b
f (x) g (x) dx = f (c) g (x) dx
a a

(première formule de la moyenne).


2. Dans le cas où la fonction f est de classe C 1 , à valeurs réelles positives
et décroissante sur [a, b] , il existe un réel c ∈ I tel que :
 b  c
f (x) g (x) dx = f (a) g (x) dx
a a

(deuxième formule de la moyenne).

Preuve.
1. La fonction f étant continue sur le compact [a, b] est bornée et atteint ses bornes,
il existe donc deux réels α, β dans [a, b] tels que m = inf f (x) = f (α) ,
x∈[a,b]
M = sup f (x) = f (β) . En supposant g à valeurs positives ou nulles, on a
x∈[a,b]
mg (x) ≤ f (x) g (x) ≤ M g (x) pour tout x ∈ [a, b] et :
 b  b  b
m g (x) dx ≤ f (x) g (x) dx ≤ M g (x) dx
a a a
 b  b
Dans le cas où γ = g (x) dx = 0, on a
f (x) g (x) dx = 0 et n’importe quel
a  a
1 b
point c convient. Pour γ = 0, on a γ > 0, δ = f (x) g (x) dx ∈ [f (α) , f (β)]
γ a
et le théorème des valeurs intermédiaires nous dit qu’il existe un réel c compris
entre α et β tel que δ = f (c) , ce qui donne la première formule de la moyenne.
2. Soit G la primitive de g nulle en a. Une intégration par parties nous donne :
 b  b
f (x) g (x) dx = f (b) G (b) − f  (x) G (x) dx
a a
Le théorème des valeurs intermédiaires 173

La fonction G étant continue sur le compact [a, b] est bornée et on peut noter
m = inf G (x) , M = sup G (x) . Comme f est à valeurs positives, on a :
x∈[a,b] x∈[a,b]

mf (b) ≤ f (b) G (b) ≤ M f (b)

Si de plus f est de classe C 1 et décroissante, on a alors f  (x) ≤ 0 pour tout


x ∈ [a, b] et M f  (x) ≤ f  (x) G (x) ≤ mf  (x) , ce qui donne par intégration :
 b
M (f (b) − f (a)) ≤ f  (x) G (x) dx ≤ m (f (b) − f (a))
a

Il en résulte que :
 b
mf (b) − m (f (b) − f (a)) ≤ f (x) g (x) dx ≤ M f (b) − M (f (b) − f (a))
a
 b
soit mf (a) ≤ f (x) g (x) dx ≤ M f (a) . Dans le cas où f (a) = 0, on a
 b a

f (x) g (x) dx = 0 et la formule est vérifiée pour tout c ∈ [a, b] . Dans le cas
a  b
1
contraire, on a f (a) > 0 et m ≤ f (x) g (x) dx ≤ M, ce qui entraîne
f (a) a
 b
1
l’existence de c ∈ [a, b] tel que f (x) g (x) dx = G (c) (théorème des
f (a) a
valeurs intermédiaires pour la fonction continue G).

La seconde formule de la moyenne est encore valable pour f, g continues par
morceaux sur I, la fonction f étant décroissante à valeurs positives (voir [19]).

6.5 Le théorème des valeurs intermédiaires


Sachant que les connexes de R sont les intervalles (corollaire 2.1), la version
réelle du théorème 1.22 est la suivante.
Théorème 6.22.
Si I est un intervalle réel et f une fonction continue de I dans R, alors
f (I) est un intervalle.

Si la fonction f n’est pas continue en tout point de I, alors f (I) n’est pas
nécessairement un intervalle comme le montre l’exemple de la fonction f définie
sur I = [0, 2] par f (x) = 1 si 0 ≤ x ≤ 1 et f (x) = 2 si 1 < x ≤ 2 (cette fonction
est continue sur I \ {1} avec f (I) = {1, 2}).
De ce théorème, on déduit le théorème des valeurs intermédiaires.
174 Limites et continuité des fonctions d’une variable réelle

Théorème 6.23. Valeurs intermédiaires


Si I = [a, b] où a < b et f est une fonction continue de I dans R telle
que f (a) f (b) < 0, l’équation f (x) = 0 admet alors au moins une solution
α ∈ ]a, b[.

Preuve. Remplaçant au besoin f par −f, on peut supposer que f (a) < 0 < f (b) .
Première démonstration. L’image f (I) est un intervalle qui contient f (a) et
f (b) , donc [f (a) , f (b)] ⊂ f (I) et de 0 ∈ [f (a) , f (b)] , on déduit qu’il existe
α ∈ I tel que f (α) = 0 avec α est différent de a et b puisque f (a) f (b) = 0.
Deuxième démonstration, directe. L’ensemble A = {x ∈ [a, b] | f (x) ≤ 0} étant
non vide (a ∈ A) et majorée (par b) dans R, il admet une borne supérieure α dans
[a, b] . La fonction f étant continue sur [a, b] , on peut trouver η > 0 tel que :

∀x ∈ [a, a + η] ⊂ [a, b] , f (x) < 0


∀x ∈ [b − η, b] ⊂ [a, b] , f (x) > 0

On a a < a + η ≤ α ≤ b − η < b et α ∈ ]a, b[ , donc il existe n0 ∈ N∗ tel que



1 1
α− ,α + ⊂ ]a, b[ et par définition de la borne supérieure, pour tout entier
n0 n0
1 1
n ≥ n0 il existe xn ∈ A tels que α − < xn ≤ α. En posant yn = α + , on a
n n
yn ∈ [a, b] − A et xn ≤ α < yn . On a alors α = lim xn = lim yn avec, pour
n→+∞ n→+∞
tout entier n ≥ n0 , f (xn ) ≤ 0 (xn ∈ A) et f (yn ) > 0 (yn ∈ [a, b] − A). Avec la
continuité de f on déduit alors que :

f (α) = lim f (xn ) ≤ 0, f (α) = lim f (yn ) ≥ 0


n→+∞ n→+∞

soit f (α) = 0.
Troisième démonstration. En utilisant le théorème des segments emboîtés (voir
le théorème 4.17). 
Si, avec les hypothèses du théorème précédent, la fonction f est de plus stric-
tement monotone, elle est alors injective et la solution α de l’équation f (x) = 0
dans l’intervalle [a, b] est unique.
La réciproque du théorème des valeurs intermédiaires n’est pas vraie, c’est-à-
dire qu’une fonction peut vérifier la propriété des valeurs intermédiaires sans être
continue. Par exemple le théorème de Darboux (théorème 7.18) nous dit qu’une
fonction dérivée vérifie la propriété des valeurs intermédiaires et il existe des fonc-
tions dérivables de dérivée non continue.On peut aussi considérer l’exemple de la
1
fonction f définie sur R par f (x) = sin si x = 0 et f (0) = 0 (exercice 6.16).
x
Précisément, on dira qu’une fonction f définie sur un intervalle réel I et à
valeurs réelles vérifie la propriété des valeurs intermédiaires si pour tout intervalle
J contenu dans I, f (J) est un intervalle.
Ce qu’il manque à une fonction vérifiant la propriété des valeurs intermédiaires
sur un intervalle compact [a, b] pour être continue est donné par le résultat suivant.
Fonctions réciproques 175

Théorème 6.24.
Si f est une fonction à valeurs réelles définie sur un intervalle I véri-
fiant la propriété des valeurs intermédiaires, elle est alors continue si, et
seulement si, pour tout réel y, l’ensemble f −1 {y} est fermé dans I.

Preuve. Si f est continue, on sait qu’elle vérifie la propriété des valeurs inter-
médiaires et l’image réciproque du fermé {y} par f est fermé. Réciproquement
supposons que f : I → R vérifie la propriété des valeurs intermédiaires et que
f −1 {y} est fermé dans I pour tout y ∈ R. On se donne x0 ∈ I et ε > 0.
Les ensembles F1 = f −1 {f (x0 ) − ε} et F2 = f −1 {f (x0 ) + ε} sont des fermés
(éventuellement vides) de I qui ne contiennent pas x0 , donc x0 est dans l’ouvert
O = (I \ F1 ) ∩ (I \ F2 ) et il existe η > 0 tel que J = I ∩ ]x0 − η, x0 + η[ ⊂ O. Pour
tout x ∈ J on a f (x) = f (x0 ) ± ε et f (J) est un intervalle qui contient f (x0 ) ,
nécessairement f (J) ⊂ ]f (x0 ) − ε, f (x0 ) + ε[ , c’est-à-dire que |f (x) − f (x0 )| < ε
pour tout x ∈ I ∩ ]x0 − η, x0 + η[ . On a donc ainsi montré que f est continue en
tout point de I. 
On peut affaiblir les hypothèses dans le théorème précédent en remplaçant
l’hypothèse, f −1 {y} est fermé dans I pour tout réel y, par f −1 {y} est fermé dans
I pour tout rationnel y (voir [8], exercice 4.1).
Dans le cas particulier des fonctions monotones, on a le résultat suivant, où
I = ]a, b[ est un intervalle ouvert avec −∞ ≤ a < b ≤ +∞.
Théorème 6.25.
Si f est une fonction monotone de I dans R telle que f (I) soit un in-
tervalle, elle est alors continue sur I.

Preuve. On suppose que f est croissante. Il s’agit de montrer que pour tout
x ∈ I on a lim f (t) = f (x) . On sait déjà que f admet une limite à gauche et à
t→x
droite en x avec f (x− ) ≤ f (x) ≤ f (x+ ) (théorème 6.2). Il s’agit alors de montrer
que f (x− ) = f (x+ ) = f (x) . Si f (x− ) < f (x) , on peut alors trouver, pour ε > 0
donné, x0 ∈ ]a, x[ tel que f (x− ) − ε < f (x0 ) ≤ f (x− ) < f (x) . Mais si de plus
f (I) est un intervalle alors tout λ ∈ ]f (x− ) , f (x)[ étant dans ]f (x0 ) , f (x)[ s’écrit
λ = f (x1 ) avec x1 ∈ ]x0 , x[ et on a alors λ = f (x1 ) ≤ f (x− ) en contradiction
avec λ > f (x− ) . On a donc f (x− ) = f (x) . On montre de manière analogue que
f (x) = f (x+ ) . Les limites à droite et à gauche en x sont donc égales à f (x) , ce
qui prouve la continuité de f en x. 

6.6 Fonctions réciproques


On désigne par I un intervalle réel non réduit à un point.
Si f est une application injective de I dans R, elle définit alors une bijection de
I sur f (I) et on peut définir sa fonction réciproque notée f −1 par :

y ∈ f (I) et x = f −1 (y) ⇔ (x ∈ I et y = f (x))


176 Limites et continuité des fonctions d’une variable réelle

Un cas particulièrement intéressant est celui des fonctions strictement mono-


tones.
Théorème 6.26.
Si f est une application strictement monotone de I dans R, elle réalise
alors une bijection de I sur f (I) d’inverse strictement monotone et de
même sens de variation que f.

Preuve. En remplaçant éventuellement f par −f, on peut supposer que f est


strictement croissante. Si x = y dans I on a x < y ou y < x (l’ordre de R est
total) ce qui entraîne f (x) < f (y) ou f (y) < f (x) , soit f (x) = f (y) dans tous
les cas. La fonction f est donc injective et elle réalise une bijection de I sur f (I) .
Il est facile de vérifier que la fonction réciproque f −1 est également strictement
croissante. 
Sans hypothèse de continuité pour f, l’image f (I) n’est pas nécessairement
un intervalle comme le montre l’exemple de la fonction f définie sur [0, 2] par
f (x) = x pour 0 ≤ x ≤ 1 et f (x) = x + 1 pour 1 < x ≤ 2.
En réalité si f est strictement monotone et f (I) est un intervalle, la fonction
f est alors nécessairement continue (théorème 6.25) ainsi que la fonction f −1 .
Le théorème qui suit est à la base des définitions de fonctions réciproques clas-
siques comme les fonctions racines n-ème, la fonction exponentielle, les fonctions
trigonométriques et hyperboliques inverses.
Théorème 6.27.
Si f est une application continue et strictement monotone de I dans R,
f (I) est alors un intervalle de même nature que I et f est une bijection de
I sur f (I) d’inverse f −1 continue strictement monotone de même sens de
variation que f (f est un homéomorphisme).

Preuve. Si f est strictement monotone, elle est alors injective. Si de plus elle est
continue, J = f (I) est alors un intervalle (théorème des valeurs intermédiaires).
La fonction réciproque f −1 étant strictement monotone de J sur I = f −1 (J) qui
est un intervalle, elle est continue. Il nous reste à montrer que J = f (I) est de
même nature que I. En notant −∞ ≤ a < b ≤ +∞ les extrémités de I et en
supposant f strictement croissante, J est un intervalle d’extrémités :
lim f (x) , β = sup (f (I)) = lim f (x)
α = inf (f (I)) = x→a
x→b
x>a x<b

Si a ∈ I alors α = f (a) ∈ J et de même pour b. Si a ∈ / I alors α ∈/ J (il suffit


de raisonner avec f −1 qui a les mêmes propriétés que f ) et α < f (x) pour tout
x ∈ J. De même pour b. Les intervalles I et J sont donc de même nature. 
Sans hypothèse de stricte monotonie, l’intervalle f (I) n’est pas nécessairement
de même nature que I comme le montre l’exemple de la fonction f définie par
f (x) = |x| sur l’intervalle I = ]−1, 1[ (f (I) = [0, 1[).
Ce résultat nous permet de définir la fonction exponentielle comme l’inverse de
la fonction logarithme définie comme la primitive sur R+,∗ nulle en 1 de la fonction
1
x → . De ln (x) > 0 sur R+,∗ on déduit que ln est strictement croissante sur
x
Fonctions réciproques 177

R+,∗ , puis avec ln (2) > ln (1) = 0, ln (2n ) = n


ln 
(2) que cette fonction n’est
1
pas bornée et lim ln (x) = +∞. Enfin avec ln = − ln (x) , on déduit que
x→+∞ x
lim ln (x) = −∞. La fonction ln est donc continue strictement croissante de R+,∗
x→0
sur R, c’est donc un homéomorphisme de R+,∗ sur R et sa fonction réciproque est
la fonction exponentielle x → ex . Cette fonction est donc définie par :

(x ∈ R et y = ex ) ⇔ y ∈ R+,∗ et x = ln (y)

Pour tout entier naturel non nul n, avec la continuité et la stricte croissance de
la fonction x → xn de R+ sur R+ , on aboutit à la définition de la fonction racine
n-ème : √
x ∈ R+ et y = n x ⇔ y ∈ R+ et x = y n .
Avec les mêmes arguments, on définit les fonctions trigonométriques inverses :
⎧ # 9 π π8 $

⎪ (x ∈ [−1, 1] et y = arcsin (x)) ⇔ y ∈ − , et x = sin (y)

⎪ 2 2

(x ∈ [−1, 1] et y = arccos (x)) ⇔ (y ∈ [0, π] et x = cos (y))

⎪ # 8 9 $


⎩ (x ∈ R et y = arctan (x)) ⇔ y ∈ − π , π et x = tan (y)
2 2
et les fonctions hyperboliques inverses :


⎪ (x ∈ R et y = argsh (x)) ⇔ (y ∈ R et x = sh (y))

(x ∈ [1, +∞[ et y = argch (x)) ⇔ (y ∈ R+ et x = ch (y))



(x ∈ R et y = argth (x)) ⇔ (y ∈ R et x = th (y))

On a vu qu’une fonction strictement monotone est injective, mais en général la


réciproque est fausse comme le montre l’exemple de la fonction f définie sur [0, 2]
x
par f (x) = x pour 0 ≤ x ≤ 1 et f (x) = 1− pour 1 < x ≤ 2 (faire un graphique).
2
Mais dans le cas où f est continue, il y a équivalence. De manière précise, on a le
résultat suivant.
Théorème 6.28.
Soit f une fonction continue de I dans R. Cette fonction f est injective
si, et seulement si, elle est strictement monotone.

Preuve. Si f est strictement monotone, il est clair qu’elle est injective (qu’elle
soit continue ou non). Pour la réciproque, on propose trois démonstrations.
Supposons f continue et injective de I dans R.
Première démonstration. S’il existe x < y < z dans I tels que f (x) < f (z) <
f (y) alors tout réel u dans ]f (z) , f (y)[ ⊂ ]f (x) , f (y)[ va s’écrire u = f (c) = f (d)
avec c ∈ ]y, z[ et d ∈ ]x, y[ , donc c = d, ce qui contredit l’injectivité de f. La
fonction f est donc strictement monotone.
Deuxième démonstration. Pour a < b dans I, on a f (a) = f (b) . Supposons que
f (a) < f (b) . Nous allons alors montrer que f est strictement croissante. Pour
x < y dans I, l’application ϕ : t → ϕ (t) = f (ta + (1 − t) x) − f (tb + (1 − t) y) est
178 Limites et continuité des fonctions d’une variable réelle

continue sur [0, 1] et ne s’annule jamais sur cet intervalle (comme f est injective,
ϕ (t) = 0 équivaut à t (b − a) + (1 − t) (y − x) = 0 encore équivalent à t (b − a) =
(1 − t) (y − x) = 0 qui est impossible). Cette fonction garde donc un signe constant
sur [0, 1] et en particulier ϕ (0) = f (x) − f (y) est de même signe que ϕ (1) =
f (a) − f (b) , c’est-à-dire que f (x) < f (y) .
Troisième démonstration. On utilise  la fonction g définie par g (x, y) = f (x) −
f (y) sur Δ = (x, y) ∈ I 2 | x < y ⊂ R2 . Cette fonction est continue sur Δ qui
est convexe donc connexe, ce qui implique que g (Δ) est connexe dans R∗ (f
est injective), c’est donc un intervalle de R∗ et on a soit g (Δ) ⊂ R+,∗ et f est
strictement croissante, soit g (Δ) ⊂ R−,∗ et f est strictement décroissante. 
Si f est une fonction continue bijective de I (intervalle réel) sur f (I) , elle est
alors strictement monotone et f −1 est continue. Mais de manière plus générale
si f est une application continue bijective d’un espace métrique E sur un espace
métrique F, son application réciproque f −1 n’est pas nécessairement continue. Par
exemple l’application f : x → eix est continue bijective de [0, 2π[ sur le cercle unité
Γ = {z ∈ C | |z| = 1} et f −1 : z → arg (z) n’est pas continue puisque l’image du
compact Γ égale à [0, 2π[ n’est pas compacte. On peut aussi considérer l’application
identité de l’espace E = C 0 ([0, 1] , R) des fonctions continues de [0, 1] dans R muni
de la norme de la convergence uniforme f → f ∞ = sup |f (x)| , dans l’espace
[0,1]
 1
F = E muni de la norme de la convergence en moyenne f → f 1 = |f (x)| dx,
0
qui est bijective continue d’inverse non continue (ces deux normes ne sont pas
équivalentes).

6.7 Prépondérance, domination et équivalents


Pour ce paragraphe, I désigne un intervalle réel non réduit à un point, a un
élément de l’adhérence I de I (éventuellement a = ±∞), f une fonction définie
sur I à valeurs réelles et n un entier naturel. Dans un premier temps on considère
le cas où a est réel.

Définition 6.5. Soient f, g deux fonctions à valeurs réelles définies sur I.


On dit que g est prépondérante devant f, ou que f est négligeable devant g,
au voisinage de a si :

∀ε > 0, ∃η > 0 | (x ∈ I, |x − a| < η) ⇒ |f (x)| ≤ ε |g (x)|

On note alors f = o (g) (notation de Landau).


x→a

Dire que f est négligeable devant g = 0 signifie que f est identiquement nulle
dans un voisinage de a (éventuellement privé de a).
La notation f = o (g) n’est pas réellement une égalité, elle signifie que f
x→a
appartient à l’ensemble des fonctions négligeables devant g au voisinage de a et
on devrait plutôt noter f ∈ o (g) .
x→a
Une définition équivalente est donnée par le résultat suivant.
Prépondérance, domination et équivalents 179

Théorème 6.29.
Avec les notations précédentes, f est négligeable devant g, au voisinage
de a si, et seulement si, il existe une fonction ε : I → R telle que :

∀x ∈ I, f (x) = ε (x) g (x)
lim ε (x) = 0
x→a

Preuve. La condition suffisante se déduit immédiatement de la définition de la


limite en a et pour la condition nécessaire, on définit la fonction ε par :


⎨ f (x) si g (x) = 0
∀x ∈ I, ε (x) = g (x)


0 si g (x) = 0


Définition 6.6. Soient f, g deux fonctions à valeurs réelles définies sur I.


On dit que f est dominée par g, au voisinage de a si :

∃M ≥ 0, ∃η > 0 | (x ∈ I, |x − a| < η) ⇒ |f (x)| ≤ M |g (x)|

On note alors f = O (g) (notation de Landau).


x→a

Dans le cas où a est infini les définitions précédentes deviennent :

Définition 6.7. Soient f, g deux fonctions à valeurs réelles définies sur un


voisinage I de +∞ [resp. −∞]. On dit que g est prépondérante devant f,
ou que f est négligeable devant g, au voisinage de +∞ [resp. −∞] si :

∀ε > 0, ∃η > 0 | (x ∈ I, x > η [resp. x < −η]) ⇒ |f (x)| ≤ ε |g (x)|

Définition 6.8. Soient f, g deux fonctions à valeurs réelles définies sur un


voisinage I de +∞ [resp. −∞]. On dit que f est dominée par g, au voisinage
de +∞ [resp. −∞] si :

∃M ≥ 0, ∃η > 0 | (x ∈ I, x > η [resp. x < −η]) ⇒ |f (x)| ≤ M |g (x)|

Comme dans le cas où a est réel, f est négligeable devant g au voisinage de


+∞ [resp. −∞] si, et seulement si, f = εg au voisinage de +∞ [resp. −∞] avec
lim ε (x) = 0 [resp. lim ε (x) = 0].
x→+∞ x→−∞
En partant des inégalités 0 < ln (x) < x pour tout réel x > 1, on déduit que,
pour tout réel α > 0, ln (x) est négligeable devant xα au voisinage de l’infini, ce qui
permet de déduire les résultats classiques suivants sur les croissances comparées
des fonctions puissance, exponentielle et logarithme au voisinage de l’infini :
α
(ln (x)) = o xβ , xβ = o (eγx )
x→+∞ x→+∞
180 Limites et continuité des fonctions d’une variable réelle

où α, β, γ sont des réels strictement positifs. Précisément, on commence par mon-


trer le résultat suivant.

Lemme 6.3 Pour tout réel α strictement positif, ln (x) est négligeable devant xα
au voisinage de l’infini.

Preuve. En posant u (x) = ln (x) , v (x) = x, on a :



u (1) = 0 < v (1) = 1
1
∀x > 1, u (x) = < v  (x) = 1
x
ce qui entraîne ln (x) < x pour tout x ≥ 1. On en déduit alors que pour tout réel
α > 0, on a :
α α
ln (x) 2 ln x 2 2 x2
∀x > 1, 0 < α
= < → 0
x α xα α xα x→+∞

ln (x)
ce qui entraîne lim = 0, soit ln (x) = o (xα ) . 
x→+∞ xα x→+∞

Pour α ≤ 0, on a directement lim = 0 et xα = o (ln (x)) .
x→+∞ ln (x) +∞

Théorème 6.30.
α
Pour tous réels α, β, γ strictement positifs, on a (ln (x)) = o xβ
x→+∞
et xβ = o (eγx ) .
x→+∞

⎛ # β $ ⎞α
(ln (x))
α
α ln xα
Preuve. Pour x > 1, on a lim = lim ⎝ ⎠ = 0 et

x→+∞ x→+∞ β x αβ
  
xβ ln (x)
lim γx = lim exp x β −γ = 0. 
x→+∞ e x→+∞ x
Des définitions, on déduit facilement les résultats suivants.
Théorème 6.31.

Les fonctions considérées étant définies au voisinage de a ∈ R éventuel-


lement privé de a, on a :
— f = o (1) si, et seulement si, lim f (x) = 0 ;
x→a x→a
— f = O (1) si, et seulement si, f est bornée au voisinage de a ;
x→a
— si f = o (g) , on a alors f = O (g) ;
x→a x→a
— si f = o (g) et g = O (h) , on a alors f = o (h) ;
x→a x→a x→a
— si f = O (g) et g = o (h) , on a alors f = o (h) ;
x→a x→a x→a
— si f = o (g) et h = o (g) , on a alors λf + μh = o (g) pour
x→a x→a x→a
tous réels λ, μ ;
Prépondérance, domination et équivalents 181

— si f = O (g) et h = O (g) , on a alors λf + μh = O (g) pour


x→a x→a x→a
tous réels λ, μ ;
— si f = O (g) et h = o (k) , on a alors f h = o (gk) .
x→a x→a x→a

On peut aussi considérer le cas où la fonction f est à valeurs dans un espace


vectoriel normé (E, ·) et la fonction g à valeurs réelles. Les définitions prennent
alors la forme suivante pour a réel :
f = o (g) ⇔ ∀ε > 0, ∃η > 0 | ∀x ∈ I ∩ ]a − η, a + η[ , f (x) ≤ ε |g (x)| ;
x→a
f = O (g) ⇔ ∃M ≥ 0, ∃η > 0 | ∀x ∈ I ∩ ]a − η, a + η[ , f (x) ≤ M |g (x)| .
x→a
Pour a infini, il est facile d’imaginer les définitions correspondantes.

Définition 6.9. On dit que les fonctions f et g définies au voisinage I de


a ∈ R éventuellement privé de a sont équivalentes au voisinage de a si f − g
est négligeable devant g en a. On note alors f  g.
x→a

Dire que f est équivalente à g = 0 signifie que f est identiquement nulle dans
un voisinage de a (éventuellement privé de a).
Théorème 6.32.
Avec les notations de la définition précédente, on a f  g si, et seule-
x→a
ment si, il existe une fonction ϕ : I → R telle que :

∀x ∈ I, f (x) = ϕ (x) g (x)
lim ϕ (x) = 1
x→a

Preuve. La condition f − g = o (g) équivaut à f − g = εg avec lim ε (x) = 0


x→a x→a
et il suffit alors de poser ϕ = 1 + ε. 
Dans la pratique on utilise les critères suivant valables dans le cas où la fonction
g ne s’annule pas au voisinage de a éventuellement privé de a :
# $  
f (x)
f = o (g) ⇔ lim =0
x→a x→a g (x)
# $  
f
f = O (g) ⇔ est bornée au voisinage de a
x→a g
# $  
f (x)
f  g ⇔ lim =1
x→a x→a g (x)

Si f  g et les fonctions f, g ne s’annulent pas au voisinage de a, elles ont


x→a
alors le même signe dans un voisinage de a.
La relation de prépondérance est transitive, mais ni réflexive ni symétrique.
La relation de domination est réflexive et transitive mais non symétrique (pour
λ∈/ {0, 1} , on a t = O (λt) et λt = O (t) avec λt = t).
Par contre pour la relation d’équivalence, comme son appellation l’indique, on
montre facilement le résultat suivant.
182 Limites et continuité des fonctions d’une variable réelle

Théorème 6.33.
La relation f  g est une relation d’équivalence.
x→a

Preuve. La réflexivité est évidente : f = 1 · f. Si f  g, on a alors f = ϕg


x→a
avec lim ϕ (x) = 1 et ϕ ne s’annule pas dans un voisinage de a, ce qui permet
x→a
1 1
d’écrire dans ce voisinage g = g avec lim = 1, ce qui signifie que g  f.
ϕ x→a ϕ (x) x→a
La relation est donc symétrique. La transitivité se déduit de f = ϕg, g = ψh avec
lim ϕ (x) = 1, lim ψ (x) = 1 entraîne f = ϕψh avec lim (ϕψ) (x) = 1. 
x→a x→a x→a
Les équivalents sont souvent utilisés pour calculer des limites grâce au résultat
suivant conséquence immédiate des définitions.
Théorème 6.34.

Si les fonction f et g définies dans un voisinage de a ∈ R éventuellement


privé de a sont équivalentes au voisinage de a, on a alors lim g (x) =  si,
x→a
et seulement si, lim f (x) = .
x→a

Les développements limités (chapitre 11) vont nous permettre d’obtenir des
équivalents, puis de calculer des limites.
Théorème 6.35.

Les fonctions considérées étant définies dans un voisinage I de a ∈ R


éventuellement privé de a, on a :
1. si f  g et h  k, on a alors f h  gk ;
x→a x→a x→a
2. si f  g et h  k, la fonction h ne s’annulant pas au voisinage de
x→a x→a
f g
a, alors la fonction k ne s’annule pas au voisinage de a et  ;
h x→a k
3. si f  g, la fonction f étant à valeurs strictement positives au voisi-
x→a
nage de a, alors g est également strictement positive au voisinage de a
et pour tout réel α, f α  g α ;
x→a
4. si f  g et h  k, les fonctions g et k étant à valeurs positives ou
x→a x→a
nulles au voisinage de a, on a alors f + h  g + k ;
x→a
5. si f  g, la fonction f étant à valeurs strictement positives au voisi-
x→a
nage de a et lim g (x) =  avec  ∈ R \ {1} , on a alors ln (f )  ln (g) ;
x→a x→a
6. on a ef  eg si, et seulement si, lim (f (x) − g (x)) = 0.
x→a x→a

Preuve.
1. Si f = ϕg et h = ψk avec lim ϕ (x) = 1 et lim ψ (x) = 1, on a alors f h = ϕψgk
x→a x→a
avec lim (ϕψ) (x) = 1, c’est-à-dire que f h  gk.
x→a x→a
Prépondérance, domination et équivalents 183

h
2. Si h ne s’annule pas au voisinage de a, il en est de même de k = (comme
ψ
f ϕg
lim ψ (x) = 1 la fonction ψ ne s’annule pas au voisinage de a) et = avec
x→a h ψk
ϕ (x) f g
lim = 1, c’est-à-dire que  .
x→a ψ (x) h x→a k
3. Si f est à valeurs strictement positives au voisinage de a, il en est de même de
f
g= et f α = ϕα g α avec lim ϕα (x) = 1 nous dit que f α  g α .
ϕ x→a x→a

4. Pour tout x voisin de a tel que (g (x) , k (x)) = (0, 0) on a, en supposant que g
et k sont à valeurs positives ou nulles au voisinage de a :
ϕ (x) g (x) + ψ (x) k (x)
f (x) + h (x) = (g (x) + k (x)) = θ (x) (g (x) + k (x))
g (x) + k (x)
et :
|ϕ (x) − 1| g (x) + |ψ (x) − 1| k (x)
|θ (x) − 1| ≤ ≤ |ϕ (x) − 1| + |ψ (x) − 1|
g (x) + k (x)

En posant θ (x) = 1 pour les x tels que (g (x) , k (x)) = (0, 0) , on a :

f (x) + h (x) = θ (x) (g (x) + k (x))

avec :
|θ (x) − 1| ≤ |ϕ (x) − 1| + |ψ (x) − 1| → 0
x→a

ce qui signifie que f + h  g + k.


x→a
5. Si f est à valeurs strictement positives au voisinage de a, il en est de même de
g (puisque f  g) et si de plus lim g (x) =  avec  ∈ R \ {1} , on a alors
x→a x→a
lim ln (g (x)) = ln () = 0, donc ln (g) ne s’annule pas au voisinage de a et :
x→a
# $
f (x)
ln (f (x)) ln (f (x)) − ln (g (x)) ln ln (1)
g(x)
=1+ =1+ → 1+ =1
ln (g (x)) ln (g (x)) ln (g (x)) x→a ln ()

ce qui entraîne que ln (f ) est équivalent à ln (g) au voisinage de a.


6. Les fonctions considérées ne s’annulant jamais, on a ef  eg si, et seulement
x→a
ef (x)
si lim g(x) = 1, ce qui équivaut à lim ef (x)−g(x) = 1 encore équivalent à
x→a e x→a
lim (f (x) − g (x)) = 0 (continuité de la fonction logarithme).
x→a

Sans hypothèse de positivité, on ne peut pas en général additionner des équi-
valents. Par exemple pour f (x) = 1 + x, g (x) = 1 + x2 , h (x) = k (x) = −1, on a
f  g et f + h = x n’est pas équivalent à g + k = x2 en 0.
x→0
Pour ce qui est du logarithme, l’exemple de f (x) = 1 + x et g (x) = 1 nous
montre que l’on peut avoir f équivalent à g au voisinage de 0 avec ln (f (x)) qui
n’est pas équivalent à ln (g) = 0.
184 Limites et continuité des fonctions d’une variable réelle

Pour ce qui est de l’exponentielle, l’exemple de f (x) = x2 + x et g (x) = x2


2
montre que l’on peut avoir f équivalent à g au voisinage de +∞ avec ef (x) = ex +x
qui n’est pas équivalent à eg(x) = ex en +∞.
Les notions de domination, prépondérance et équivalence se définissent de ma-
nière analogue pour les suites réelles ou complexes (à l’infini) et on a des résultats
similaires à ceux obtenus pour les fonctions.

6.8 Exercices

Exercice 6.1. On notant 1


Q la fonction caractéristique
 de Q dans R,
n
montrer que 1Q (x) = lim lim (cos (m!πx)) pour tout x ∈ R.
m→+∞ n→+∞

Solution. Pour x ∈ / Q, on a |cos (m!πx)| < 1 pour tout m ∈ N (0! = 1), donc
p
avec (p, q) ∈ Z × N∗ , on a pour
n
lim (cos (m!πx)) = 0 = 1Q (0) . Pour x =
n→+∞ q
tout m ≥ 2q, m!πx = 2kπ avec k ∈ Z, donc cos (m!πx) = 1 = 1Q (1) .

Exercice 6.2.
1. Montrer que pour tout n ∈ N, la fonction x → xn est continue sur R.
1
2. Montrer que pour tout n ∈ N∗ , la fonction x → x n est continue sur
R+,∗ .
3. Montrer que pour tout r ∈ Q, la fonction x → xr est continue sur R+,∗ .

Solution.
1. Pour n = 0, f0 est la fonction constante égale à 1. La continuité d’une fonction
constante se vérifiant facilement (pour ε > 0 donné tout réel η > 0 convient).
Pour n ≥ 1, α ∈ R, on peut trouver un réel R > 0 tel que α ∈ ]−R, R[ et pour
tout x ∈ ]−R, R[ , on a :

n−1
|xn − αn | = |x − α| xn−1−k αk ≤ nRn−1 |x − α|
k=0
ε
et pour ε > 0 donné, on aura |xn − αn | < ε dès que |x − α| < η = n−1
.
 nR
1
2. Pour n ≥ 1 et α > 0, on peut trouver un réel R > 0 tel que α ∈ , R et pour
  R
1
tout x ∈ , R , on a :
R
n−1 
# 1 $n # 1 $n 1 1
 # 1 $n−1−k # 1 $k
|x − α| = x n − αn = xn − αn xn αn
k=0
  n−1
n
1 1 1
≥n xn − αn
R
Exercices 185

1 1 1 n−1 n−1
donc x n − α n ≤ R n |x − α| ≤ R n |x − α| et pour ε > 0 donné, on aura
n
1 1 ε
x n − α n < ε dès que |x − α| < η = n−1 .
R n
p # 1 $p
2
3. En notant r = avec (p, q) ∈ (N∗ ) pour r > 0, la fonction x → xr = x q est
q
continue sur R+,∗ comme composée de deux fonctions continues. Pour r = 0,
la fonction est constante et pour r < 0, elle continue comme l’inverse de la
fonction continue non nulle x → x−r .

Exercice 6.3. Montrer que la fonction f : ]0, 1[ → R définie par f (x) = 0


1 p
si x est irrationnel et par f (x) = si x = est rationnel où p, q sont
q q
entiers naturels non nuls premiers entre eux, est continue en tout point
irrationnel et discontinue en tout point rationnel.
p
Solution. Un rationnel r = ∈ ]0, 1[ ∩ Q est limite de la suite d’irrationnels
 q
√ 
2
(xn )n≥n0 = r + , où n0 est choisi assez grand pour que cette suite soit
n
n≥n0
1
à valeurs dans ]0, 1[ , et lim f (xn ) = 0 = f (r) = . La fonction f n’est donc
n→+∞ q
pas continue en ce point. Soit ε > 0. Si α ∈ ]0, 1[ ∩ (R \ Q) et η > 0 est tel que
]α − η, α + η[ ⊂ ]0, 1[ , on note E = {x ∈ ]α − η, α + η[ | f (x) > ε} . Un élément
p
de E est nécessairement rationnel (sinon f (x) = 0 < ε), il s’écrit donc r = avec
q
1 1
p, q premiers entre eux et f (r) = > ε entraîne que E est vide ou que 1 ≤ q <
q ε
1
et 1 ≤ p < q < (r est strictement compris entre 0 et 1). L’ensemble E est donc
ε
vide ou fini. Pour 0 < η  < η assez petit on aura alors E ∩ ]α − η  , α + η  [ = ∅,
ce qui signifie que 0 ≤ f (x) ≤ ε pour tout x ∈ ]α − η  , α + η  [ . On a donc ainsi
montré que f est continue en α.

Exercice 6.4. Soit n un entier naturel non nul.


1. Étudier la continuité de la fonction an qui à tout réel x appartenant à
[0, 1] associe la n-ème décimale dans le développement décimal propre
pour x ∈ [0, 1[ (voir le paragraphe 4.3) et 9 pour x = 1 (pour x = 1 on
utilise le développement décimal illimité impropre).
 1
2. Calculer an (x) dx.
0

6 7
Solution. On rappelle que pour x ∈ [0, 1[ , on a an (x) = [10n x] − 10 10n−1 x .
 
k k+1
1. Pour tout entier k compris entre 0 et 10 − 1 et x ∈
n
, , on a
6 n−1 7 6 n−1 7 10n 10n
an (x) = k − 10 10 x . De plus avec 10 10 x ≤ 10 x < k + 1, on déduit
n
186 Limites et continuité des fonctions d’une variable réelle
 
6 k 7 6 n−1 7 k 6 7
que 10 x ≤ ≤ 10
n−1 n−1
x < 10 x + 1 et = 10n−1 x . La fonction
10 10  
k k+1
an est donc constante (et en conséquence continue) sur , égale à
  10n 10n
k
k − 10 . Puis avec :
10
     
k+1 k+1 k
an n
= k + 1 − 10 = lim a n (x) = k − 10
10 10 x→( k+1
10n )
− 10

k+1
on déduit que an est discontinue en tout point où k est compris entre
 n  n
10
10 − 1
0 et 10n − 2. Sur le dernier intervalle , 1 , on a an (x) = 9 et an est
10n
continue en 1.
2. La fonction an étant continue par morceaux est intégrable sur [0, 1] avec :
 10

n
−1     10 −1 n  
1 
k+1
1 10n k k
an (x) dx = k − 10 dx = n k − 10
0 k
10n
10 10 10
k=0 k=0
 
k
En remarquant que la fonction ϕ : k → k −10 est périodique de période 10
10
et en écrivant tout entier k compris entre 0 et 10 − 1 sous la forme k = 10q + r
n

avec 0 ≤ q ≤ 10n−1 − 1 et 0 ≤ r ≤ 9, on a :
 10n−1 9
−1  9
1
1 1  9
an (x) dx = n ϕ (r) = r=
0 10 q=0 r=0
10 r=0 2

Exercice 6.5. Soit f : R → R une fonction continue telle que


f (ax + b) = f (x) pour tout réel x, où a, b sont deux constantes réelles
avec |a| = 1. Montrer que f est nécessairement constante.

Solution. De f (ax + b) = f (x) , on déduit que f (a (ax + b) + b) = f (ax + b) =


f (x) , soit f a2 x + b (a + 1) = f (x) . Par récurrence, on montre alors que pour
tout entier n ≥ 1 on a :
 

n−1
∀x ∈ R, f a x + b
n
a k
= f (x)
k=0

Le résultat est vrai pour n = 1 et en le supposant vrai au rang n ≥ 1, on a :


     

n−1 
n−1
f a an x + b a k + b = f an x + b ak = f (x)
k=0 k=0
Exercices 187
 

n−1 
n
avec a an x + b ak + b = an+1 x + b ak . Comme |a| = 1, on peut écrire :
k=0 k=0
 
an − 1
∀n ∈ N∗ , ∀x ∈ R, f an x + b = f (x)
a−1

et pour |a| < 1, avec la continuité de f, on déduit que pour tout réel x on a :
   
n an − 1 b
f (x) = lim f a x + b =f
n→+∞ a−1 1−a

c’est-à-dire que f est constante. Pour traiter le cas où |a| > 1, on peut remarquer,
en faisant le changement devariablet = ax + b, que la condition f (ax + b) = f (x)
1 b 1
est équivalente à f (t) = f t− pour tout réel t avec < 1, ce qui entraîne
a a a
que f est constante.

Exercice 6.6. Soit f une fonction définie sur R+,∗ , à valeurs réelles,
f (x)
croissante et telle que la fonction g : x → soit décroissante. Montrer
x
+,∗
que la fonction f est continue sur R .

Solution. f qui est croissante admet une limite à gauche et à droite en tout point
de R+,∗ avec f (x− ) ≤ f (x) ≤ f (x+ ) . De même, g qui est décroissante admet une
limite à gauche et à droite en tout point avec g (x− ) ≥ g (x) ≥ g (x+ ) et tenant
compte de :
lim f (t)
f (t) t→x, t<x f (x− )
g x− = lim = =
t→x
t<x
t x x
lim f (t)
f (t) t→x, t>x f (x+ )
g x+ = lim = =
t→x
t>x
t x x

avec x > 0, on déduit que f (x− ) ≥ f (x) ≥ f (x+ ) . On a donc en définitive


f (x− ) = f (x) = f (x+ ) , ce qui équivaut à la continuité de f en x.

Exercice 6.7. Soient T1 , T2 deux réels strictement positifs et f : R → R


une fonction continue admettant T1 et T2 comme périodes. Montrer que si
T1
est irrationnel, la fonction f est alors constante.
T2

Solution. Comme T1 et T2 sont dans le groupe P (f ) des périodes de f, on a


T1
ZT1 + ZT2 ⊂ P (f ) . Si irrationnel, le groupe ZT1 + ZT2 est alors dense dans
T2
R (corollaire 4.4) et il en est de même de P (f ) . Comme ce groupe est fermé
pour f continue (théorème 6.16), on a P (f ) = R, ce qui revient à dire que f est
constante.
188 Limites et continuité des fonctions d’une variable réelle

Exercice 6.8. Soient f, g deux fonctions continues périodiques non


constantes de R dans R de plus petites périodes respectives T1 > 0 et T2 > 0.
T1
Montrer que si est irrationnel, la fonction f + g n’est alors pas pério-
T2
dique.

Solution. Soit T ∈ P (f + g) . Pour tout réel x, on a f (x + T ) − f (x) = g (x) −


g (x + T ) et la fonction h : x → f (x + T ) − f (x) admet T1 et T2 comme périodes.
T1
Donc pour irrationnel, la fonction continue h est constante (exercice précédent),
T2
soit h (x) = λ pour tout réel x. Comme f est T1 -périodique, on a :
 a+T1  T1
∀a ∈ R, f (t) dt = f (t) dt
a 0

donc :
 T1  T1  T1
λT1 = (f (t + T ) − f (t)) dt = f (t + T ) dt − f (t) dt
0 0 0
 T +T1  T1
= f (t) dt − f (t) dt = 0
T 0

c’est-à-dire que λ = 0 et f (x + T ) = f (x) , g (x + T ) = g (x) pour tout réel x.


T1
Donc T ∈ P (f ) ∩ P (f ) = ZT1 ∩ ZT2 = {0} ( irrationnel), soit T = 0. En
T2
définitive, P (f + g) = {0} et f + g n’est pas périodique.

Exercice 6.9. Montrer que si f : R → R est une fonction périodique


continue et non constante, alors l’équation différentielle y  + 2y  + 2y = f
ne peut avoir deux solutions périodiques linéairement indépendantes.

Solution. La fonction f étant continue périodique non constante, son groupe des
périodes est discret, soit P (f ) = ZT avec T > 0. Si y1 , y2 sont deux solutions
périodiques linéairement indépendantes de y  + 2y  + 2y = f, alors aucune de ces
solutions ne peut être constante (sinon f = 2yj serait constante) et leurs groupes
de périodes sont discrets engendrés respectivement par T1 > 0 et T2 > 0. Les réels
T1 , T2 sont alors également des périodes de f. Il existe donc des entiers naturels
non nuls n1 , n2 tels que T1 = n1 T et T2 = n2 T et n2 T1 = n1 T2 est une période
commune à y1 et y2 . La fonction y = y1 − y2 est alors une solution périodique de
l’équation homogène y  + 2y  + 2y = 0, le réel n1 n2 T étant une période de cette
fonction. Mais la forme générale des solutions de cette équation différentielle est
donnée par y (x) = e−t (a cos (x) + b sin (x)) = λe−t cos (x + ϕ) et seule la fonction
nulle est périodique. On a donc y1 = y2 .

Exercice 6.10. Montrer que si f, g sont deux fonctions continues pério-


diques de R dans R telles que lim (f (x) − g (x)) = 0, on a alors f = g.
x→+∞
Exercices 189

Solution. Si f est constante égale à λ, alors la condition lim (f (x) − g (x)) = 0


x→+∞
équivaut à lim g (x) = λ et pour toute période T > 0 de g, pour tout réel x, on a
x→+∞
λ = lim g (x + nT ) = lim g (x) = g (x) , c’est-à-dire que g est constante égale
n→+∞ n→+∞
à λ. On suppose donc que f et g sont non constantes de périodes respectives T1 > 0
et T2 > 0. On suppose aussi que f = g et on se donne a tel que f (a) = g (a) et un
réel ε > 0. Avec lim (f (x) − g (x)) = 0 on déduit qu’il existe un entier n0 ∈ N∗
x→+∞
tel que |f (x) − g (x)| < ε pour tout x ≥ a + n0 T1 . On a donc en particulier :
∀k ∈ N∗ , |f (a + kn0 T1 ) − g (a + kn0 T1 )| < ε
Pour tout entier k ∈ N∗ , on peut écrire :
|f (a) − g (a)| = |f (a + kn0 T1 ) − g (a)|
≤ |f (a + kn0 T1 ) − g (a + kn0 T1 )| + |g (a + kn0 T1 ) − g (a)|
< ε + |g (a + kn0 T1 ) − g (a)|
D’autre part, avec l’uniforme continuité de g sur R (théorème 6.18), on peut trouver
un réel η > 0 tel que :
|x − y| < η ⇒ |g (x) − g (y)| < ε
et en écrivant que |g (a + kn0 T1 ) − g (a)| = |g (a + kn0 T1 ) − g (a − mT2 )| , où m
est un entier relatif quelconque, on aura |g (a + kn0 T1 ) − g (a)| < ε si on peut
T1
trouver k ∈ N∗ et m ∈ Z tels que |kn0 T1 − mT2 | < η. Si est rationnel égal à
T2
p T1
avec p, q dans N∗ , on a qT1 − pT2 = 0 et |qn0 T1 − pn0 T2 | = 0 < η. Si est
q T2
n0 T 1
irrationnel, il en est alors de même de et on sait que le groupe ZT1 + ZT2
T2
est dense dans R (corollaire 4.4), il existe donc des entiers relatifs p et q tels que
0 < |pn0 T1 − qT2 | < η. On peut supposer que p ∈ N∗ en réduisant au besoin η. En
définitive, on a montré que |f (a) − g (a)| < 2ε pour tout ε > 0, ce qui contredit
f (a) = g (a) . La seule possibilité est donc f = g.

Exercice 6.11. Soit f : R → R une fonction périodique dérivable. Mon-


trer que la dérivée f  de f est périodique de même groupe des périodes que
f. En particulier, pour f non constante, les fonctions f et f  ont même
plus petite période strictement positive.

Solution. Soit T dans le groupe des périodes P (f ) de la fonction f. On a :


∀x ∈ R, f (x + T ) = f (x)
et par dérivation, f  (x + T ) = f  (x) , ce qui signifie que T est dans le groupe des
périodes P (f  ) de la fonction f  . On a donc P (f ) ⊂ P (f  ) . Si T ∈ P (f  ) , la
fonction x → f (x + T ) − f (x) est de dérivée nulle sur R, donc constante. Il existe
donc une constante réelle λ telle que :
∀x ∈ R, f (x + T ) = f (x) + λ
190 Limites et continuité des fonctions d’une variable réelle

On vérifie facilement par récurrence que :

∀n ∈ N, f (nT ) = f (0) + nλ

La fonction f étant continue périodique est bornée sur R et avec :

f (nT ) − f (0) f ∞
∀n ≥ 1, |λ| = ≤2 → 0
n n n→+∞

on déduit que λ = 0, c’est-à-dire que T est une période de f et P (f  ) ⊂ P (f ) .


On a donc P (f ) = P (f  ) . Si f est constante, il en est alors de même de f  et
P (f ) = P (f  ) = R. Si f n’est pas constante, on a alors P (f ) = P (f  ) = ZT, où
T > 0 est la plus petite période strictement positive de f et f  .

Exercice 6.12. Soit f : R → R une fonction uniformément continue.


Montrer qu’il existe deux constantes réelles a, b telles que |f (x)| ≤ a |x| + b
pour tout réel x. En déduire que la fonction x → x2 n’est pas uniformément
continue sur R.

Solution. Avec l’uniforme continuité de f sur R on peut trouver un réel α > 0


tel que |f (x) − f (y)| ≤ 1 pour tout couple (x, y) de réels tels que |x − y| ≤ α. On
en déduit alors par récurrence que :

∀n ∈ N, ∀x ∈ [nα, (n + 1) α] , |f (x) − f (0)| ≤ n + 1

Le résultat est vrai pour n = 0 et en le supposant acquis pour n ≥ 0, on a pour


tout x ∈ [(n + 1) α, (n + 2) α] :

|f (x) − f (0)| ≤ |f (x) − f ((n + 1) α)| + |f ((n + 1) α) − f (0)|


≤ 1 + (n + 1) = n + 2

Si x est un réel positif ou nul, on peut alors trouver un entier naturel n tel que
x
x ∈ [nα, (n + 1) α] et avec n ≤ , on déduit que :
α
x
|f (x)| ≤ |f (x) − f (0)| + |f (0)| ≤ n + 1 + |f (0)| ≤ + (1 + |f (0)|)
α
En raisonnant avec la fonction g définie par g (x) = f (−x) , on a un résultat
analogue pour les réels négatifs. Du fait qu’il n’est pas possible de trouver des
réels a, b tels que x2 ≤ ax + b pour tout réel positif, on déduit que la fonction
x → x2 n’est pas uniformément continue sur R.

Exercice 6.13. Soit f : R+ → R une fonction uniformément conti-


+∞
nue telle que l’intégrale f (x) dx soit convergente. Montrer que
0
lim f (x) = 0. Ce résultat est-il encore valable si on suppose seulement f
x→+∞
continue sur R+ .
Exercices 191

Solution. Avec l’uniforme continuité de f sur R+ , on déduit que pour tout réel
ε > 0 on peut trouver un réel η > 0 tel que |f (x) − f (y)| < ε pour tous x, y dans
R+ tels que |x − y| < η et, pour tout x ∈ R+ , on a :
 x+η  x+η  x+η
1 1 1
|f (x)| = f (x) dt ≤ |f (x) − f (t)| dt + f (t) dt
η x η x η x
 x+η
1
≤ε+ f (t) dt
η x
 +∞
D’autre part, avec la convergence de l’intégrale f (x) dx, on déduit qu’il existe
 y 0

un réel λ > 0 tel que f (t) dt < εη pour tous x, y dans [λ, +∞[ et de l’inégalité
x
précédente, on déduit que |f (x)| < 2ε pour tout x ≥ λ. On a donc montré que
lim f (x) = 0. Ce résultat n’est plus valable si on suppose seulement f continue
x→+∞
sur R comme le montre l’exemple de la fonction f définie par f (x) = sin x2 .
+

La convergence de l’intégrale peut se montrer en faisant le changement de variable


t = x2 qui donne :
 +∞  1  +∞
sin (t)
sin x2 dx = sin x2 dx + √ dt
0 0 1 2 t
 +∞
sin (t)
la convergence de √ dt se vérifiant en utilisant le critère d’Abel (ou en
1 2 t
intégrant par parties).

Exercice 6.14. Soit f une application continue de [0, 1] dans R telle que
f (0) = f (1) .Montrer que pour tout entier naturel
 non
 nul n il existe un
1 1
réel xn dans 0, 1 − tel que f (xn ) = f xn + . Ce résultat est-il
n n
1
valable si on remplace par un réel α ∈ ]0, 1[ qui n’est pas l’inverse d’un
n
entier.
 
1
Solution. Pour n ≥ 1 on désigne par fn la fonction définie sur In = 0, 1 −
  n
1
par fn (x) = f x + −f (x) . Si cette fonction ne s’annule jamais sur In , du fait
n
de sa continuité, on déduit du théorème des valeurs intermédiaires qu’elle garde
un signe constant sur cet intervalle. Supposons que fn (x) > 0 pour tout x ∈ In .
On a alors :
  k + 1
n−1   n−1
k  k
f (1) − f (0) = f −f = fn >0
n n n
k=0 k=0

ce qui contredit f (0) = f (1) . La fonction fn s’annule donc au moins une fois
sur In . De ce résultat on peut déduire que si une voiture parcourt 100 km en une
192 Limites et continuité des fonctions d’une variable réelle

heure, il existe alors un intervalle de temps égal à une demi-heure pendant lequel
la voiture a parcouru 50 km. Pour ce faire on considère la fonction f définie sur
[0, 1] par f (x) = d (x) − 100x où d (x) est le nombre de kilomètres parcourus en x
heures. Cette application est continue avec f (0) = f (1) = 0. Le résultatprécédent,

1 1
pour n = 2, nous dit qu’il existe x2 ∈ 0, tel que f (x2 ) = f x2 + ,
  2   2
1 1
soit d x2 + − d (x2 ) = 50 et l’intervalle de temps x2 , x2 + répond à la
2 2
1
question. Ce résultat n’est plus valable si on remplace par un réel α ∈ ]0, 1[ qui
n
n’est pas l’inverse d’un entier.
 En effet, si f est la fonction définie et continue sur
2πx
[0, 1] par f (x) = cos − λx, où λ est choisi tel que f (0) = f (1) (prendre
  a

λ = cos − 1), alors pour tout réel x ∈ [0, 1 − a] , on a :
a
  

f (x + a) − f (x) = −λa = a 1 − cos =0
a
1
puisque n’est pas entier.
a

Exercice 6.15. Montrer que si f : R → R est une fonction périodique


continue
 et
 non constante de période T > 0, il existe alors un réel a tel que
T
f a+ = f (a) .
2
 
T
Solution. La fonction g définie sur R par g (x) = f x + − f (x) est continue
2
avec : ⎧  

⎪ T
⎨ g (0) = f − f (0)
  2    

⎪ T T T
⎩ g = f (T ) − f = f (0) − f = −g (0)
2 2 2
on déduit alors du théorème des valeurs intermédiaires qu’il existe un réel a compris
T
entre 0 et tel que g (a) = 0.
2

  Montrer que la fonction f définie sur R par f (0) = 0 et


Exercice 6.16.
1
f (x) = sin pour x = 0, vérifie la propriété des valeurs intermédiaires
x
sans être continue.
1
Solution. En considérant la suite (xn )n∈N définie par xn = , on a
nπ + π2
n
lim xn = 0 et la suite (f (xn ))n∈N = ((−1) )n∈N n’a pas de limite, ce qui
n→+∞
prouve que f n’est pas continue en 0. Si J est un intervalle réel ne contenant
pas 0, alors f est continue sur J et f (J) est un intervalle. Si J est un intervalle
Exercices 193

contenant 0 non réduit à un point (sinon J = f (J) = {0}), on considère les suites
1 1
(xn )n≥n0 , (yn )n≥n0 , définies par xn = π , yn = , où n0 est
2nπ + 2 (2n + 1) π + π2
un entier assez grand pour que ces suites soient à valeurs dans J, et on a f (xn ) = 1,
f (yn ) = −1 pour tout n ≥ n0 et [−1, 1] ⊃ f (J) ⊃ f ([yn , xn ]) ⊃ [−1, 1] , c’est-à-
dire que f (J) = [−1, 1] . En définitive, la fonction f vérifie la propriété des valeurs
intermédiaires.

Exercice 6.17. On désigne par Γ le cercle unité dans le plan complexe et


par f une fonction continue de Γ dans R. Montrer qu’il existe deux points
diamétralement opposés dans Γ ayant même image par f.

Solution. La fonction g définie sur R par g (x) = f eix −f ei(x+π) est continue
à valeurs réelles avec g (0) = f (1) − f (−1) = −g (π) . Le théorème des valeurs
intermédiaires nous dit alors qu’il existe c ∈ [0, π] tel que g (c) = 0, ce qui donne
le résultat.

Exercice 6.18. Montrer qu’on peut définir une suite réelle (xn )n∈N par
x5n + nxn − 1 = 0 pour tout n ∈ N. Étudier la limite de cette suite et donner
6  
ak 1
un développement asymptotique de la forme xn = + o .
nk n→+∞ n6
k=0

Solution. On a x0 = 1. Pour n ≥ 1, la fonction fn : x → x5 + nx − 1 est un


homéomorphisme strictement croissant de R sur R, ce qui entraîne l’existence
 et 
1 1 1
l’unicité de xn . Avec fn (0) = −1, fn = 5 , on déduit que xn ∈ 0,
n n n
5 1
et lim (xn ) = 0. De nxn = 1 − xn , on déduit que xn  . En écrivant
n→+∞ n→+∞ n
1 1 1 1
xn = − yn , de fn (xn ) = 0, on déduit que (nyn ) 5 = (1 − nxn ) 5 = xn  ,
n   n→+∞ n
1 1 1 1
ce qui entraîne yn  et xn = − 6 + o .
n→+∞ n6 n n n→+∞ n6

Exercice 6.19. Montrer qu’on peut définir une suite de réels positifs
(xn )n∈N∗ par xnn + xn−1
n + · · · + xn − 1 = 0 pour tout n ∈ N∗ . Montrer
que cette suite a une limite λ et donner un équivalent de xn − λ.

Solution. Soit fn : x → xn + xn−1 + · · · + x − 1. On a fn (x) > 0 pour x ≥ 0,


fn (0) = −1 et fn (1) = n − 1, ce qui entraîne l’existence et l’unicité d’une racine
positive, avec xn ∈ ]0, 1[ pour n ≥ 2. De fn+1 (xn+1 ) = 0 = xn+1 n+1 + fn (xn+1 ) ,
on déduit que fn (xn+1 ) < 0 et 0 < xn+1 < xn . La suite (xn )n∈N∗ est donc
décroissante minorée et en conséquence convergente vers λ ∈ [0, 1[ . Pour x = 1, on
1 − xn+1
a fn (x) = − 2 et fn (xn ) = 0 entraîne 2xn − 1 = xn+1 . Mais 0 ≤ xn+1 ≤
1−x n n
1
xn+1
2 avec x2 ∈ ]0, 1[ entraîne lim xn+1 n = 0 et lim (xn ) = . D’autre
n→+∞ n→+∞ 2
194 Limites et continuité des fonctions d’une variable réelle

n+1
part, on a ln (2xn ) = (n + 1) ln (2xn )  (n + 1) (2xn − 1) = (n + 1) xn+1
n et en
tenant compte de :

0 ≤ (n + 1) xn+1
n ≤ (n + 1) xn+1
2 → 0
n→+∞
# $
n+1 n+1
(car x2 ∈ ]0, 1[), on déduit que lim ln (2xn ) = 0 et lim (2xn ) = 1,
n→+∞ n→+∞
1 1 1
ce qui entraîne xn − = xn+1  .
2 2 n n→+∞ 2n+2

Exercice
8 6.20. Montrer qu’on peut définir une suite réelle (xn )n∈N∗ par
π9
xn ∈ 2nπ, 2nπ + et xn sin (xn ) − 1 = 0 pour tout n ∈ N∗ . Donner un
2  
b 1
développement asymptotique du type xn = na + + o .
n n→+∞ n
# π$
Solution. Soit f (x) = x sin (x) − 1. On a f (2nπ) = −1, f 2nπ + = 2nπ +
π 8 π 9 2
− 1 > 0 et f  (x) = sin (x) + x cos (x) > 0 sur 2nπ, 2nπ + . On déduit donc
2 8 π 9 2
que f a un unique zéro xn ∈ 2nπ, 2nπ + . On a :
2
  
1 1
sin (xn − 2nπ) = sin (xn ) = = sin arcsin
xn xn
  8 π9  
1 1
avec xn − 2nπ et arcsin dans 0, , donc xn = arcsin + 2nπ. Avec
xn  2 xn
1 1 1
xn  2nπ, on a arcsin   , soit :
n→+∞ xn n→+∞ xn 2nπ
     
1 1 1 1 1
arcsin = + o et xn = 2nπ + + o
xn 2nπ n→+∞ n 2nπ n→+∞ n

Exercice 6.21. Montrer qu’on peut définir une suite réelle (xn )n≥1 par
8 π9
xn ∈ nπ, nπ + et tan (xn ) = xn pour tout n ∈ N. Donner un dévelop-
2  
c 1
pement asymptotique de xn de la forme xn = a + bn + + o .
n n→+∞ n

Solution.
8 Soit f (x) = tan (x)# − x. On a f (nπ) = −nπ, f  (x) = tan2 (x) > 0 sur
π9 π$
nπ, nπ + et lim f nπ + = +∞. On déduit donc que f a un unique
2 x→(nπ+ π 2)
− 2
8 π 9
zéro xn ∈ nπ, nπ + . On a tan (xn − nπ) = tan (xn ) = xn = tan (arctan (xn ))
2 8 π9
avec xn − nπ et arctan (xn ) dans 0, , donc :
2
 
π 1
xn = arctan (xn ) + nπ = − arctan + nπ
2 xn
Exercices 195
 
1 1 1
Avec xn  nπ, on déduit que arctan   , soit :
xn n→+∞ xn n→+∞ nπ
     
1 1 1 π 1 1
arctan = + o et xn = + nπ − + o
xn nπ n→+∞ n 2 nπ n→+∞ n

Exercice 6.22. Montrer qu’on peut définir une suite réelle (xn )n≥3 par
xn ∈ ]0, 1[ et xnn − nxn + 1 = 0 pour tout n ≥ 3. Étudier la limite de cette
suite et donner un équivalent de xn quand n tend vers l’infini

Solution. La fonction fn : x → xn − nx + 1 est un homéomorphisme strictement


décroissant de ]0, 1[ sur ]1, 2 − n[ , ce qui entraîne l’existence et l’unicité de xn .
Pour x fixé dans ]0, 1[ , on a fn (x)  −nx, donc fn (x) < 0 pour n grand.
n→+∞
Pour tout ε > 0 il existe donc n0 ∈ N tel que fn (ε) < 0 pour n ≥ n0 . On a donc
0 < xn < ε pour n ≥ n0 , ce qui prouve que lim xn = 0. On a nxn = 1 + xnn avec
n→+∞
1 1
lim xnn = 0 (xn < pour n grand), donc xn  .
n→+∞ 2 n→+∞ n

Exercice 6.23. Montrer qu’on peut définir une suite réelle (xn )n≥3 par
xn ∈ ]1, +∞[ et xnn − xn − n = 0 pour tout n ∈ N. Montrer que cette suite
a une limite finie λ et donner un équivalent de xn − λ quand n tend vers
l’infini

Solution. La fonction fn : x → xn − x − n est un homéomorphisme strictement


croissant de ]1, +∞[ sur ]−n, +∞[ , ce qui entraîne l’existence et l’unicité de xn .
Pour x fixé dans ]1, +∞[ , on a fn (x)  xn , donc fn (x) > 0 pour n grand.
n→+∞
Pour tout ε > 0 il existe donc n0 ∈ N tel que fn (1 + ε) > 0 pour n ≥ n0 . On a
donc 1 < xn < 1 + ε pour n ≥ n0 , ce qui prouve que lim xn = 1. On a :
n→+∞

1 1
xn − 1 = (xn + n) n − 1 = e n ln(xn +n) − 1
   
1 1 ln (n) ln (n)
= ln (xn + n) + o ln (xn + n) = + o
n n→+∞ n n n→+∞ n
1
du fait que lim ln (xn + n) = 0.
n→+∞ n

cos (x)
Exercice 6.24. Montrer que pour n ∈ N∗ , la fonction f : x → a
9 π 8 x
un unique extremum dans nπ − , nπ en un point xn . Donner un déve-
2
loppement asymptotique de xn de la forme :
 
c 1
xn = an + b + + o
n n→+∞ n
196 Limites et continuité des fonctions d’une variable réelle

Donner un équivalent de f (xn ) quand n tend vers l’infini.

g (x)
Solution. On a f  (x) = − , avec :
x2
 
1
g (x) = x sin (x) + cos (x) = x cos (x) tan (x) + = x cos (x) h (x)
x

1 1
Avec h (x) = − 2 > 0 pour x > 1, on vérifie que h réalise un ho-
cos2 (x) x  
9 π 8 1
méomorphisme strictement croissant de nπ − , nπ sur −∞, , d’où l’exis-
2 nπ
1
tence et l’unicité de xn . De tan(xn ) = − , on déduit qu’il existe k ∈ Z tel que
  xn  8
1 1 π 9 9 π 8
xn = kπ − arctan et avec − arctan ∈ − , 0 , xn ∈ nπ − , nπ ,
xn xn  2 2
1
on déduit que k = n. Donc xn = nπ − arctan . Avec xn  nπ, on a
    xn  
1 1 1 1 1 1
arctan   , soit arctan = + o et xn =
xn xn nπ xn nπ n→+∞ n
1 1
nπ− + o . Comme xn = nπ+ o (1) , on déduit que cos (xn ) 
nπ n→+∞ n n→+∞ n→+∞
n
n (−1)
(−1) et f (xn )  .
n→+∞ nπ
Chapitre 7

Dérivées des fonctions d’une


variable réelle

Pour ce chapitre, K désigne le corps des réels ou des complexes, I un intervalle



réel non réduit à un point, I l’intérieur de I, (E, ·) un K-espace vectoriel normé
et les fonctions considérées sont définies sur I et à valeurs dans E.
x 1
Pour x ∈ E et t ∈ R, on notera abusivement le vecteur x.
t t

7.1 Dérivée d’ordre 1 et dérivées d’ordre supé-


rieur
On se donne une fonction f : I → E.

Définition 7.1. On dit qu’une fonction f est dérivable en α ∈ I si la


f (x) − f (α)
fonction τα : x ∈ I \ {α} → admet une limite en α.
x−α

Quand cette limite existe, elle est unique, on la note f  (α) et on dit que c’est
le vecteur dérivé (ou le nombre dérivé pour E = K) de f en α.
De manière équivalente, on peut dire que f est dérivable en α si, et seulement
si, elle admet un développement limité d’ordre 1 en α :

f (x) = a0 + a1 (x − α) + o (x − α)
x→α

et dans ce cas, on a a0 = f (α) , a1 = f  (α) .


De la définition du vecteur dérivé on déduit facilement le résultat suivant.
Théorème 7.1.
Si f est dérivable en α ∈ I, elle est alors continue en ce point.

La réciproque de ce résultat est fausse comme le montre l’exemple de la fonction


x → |x| au voisinage de 0.
198 Dérivées des fonctions d’une variable réelle

Définition 7.2. On dit que la fonction f est dérivable à gauche [resp. à


droite] en α ∈ I si la fonction τα admet une limite à gauche [resp. à droite]
en α.

Quand cette limite existe, elle est unique, on la note fg (α) [resp. fd (α)] et on
dit que c’est le vecteur (ou le nombre pour E = K) dérivé à gauche [resp. à droite]
de f en α.
Là encore des définitions on déduit facilement les résultats suivants.
Théorème 7.2.

Si f est dérivable à gauche et à droite en α ∈ I, elle est alors continue
en ce point.

Théorème 7.3.

f est dérivable en α ∈ I si, et seulement si, elle dérivable à gauche et
à droite en ce point avec fg (α) = fd (α) . Cette valeur commune est alors
égale à f  (α) .

Définition 7.3. Si D est l’ensemble des points x ∈ I où f est dérivable,


on définit alors la fonction dérivée de f sur D par x → f  (x) .

Cet ensemble D peut être vide et dans ce cas la fonction dérivée n’est pas définie.
C’est le cas par exemple pour la fonction caractéristique de Q qui est discontinue
en tout point de R (exemples 6.2) et en conséquence ne peut être dérivable.
Une fonction peut très bien être continue et nulle part dérivable sur I. En vue
de construire une telle fonction à valeurs réelles, on désigne par ϕ la fonction
2-périodique sur R définie par ϕ (x) = |x| pour tout x ∈ [−1, 1] .

Lemme 7.1 Pour tous réels x, y on a |ϕ (x) − ϕ (y)| ≤ |x − y| .

Preuve. Comme ϕ (x) ∈ [0, 1] pour tout réel x, on a pour tous x, y dans R tels
que |x − y| ≥ 1, |ϕ (x) − ϕ (y)| ≤ 1 ≤ |x − y| . On suppose donc que |x − y| < 1 et
comme x, y jouent des rôles symétriques, on peut même supposer que 0 < y−x < 1.
On distingue alors les cas suivants :
— si x, y sont dans [−1, 1] , on a alors |ϕ (x) − ϕ (y)| = ||x| − |y|| ≤ |x − y| ;
— si x ∈ [−1, 1] et y ∈ [1, 2] , avec 0 < y − x < 1 on a nécessairement x ∈ [0, 1]
et y − 2 ∈ [−1, 0] , ce qui donne :

ϕ (x) − ϕ (y) = ϕ (x) − ϕ (y − 2) = x + y − 2 ≤ y − x
ϕ (y) − ϕ (x) = ϕ (y − 2) − ϕ (x) = 2 − y − x ≤ y − x

soit |ϕ (x) − ϕ (y)| ≤ |x − y| ;


Dérivée d’ordre 1 et dérivées d’ordre supérieur 199

— dans le cas général, toujours avec 0 < y − x < 1, en notant n la partie entière
x+1
de , on a :
2

−1 ≤ x − 2n < 1
−1 ≤ x − 2n < y − 2n < 1 + x − 2n < 2

et avec ce qui précède, on déduit que :

|ϕ (x) − ϕ (y)| = |ϕ (x − 2n) − ϕ (y − 2n)| ≤ |x − y|


Le lemme qui suit nous sera également utile.
 
1
Lemme 7.2 Soit x ∈ R. Si l’intervalle x, x + ne contient pas d’entiers, on a
  2
1 1
alors ϕ x + − ϕ (x) = .
2 2

x+1
Preuve. Si n est la partie entière de , on a alors −1 < x−2n < 1 (l’inégalité
2
stricte
 à gauche est justifiée par x ∈/ Z) et comme il n’y a pas d’entiers dans
1 1 1
x − 2n, x − 2n + , on a soit −1 < x − 2n < 0 et − < x − 2n + ≤ 0, soit
2 2 2
1 1
x − 2n > 0 et < x − 2n + ≤ 1, ce qui donne :
2 2
   
1 1 1
ϕ x+ − ϕ (x) = ϕ x − 2n + − ϕ (x − 2n) = −
2 2 2

dans le premier cas et :


   
1 1 1
ϕ x+ − ϕ (x) = ϕ x − 2n + − ϕ (x − 2n) =
2 2 2

dans le second. 
On définit la fonction de Van der Waerden par :
+∞  n
 3
∀x ∈ R, f (x) = ϕ (4n x)
n=0
4
 n  n
3 3
Avec 0 ≤ ϕ (4 x) ≤
n
, on déduit que cette série de fonction est
4 4
uniformément convergente et avec la continuité de ϕ que sa somme f est continue
sur R.
Théorème 7.4.
La fonction f n’est dérivable en aucun point de R.
200 Dérivées des fonctions d’une variable réelle
 
1 m 1
Preuve. Soient x ∈ R et m ∈ N \ {0} . L’intervalle 4 x − , 4 x +m
qui est
2 2
de longueur 1 contient
 exactement  un entier
 et cet entier
 est dans l’un seulement
1 1
des deux intervalles 4m x − , 4m x ou 4m x, 4m x + . On note alors εm = −1
2 2
si le premier intervalle ne contient pas d’entier et εm = 1 si c’est le second. En
εm 1
posant hm = , on a :
2 4m
+∞  n
f (x + hm ) − f (x)  3 ϕ (4n (x + hm )) − ϕ (4n x)
=
hm n=0
4 hm

Pour n > m, 4n hm = 2εm 4n−m−1 est un entier pair et ϕ (4n x + 4n hm ) −


εm
ϕ (4n x) = 0. Pour n = m, on a 4m hm = et le lemme précédent nous dit que :
2
1
|ϕ (4m x + 4m hm ) − ϕ (4m x)| =
2
Enfin pour 0 ≤ n < m, le lemme 7.1 nous dit que :

|ϕ (4n (x + hm )) − ϕ (4n x)| ≤ 4n hm

Il en résulte que :

m  n
f (x + hm ) − f (x) 3 ϕ (4n (x + hm )) − ϕ (4n x)
=
hm n=0
4 hm

m−1
3m + 1
≥ 3m − 3n =
n=0
2

f (x + hm ) − f (x)
et lim = +∞ avec lim hm = 0, ce qui implique que f
m→+∞ hm m→+∞
ne peut être dérivable en x. 
Un autre exemple de telle fonction est donné par la fonction de Weierstrass
+∞
 cos (pn x)
définie sur R par f (x) = , où p ≥ 6 est un entier pair. On peut même
n=0
2n
montrer que cette fonction n’est monotone sur aucun intervalle non réduit à un
point (voir [19]).
En utilisant le théorème de Baire, on peut montrer le résultat suivant.
Théorème 7.5.

Si E = C 0 ([0, 1] , R) est muni de la norme de la convergence uniforme,


alors l’ensemble des fonctions f ∈ E qui ne sont dérivables en aucun point
de [0, 1] est dense dans E.

Preuve. Voir [22]. 


Si une fonction f est dérivable sur un intervalle I, sa dérivée f  n’est pas néces-
sairement continue comme le montre l’exemple de la fonction f définie sur R par
Opérations sur les fonctions dérivables 201
     
2 1  1 1
f (0) = 0 et f (x) = x sin pour x = 0. On a f (x) = 2x sin − cos
x   x x
f (x) 1  
pour x = 0 et = x sin ≤ |x| → 0, donc f (0) = 0. Mais f n’est
x x x→0
 
1
pas continue en 0 car la fonction g : x → cos n’a pas de limite en 0 (ce qui
  x
1 k
se déduit de g = (−1) pour tout entier k ≥ 1).

On peut montrer, comme conséquence du théorème de Baire, que si f est une
fonction dérivable sur un intervalle I, alors l’ensemble de ses points de continuité
est dense dans I (voir [22]).

Définition 7.4. On dit que f est de classe C 1 (ou continûment dérivable)


sur I, si elle est dérivable en tout point de I et si la fonction dérivée f  est
continue sur cet intervalle.

Si f est une fonction dérivable sur I et si la dérivée f  est également dérivable sur
I, sa dérivée est notée f  et on dit que c’est la dérivée seconde de f. Par récurrence,
on peut définir les dérivées successives d’une fonction, quand elles existent, comme
suit : on note f (0) = f et pour n ∈ N, dans le cas où la fonction f (n) est définie

et dérivable sur I, on note f (n+1) = f (n) . Quand la fonction f (n) existe, on dit
que c’est la dérivée d’ordre n de f.

Définition 7.5. Pour n ∈ N∗ , on dit que f est n fois dérivable en α ∈ I si


f est n − 1 fois dérivable sur un voisinage de α avec f (n−1) dérivable en α.

Définition 7.6. Pour n ∈ N∗ , on dit que f est de classe C n (ou n fois


continûment dérivable) sur I si elle est n fois dérivable sur I avec f (n)
continue sur cet intervalle.

Définition 7.7. On dit que f est de classe C ∞ (ou indéfiniment dérivable)


sur I, si elle est n fois dérivable sur cet intervalle pour tout n ∈ N.

On note :
— C 0 (I, E) l’ensemble des fonctions continues de I dans E ;
— C n (I, E) l’ensemble des fonctions n fois continûment dérivables de I dans
E, où n ∈ N∗ ;
— C ∞ (I, E) l’ensemble des fonctions indéfiniment dérivables de I dans E.

7.2 Opérations sur les fonctions dérivables


Les résultats importants relatifs aux opérations algébriques sur les fonctions
dérivables sont résumés par le théorème qui suit.
202 Dérivées des fonctions d’une variable réelle

Théorème 7.6.
Soient f, g deux fonctions de I dans E dérivables en α ∈ I.
1. Pour tous réels λ, μ la fonction λf + μg est dérivable en α avec

(λf + μg) (α) = λf  (α) + μg  (α) .

2. Dans le cas où E = K, la fonction f g est dérivable en α avec (f g) (α) =
f  (α) g (α) + f (α) g  (α) (formule de Leibniz).
3. Dans le cas où E = K et g (α) = 0, la fonction g ne s’annule pas dans
1 f
un voisinage de α, les fonctions et qui sont définies dans un tel
g g
voisinage sont dérivables en α avec :
   
1 g  (α) f g (α) f  (α) − f (α) g  (α)
(α) = − 2 , (α) =
g g (a) g g 2 (α)

Preuve.
1. Résulte de τα (λf + μg) = λτα (f ) + μτα (g) .
2. Résulte de τα (f g) (x) = f (x) τα (g) + g (α) τα (f ) .
3. Si g (α) = 0 dans K, on a alors g (x) = 0 pour tout x dans un voisinage de α
1 1
du fait de la continuité de g en ce point. Avec τα (x) = − τα (g)
g g (x) g (α)
 
1 g  (α)
pour x = α, on déduit par passage à la limite en α que (α) = − 2 .
g g (α)
La formule de Leibniz permet d’obtenir le deuxième point.

La formule de Leibniz est fait valable, de manière plus générale, pour les fonc-
tions plusieurs fois dérivables. Précisément on a le résultat suivant.
Théorème 7.7. Leibniz
Soient f, g deux fonctions n fois dérivables de I dans K. La fonction f g
n  
(n) n (k) (n−k)
est n fois dérivable sur I avec (f g) = f g .
k
k=0

Preuve. On procède par récurrence sur n ≥ 1. Pour n = 1, c’est le deuxième


point du théorème précédent. En supposant le résultat acquis pour n ≥ 1 et toutes
les fonctions dérivables n fois sur I, on peut écrire pour f, g dérivables n + 1 fois
Opérations sur les fonctions dérivables 203

n  

(n) n
sur I, (f g) = f (k) g (n−k) et en dérivant encore une fois, on obtient :
k
k=0

n  #
 $
(n+1) n
(f g) = f (k+1) g (n−k) + f (k) g (n−k+1)
k
k=0
n  
 

n−1
n n (k+1) (n−k)
= f g (n+1) + f (k) g (n+1−k) + f g + f (n+1) g
k k
k=1 k=0
n   n  
(n+1) n (k) (n+1−k) n
= fg + f g + f (j) g (n+1−j) + f (n+1) g
k j=1
i−1
k=1
n    
n n
= f g (n+1) + + f (k) g (n+1−k) + f (n+1) g
k k−1
k=1
 n + 1
n+1 
= f (k) g (n+1−k)
k
k=0

c’est-à-dire le résultat au rang n + 1. 


Pour ce qui est de la composition et du passage à l’inverse, on a les résultats
suivants.
Théorème 7.8.
Soient I, J deux intervalles réels f : I → J une fonction dérivable en
α ∈ I et g : J → E une fonction dérivable en β = f (α) . La fonction g ◦ f

est définie sur I et dérivable en α avec (g ◦ f ) (α) = g  (f (α)) f  (α) .

Preuve. On définit la fonction τβ sur J par :



⎨ g (y) − g (β) si y = β

τβ (y) = y−β

⎩ g  (β) si y = β

g ◦ f (x) − g ◦ f (α) f (x) − f (α)


et pour x = α dans I, on a = τβ (f (x)) (pour
x−α x−α
f (x) = f (α) c’est clair et pour f (x) = f (α) , les deux membres de cette égalité
sont nuls). Faisant tendre x vers α on obtient le résultat du fait de la continuité
de f en α, de celle de τβ en β et de la définition de f  (α) . 
On rappelle que si f : I → R est continue strictement monotone, c’est alors un
homéomorphisme de I sur f (I) (théorème 6.27).
Théorème 7.9.
Soit f : I → R une fonction continue strictement monotone dérivable
en α. La fonction réciproque f −1 est dérivable en f (α) si, et seulement si,
 1
f  (α) = 0 et dans ce cas on a f −1 (f (α)) =  .
f (α)
204 Dérivées des fonctions d’une variable réelle

Preuve. Si f −1 est dérivable en f (α) , on a alors :


 
1 = f −1 ◦ f (α) = f −1 (f (α)) · f  (α)

et nécessairement f  (α) = 0. Supposons f  (α) = 0 et notons β = f (α) . Pour tout


y = β dans J on a f −1 (y) = α et :
 −1
f −1 (y) − f −1 (β) f f −1 (y) − f (α)
=
y−β f −1 (y) − α

f f −1 (y) − f (α)
Avec la continuité de f −1 , on a lim = f  (α) , ce qui entraîne :
y→β f −1 (y) − α

f −1 (y) − f −1 (β) 1
lim = 
y→β y−β f (α)


De ce résultat, on déduit les dérivées des fonctions trigonométriques et hyper-
boliques inverses, à savoir :
1 1
— ∀x ∈ ]−1, 1[ , arcsin (x) = √ , arccos (x) = − √ ;
1−x 2 1 − x2
1 1
— ∀x ∈ R, arctan (x) = , argsh (x) = √ ;
1 + x2 1 + x2
1
— ∀x ∈ ]1, +∞[ , argch (x) = √ ;
x2 − 1
1
— ∀x ∈ ]−1, 1[ , argth (x) = .
1 − x2
La fonction arcsin + arccos étant de dérivée nulle sur ]−1, 1[ est constante (co-
rollaire 7.1) et la valeur de cette fonction en x = 0, nous donne :
π
∀x ∈ ]−1, 1[ , arcsin (x) + arccos (x) =
2
 
1
De même en remarquant que la dérivée de x → arctan (x) + arctan est
x

nulle sur R et en prenant les valeurs en −1 et 1, on déduit que :
 
∗ 1 x π
∀x ∈ R , arctan (x) + arctan =
x |x| 2

Pour ce qui est de la composée de deux fonctions n fois dérivable, on a le résultat


suivant de démonstration non élémentaire.
Théorème 7.10. Faà di Bruno
Soient I, J deux intervalles réels, f une fonction n fois dérivable de I
dans J et g une fonction n fois dérivable de J dans R. La composée g ◦ f
Sens de variation d’une fonction 205

est alors n fois dérivable sur I avec :

  k1   kn
(n) n! f  (x) f (n) (x)
(g ◦ f ) = g (k) (f (x)) ···
k1 !k2 ! · · · kn ! 1! n!

où k = k1 +· · · +kn et la somme est étendue aux entiers naturels k1 , · · · , kn


tels que k1 + 2k2 + · · · + nkn = n.

Preuve. Voir [13], exercice 2.1.38. 

7.3 Sens de variation d’une fonction


On utilisant le théorème des accroissements finis, il est classique de vérifier

qu’une fonction f : I → R continue sur I et dérivable sur I est croissante si, et

seulement si, on a f  (x) ≥ 0 pour tout x dans I (théorème 9.19). Ce résultat peut
aussi se démontrer sans utiliser le théorème des accroissements finis, en utilisant
le principe de dichotomie.

On se donne une fonction f : I → R et pour tous x = y dans I, on note
f (y) − f (x)
τ (x, y) = .
y−x

Lemme 7.3 Soient a < b dans I. Pour tout c ∈ ]a, b[ , τ (a, b) est entre τ (a, c) et
τ (c, b) .
Preuve. C’est clair en faisant un dessin. On peut aussi remarquer que :
f (b) − f (c) f (b) − f (a) f (a) − f (c) b−a a−c
τ (c, b) = = + = τ (a, b)+ τ (a, c)
b−c b−c b−c b−c b−c
et en conséquence :
 
b−a a−c c−a
τ (c, b) − τ (a, b) = − 1 τ (a, b) + τ (a, c) = (τ (a, b) − τ (a, c))
b−c b−c b−c
de sorte que τ (c, b) − τ (a, b) et τ (a, b) − τ (a, c) sont de même signe, ce qui impose
que τ (a, b) est entre τ (a, c) et τ (c, b) . En effet, si τ (a, b) ≤ τ (a, c) , on a alors
τ (c, b) ≤ τ (a, b) , soit τ (a, b) ∈ [τ (c, b) , τ (a, c)] et si τ (a, b) > τ (a, c) , on a alors
τ (c, b) > τ (a, b) , soit τ (a, b) ∈ ]τ (a, c) , τ (c, b)[ . 
Théorème 7.11.

Si f : I → R est continue sur I et dérivable sur I, elle est alors croissante

sur I si, et seulement si, f  (x) ≥ 0 pour tout x dans I.


Preuve. Pour f croissante sur I et x = y dans I, le taux d’accroissement
f (y) − f (x)
est positif ou nul, donc passant à la limite quand y tend vers x,
y−x
on en déduit que f  (x) ≥ 0.
206 Dérivées des fonctions d’une variable réelle


Réciproquement, on suppose que f  (x) ≥ 0 pour tout x dans I. Si f est non
◦ ◦
croissante sur I, il existe alors a1 < b1 dans I tels que f (a1 ) > f (b1 ) et on a
f (b1 ) − f (a1 )
τ1 = τ (a1 , b1 ) = < 0. En utilisant le principe de dichotomie, on
b1 − a 1

construit par récurrence deux suites (an )n∈N∗ et (bn )n∈N∗ de points de I telles
que : ⎧
⎨ [an+1 , bn+1 ] ⊂ [an , bn ]

∀n ∈ N ,
⎩ bn − an = b1 − a1 > 0, τn = τ (an , bn ) ≤ τ1
2n−1
◦ a n + bn
Supposons an et bn construits dans I pour n ≥ 1. En notant cn = , le
2
lemme précédent nous dit que τ (an , bn ) est entre τ (an , cn ) et τ (cn , bn ) . Préci-
sément, si τ (an , bn ) ≤ τ (an , cn ) , on a alors τ (an , bn ) ∈ [τ (cn , bn ) , τ (an , cn )] et
on pose an+1 = cn , bn+1 = bn , sinon on a τ (an , bn ) ∈ ]τ (an , cn ) , τ (cn , bn )[ et
on pose an+1 = an , bn+1 = cn . Dans tous les cas on a [an+1 , bn+1 ] ⊂ [an , bn ] ,
bn − an b1 − a1
bn+1 − an+1 = = et τ (an+1 , bn+1 ) ≤ τ (an , bn ) ≤ τ1 .
2 2n
Les suites (an )n≥1 et (bn )n≥1 sont alors adjacentes et elles convergent vers un

même réel c ∈ [a1 , b1 ] ⊂ I.
En écrivant que τ1 < 0 ≤ f  (c) = lim τ (x, c) , on déduit qu’il existe un réel
x→c
η > 0 tel que τ (x, c) > τ1 pour tout x ∈ [c − η, c + η] \ {c} ⊂ I. De plus, il existe
un entier n0 ≥ 1 tel que an ∈ [c − η, c] et bn ∈ [c, c + η] pour tout n ≥ n0 . Mais
pour n ≥ n0 on a :
— soit an = c et dans ce cas bn > c (on a an < bn ), donc τ (c, bn ) > τ1 ce qui
est en contradiction avec τ (c, bn ) = τ (an , bn ) ≤ τ1 ;
— soit bn = c et dans ce cas an < c, donc τ (an , c) > τ1 ce qui est en contradic-
tion avec τ (an , c) = τ (an , bn ) ≤ τ1 ;
— soit an < c < bn et dans ce cas les inégalités τ (an , c) > τ1 et τ (c, bn ) > τ1
sont en contradiction avec τ (an , bn ) ≤ τ1 et τ (an , bn ) est entre τ (an , c) et
τ (c, bn ) .

En définitive la fonction f est nécessairement croissante sur I et sur I par
continuité de f. 
Du théorème précédent, on déduit les résultats classiques suivants.

Corollaire 7.1. Soient f, g deux fonctions à valeurs réelles continues sur



I et dérivables sur I.
1. La fonction f est décroissante sur I si, et seulement si, f  (x) ≤ 0 pour

tout x dans I.
2. La fonction f est constante sur I si, et seulement si, f  (x) = 0 pour tout

x dans I.

3. Si f  (x) > 0 [resp. f  (x) < 0] pour tout x dans I, la fonction f est alors
strictement croissante [resp. strictement décroissante] sur I.
Sens de variation d’une fonction 207

4. Si f  (x) ≤ g  (x) pour tout x dans I = [a, b] , on a alors :

∀x ∈ [a, b] , f (x) − f (a) ≤ g (x) − g (a)

5. Si m ≤ f  (x) ≤ M pour tout x dans I = [a, b] , on a alors :

∀x ∈ [a, b] , m (x − a) ≤ f (x) − f (a) ≤ M (x − a)

Preuve.
1. On applique le théorème précédent à la fonction −f.
2. Si f  = 0, la fonction f est à la fois croissante et décroissante, donc constante.
La réciproque est évidente.

3. Si f  (x) > 0 pour tout x dans I, on sait déjà que la fonction f est croissante.
Si il existe a < b dans I tels f (a) = f (b) , on a alors :

∀x ∈ [a, b] , f (a) ≤ f (x) ≤ f (b) = f (a)

et la fonction f est constante sur [a, b] d’intérieur non vide, ce qui entraîne
f  = 0 sur ]a, b[ en contradiction avec f  > 0.
4. Résulte de la croissance de la fonction h = g − f.
5. On applique ce qui précède à (mx, f ) et (f, M x) .

On peut remarquer que le point 3. du corollaire précédent implique le théorème
7.11. Les deux résultats sont donc équivalents. En effet, en notant, pour tout réel

m > 0, gm (x) = f (x) + m, l’hypothèse f  (x) ≥ 0 pour tout x dans I entraîne


gm (x) > 0 pour tout x dans I, donc gm est strictement croissante sur I et pour
x < y dans I, on a f (x) + m < f (y) + m pour tout m > 0 ce qui entraîne
f (x) ≤ f (y) en faisant tendre m vers 0.
En fait, on a le résultat suivant, un peu plus fin que le théorème 7.11.
Théorème 7.12.

Si f : I → R est continue sur I et dérivable à droite sur I, elle est alors

croissante sur I si, et seulement si, fd (x) ≥ 0 pour tout x dans I.


Preuve. Pour f croissante sur I et x < y dans I, le taux d’accroissement
f (y) − f (x)
est positif ou nul, donc passant à la limite quand y tend vers x+ , on
y−x
en déduit que fd (x) ≥ 0. Réciproquement, on suppose que fd (x) ≥ 0 pour tout x
◦ ◦
dans I. Pour x < y fixés dans I et ε > 0 quelconque, on définit l’ensemble :

Iε = {z ∈ [x, y] | ∀t ∈ [x, z] , f (t) − f (x) ≥ −ε (t − x)}

Cet ensemble est un intervalle qui contient x. En effet, pour z1 ≤ z2 dans Iε


et z ∈ [z1 , z2 ] , on a [x, z] ⊂ [x, z2 ] et en conséquence, f (t) − f (x) ≥ −ε (t − x)
208 Dérivées des fonctions d’une variable réelle

pour tout t ∈ [x, z] . Et il est clair que x ∈ Iε . La borne supérieure α de Iε est


alors dans Iε . En effet, c’est clair pour α = x et pour α > x, on a α ∈ [x, y] (y
majore Iε ) et pour tout t ∈ [x, α[ , il existe par définition de la borne supérieure
z ∈ Iε tel que t < z ≤ α, donc f (t) − f (x) ≥ −ε (t − x) . Par continuité de f, cette
inégalité est encore vraie pour t ∈ [x, α] , donc α ∈ Iε et Iε = [x, α] . Comme α est
◦ f (t) − f (α)
dans I, on a fd (α) = lim ≥ 0, donc il existe un réel η > 0 tel que
t→α + t−α
◦ f (t) − f (α)
[α, α + η] ⊂ I et ≥ −ε pour tout t ∈ ]α, α + h] . Si α < y, en prenant
t−α
z dans ]α, α + h] ∩ ]α, y] ⊂ [x, y] , on a pour tout t ∈ ]α, z] ⊂ ]α, α + h] :

f (t) − f (x) = f (t) − f (α) + f (α) − f (x) ≥ −ε (t − α) − ε (α − x) = −ε (t − x)

ce qui entraîne que f (t) − f (x) ≥ −ε (t − x) pour tout t ∈ [x, z] puisque cette
inégalité est vérifiée sur [x, α] . Mais alors z est dans ]α, y] et dans Iε , ce qui
contredit le caractère maximal de α. On a donc α = y et en particulier f (y) −
f (x) ≥ −ε (y − x) . Faisant tendre ε vers 0, on en déduit que f (y) − f (x) ≥ 0.

En définitive la fonction f est croissante sur I et en conséquence sur I par
continuité de f. 

7.4 Dérivée logarithmique


Pour ce paragraphe, I est un intervalle réel d’intérieur non vide et les fonctions
considérées sont à valeurs réelles ou complexes, ne s’annulant pas.

Définition 7.8. Si f : I → K∗ est une fonction dérivable, sa dérivée


f
logarithmique est la fonction .
f

Théorème 7.13.
La dérivée logarithmique d’un produit [resp. quotient] de deux fonctions
dérivables est la somme [resp. la différence] des dérivées logarithmiques.
Deux fonctions ayant même dérivée logarithmique sont proportionnelles.

Preuve. Soient f, g deux fonctions dérivables de I dans K∗ . La dérivée logarith-



(f g) f  g + f g f  g
mique du produit f g est = = + et la dérivée logarithmique
fg fg f g
   
f gf − f g g f g
du quotient est 2
= − .
g g f f g  
f g f
Si = sur I, on a alors f g − f g  = 0 et

= 0, ce qui signifie que
f g g
f = λf avec λ dans K∗ . 
Une application de ce résultat est le théorème de relèvement qui suit, où on a
noté Γ = {z ∈ C | |z| = 1} le cercle unité dans C.
Extrema et dérivation 209

Théorème 7.14. de relèvement

Soient f une fonction de classe C 1 de I dans Γ (i. e. |f (t)| = 1 pour


tout t ∈ I) et α un point fixé dans I. Si θ0 est un réel tel que f (α) = eiθ0 ,
il existe alors une unique fonction θ de classe C 1 de I dans R telle que
θ (α) = θ0 et f (t) = eiθ(t) pour tout t ∈ I.

Preuve. Si une telle fonction θ existe, on a nécessairement f  = iθ f, ce qui nous


conduit à définir la fonction θ par :
 t 
f (s)
∀t ∈ I, θ (t) = θ0 − i ds
a f (s)

Une telle fonction est de classe C 1 sur I et les fonctions f et eiθ ont même dérivée
logarithmique, elle sont donc proportionnelles et ayant même valeur en α, elles
sont égales. L’unicité a été montrée en introduction. 
Une telle fonction θ est un relèvement de la fonction f.
En écrivant f = x + iy, la condition |f (t)| = 1 pour tout t ∈ I se traduit par
x2 (t) + y 2 (t) = 1 qui entraîne xx + yy  = 0 et :
f x + iy  (x + iy  ) (x − iy)
= = = i (xy  − x y)
f x + iy x2 + y 2
On a donc :
 t
∀t ∈ I, θ (t) = θ0 + (x (s) y  (s) − x (s) y (s)) ds
a

Ce théorème peut être utilisé pour montrer que l’indice d’un lacet dans le plan
complexe est un entier. Précisément, on a le résultat suivant.
1
 2π  de classe C et 2π-périodique de R
Corollaire 7.2. Si f est une fonction
1 f (t)
dans C∗ , on a alors I (f ) = dt ∈ Z.
2iπ 0 f (t)

f
Preuve. La fonction g = étant de classe C 1 de R dans le cercle unité Γ admet
|f |
un relèvement θ de classe C 1 de R dans R. On a donc f = |f | g = |f | eiθ et :
 2π   
1 |f | (t)  1 2π
I (f ) = + iθ (t) dt = [ln (|f |) + iθ]0
2iπ 0 |f | (t) 2iπ
Avec la 2π-périodicité de f, on a f (2π) = f (0) et θ (2π) = θ (0) + 2kπ avec k ∈ Z,
θ (2π) − θ (0)
ce qui donne I (f ) = = k ∈ Z. 

7.5 Extrema et dérivation


Dans le cadre des fonctions d’une variable réelle à valeurs réelles, on a le ré-
sultat important suivant qui donne une condition nécessaire pour qu’une fonction
dérivable en un point admette un extremum local en ce point.
210 Dérivées des fonctions d’une variable réelle

Théorème 7.15.
Soient I un intervalle réel d’intérieur non vide, f : I → R une fonction

dérivable en un point α ∈ I. Si f admet un extremum local en α, on a alors
f  (α) = 0.

Preuve. On suppose que la fonction f admet un maximum local en α. Le point α


étant intérieur à I, la fonction ϕ : t → f (α + t) est définie sur un voisinage ouvert
de 0 et en écrivant que :

⎪ f (α + t) − f (α)

⎪ f  (α) = lim ≤0

⎨ t→0 t
t>0

⎪ f (α + t) − f (α)

⎪ 
≥0
⎩ f (α) = t→0
lim
t
t<0

on déduit que f (α) = 0. 
La réciproque de ce théorème est fausse comme le montre l’exemple de la fonc-
tion x → x3 au voisinage de 0.
Deux conséquences importantes de ce théorème sont le théorème de Rolle (théo-
rème 9.2) et le théorème de Darboux exposé au paragraphe suivant.
La démonstration du théorème précédent contient plus précisément le résultat
suivant.
Théorème 7.16.
Si I est un intervalle réel d’intérieur non vide, f une fonction à valeurs
réelles définie sur I dérivable à gauche et à droite en un point α intérieur à
I et qui admet un maximum [resp. minimum] local en ce point, on a alors
fg (α) ≥ 0 et fd (α) ≤ 0 [resp. fg (α) ≤ 0 et fd (α) ≥ 0].

Le résultat qui suit, conséquence du théorème des accroissements finis (voir le


chapitre 9), nous donne une condition suffisante d’extremum global.
Théorème 7.17.
Soient I un intervalle réel d’intérieur non vide, f une fonction à valeurs
réelles définie et dérivable sur I et α un point de I. Si (x − α) f  (x) ≥ 0
[resp. (x − α) f  (x) ≤ 0] pour tout x ∈ I, f admet alors un minimum [resp.
maximum] global en α.

Preuve. Pour x ∈ I \ {α} le théorème des accroissements finis nous permet


d’écrire :
x−α
f (x) − f (α) = (x − α) f  (cx ) = (cx − α) f  (cx )
cx − α
x−α
avec cx strictement compris entre α et x. Avec > 0 et (cx − α) f  (cx ) ≥ 0
cx − α
[resp. (cx − α) f  (cx ) ≤ 0], on en déduit que f (x) ≥ f (α) [resp. f (x) ≤ f (α)]. La
fonction f admet donc un minimum [resp. maximum] global en α. 
Extrema et dérivation 211

La démonstration précédente nous montre que l’extremum global est strict si


on a l’inégalité stricte (x − α) f  (x) > 0 [resp. (x − α) f  (x) < 0].
On a vu que si f est une fonction dérivable sur un intervalle I, sa dérivée f 
n’est pas nécessairement continue et pourtant nous allons vérifier que cette dérivée
vérifie la propriété des valeurs intermédiaires (voir le paragraphe 6.5). Ce résultat
peut se montrer en utilisant le théorème 7.15.
Théorème 7.18. Darboux
Si f est une fonction à valeurs réelles définie et dérivable sur un intervalle
I, sa fonction dérivée f  vérifie alors la propriété des valeurs intermédiaires.

Preuve. Soient a < b dans I. Si f  (a) = f  (b) il n’y a alors rien à montrer.
On suppose donc que f  (a) < f  (b) et on se donne λ ∈ ]f  (a) , f  (b)[ . On définit
la fonction ϕ sur [a, b] par ϕ (x) = f (x) − λx. Cette fonction qui est continue
sur le compact [a, b] , est minorée et atteint sa borne inférieure, c’est-à-dire qu’il
existe c ∈ [a, b] tel que ϕ (c) = inf ϕ (x) . Si c = a [resp. c = b], on a alors
x∈[a,b]
ϕ (x) − ϕ (a) ϕ (b) − ϕ (x)
≥ 0 [resp. ≤ 0] pour tout x ∈ ]a, b[ et en passant à
x−a b−x
limite quand x tend vers a [resp. vers b] par valeurs supérieures [resp. inférieures],
on déduit que ϕ (a) ≥ 0 [resp. ϕ (b) ≤ 0] ce qui est en contradiction avec ϕ (a) =
f  (a)−λ < 0 < ϕ (b) = f  (b)−λ. On a donc c ∈ ]a, b[ et ϕ (c) = 0, soit f  (c) = λ.

Le théorème de Darboux nous montre qu’une fonction peut très bien vérifier la
propriété des valeurs intermédiaires
  sans être continue. Par exemple la fonction f
2 1
définie par f (x) = x sin prolongée par continuité en 0 est dérivable sur R
x
de dérivée f  vérifiant la propriété des valeurs intermédiaires et non continue en 0.

Corollaire 7.3. Il existe des fonctions définies sur un intervalle réel qui
n’admettent pas de primitive.

Preuve. Si f admet une primitive F sur I, elle doit vérifier la propriété des
valeurs intermédiaires. Une fonction ne vérifiant pas cette propriété, par exemple
une fonction en escalier, n’admet donc pas de primitive sur I. 
En fait, on peut vérifier directement qu’une fonction en escalier n’admet pas de
primitives (exercice 7.12).
Du théorème de Darboux et du théorème 6.25, on déduit le résultat suivant.
Théorème 7.19.
Une fonction convexe et dérivable de I dans R est continûment dérivable.

Preuve. Si f est convexe et dérivable de I dans R, sa dérivée f  est alors crois-


sante. Cette dérivée vérifiant la propriété des valeurs intermédiaires, on déduit du
théorème 6.25 qu’elle est continue. 
212 Dérivées des fonctions d’une variable réelle

7.6 Position d’une courbe par rapport aux sé-


cantes et aux tangentes
Pour ce paragraphe, on se donne une fonction f : I → R et on note C sa courbe
représentative dans le plan affine R2 .
Si D est une droite, non verticale, d’équation y = ax + b, elle partage alors
le plan R2 en deux demi-plans. Pour tout point M (x, y) dans R2 \ D on a deux
possibilités :
— soit y > ax + b et on dit alors que le point M est au dessus de la droite D ;
— soit y < ax + b et on dit alors que le point M est au dessous de la droite D.
L’étude de la position du graphe de la fonction f par rapport à la droite D
revient à étudier le signe de la fonction g définie sur I par g (x) = f (x) − ax − b.
Si localement la droite D coupe la courbe C en un seul point l’étude de la position

de C par rapport à D est relativement simple. Supposons qu’il existe α ∈ I et un
réel η > 0 tels que J = [α − η, α + η] soit contenu dans I et l’équation g (x) = 0
admette α comme unique solution dans J. Une équation de la droite D peut alors
s’écrire sous la forme y = f (α) + a (x − α) et la fonction g est définie par :
∀x ∈ I, g (x) = f (x) − f (α) − a (x − α)
En supposant la fonction f dérivable en α, il existe une fonction ε définie sur I
de limite nulle en α telle que :
∀x ∈ I, g (x) = (f  (α) − a + ε (x)) (x − α)
Si a = f (α) la droite D est alors tangente à la courbe C et c’est l’étude du signe
de la fonction ε au voisinage de α qui nous renseignera sur la position locale de C
par rapport à D. Cette étude est menée en fin de ce paragraphe.
Si a = f (α) , c’est-à-dire si D est sécante non tangente à C en α, c’est alors le
signe de f  (α) − a qui va nous renseigner sur la position locale de C par rapport
à D.
La fonction ε, définie par :

⎨ f (x) − f (α) − f  (α) si x = α
∀x ∈ I, ε (x) = x−α

0 si x = α

étant continue en α avec ε (α) = 0, il existe η  ∈ ]0, η] tel que f  (α) − a + ε (x) soit
du signe de f  (α) − a pour tout x ∈ J  = [α − η  , α + η  ] . On a donc :

∀x ∈ ]α − η  , α[ , g (x) < 0
f  (α) > a ⇒
∀x ∈ ]α, α + η  [ , g (x) > 0

∀x ∈ ]α − η  , α[ , g (x) > 0
f  (α) < a ⇒
∀x ∈ ]α, α + η  [ , g (x) < 0

ce qui signifie que pour f  (α) > a [resp. f  (α) > a] la courbe C est localement au
dessous [resp. au dessus] de la sécante D si x < α et localement au dessus [resp.
au dessous] si x > α.
Position d’une courbe par rapport aux sécantes et aux tangentes 213

Dans le cas où D est une corde, c’est-à-dire qu’elle coupe C en deux points au
moins, on peut être plus précis dans l’étude précédente si on suppose de plus que
la fonction f est dérivable sur I à dérivée monotone. Cette étude nous conduira
naturellement à la notion de convexité qui est étudiée plus en détail au chapitre 8.
Si la droite D coupe la courbe C en deux points distincts M0 (α, f (α)) et
M1 (β, f (β)) avec α < β dans I, on peut alors écrire une équation de D sous
f (β) − f (α)
la forme y = h (x) = f (α) + (x − α) et la fonction g est définie par :
β−α
f (β) − f (α)
∀x ∈ I, g (x) = f (x) − f (α) − (x − α)
β−α
En écrivant tout réel x ∈ [α, β] sous la forme x = λα + (1 − λ) β avec λ ∈ [0, 1] ,
tout revient à étudier le signe de la fonction ϕ définie sur [0, 1] par :

∀λ ∈ [0, 1] , ϕ (λ) = f (λα + (1 − λ) β) − (λf (α) + (1 − λ) f (β))

Le graphe de la restriction de f à [α, β] est sous la corde D si, et seulement si,


ϕ (λ) ≤ 0 pour tout λ ∈ [0, 1] et au dessus si, et seulement si, ϕ (λ) ≥ 0 pour tout
λ ∈ [0, 1] . Ce qui nous conduit à la notion de fonction convexe.

Définition 7.9. On dit que la fonction f est convexe sur I si :

∀ (x, y) ∈ I 2 , ∀λ ∈ [0, 1] , f ((1 − λ) x + λy) ≤ (1 − λ) f (x) + λf (y)

ce qui équivaut à dire que le graphe de f est au dessous de toutes ses cordes.
On dit que f est concave si la fonction −f est convexe, ce qui équivaut à
dire que le graphe de f est au dessus de toutes ses cordes.

Dans le cas où la fonction f est dérivable sur I, il en est de même de la fonc-


f (β) − f (α)
tion g avec g  (x) = f  (x) − pour tout x ∈ I et le théorème des
β−α
accroissements finis (théorème 9.13) nous dit qu’il existe un point c ∈ ]α, β[ tel
que g  (x) = f  (x) − f  (c) pour tout x ∈ I, ce qui permet de donner une condition
suffisante relativement simple de convexité.
Théorème 7.20.
Si, avec les notations qui précèdent, la fonction f est dérivable de déri-
vée croissante [resp. décroissante], cette fonction est alors convexe [resp.
concave], c’est-à-dire que son graphe est au dessous [resp. au dessus] de
toutes ses cordes.

Preuve. En gardant toujours les mêmes notations, dans le cas où f  est croissante,
on a le tableau de variation suivant de la restriction de g à [α, β] :

x α c β
g − +
0 0
g
 
214 Dérivées des fonctions d’une variable réelle

qui nous dit que g (x) ≤ 0 pour tout x ∈ [α, β] . 


Dans le cas où f  est strictement monotone, les points M0 et M1 sont les seuls
points d’intersection de C et D en restriction à [α, β] . En réalité cette condition
est également nécessaire (théorème 8.16).
f (x) − f (α)
Pour x = α dans I, le taux d’accroissement τα (x) = est la pente
x−α
de la corde passant par les points M0 (α, f (α)) , Mx (x, f (x)) et, si f est dérivable
en α, ces pentes ont une limite finie f  (α) quand x tend vers α, ce qui signifie
que les cordes (M0 Mx ) ont pour limite quand x tend vers α la droite T0 de pente
f  (α) passant par M0 . Cette droite T0 est appelée la tangente au graphe de f en
M0 . Une équation de cette tangente est donc y = f (α) + f  (α) (x − α) .
Étudier la position relative de C par rapport à T0 revient à étudier, au voisinage
de α, le signe de la fonction g définie sur I par g (x) = f (x)−f (α)−f  (α) (x − α) .
En supposant que f est dérivable sur I, il en est de même de g avec :
∀x ∈ I, g  (x) = f  (x) − f  (α)
Si on suppose de plus la fonction f  est dérivable en α, il existe alors une fonction
ε définie sur I \ {α} et de limite nulle en α telle que :
∀x ∈ I \ {α} , g  (x) = (x − α) (f  (α) + ε (x))
En supposant que f  (α) est strictement positif [resp. strictement négatif], on
peut trouver un réel η > 0 telle sur l’intervalle [α − η, α + η] la fonction g  soit du
signe de x−α [resp. de signe contraire]. Dans le cas où f  (α) est strictement positif
on a donc le tableau de variations de g suivant sur l’intervalle [α − η, α + η] :
x α−η α α+η
g − +
 
g
0 0
qui nous dit que g (x) ≥ 0 pour tout x ∈ [α − η, α + η] et le graphe de f est au
dessus de la tangente en α.
De manière analogue, on vérifie que pour f  (α) < 0 le graphe de f est locale-
ment au dessous de la tangente en α.
Dans le cas où f  (α) est nul on peut utiliser les développements limités pour
étudier localement la position relative de la courbe par rapport à une tangente
(cette étude est menée au paragraphe 11.3.2).

7.7 Dérivation et intégration


 b
Pour f dérivable sur [a, b] l’égalité f  (x) dx = f (b) − f (a) n’est pas tou-
a    
x 1 1 1
jours assuré. Par exemple la fonction f : x → cos sur I = − ,
ln (|x|) x 2 2
(prolongée par continuité en 0 avec f (0) = 0) est dérivable sur I avec :
     
1 1 1 1 1 1
f  (x) = cos − 2 cos + sin
ln (|x|) x ln (|x|) x x ln (|x|) x
Suites de fonctions dérivables 215

pour x = 0 et f  (0) = 0. La fonction


   
1 1 1 1
x → cos − 2 cos
ln (|x|) x ln (|x|) x

est continue sur I donc Riemann-intégrable, mais la fonction


 
1 1
g : x → sin
x ln (|x|) x

ne l’est pas puisqu’elle n’est pas bornée sur I. En effet on a :


  π
1 2 + 2kπ
lim g π = − lim = −∞
k→+∞ ln π + 2kπ
2 + 2kπ
k→+∞
2

La fonction f  n’est donc pas Riemann-intégrable sur I.


En utilisant le théorème des accroissements finis, on peut montrer le résultat
suivant.
Théorème 7.21.
Si f est une fonction dérivable sur [a, b] avec f  Riemann-intégrable sur
 b
[a, b] , on a alors f  (x) dx = f (b) − f (a) .
a

Preuve. Voir le théorème 9.23. 


De ce théorème (parfois appelé théorème fondamental du calcul intégral) on
déduit le théorème d’intégration par parties suivant.
Théorème 7.22.
Si f, g sont deux fonctions dérivables sur [a, b] avec f  , g  Riemann-
intégrables sur [a, b] , on a alors :
 b  b
f (x) g  (x) dx = f (b) g (b) − f (a) g (a) − f  (x) g (x) dx
a a

Preuve. On applique le résultat précédent à la fonction h = f g qui est dérivable


de dérivée f  g + f g  Riemann-intégrable sur [a, b] . 

7.8 Suites de fonctions dérivables


Une limite uniforme d’une suite de fonctions dérivables (ou même de classe C 1 )
n’est pas nécessairement dérivable. Par exemple, le théorème de Weierstrass nous
dit que toute fonction continue sur un intervalle compact est limite uniforme d’une
suite de polynômes (qui sont de classe C ∞ ) et on peut trouver des fonctions conti-
nues nulle part dérivables. Toutefois le théorème des accroissements finis permet
de montrer les résultats suivants.
216 Dérivées des fonctions d’une variable réelle

Théorème 7.23.
Soit (fn )n∈N une suite de fonctions continues de [a, b] dans R, dérivables
sur ]a, b[ , qui converge simplement vers une fonction f. S’il existe une
constante M > 0 telle que |fn (x)| ≤ M pour tout n dans N et tout x
dans ]a, b[ , la suite (fn )n∈N converge alors uniformément et f est continue.

Preuve. Voir le théorème 9.29. 


Théorème 7.24.
Soit (fn )n∈N une suite de fonctions dérivables de [a, b] dans R telle que
la suite (fn )n∈N converge uniformément sur [a, b] vers une fonction g. S’il
existe x0 ∈ [a, b] tel que la suite (fn (x0 ))n∈N soit convergente, la suite
(fn )n∈N converge alors uniformément vers une fonction dérivable f et f  =
g.

Preuve. Voir le théorème 9.30. 


La démonstration de ce théorème est simplifiée si on suppose les fn de classe
C 1 sur [a, b] . Dans ce cas il suffit d’écrire que :
 x  x
fn (x) = fn (x0 ) + fn (t) dt → f (x0 ) + g (t) dt = f (x)
x0 n→+∞ x0

7.9 Fonctions différentiables


Le théorème 7.15 est en fait valable dans le cadre plus général des fonctions
définies sur un ouvert d’un espace vectoriel normé et à valeurs réelles.
On rappelle d’abord quelques résultats sur les fonctions différentiables à valeurs
réelles.

Définition 7.10. Soient O un ouvert non vide d’un espace vectoriel normé
(E, ·) , α un point de O et une fonction f : O → R. On dit que f est
différentiable en α s’il existe une forme linéaire continue L sur E telle que
f (α + h) = f (α) + L (h) + o (h) pour tout h dans un voisinage de 0.

En cas d’existence une telle forme linéaire L est unique. On la note L = df (α)
et on dit que L est la différentielle de f en α.
Il est facile de vérifier que si f est différentiable en α, elle est alors continue en
ce point.
Dans le cas où E = Rn , si f est différentiable en α ∈ O, elle admet alors des
dérivées partielles en α par rapport à chacune des variables xk (1 ≤ k ≤ n) et
n
∂f
pour tout h ∈ Rn on a df (α) (h) = (α) hk .
∂xk
k=1
On dit que la fonction f est différentiable sur O si elle est différentiable en tout
point de O.
Exercices 217

Théorème 7.25.
Soient O un ouvert non vide de E, f : O → R une fonction différentiable
en un point α ∈ O. Si f admet un extremum local en α, on alors df (α) = 0.

Preuve. On suppose que la fonction f admet un maximum local en α. L’ensemble


O étant ouvert, pour tout vecteur h ∈ E il existe un réel r > 0 tel que la fonction
ϕ : t → f (α + th) soit définie sur ]−r, r[ . Cette fonction est dérivable en 0 avec
ϕ (0) = df (α) (h) . En effet, pour t = 0 dans ]−r, r[ on a :

ϕ (t) − ϕ (0) f (α + th) − f (a) df (α) (th) + th ε (th)


= =
t t t
|t|
= df (α) (h) + ε (t · h) → df (α) (h)
t t→0

(on a lim ε (h) = 0). Puis, en écrivant que :


h→0

⎪ f (α + th) − f (α)



≤0
⎨ ϕ (0) = t→0
lim
t
t>0

⎪  f (α + th) − f (α)

⎩ ϕ (0) = t→0
lim ≥0
t
t<0

on déduit que ϕ (0) = 0. On a donc ainsi montré que df (α) (h) = 0 pour tout
h ∈ E, ce qui équivaut à df (α) = 0. 
L’équation df (α) = 0 est appelée équation d’Euler.

7.10 Exercices

Exercice 7.1. Étudier la#dérivabilité de la fonction f définie sur R par


2 π$
f (0) = 0 et f (x) = x cos pour x = 0.
x
 
1 ∗ 2
Solution. Il est clair que f est de classe C sur R \ | k ∈ Z . De
2k + 1
f (x)
l’inégalité ≤ |x| , on déduit que f est dérivable en 0 avec f  (0) = 0.
x
2 π 8 π 9
Soit k = 2p un entier naturel pair et xk = . Pour ∈ kπ, + kπ , on a
#π$ π 8π 9 + 1 #π $ x
2k 2
cos > 0 et pour ∈ + kπ, (k + 1) π , cos < 0, de sorte que :
x x 2 x
2 1
si < x < pour k = 0, ou x > 2 pour k = 0, alors :
2k + 1 k
#π $
2 # # π $$
f (x) − f (xk ) x cos
= x → + x2 cos =π
x − xk x − xk x→xk x |x=xk
218 Dérivées des fonctions d’une variable réelle

1 2
et si <x< , alors :
k+1 2k + 1
#π$
f (x) − f (xk ) x2 cos # # π $$
=− x → + − x2 cos = −π
x − xk x − xk x→xk x |x=xk

f est donc dérivable à droite et gauche en x2p avec fg (x2p ) = −π, fd (x2p ) = π.
On vérifie de même que f est dérivable à droite et gauche en x2p+1 , pour tout
entier naturel p, avec fg (x2p+1 ) = −π, fd (x2p+1 ) = π. Ces dérivées à droite et
à gauche étant distinctes, on en déduit que f n’est pas dérivable en xk pour tout
k ∈ N. Avec la parité de la fonction f, on déduit que ce résultat est encore valable
pour tout k ∈ Z.

Exercice 7.2. Soit (ak )1≤k≤n une suite finie de réels ou de complexes.

n
Montrer que si ak sin (kx) ≤ |sin (x)| pour tout réel x dans un voisinage
k=1
n
de 0, on a alors kak ≤ 1.
k=1


n
Solution. Soit f la fonction définie sur R par f (x) = ak sin (kx) . Cette fonc-
k=1

n n
tion est dérivable avec f  (0) = kak et la condition ak sin (kx) ≤ |sin (x)|
k=1 k=1
π
dans un intervalle ]−δ, δ[ avec 0 < δ < , entraîne :
2
f (x) f (x) sin (x)
∀x ∈ ]−δ, δ[ \ {0} , = ≤1
x sin (x) x

f (x)
de sorte que |f  (0)| = lim ≤ 1.
x→0 x

Exercice 7.3. Calculer, pour tout entier naturel non nul n, la dérivée
1
d’ordre n de la fonction f : x → ainsi que tous les zéros de f (n) .
1 + x2
 
i 1 1
Solution. La décomposition en éléments simples f (x) = −
2 x+i x−i
donne :
 
n
(n) i (−1) n! 1 1
f (x) = n+1 − n+1
2 (x + i) (x − i)
# $ # $
n n+1 n+1 n n+1
i (−1) n! (x − i) − (x + i) (−1) n! (x + i)
= n+1 = n+1
2 (x2 + 1) (x2 + 1)
Exercices 219

Les zéros de f (n) sont donnés par (x − i)


n+1 n+1
− (x + i) = 0, ce quiéquivaut à
2ikπ
x − i = ωk (x + i) pour 0 ≤ k ≤ n, où on a noté ωk = exp les n + 1
n+1
racines (n + 1)-ème de l’unité. La valeur k = 0 donne une impossibilité et notant

θk = pour k compris entre 1 et n, les zéros de f (n) sont les n réels distincts :
n+1

1 + ωk 1 + e2iθk e−iθk + eiθk


xk = i =i 2iθ
= i −iθ = − cotan (θk ) (1 ≤ k ≤ n)
1 − ωk 1−e k e k − eiθk

Exercice 7.4. Soit f : I → R une fonction dérivable en un point α


intérieur à I. Montrer que pour toutes suites (xn )n∈N et (yn )n∈N de points
de I telles que : 
∀n ∈ N, xn < a < yn
lim xn = lim yn = α
n→+∞ n→+∞

f (yn ) − f (xn )
on a lim = f  (α) . Le résultat est-il encore valable sans
n→+∞ yn − x n
l’hypothèse xn < α < yn pour tout n ∈ N ?

yn − α
Solution. En posant λn = , pour tout n ∈ N, on a 0 < λn < 1,
yn − x n
α − xn
1 − λn = et on peut écrire :
yn − x n

f (yn ) − f (xn ) f (yn ) − f (α) f (α) − f (xn )


= λn + (1 − λn )
yn − x n yn − α α − xn
ce qui donne :

f (yn ) − f (xn ) f (yn ) − f (α) f (α) − f (xn )


− f  (α) ≤ − f  (α) + − f  (α)
yn − x n yn − α α − xn

et faisant tendre n vers l’infini, on a le résultat annoncé.  


1 2
En considérant la fonction f définie sur R par f (0) = 0 et f (x) = x sin
x
pour x = 0 et les suites (xn )n∈N∗ et (yn )n∈N∗ définies par :

1 π 1 π
∀n ∈ N∗ , = 2nπ + , = 2nπ −
xn 2 yn 2

f (yn ) − f (xn ) −yn2 − x2n 2 16n2 + 1


on a = = − et en conséquence,
yn − x n yn − x n π (4n + 1) (4n − 1)
f (yn ) − f (xn ) 2
lim = − = f  (0) = 0.
n→+∞ yn − x n π
220 Dérivées des fonctions d’une variable réelle

Exercice 7.5. Soit P un polynôme réel de degré n ≥ 2 ayant n racines


réelles distinctes x1 < x2 < · · · < xn .
1
1. En utilisant la décomposition en éléments simples de , montrer que
P
 n
1
= 0.
P  (xk )
k=1
2. Montrer que :
n  
 k
n (−1) n!
∀x ∈ R \ {−n, · · · , −1, 0} , = 2
n
k x+k
k=0 (x + k)
k=0

Solution.
(
n
1. En écrivant P (x) = an (x − xk ) , avec an = 0, on a la décomposition en
k=1
1 n
αk
éléments simples sur R \ {x1 , · · · , xn } ,= , les coefficients αk ,
P (x) x − xk
k=1
pour k compris entre 1 et n, étant donnés par :
x − xk x − xk 1
αk = lim = lim = 
x→xk P (x) x→xk P (x) − P (xk ) P (xk )
(les racines xk de P étant simples, les P  (xk ) sont tous non nuls). On a donc :
1  n
1 1
∀x ∈ R \ {x1 , · · · , xn } , =
P (x) P  (xk ) x − xk
k=1

L’égalité précédente peut aussi s’écrire, pour tout réel x :



n
1 P (x) 
n
1 (n
1= = a n (x − xj )
P  (xk ) x − xk P  (xk ) j=1
k=1 k=1
j =k


n
1
et l’identification des coefficients de xn−1 nous donne = 0 (n ≥ 2).
P  (xk )
k=1
(
n 
n
2
n
2. Pour P (x) = (x + k) , on a P  (x) = (x + j) , donc :
k=0 k=0 j=0
j =k

(
n
(−1)
k
P  (−k) =
k
(j − k) = (−1) k! (n − k)! = n! n
j=0 k
j =k

1
et la décomposition en éléments simples de donne :
P
n   k
n (−1) n!
∀x ∈ R \ {−n, · · · , −1, 0} , = 2
n
k x+k
k=0 (x + k)
k=0
Exercices 221

Exercice 7.6. Soit f : [0, 1] → R continue, dérivable en 0 avec f (0) = 0.


 n  
1
Montrer que lim f = f  (0) ln (2) .
n→+∞ n+k
k=1

Solution. Soient ε > 0 et η > 0 tels que :


 
f (x) 
(0 < x < η) ⇒ − f (0) < ε
x

1 1
Pour tout entier n > , on a 0 < < η pour tout entier k compris entre 1 et
  η n+k
1 1 1
n, donc f − f  (0) < ε, ce qui entraîne :
n+k n+k n+k

n    n
  n
 1

1 1
f − f  (0) < ε<ε
n+k n+k n+k
k=1 k=1 k=1

En considérant que :
 
1 1 1
n n
1 dx
lim = lim k
= = ln (2)
n→+∞ n + k n→+∞ n 1+ n 0 1+x
k=1 k=1

on aboutit au résultat. Par exemple pour f (x) = x2 et pour f (x) = arctan (x) ,
n n  
1 1
on obtient lim 2 = 0 et n→+∞
lim arctan = ln (2) .
n→+∞ (n + k) n+k
k=1 k=1

Exercice 7.7. Soit f : [0, 1] → R continue, dérivable en 0 avec f (0) = 0.


n  
k f  (0)
Montrer que lim f 2
= . En déduire la limite de la suite
n→+∞ n 2
 n  
k=1
( k
1+ 2 .
n ∗
k=1 n∈N

Solution. Soient ε > 0 et η > 0 tels que :


 
f (x)
(0 < x < η) ⇒ − f  (0) < ε
x

1 k 1
Pour tout entier n > , on a 0 < 2 ≤ < η pour tout entier k compris entre 1
  η n n
k k  k
et n, donc f − 2 f (0) < 2 ε, ce qui entraîne :
n2 n n
     n 

n
k 
n
k  k n+1

f − f (0) < ε= ε≤ε
n2 n2 n2 2n
k=1 k=1 k=1
222 Dérivées des fonctions d’une variable réelle

et pour n assez grand :


n   
n  
k f  (0) k n+1  |f  (0)|
f 2
− ≤ f 2
− f (0) +
n 2 n 2n 2n
k=1 k=1
|f  (0)|
≤ε+ < 2ε
2n
n 
(  
n  
k k 1
En notant un = 1+ 2 , on a ln (un ) = ln 1 + 2 → , donc
n n n→+∞ 2
√ k=1 k=1
lim un = e.
n→+∞

Exercice 7.8. Soit f : [0, 1] → R une fonction dérivable telle que f (0) =
f (c)
f  (0) = f  (1) = 0. Montrer qu’il existe c ∈ ]0, 1] tel que f  (c) = .
c

Solution. Dans le cas où f (1) = 0, c = 1 répond à la question. On suppose


donc que f (1) = 0 et, quitte à considérer −f, on peut supposer que f (1) > 0.
f (x)
On désigne par g la fonction définie sur [0, 1] par g (0) = 0 et g (x) = pour
x
x ∈ ]0, 1] . Cette fonction est continue sur ]0, 1] et avec :

f (x) − f (0)
lim+ g (x) = lim+ = f  (0) = 0 = g (0)
x→0 x→0 x
on déduit qu’elle est également continue en 0. Cette fonction est dérivable sur ]0, 1]
xf  (x) − f (x)
de dérivée g  (x) = . La fonction g étant continue sur le compact
x2
[0, 1] est majorée et atteint sa borne supérieure en un point c ∈ [0, 1] . Si c = 0,
alors g (c) = g (0) = 0 contredit g (c) ≥ g (1) = f (1) > 0. Si c = 1, on a alors :

g (1) − g (x)
f (1) = −g  (1) = − lim− ≤0
x→1 1−x
f (c)
ce qui contredit f (1) > 0. On a donc c ∈ ]0, 1[ et g  (c) = 0, soit f  (c) = .
c

Exercice 7.9. Trouver toutes les fonctions dérivables f : R → R telles


2
que (f  (x)) = 1 pour tout réel x.

Solution. Pour tout réel x, on a f (x) = ±1. Si il existe x < y tels que f (x) = −1
et f (y) = 1, le théorème de Darboux nous dit qu’il existe z ∈ ]x, y[ tel que
2
f  (z) = 0, ce qui contredit l’hypothèse (f  ) = 1. La fonction f  a donc un signe
constant, c’est-à-dire que l’on a f  = −1 ou f  = 1, soit f (x) = −x + b pour
tout réel x ou f (x) = x + c pour tout réel x, où b, c sont deux constantes réelles.
Réciproquement, ces fonctions conviennent.
Exercices 223

Exercice 7.10. Soit f : ]a, b[ → R une fonction dérivable telle que


lim+ f (x) = lim− f (x) = +∞. Montrer que f  (]a, b[) = R.
x→a x→b

a+b
Solution. En notant c = , on a lim f (c + h) = lim f (x) = +∞
2 h→( b−a
2 )
− x→b−

et lim − f (c − h) = lim+ f (x) = +∞, donc pour λ > 0, il existe h, k dans


h→( b−a
2 )
x→a
 
b−a b−a
0, tels que f (c − h) > f (c) > f (c) − λh et f (c + k) > f (c) + λ >
2 2
f (c) − f (c − h) f (c + k) − f (c)
f (c) + λk, ce qui donne = f  (α) < λ < = f  (β)
h k
avec α ∈ ]c − h, c[ , β ∈ ]c, c + k[ et le théorème de Darboux nous dit qu’il existe

γ ∈ ]α, β[ tel que λ = f (γ) . Pour λ ≤ 0, on procède de manière analogue
b−a b−a
avec h, k dans 0, tels que f (c − h) > f (c) − λ ≥ f (c) − λh et
2 2
f (c + k) > f (c) ≥ f (c) + λk, ce qui donne :

f (c) − f (c − h) f (c + k) − f (c)
= f  (α) < λ < = f  (β)
h k

Exercice 7.11. Soit f une fonction dérivable de R dans R, non identi-


quement nulle et telle que :

∀x ∈ R, |f  (x)| = |f (x)| (7.1)

1. On suppose que f ne s’annule jamais sur R. Montrer alors que f  garde


un signe constant sur R et conclure.
2. On se donne un réel a tel que f (a) = 0 et pour fixer les idées on suppose
que f (a) > 0. On note E = {x ∈ [a, +∞[ | f (x) = 0} et on suppose cet
ensemble non vide.
(a) Montrer qu’il existe b > a tel que f (x) > 0 pour tout x ∈ [a, b[ et
f (b) = 0.
(b) On suppose que f  (a) = f (a) . Montrer alors que f  (x) = f (x)
pour tout x ∈ [a, b[ et conclure.
3. Résoudre (7.1) .

Solution.
1. Si f ne s’annule jamais sur R il en est de même de f  (|f  | = |f |). De plus la
fonction dérivée f  vérifiant la propriété des valeurs intermédiaires, s’il existe
x < y dans R tels que f  (x) f  (y) < 0 il en résulte alors l’existence de z ∈ ]x, y[
tel que f  (z) = 0, ce qui contredit f  (t) = 0 pour t ∈ R. En conclusion f  garde
un signe constant sur R et comme il en est de même de f (théorème des valeurs
intermédiaires), on déduit que l’on a soit f  = f, soit f  = −f, ce qui entraîne
f (x) = αex ou f (x) = αe−x pour tout x ∈ R avec α ∈ R∗ .
224 Dérivées des fonctions d’une variable réelle

2.
(a) L’ensemble E = [a, +∞[ ∩ f −1 {0} est fermé du fait de la continuité de
f. Si cet ensemble est non vide, étant minoré par a, il admet une borne
inférieure b et cette dernière est dans E. On a donc f (b) = 0, b > a et
f (x) = 0 sur [a, b[ , ce qui entraîne f (x) > 0 pour tout x ∈ [a, b[ du fait
de la continuité de f et de f (a) > 0.
(b) Supposons qu’il existe c ∈ [a, b[ tel que f  (c) = −f (c) . On a donc c ∈ ]a, b[
(car f  (a) = f (a) > 0). L’ensemble F = {x ∈ ]−∞, c[ | f  (x) = f (x)} est
non vide (il contient a) majoré par c, il admet donc une borne supérieure
d ∈ [a, c] . Si d = a, alors f  (x) = −f (x) < 0 sur ]a, c[ , donc f est
strictement décroissante et f  = −f est strictement croissante, ce qui en-
traîne pour x ∈ ]a, c[ , f  (a) < f  (x) = −f (x) < 0 en contradiction avec
f  (a) = f (a) > 0. On a donc d ∈ ]a, c[ ⊂ ]a, b[ , ce qui entraîne f (d) > 0
et avec la continuité de f en d l’existence d’un réel η > 0 tel que :
1
∀x ∈ ]d − η, d + η[ ⊂ ]a, b[ , f (x) > f (d) > 0
2
De plus par définition de la borne supérieure on peut trouver e ∈ ]d − η, d]
1
tel que f  (e) = f (e) > f (d) > 0. On a donc f  (c) < 0, f  (e) > 0 avec
2
e ≤ d ≤ c, donc e < c et le théorème de Darboux dit que f  s’annule sur
]e, c[ ⊂ ]a, b[ , ce qui est faux. En première conclusion, on a f  (x) = f (x)
sur tout [a, b[ , donc f (x) = αex sur cet intervalle avec α ∈ R∗ et f (b) =
αeb = 0 par continuité, ce qui contredit f (b) = 0. En conclusion E est
vide, ce qui signifie que f (x) > 0 sur tout [a, +∞[ .
3. Comme dans la question précédente, on montre que f a un signe constant sur
]−∞, a] . Cette fonction a donc un signe constant sur R et on conclut avec la
première question.

Exercice 7.12. Montrer que la fonction f définie sur I = [0, 2] par


f (x) = 0 si x ∈ [0, 1] et f (x) = 1 si x ∈ ]1, 2] n’admet pas de primi-
tives sur I.

Solution. Si F est une primitive de f sur I, on a alors F  (x) = 0 sur [0, 1] et


F  (x) = 1 sur ]1, 2] , ce qui donne F (x) = α sur [0, 1] et F (x) = x + β sur ]1, 2] ,
où α, β sont des constantes réelles. Avec la continuité de F en 1, on déduit que
α = 1 + β et F est définie par F (x) = 1 + β sur [0, 1] et F (x) = x + β sur ]1, 2] .
Mais une telle fonction ne peut être dérivable en 1, puisque :

F (x) − F (1) F (x) − F (1)


lim = 0 = lim =1
x→1− x−1 x→1+ x−1
Chapitre 8

Fonctions convexes

On rappelle qu’une partie I d’un espace vectoriel E est convexe, si elle est non
vide, non réduite à un point et si pour tout couple (a, b) d’éléments de I, le segment
[a, b] = {(1 − λ) a + λb | 0 ≤ λ ≤ 1} est contenu dans I.
Pour l’étude des fonctions convexes, on se ramènera rapidement au cas où E
est la droite réelle et dans ce cas, les convexes sont les intervalles (corollaire 2.1).

8.1 Fonctions convexes


Pour ce paragraphe, I désigne un convexe dans un espace vectoriel normé
(E, ·) et f est une application définie sur I à valeurs réelles.

Définition 8.1. On dit que la fonction f est convexe si :

∀ (x, y) ∈ I 2 , ∀λ ∈ [0, 1] , f ((1 − λ) x + λy) ≤ (1 − λ) f (x) + λf (y)

On dit que f est strictement convexe si pour tout couple (x, y) de points
distincts de I et tout réel λ ∈ ]0, 1[ , on a :

f ((1 − λ) x + λy) < (1 − λ) f (x) + λf (y)

On dit que f est concave [resp. strictement concave] si la fonction −f est


convexe [resp. strictement convexe].

On rappelle que l’épigraphe de f est la partie de E × R définie par :


E (f ) = {(x, y) ∈ I × R | y ≥ f (x)}

Théorème 8.1.
L’application f est convexe si, et seulement si, son épigraphe est convexe
dans E × R.

Preuve. Supposons f convexe. Si (x, y) , (x , y  ) sont dans l’épigraphe E (f ) et λ


dans [0, 1] , on a alors :
(1 − λ) y + λy  ≥ (1 − λ) f (x) + λf (x ) ≥ f ((1 − λ) x + λx )
226 Fonctions convexes

c’est-à-dire que le point (1 − λ) (x, y) + λ (x , y  ) est dans E (f ) . Réciproquement,


supposons E (f ) convexe. Pour x, x dans I et λ dans [0, 1] , les points (x, f (x))
et (x , f (x )) sont dans E (f ) , donc aussi (1 − λ) (x, f (x)) + λ (x , f (x )) , ce qui
signifie que (1 − λ) f (x) + λf (x ) ≥ f ((1 − λ) x + λx ) . La fonction f est donc
convexe. 
Une autre interprétation graphique de la convexité est donnée par le résultat
suivant où I est un intervalle réel.
Théorème 8.2.
Soit I un intervalle réel. Une fonction f : I → R est convexe si, et seule-
ment si, pour tout couple (A, B) de points du graphe de f où A (a, f (a)) ,
B (b, f (b)) avec a < b, la courbe représentative de la restriction de f à
l’intervalle [a, b] est au dessous du segment [AB] .

Preuve. Soit h l’application affine qui coïncide avec f en a et b :


b−x x−a
∀x ∈ R, h (x) = f (a) + f (b)
b−a b−a
x−a
Tout point x de [a, b] s’écrit x = (1 − λ) a + λb où λ = et avec la convexité
b−a
b−x x−a
de f, on a f (x) ≤ (1 − λ) f (a) + λf (b) = f (a) + f (b) = h (x) . Réci-
b−a b−a
proquement si, pour tous a < b dans I, le graphe de la restriction de f à l’intervalle
[a, b] est sous la corde [A, B] , l’inégalité f (x) ≤ h (x) pour tout x ∈ [a, b] se tra-
duit par f (x) = f ((1 − λ) a + λb) ≤ h (x) = (1 − λ) f (a) + λf (b) , en posant
x−a
λ= . 
b−a
Dans le cas où f est strictement convexe, toute droite coupe le graphe de f
en au plus deux points (pour A = B le graphe de la restriction de f à ]a, b[ est
strictement au dessus de la corde [A, B]).
Le résultat qui suit nous dit que l’étude des fonctions convexes se ramène à
l’étude des fonctions convexes sur un intervalle réel.
Théorème 8.3.
La fonction f est convexe si, et seulement si, pour tout couple (x, y) de
points de I, la fonction fx,y : t → f ((1 − t) x + ty) est convexe sur [0, 1] .

Preuve. Supposons f convexe et soient x, y fixés dans I. Pour t, t dans [0, 1] , λ


dans [0, 1] , on a t = (1 − λ) t + λt ∈ [0, 1] avec :

(1 − t ) x + t y = (1 − (1 − λ) t − λt ) x + ((1 − λ) t + λt ) y 


= ((1 − λ) (1 − t) + λ (1 − t )) x + ((1 − λ) t + λt ) y 

en écrivant 1 = (1 − λ) + λ dans la première parenthèse, soit :

(1 − t ) x + t y = (1 − λ) ((1 − t) x + ty) + λ ((1 − t ) x + t y)


Fonctions convexes 227

et on a :

fx,y (t ) ≤ (1 − λ) f ((1 − t) x + ty) + λf ((1 − t ) x + t y)


≤ (1 − λ) fx,y (t) + λfx,y (t )

Ce qui prouve la convexité de fx,y . Réciproquement, supposons que toutes les


fonctions fx,y sont convexes sur [0, 1] . Pour x, y dans I, t dans [0, 1] , on a :

f ((1 − t) x + ty) = fx,y (t) = fx,y ((1 − t) 0 + t1)


≤ (1 − t) fx,y (0) + tfx,y (1) ≤ (1 − t) f (x) + tf (y)

ce qui prouve la convexité de f sur I. 


Dans ce qui suit, sauf précision contraire, I désigne un intervalle réel d’intérieur

I non vide et f une fonction définie sur I à valeurs réelles.

Exemples 8.1
1. En utilisant l’inégalité triangulaire sur R (ou sur E) on voit que l’application
x → |x| (ou x → x) est convexe sur R (ou sur E).
2. On peut vérifier à partir de la définition et en utilisant le théorème de Rolle que
la fonction exponentielle est convexe (voir le théorème 9.12).
3. Une fonction affine est à la fois convexe et concave sur R. Graphiquement on
peut se convaincre que la réciproque est vérifiée, c’est ce qu’on montrera un peu
plus loin (théorème 8.10).
4. Une combinaison linéaire à coefficients réels positifs de fonctions convexes est
convexe. Mais le produit de deux fonctions convexes n’est pas nécessairement
convexe comme le montre l’exemple de la fonction x → x3 = x · x2 (le graphe
de la restriction à [−1, 1] n’est pas sous la corde).
5. La composée f = ϕ ◦ g d’une fonction convexe croissante ϕ : J → R avec
une fonction convexe g : I → J est convexe. En effet, pour (x, y) ∈ I 2 et
λ ∈ [0, 1] , on a g ((1 − λ) x + λy) ≤ (1 − λ) g (x) + λg (y) pour g convexe avec
g ((1 − λ) x + λy) et (1 − λ) g (x) + λg (y) dans J, donc avec la croissance et la
convexité de ϕ, on a :

f ((1 − λ) x + λy) ≤ ϕ ((1 − λ) g (x) + λg (y)) ≤ (1 − λ) f (x) + λf (y)

ce qui signifie que la fonction ϕ ◦ g est convexe sur I.


6. La composée de deux fonctions convexes n’est pas toujours convexe comme le
montre l’exemple de la composée d’une fonction convexe f non affine avec la
fonction −x, ce qui donne la fonction −f concave qui est non convexe (car non
affine).
7. Une limite simple de fonctions convexes est convexe.
8. Si f1 , f2 sont convexes sur I, il en est alors de même de h = max (f1 , f2 ) . En
effet pour x, y dans I et λ dans [0, 1] on a, pour j = 1, 2 :

fj ((1 − λ) x + λy) ≤ (1 − λ) fj (x) + λfj (y) ≤ (1 − λ) h (x) + λh (y)

et h ((1 − λ) x + λy) ≤ (1 − λ) h (x) + λh (y) .


228 Fonctions convexes

Définition 8.2. On dit qu’une fonction f définie sur I et à valeurs stric-


tement positives est logarithmiquement convexe (ou plus simplement log-
convexe) si la fonction ln (f ) est convexe sur I.

Théorème 8.4.
Une fonction log-convexe est convexe.

Preuve. Si f est log-convexe, la fonction f = eln(f ) est alors convexe comme


composée d’une fonction convexe avec une fonction convexe croissante. 
La réciproque du théorème précédant est fausse comme le montre l’exemple de
la fonction x → x qui est convexe alors que la fonction ln ne l’est pas (on verra
plus loin qu’elle est concave).
S’il est facile de vérifier que le produit de deux fonctions log-convexes est log-
convexe, le résultat analogue pour la somme n’est pas si simple à montrer. Il est
conséquence du résultat suivant qui donne des définitions équivalentes de la notion
de fonction log-convexe.
Théorème 8.5.

Pour f : I → R+,∗ , les assertions suivantes sont équivalentes :


1. f est logarithmiquement convexe ;
2. pour tout réel α > 0 la fonction x → αx f (x) est convexe ;
3. pour tous réels x, y dans I et tout réel λ ∈ [0, 1] , on a
1−λ λ
f ((1 − λ) x + λy) ≤ (f (x)) (f (y)) ;
4. pour tout réel α > 0, la fonction f α est convexe.

Preuve. (1) ⇒ (2) Si f est logarithmiquement convexe, pour tout réel α > 0 la
fonction x → ln (αx f (x)) = x ln (α) + ln (f (x)) est alors convexe comme somme
de deux fonctions convexes, ce qui signifie que x → αx f (x) est logarithmiquement
convexe, donc convexe.
(2) ⇒ (3) Soit f : I → R+,∗ telle que, pour tout réel α > 0, la fonction
x → αx f (x) soit convexe. Pour x < y fixés dans I et λ fixé dans ]0, 1[ , on a :

α(1−λ)x+λy f ((1 − λ) x + λy) ≤ (1 − λ) αx f (x) + λαy f (y)

ou encore :

f ((1 − λ) x + λy) ≤ ϕ (α) = (1 − λ) α−λ(y−x) f (x) + λα(1−λ)(y−x) f (y)

donc f ((1 − λ) x + λy) ≤ inf ϕ (α) , cette borne inférieure étant atteinte pour
α>0
α > 0 tel que ϕ (α) = λ (1 − λ) (y − x) α−λ(y−x)−1 (αy−x f (y) − f (x)) = 0, ce qui
Fonctions convexes 229

f (x)
équivaut à αy−x = . On a donc :
f (y)
 −λ  1−λ
f (x) f (x)
f ((1 − λ) x + λy) ≤ (1 − λ) f (x) + λ f (y)
f (y) f (y)
1−λ λ
≤ (f (x)) (f (y))

(3) ⇒ (1) Résulte de la croissance de la fonction ln sur R+,∗ .


(1) ⇒ (4) Pour f logarithmiquement convexe et α > 0, la fonction f α = eα ln(f )
est convexe comme la composée exp ◦ (α ln (f )) de la fonction exp qui est convexe
croissante et de la fonction α ln (f ) qui est convexe.
(4) ⇒ (3) Supposons que f α soit convexe pour tout α > 0, ce qui signifie que
pour tous x < y dans I et tous λ dans ]0, 1[ , on a :

f α ((1 − λ) x + λy) ≤ (1 − λ) f α (x) + λf α (y)

ce qui équivaut à :

α ln (f ((1 − λ) x + λy)) ≤ ϕ (α) = ln ((1 − λ) f α (x) + λf α (y))

(f α (x) et f α (y) sont dans R+,∗ , donc aussi (1 − λ) f α (x) + λf α (y)), la fonction
ϕ (à λ, x, y fixés) étant de classe C ∞ sur R+,∗ avec lim+ ϕ (α) = ln (1) = 0, elle se
α→0
prolonge donc par continuité en 0. De plus, on a :

(1 − λ) ln (f (x)) f α (x) + λ ln (f (y)) f α (y)


lim ϕ (α) = lim
α→0+ α→0+ (1 − λ) f α (x) + λf α (y)
(1 − λ) ln (f (x)) + λ ln (f (y))
= = ln f 1−λ (x) f λ (y)
(1 − λ) + λ
ce qui signifie que ϕ est dérivable en 0. On en déduit alors que :

ϕ (α)
ln (f ((1 − λ) x + λy)) ≤ lim = ϕ (0) = ln f 1−λ (x) f λ (y)
α→0+ α
1−λ λ
soit f ((1 − λ) x + λy) ≤ (f (x)) (f (y)) . 

Corollaire 8.1. La somme de deux fonctions log-convexes de I dans R+,∗


est une fonction log-convexe.

Preuve. Si f, g sont log-convexes, les fonctions f αx et gαx sont alors convexes


pour tout réel α > 0, ce qui entraîne la convexité de la somme (f + g) αx et la
log-convexité de f + g. 
Dans le cas des fonctions continues le théorème qui suit nous donne une carac-
térisation des fonctions convexes. Ce résultat est une conséquence de l’existence
des développements dyadiques des réels. On rappelle que pour tout réel x, la suites
[2n x] 1
(rn )n∈N définie par rn = n pour tout n ∈ N est telle que 0 ≤ x − rn < n pour
2 2
tout n ∈ N, ce qui entraîne la convergence de cette suite vers x (voir le paragraphe
4.3, en remplaçant la base 10 par la base 2).
230 Fonctions convexes

Théorème 8.6.
Une fonction continue f : I → R est convexe si, et seulement si :
 
2 x+y f (x) + f (y)
∀ (x, y) ∈ I , f ≤ (8.1)
2 2

Preuve. La condition nécessaire est une conséquence immédiate de la convexité


(que f soit continue ou non). Pour la réciproque on montre tout d’abord par
récurrence sur n ∈ N, en supposant (8.1) vérifié, que pour tous réels x, y dans I et
k
tout nombre rationnel de la forme λn,k = n où k est un entier compris entre 0 et
2
2n on a f ((1 − λn,k ) x + λn,k y) ≤ (1 − λn,k ) f (x)+λn,k f (y) . Pour n = 0 les seules
valeurs possibles de λn,k sont λ0,0 = 0 et λ0,1 = 1 et les inégalités précédentes sont
de simples égalités. En supposant le résultat acquis au rang n ≥ 0, soient x, y dans
k
I et λn+1,k un nombre rationnel de la forme n+1 où k est un entier compris entre
2
p
0 et 2n+1 . Si k est pair alors λn+1 , k = n avec 0 ≤ p ≤ 2n et l’inégalité est vérifiée
2
par hypothèse de récurrence. Si k est impair
 alors k= 2p + 1 avec 0 ≤ p ≤ 2n − 1.
2p + 1 1 p p+1
En écrivant que λn+1,k = n+1 = n
+ n , on a :
2 2 2 2

z = (1 − λn+1,k ) x + λn+1,k y
1
= (((1 − λn,p ) x + λn,p y) + ((1 − λn,p+1 ) x + λn,p+1 y))
2
1
et f (z) ≤ (f ((1 − λn,p ) x + λn,p y) + f ((1 − λn,p+1 ) x + λn,p+1 y)) , puis, avec
2
l’hypothèse de récurrence on obtient :
1
f (z) ≤ ((1 − λn,p ) f (x) + λn,p f (y) + (1 − λn,p+1 ) f (x) + λn,p+1 f (y))
2
≤ (1 − λn+1,k ) f (x) + λn+1,k f (y) .

[2n λ]
Si λ est un réel compris entre 0 et 1, on a λ = lim λn , où λn = avec
n→+∞ 2n
0 ≤ [2n λ] ≤ 2n et avec la continuité de f on déduit de ce qui précède que :

f ((1 − λ) x + λy) = lim f ((1 − λn ) x + λn y)


n→+∞

≤ lim ((1 − λn ) f (x) + λn f (y)) ≤ (1 − λ) f (x) + λf (y)


n→+∞

ce qui prouve la convexité de f. 


Régularité des fonctions convexes 231

8.2 Régularité des fonctions convexes


Théorème 8.7.

Si f est convexe sur I, sa restriction à tout intervalle [a, b] ⊂ I est alors

lipschitzienne. En conséquence, f est continue sur I.


Preuve. On se donne, une fonction f convexe sur I, un intervalle [a, b] ⊂ I et un
y−x
réel ε > 0 tel que [a − ε, b + ε] ⊂ I. Pour x = y dans [a, b] , on note z = y + ε
|y − x|
(z = y ± ε, où ± est le signe y − x).
Pour x < y, on a z = y +ε et y ∈ ]x, z[ et pour x > y, on a z = y −ε et y ∈ ]z, x[ ,
donc dans tous les cas, on peut écrire que y = (1 − λ) x + λz avec λ ∈ ]0, 1[ est
donné par :

y−x y−x (y − x) |y − x| |y − x|
λ= = = =
z−x y−x
y + |y−x| ε−x |y − x| (y − x) + (y − x) ε |y − x| + ε

On a donc f (y) = f ((1 − λ) x + λz) ≤ (1 − λ) f (x) + λf (z) , soit :

|y − x|
f (y) − f (x) ≤ λ (f (z) − f (x)) = (f (z) − f (x))
|y − x| + ε
(f (z) − f (x))
≤ |y − x|
ε
Comme la fonction convexe f est bornée sur [a − ε, b + ε] , il existe des constantes
m ≤ M telles que m ≤ f (t) ≤ M pour tout t ∈ [a − ε, b + ε] , ce qui nous donne
M −m
f (y) − f (x) ≤ |y − x| pour tous réels x = y dans [a, b] , ce qui équivaut
ε
M −m
à |f (y) − f (x)| ≤ |y − x| (pour f (x) > f (y) , on applique l’inégalité
ε

précédente au couple (y, x)). La fonction f est donc lipschitzienne sur tout [a, b] ⊂ I
et en conséquence elle est uniformément continue sur ces intervalles. Il en résulte

que f est continue sur I. 
Une fonction convexe sur I n’est pas nécessairement continue sur tout l’inter-
valle I comme le montre l’exemple de la fonction f définie sur [0, 1] par f (x) = 0
si 0 < x < 1 et f (0) = f (1) = 1.
Théorème 8.8.

Si f est continue sur I et convexe sur I, elle est alors convexe sur I.

1
Preuve. Pour x < y dans I il existe un entier n0 ≥ 1 tel que xn = x + et
n
1 ◦
yn = y − soient dans I pour tout n ≥ n0 avec xn < yn . On a alors avec la
n
232 Fonctions convexes


convexité de f sur I et la continuité sur I, pour tout réel λ ∈ [0, 1] :

f ((1 − λ) x + λy) = lim f ((1 − λ) xn + λyn )


n→+∞

≤ lim ((1 − λ) f (xn ) + λf (yn )) ≤ (1 − λ) f (x) + λf (y)


n→+∞


f (y) − f (x)
Pour x = y dans I, on note p (x, y) = la pente de la droite (M N )
y−x
où M (x, f (x)) et N (y, f (y)) . Comme x et y jouent des rôles symétriques, on a
p (x, y) = p (y, x) .

y z
x

Figure 8.1 – Inégalité des trois pentes

Théorème 8.9.
Pour f : I → R les propriétés suivantes sont équivalentes :
1. f est convexe ;
2. pour tous x < y < z dans I, on a p (x, y) ≤ p (x, z) ≤ p (y, z) (inégalité
des trois pentes, figure 8.1) ;
f (x) − f (a)
3. pour tout a ∈ I la fonction τa : x → est croissante sur
x−a
I \ {a} .

Preuve. Tout est basé sur le fait que tout point y ∈ ]x, z[ s’écrit y = (1 − λ) x+λz
y−x z−y
avec λ = et 1 − λ = dans ]0, 1[ .
z−x z−x
(1) ⇒ (2) Si f est convexe, on a alors pour y = (1 − λ) x + λz ∈ ]x, z[ :

f (y) ≤ (1 − λ) f (x) + λf (z)


Régularité des fonctions convexes 233

y−x
soit f (y) − f (x) ≤ λ (f (z) − f (x)) = (f (z) − f (x)) et en conséquence,
z−x
z−y
f (y) − f (z) ≤ (1 − λ) (f (x) − f (z)) = (f (x) − f (z)) , ce qui nous donne :
z−x
f (y) − f (x) f (z) − f (x)
p (x, y) = ≤ = p (x, z)
y−x z−x
f (y) − f (z) f (x) − f (z)
et −p (y, z) = ≤ −p (x, z) = , soit p (x, z) ≤ p (y, z) .
z−y z−x
(2) ⇒ (3) Pour x < y < a, on a τa (x) = p (x, a) ≤ p (y, a) = τa (y) , pour
x < a < y, on a τa (x) = p (x, a) ≤ p (a, y) = τa (y) et pour a < x < y, on a
τa (x) = p (a, x) ≤ p (a, y) = τa (y) . Ou alors, on peut remarquer que la fonction :
τa (y) − τa (x) p (a, y) − p (a, x)
(a, x, y) → =
y−x y−x
est invariante par permutation de (a, x, y) et positive pour x < y < a.
(3) ⇒ (1) Pour x = y, l’inégalité de convexité est une égalité trivialement
vérifiée. On se donne donc x < y dans I, λ dans ]0, 1[ et t = (1 − λ) x + λy dans
]x, y[ . Avec la croissance de τy sur I − {y} on a :
f (x) − f (y) f (t) − f (y)
τy (x) = ≤ τy (t) =
x−y t−y
f (x) − f (y)
ce qui s’écrit (t − y) + f (y) ≥ f (t) , ou encore :
x−y
y−t t−x
f (t) ≤ f (x) + f (y) = (1 − λ) f (x) + λf (y)
y−x y−x
et traduit la convexité de f. 
De ce théorème, on déduit que la fonction f est concave si, et seulement si,
pour tout a ∈ I la fonction τa est décroissante sur I \ {a} , ce qui se déduit
immédiatement de τ−f,a = −τf,a .
On démontre de manière analogue que la fonction f est strictement convexe
[resp. strictement concave] si, et seulement si, pour tout a ∈ I la fonction τa est
strictement croissante [resp. strictement décroissante] sur I − {a} .
C’est principalement la propriété (3) qui va nous permettre de déduire quelques
propriétés importantes de régularité des fonctions convexes.
Théorème 8.10.
Une fonction f de R dans R est affine si, et seulement si, elle est à la
fois convexe et concave.

Preuve. Il est clair qu’une fonction affine est convexe et concave. Si f est convexe
et concave, la fonction τ0 est alors constante sur R∗ puisque croissante et décrois-
sante. On a donc τ0 (x) = τ0 (1) pour tout x ∈ R∗ , ce qui équivaut à f (x) = ax + b
pour tout x ∈ R∗ avec a = τ0 (1) = f (1) − f (0) et b = f (0) . Cette égalité étant
encore vérifiée pour x = 0, la fonction f est affine. 
De la propriété (3) on peut aussi déduire le résultat suivant.
234 Fonctions convexes

Théorème 8.11.
Une fonction f de R dans R est constante si, et seulement si, elle est
convexe et majorée.

Preuve. Soit f : R → R convexe et majorée. Si f n’est pas constante il existe


a < b tels que f (a) = f (b) . Supposons que f (a) < f (b) . Avec la croissance de τb
on a :
f (x) − f (b) f (b) − f (a)
∀x > b, τb (x) = ≥ τb (a) =
x−b b−a
soit f (x) ≥ λx + μ pour tout x > b avec λ = τb (a) > 0, ce qui entraîne que
lim f (x) = +∞ en contradiction avec f majorée. Le cas où f (a) > f (b) se
x→+∞
traite de manière analogue en considérant la limite en −∞. 
Le résultat précédent n’est pas valable pour une fonction convexe majorée sur
un intervalle réel distinct de R. Par exemple la fonction f définie sur R+ par
1
f (x) = est convexe et majorée par 1 sans être constante.
1+x
Dans le cas des fonctions convexes, le théorème 7.15 donnant une condition
nécessaire d’extremum admet une réciproque.
Théorème 8.12.
Si la fonction f convexe sur I est dérivable en un point α intérieur à I
et si f  (α) = 0, elle admet alors un minimum global en α.

Preuve. Avec la croissance de τα sur I \ {α} , on a :



∀x ∈ ]−∞, α[ ∩ I, τα (x) ≤ fg (α) = f  (α) = 0 ⇒ (f (x) ≥ f (α))
(∀x ∈ ]α, +∞[ ∩ I, τα (x) ≥ fd (α) = f  (α) = 0) ⇒ (f (x) ≥ f (α))

La fonction f admet donc un minimum global en α. 


Si f est strictement convexe, la fonction τα est alors strictement croissante et
la condition f  (α) = 0 est une condition suffisante de minimum global strict.
Sans hypothèse de dérivabilité on a le résultat suivant.
Théorème 8.13.
Si la fonction f convexe sur I admet un minimum local en un point α de
I, ce minimum est alors global.

Preuve. Supposons le minimum non global. Il existe alors un point x0 différent


de α dans I tel que f (x0 ) < f (α) . Supposons que x0 < α. Avec la convexité de f
on a pour tout x = (1 − λ) x0 + λα dans [x0 , α[ (λ ∈ [0, 1[) :

f (x) ≤ (1 − λ) f (x0 ) + λf (α) < (1 − λ) f (α) + λf (α) = f (α)

ce qui contredit le caractère minimum local de α. On procède de même si x0 > α.



La croissance des fonctions τa va nous permettre de montrer qu’une fonction
convexe sur I est dérivable à droite et à gauche en tout point a intérieur à I, elle
Régularité des fonctions convexes 235


est donc continue sur I et dans le cas où f est dérivable sur I on disposera d’une
critère simple de convexité qui est la croissance de f  , simplement traduite par la
condition f  ≥ 0 dans le cas où f est deux fois dérivable.
Théorème 8.14.
Si f est convexe sur I, elle admet alors une dérivée à droite et à gauche

en tout point de l’intérieur I de I, les fonctions dérivées à droite et à gauche
◦ ◦
sont croissantes sur I et pour a < b dans I on a :

f (b) − f (a)
fg (a) ≤ fd (a) ≤ ≤ fg (b) ≤ fd (b)
b−a


Preuve. Pour c ∈ I et a, b dans I tels que a < c < b, avec la croissance de τc
sur I \ {c} , on a τc (a) ≤ τc (x) ≤ τc (b) pour tout x ∈ [a, b] − {c} , ce qui entraîne
l’existence de :

fg (c) = x→c


lim τc (x) = sup τc (x) ≤ fd (c) = x→c
lim τc (x) = inf τc (x)
a≤cx<c c<x≤b
x<c x>


Pour a < b dans I, on a :

fd (a) = inf τa (x) ≤ τa (b) = τb (a) ≤ sup τb (x) = fg (b)
x∈]a,+∞[∩I x∈]−∞,b[∩I


Une fonction convexe n’est pas nécessairement dérivable en tout point comme
le montre l’exemple de la fonction valeur absolue sur [−1, 1] .
Avec théorème précédent, on peut retrouver le théorème 8.7.

Corollaire 8.2. Une fonction convexe sur I est continue sur I.

Preuve. Résulte du fait qu’une fonction dérivable à droite et à gauche en un



point de I est continue en ce point.
On peut aussi montrer directement ce résultat à partir de la croissance des
◦ ◦
fonctions τc pour c ∈ I. En effet pour c ∈ I, a < c < b et c < x < b dans I, on a
τc (a) ≤ τc (x) ≤ τc (b) ce qui se traduit par :

τc (a) (x − c) ≤ f (x) − f (c) ≤ τc (b) (x − c)

qui par passage à la limite quand x tend vers c donne lim (f (x) − f (c)) = 0, ce
x→c+
qui traduit la continuité à droite en c. La continuité à gauche se montre de manière
analogue. 
Sur un intervalle ouvert on a la caractérisation suivante des fonctions convexes.
236 Fonctions convexes

Théorème 8.15.
Soit I un intervalle réel ouvert non vide et f : I → R. La fonction f est
convexe sur I si, et seulement si, elle est continue et dérivable à droite sur
I de dérivée droite fd croissante.

Preuve. On sait déjà que f convexe est continue et dérivable à droite sur I de
dérivée droite fd croissante. Réciproquement, supposons f continue et dérivable
à droite sur I de dérivée droite fd croissante. Pour x < y dans I et λ ∈ [0, 1] la
fonction ϕ : t → f ((1 − λ) t + λy) − (1 − λ) f (t) − λf (y) est continue sur [x, y]
et admet une dérivée à droite ϕd : t → (1 − λ) (fd ((1 − λ) t + λy) − fd (t)) ≥ 0
((1 − λ) t + λy ∈ [t, y]), elle est donc croissante (théorème 7.12), ce qui donne
ϕ (x) ≤ ϕ (y) = 0, c’est-à-dire l’inégalité de convexité. 
Dans le cas où f est dérivable, on dispose du critère de convexité suivant qui
est le plus fréquemment utilisé.
Théorème 8.16.
Soit f une fonction dérivable sur I. Les propriétés suivantes sont équi-
valentes :
1. f est convexe sur I ;
2. la fonction dérivée f  est croissante sur I ;
3. la courbe représentative de f est située au dessus de sa tangente en tout
point de I.

Preuve. (1) ⇒ (2) Si f est convexe et dérivable, pour x < y dans I il existe u, v

dans I tels que x < u < v < y et avec la croissance de τu et τv on a :

f (x) − f (u) f (v) − f (u) f (y) − f (v)


τu (x) = ≤ τu (v) = = τv (u) ≤ τv (y) =
x−u v−u y−v

et faisant tendre respectivement u vers x et v vers y, on aboutit à f  (x) ≤ f  (y) ,


ce qui prouve la croissance de f  sur I (on sait déjà que f  = fg = fd est croissante

sur I).
(2) ⇒ (1) Si f  est croissante, pour x < y dans I et λ dans [0, 1] l’application ϕ
définie sur [x, y] par ϕ (t) = f ((1 − λ) t + λy) − (1 − λ) f (t) − λf (y) est dérivable
sur cet intervalle avec ϕ (t) = (1 − λ) (f  ((1 − λ) t + λy) − f  (t)) ≥ 0 (puisque
(1 − λ) t + λy ∈ [t, y] et f  est croissante). La fonction ϕ est donc croissante et
ϕ (x) ≤ ϕ (y) = 0 traduit l’inégalité de convexité.
(2) ⇒ (3) Si f  est croissante sur I alors pour tout a ∈ I l’application ϕ
définie sur I par ϕ (x) = f (x) − f (a) − f  (a) (x − a) est telle que (x − a) ϕ (x) =
(x − a) (f  (x) − f  (a)) ≥ 0 pour tout x ∈ I, on en déduit alors que ϕ admet un
minimum global en a (théorème 7.17) et on a ϕ (x) ≥ ϕ (a) = 0 pour tout x ∈ I,
ce qui signifie que le graphe de f est au dessus de la tangente en a.
(3) ⇒ (2) Pour x < y dans I on a f (x) ≥ f (y)+f  (y) (x − y) et f (y) ≥ f (x)+
f  (x) (y − x) , ce qui donne par addition, (f  (y) − f  (x)) (y − x) ≥ 0, équivalent
à la croissance de f  sur I. 
Régularité des fonctions convexes 237

Ce théorème se généralise au cas des fonctions définies sur un ouvert convexe


d’un espace vectoriel normé.
Théorème 8.17.
Soient I un ouvert convexe d’un espace vectoriel normé E et f une fonc-
tion différentiable de I dans R. Les propriétés suivantes sont équivalentes :
1. f est convexe sur I ;
2. pour tous x, y dans I on a (df (x) − df (y)) (x − y) ≥ 0 ;
3. pour tous x, y dans I on a f (x) ≥ f (y) + df (y) (x − y) .

Preuve. (1) ⇒ (2) Si f est convexe sur I alors pour x = y dans I (le cas x = y est
trivial) la fonction ϕ : λ → f ((1 − λ) x + λy) est convexe sur [0, 1] . Cette fonction
est dérivable sur [0, 1] de dérivée croissante donnée par :

ϕ (λ) = df ((1 − λ) x + λy) (y − x)

et l’inégalité ϕ (0) ≤ ϕ (1) se traduit par df (x) (x − y) ≤ df (y) (x − y) , soit


(df (x) − df (y)) (x − y) ≥ 0.
(2) ⇒ (3) Pour x = y dans I et λ < λ dans [0, 1] on a :

(df ((1 − λ) x + λy) − df ((1 − λ ) x + λ y)) ((λ − λ ) (x − y)) ≥ 0

soit
(df ((1 − λ) x + λy) − df ((1 − λ ) x + λ y)) (x − y) ≤ 0
ou encore ϕ (λ) ≤ ϕ (λ ) . La fonction ϕ est donc croissante sur [0, 1] , ce qui
entraîne, avec les notations qui précèdent, que ϕ (0) ≥ ϕ (1) − ϕ (1) équivalent à
f (x) ≥ f (y) + df (y) (x − y) .
(3) ⇒ (1) Toujours en gardant les mêmes notations, on a :

f ((1 − λ) x + λy) ≥ f ((1 − λ ) x + λ y) + df ((1 − λ ) x + λ y) ((λ − λ ) (x − y))

ce qui équivaut à ϕ (λ) ≥ ϕ (λ ) + ϕ (λ ) (λ − λ ) encore équivalent à la convexité


de ϕ. Il en résulte que f est convexe. 
Pour la stricte convexité on dispose d’un résultat analogue, à savoir.
Théorème 8.18.
Soit f une fonction dérivable sur I. Les propriétés suivantes sont équi-
valentes :
1. f est strictement convexe sur I ;
2. la fonction dérivée f  est strictement croissante sur I ;
3. la courbe représentative de f est située strictement au dessus de sa tan-
gente en tout point de I.

Pour les fonctions deux fois dérivables on dispose du critère de convexité qui
suit.
238 Fonctions convexes

Théorème 8.19.
Si f est deux fois dérivable sur I, elle est alors convexe [resp. concave]
sur I si, et seulement si, f  (x) ≥ 0 [resp. f  (x) ≤ 0] pour tout x ∈ I.

On peut donner une démonstration directe de l’implication f  à valeurs posi-


tives entraîne f convexe en utilisant le théorème de Rolle (théorème 9.12).
Pour f deux fois dérivable la stricte convexité ne se traduit pas par f  (x) > 0
pour tout x ∈ I mais par f  (x) ≥ 0 sur I et les zéros de f  sont isolés (i. e. il
n’existe pas d’intervalle ouvert dans I sur lequel f  est identiquement nulle).
Le théorème précédent permet de montrer la convexité ou concavité de certaines
fonctions usuelles.

Exemples 8.2
1. La fonction exponentielle est strictement convexe sur R.
2. La fonction logarithme est strictement concave sur R+,∗ .
3. Pour p > 1 la fonction x → xp est strictement convexe sur R+,∗ et pour
0 < p < 1 elle est strictement concave.
4. La fonction sin est strictement convexe sur [(2k + 1) π, (2k + 2) π] et stricte-
ment concave sur [2kπ, (2k + 1) π] pour tout k ∈ Z.
 +∞
5. La fonction Γ définie sur R+,∗ par Γ (x) = tx−1 e−t dtest convexe. En effet
0
avec la concavité du logarithme on déduit que :
2
∀ (u, v) ∈ R+,∗ , ∀λ ∈ [0, 1] , uλ v 1−λ ≤ λu + (1 − λ) v

et pour x, y strictement positifs, λ ∈ [0, 1] , on a :


 +∞
Γ (λx + (1 − λ) y) = tλx+(1−λ)y−1 e−t dt
0
 +∞
λ y−1 −t 1−λ
= tx−1 e−t t e dt
0
 +∞  +∞
≤λ tx−1 e−t dt + (1 − λ) ty−1 e−t dt
0 0
≤ λΓ (x) + (1 − λ) Γ (y)

On peut également montrer que cette fonction est log-convexe (lemme 13.11).
En fait la fonction Γ est l’unique fonction de classe C 1 sur R+,∗ , log-convexe et
solution de l’équation fonctionnelle f (x + 1) = xf (x) avec f (1) = 1 (théorème
13.9).

Du théorème de Darboux on déduit le résultat suivant.


Théorème 8.20.
Une fonction convexe et dérivable de I dans R est continûment dérivable.

Preuve. Voir le théorème 7.19. 


Inégalités de convexité 239

8.3 Inégalités de convexité


8.3.1 Quelques inégalités classiques
Avec la stricte convexité de la fonction exponentielle, on déduit que ex ≥ x + 1
pour tout réel x, l’égalité étant réalisée uniquement pour x = 0. Cette inégalité
traduit le fait que le graphe de la fonction est strictement au dessus de la tangente
a+b ea + e b
en 0 d’équation y = 1 + x. On peut également déduire l’inégalité e 2 ≤ ,
2
l’égalité étant réalisée si, et seulement si, a = b.
Avec la stricte concavité de la fonction logarithme on déduit que ln (x) ≤ x − 1
pour tout x ∈ R+,∗ , l’égalité étant uniquement réalisée pour x = 1. Cette inégalité
traduit le fait que le graphe de la fonction est strictement au dessous de la tangente
en 1, cette tangente ayant pour équation y = x − 1.
On en déduit également le résultat suivant qui peut être utilisé pour montrer
l’inégalité de Hölder (exercice 2.1).
1 1
Lemme 8.1 Si p, q sont deux réels strictement positifs tels que + = 1, on a
p q
alors :
2 1 1 1 1
∀ (u, v) ∈ R+,∗ , u p v q ≤ u + v
p q
Preuve. La concavité de la fonction ln sur R+,∗ nous dit que pour tout réel
λ ∈ [0, 1] et tous réels u, v strictement positifs on a :
ln (λu + (1 − λ) v) ≥ λ ln (u) + (1 − λ) ln (v) = ln uλ v 1−λ
puis avec la croissance de la fonction exp sur R+,∗ on en déduit que :
∀λ ∈ [0, 1] , ∀u ∈ R+,∗ , ∀v ∈ R+,∗ , uλ v 1−λ ≤ λu + (1 − λ) v
1
Cette inégalité est également vérifiée pour u = 0 ou v = 0. En prenant λ = dans
p
1 1 1 1 1
l’inégalité précédente, on a 1 − λ = et u p v q ≤ u + v. 
q p q
√ 1
Cette inégalité généralise l’inégalité classique uv ≤ (u + v) conséquence de
√ √ 2 2
( u − v) ≥ 0.
Cette inégalité de convexité peut également s’écrire :
2 1 1
∀ (a, b) ∈ R+,∗ , ab ≤ ap + bq
p q
9 π8
Avec la stricte concavité de la fonction sin sur 0, on déduit que :
2
8 π9 2
∀x ∈ 0, , x < sin (x) < x
2 π
L’inégalité de gauche (inégalité de Jordan) traduit le fait que le graphe de la
fonction est strictement au dessus de la corde définie par les points A (0, 0) et
#π $ 2
B , 1 , cette corde ayant pour équation y = x et l’inégalité de droite traduit
2 π
le fait que le graphe de la fonction est strictement sous la tangente en 0, cette
tangente ayant pour équation y = x.
240 Fonctions convexes

8.3.2 Les inégalités de Jensen

Définition 8.3. Soit (xi )1≤i≤p une suite de points d’un espace vectoriel
E. On dit que x ∈ E est combinaison linéaire convexe des xi s’il existe des

p 
p
réels positifs ou nuls λ1 , · · · , λp tels que λi = 1 et x = λi x i .
i=1 i=1

Théorème 8.21.
Toute partie convexe d’un espace vectoriel E est stable par combinaison
linéaire convexe.

Preuve. Soit I un convexe dans E. On montre par récurrence sur p ≥ 1 que


toute combinaison linéaire convexe de p éléments de I est dans I. Pour p = 1,
le résultat est clair et pour p = 2, c’est la définition d’un convexe. Supposons le
résultat acquis pour p ≥ 2 et soient x1 , · · · , xp+1 dans l’ensemble I, λ1 , · · · , λp+1

p+1  p
dans R+ tels que λi = 1. On note λ = λi .
i=1 i=1
Si λ = 0, alors tous les λi , pour 1 ≤ i ≤ p, sont nuls et λp+1 = 1, de sorte que

p+1
λi xi = xp+1 est dans I. Si λ = 0, en utilisant l’hypothèse de récurrence, on a
i=1

p
λi 
p+1
x = xi ∈ I et λi xi = λx + λp+1 xp+1 ∈ I puisque λ ≥ 0, λp+1 ≥ 0 et
i=1
λ i=1
λ + λp+1 = 1. 
De la définition d’une fonction convexe on déduit par récurrence le résultat
suivant.
Théorème 8.22. Jensen
Soient I une partie convexe d’un espace vectoriel E et une fonction f :
I → R. La fonction f est convexe si, et seulementsi, pour  toute combinaison
p  p p
linéaire convexe λi xi de points de I, on a f λi x i ≤ λi f (xi ) .
i=1 i=1 i=1

Preuve. Il est clair que la condition est suffisante (prendre p = 2). Pour la
réciproque, on procède par récurrence sur p ≥ 1. Pour p = 1 le résultat est trivial
et pour p = 2 il s’agit de la définition d’une fonction convexe. Supposons le résultat
acquis pour p ≥ 2 et soient x1 , · · · , xp+1 dans I, λ1 , · · · , λp+1 dans R+ tels que

p+1 p
λi = 1. On note λ = λi .
i=1 i=1
Si λ = 0, tous les λi , pour 1 ≤ i ≤ p, sont alors nuls, λp+1 = 1 et l’inégalité est
p
λi p
λi
trivialement une égalité. Si λ = 0, en notant x = xi , on a = 1, x ∈ I
i=1
λ i=1
λ
Inégalités de convexité 241
p+1 

et f λi x i = f (λx + λp+1 xp+1 ) ≤ λf (x ) + λp+1 f (xp+1 ) puisque λ ≥ 0,
i=1
λp+1 ≥ 0 et λ + λp+1 = 1. Avec l’hypothèse de récurrence on déduit alors que :
p+1 
 
p
λi 
p+1
f λi x i ≤λ f (xi ) + λp+1 f (xp+1 ) = λi f (xi )
i=1 i=1
λ i=1


On est parfois amené à utiliser cette inégalité de convexité sous la forme sui-
vante.
Corollaire 8.3. Si f est une fonction convexe définie sur une partie
convexe d’un espace vectoriel E alors pour toute combinaison linéaire à
p
coefficients réels positifs non tous nuls λi xi d’éléments de I, on a en
 p  i=1
p
1 1
p
posant λ = λi , f λi x i ≤ λi f (xi ) .
i=1
λ i=1 λ i=1

En utilisant les sommes de Riemann on en déduit le résultat suivant qui est la


version « continue » de l’inégalité précédente.
Théorème 8.23. Jensen
Si f : R → R est une fonction convexe alors pour toute fonction u
continue sur un intervalle [a, b] (avec a < b), on a :
  b   b
1 1
f u (t) dt ≤ f ◦ u (t) dt
b−a a b−a a

Preuve. On remarque tout d’abord que f convexe sur R est continue, il en donc
de même de f ◦ u et cette fonction est bien intégrable sur [a, b] . Avec la convexité
de f, on peut écrire que pour tout entier n ≥ 1 on a :
 n    
1 1
n
b−a b−a
f u a+k ≤ f ◦u a+k
n n n n
k=1 k=1

qui par passage à la limite quand n tend vers l’infini donne, compte tenu de la
continuité de f et de la définition de l’intégrale d’une fonction continue sur [a, b]
comme limite des sommes de Riemann :
  b   b
1 1
f u (t) dt ≤ f ◦ u (t) dt
b−a a b−a a


242 Fonctions convexes

8.3.3 Comparaison des moyennes harmonique, géométrique


et arithmétique
Pour toute suite finie x = (xi )1≤i≤n de réels strictement positifs, on note res-
pectivement :
  n1
n (
n
1
n
H (x) = %n 1 , G (x) = xi et A (x) = xi
i=1
n i=1
i=1 xi

les moyennes harmonique,


  géométrique et arithmétique de x.
1 1 1
En notant y = , on a H (x) = et G (x) = .
xi 1≤i≤n A (y) G (y)
Avec la concavité de la fonction logarithme on obtient le résultat suivant.
Théorème 8.24.
Avec les notations qui précèdent, on a H (x) ≤ G (x) ≤ A (x) .

Preuve. La concavité de la fonction ln nous permet d’écrire :


 n 
1 1
n
ln (G (x)) = ln (xi ) ≤ ln xi = ln (A (x))
n i=1 n i=1

ce qui équivaut, du fait de la croissance de la fonction exp, à G (x) ≤ A (x) . On


1 1
en déduit que H (x) = ≤ = G (x) ≤ A (x) . 
A (y) G (y)
√ x1 + x 2
Pour n = 2 on retrouve l’inégalité x1 x2 ≤ , conséquence de la positi-
2
√ √ 2
vité de x1 − x2 .
De manière plus générale, on peut définir, pour toute suite finie x = (xi )1≤i≤n
de réels strictement positifs, toute suite λ = (λi )1≤i≤n de réels strictement positifs
n
telle que λi = 1 et tout réel non nul α, la moyenne pondérée d’ordre α par :
i=1

  a1

n
M (α, x, λ) = λi x α
i
i=1

(les xi sont pondérés


 par les λi ).
 1
En notant x = , on a pour α non nul :
xi 1≤i≤n
 − a1

n
1 1
M (−α, x, λ) = λi x−α = = (8.2)
i
%
n # $α  a1 M (α, x , λ)
i=1 1
λi xi
i=1
Inégalités de convexité 243

Dans le cas où les xi sont tous égaux à un même réel ξ > 0, on a :


  a1   a1

n 
n
M (α, x, λ) = λi ξ α =ξ λi =ξ
i=1 i=1


n
puisque λi = 1.
i=1
1
Dans le cas où les λi sont tous égaux, on a nécessairement λi = pour tout i
 n  a1 n
1 α
et M (α, x, λ) = x .
n i=1 i
Pour α = 1 (et les λi sont tous égaux), on reconnaît la moyenne arithmétique
A (x) et pour α = −1, la moyenne harmonique H (x) .
La moyenne géométrique correspond au cas limite α = 0.

Lemme 8.2 Avec les notations qui précèdent, la fonction α → M (α, x, λ) , pour
(
n
x et λ fixés, se prolonge en une fonction continue sur R avec M (0, x, λ) = xλi i .
i=1
  
1 %n
Preuve. En écrivant que M (α, x, λ) = exp ln λi x α
i , on voit que la
α i=1
fonction α → M (α, x, λ) est continue sur R∗ et pour montrer qu’elle  se prolonge 
1 n
par continuité en 0, il suffit de montrer que la fonction ϕ : α → ln λi x α
i
α i=1
admet une limite en 0, ce qui peut se faire en utilisant les développements limités.
α ln(xi )
Pour tout i, on a xαi =e = 1 + α ln (xi ) + o (α) et :

n 
n 
n
λi x α
i = λi + α λi ln (xi ) + o (α)
i=1 i=1 i=1
 

n (
n
=1+α λi ln (xi ) + o (α) = 1 + α ln xλi i + o (α)
i=1 i=1
   

n (
n
ce qui donne ln λi x α
i = α ln xλi i + o (α) et enfin :
i=1 i=1
   
(
n (
n
ϕ (α) = ln xλi i + o (1) → ln xλi i
α→0
i=1 i=1

(
n
Il en résulte que lim M (α, x, λ) = lim exp (ϕ (α)) = xλi i . 
α→0 α→0
i=1
On vérifie facilement que la relation (8.2) est encore valable pour α = 0. En
(n
1 1
effet, dans ce cas, on a M (0, x, λ) = xλi i = n # $λi = .
2 1 M (0, x , λ)
i=1
xi
i=1
244 Fonctions convexes

  n1
(
n
Dans le cas où les λi sont tous égaux, on a M (0, x, λ) = xi = G (x) .
i=1

Lemme 8.3 Pour x et λ fixés, on a :


lim M (α, x, λ) = min xi et lim M (α, x, λ) = max xi
α→−∞ 1≤i≤n α→+∞ 1≤i≤n
1
Preuve. Pour α est strictement positif, les fonctions t → tα et t → t α sont
strictement croissantes sur R+,∗ et pour i compris entre 1 et n on a, en notant
n 
n
μ = max xi , λi x α
i ≤ λi μα = μα et M (α, x, λ) ≤ μ. D’autre part, il existe
1≤i≤n
i=1 i=1

n

i ≥ λk x k
λi x α α
un entier k compris entre 1 et n tel que μ = xk , de sorte que
i=1
1 1
et λkα xk ≤ M (α, x, λ) . On a donc pour tout α > 0, λkα μ ≤ M (α,x, λ) ≤ μ
1 ln (λk )
(k ne dépendant que de x) et avec lim λkα = lim exp = 1, on
α→+∞ α→+∞ α
1
déduit que lim M (α, x, λ) = max xi . Avec M (α, x, λ) = , où
  α→+∞ 1≤i≤n M (−α, x , λ)
1
x = , on déduit que :
xi 1≤i≤n
1 1
lim M (α, x, λ) =  
= # $ = min xi
α→−∞ lim M (α , x , λ) max x1i 1≤i≤n
α →∞
1≤i≤n


En utilisant la stricte concavité des fonctions ln et t → tγ pour 0 < γ < 1 (dans
ce cas la dérivée seconde est strictement négative) on obtient le résultat suivant.
Théorème 8.25.
En supposant les xi non tous égaux, la fonction α → M (α, x, λ) , pour x
et λ fixés, est strictement croissante.

Preuve. Il s’agit de montrer que α < β ⇒ M (α, x, λ) < M (β, x, λ) . Pour ce


faire, on distingue plusieurs cas.
Si 0 < α < β, en utilisant la croissance stricte de t → tα sur R+,∗ , on a les
équivalences :
⎛  a1  n  β1 ⎞
n 
(M (α, x, λ) < M (β, x, λ)) ⇔ ⎝ λi x α
i < λi xβi ⎠
i=1 i=1
⎛  n  αβ ⎞
n  β
⇔⎝ λi x α
i < λi (xα
i )
α ⎠
i=1 i=1
α
et la dernière inégalité est vérifiée du fait de la stricte concavité sur R+,∗ de t → t β
α
(on a 0 < < 1).
β
Exercices 245
 
 1
Si α < β < 0, en notant x = , on a :
xi 1≤i≤n

1 1
M (α, x, λ) = < = M (β, x, λ)
M (−α, x , λ) M (−β, x , λ)

Pour α = 0, β > 0, en utilisant la croissance stricte de t → ln (t) sur R+,∗ , on


a les équivalences :
⎛  n  β1 ⎞
(
n 
(M (0, x, λ) < M (β, x, λ)) ⇔ ⎝ xλi i < λi xβi ⎠
i=1 i=1
  n 

n
1  β
⇔ λi ln (xi ) < ln λi x i
i=1
β i=1
 n  n 
 # $ 
β β
⇔ λi ln xi < ln λi x i
i=1 i=1

et la dernière inégalité est vérifiée du fait de la stricte concavité sur R+,∗ de


t → ln (t) .
Enfin pour α < 0 et β = 0, on a, toujours avec les mêmes notations :
1 1
M (α, x, λ) = < M (α, x, λ) = = M (0, x, λ)
M (−α, x , λ) M (0, x , λ)


1
En prenant les λi tous égaux à , on retrouve l’encadrement :
n
M (−1, x, λ) = H (x) ≤ M (0, x, λ) = G (x) ≤ M (1, x, λ) = A (x)

l’une des égalités étant réalisée si, et seulement si, tous les xi sont égaux.

8.4 Exercices

Exercice 8.1. Soient I un intervalle réel d’intérieur non vide et f une


fonction de I dans R. Montrer que f est convexe si, et seulement si, pour
tous x < y < z dans I on a :

1 1 1
d (x, y, z) = x y z ≥0
f (x) f (y) f (z)
246 Fonctions convexes

Solution. Pour x < y < z dans I on a :

1 0 0
d (x, y, z) = x y−x z−x
f (x) f (y) − f (x) f (z) − f (x)
1 1
= (y − x) (z − x) f (y) − f (x) f (z) − f (x)
y−x z−x

soit en utilisant les notations du paragraphe 8.2 :

1 1
d (x, y, z) = (y − x) (z − x)
p (x, y) p (x, z)
= (y − x) (z − x) (p (x, z) − p (x, y))

Pour f est convexe, on a p (x, y) ≤ p (x, z) , ce qui équivaut à d (x, y, z) ≥ 0.


Réciproquement si d (x, y, z) ≥ 0 pour tous x < y < z dans I, on a alors
p (x, y) ≤ p (x, z) et (y − x) (f (z) − f (x)) − (z − x) (f (y) − f (x)) ≥ 0, ce qui
équivaut à (y − x) f (z) + (z − y) f (x) − (z − x) f (y) ≥ 0, qui est encore équi-
valent à (z − y) (f (x) − f (z)) + (z − x) (f (z) − f (y)) ≥ 0 (en écrivant y − x =
(y − z)+(z − x)) et divisant par (z − y) (z − x) on aboutit à −p (x, z)+p (y, z) ≥ 0.
On a donc p (x, y) ≤ p (x, z) ≤ p (y, z) pour tous x < y < z, ce qui équivaut à la
convexité de f.

Exercice 8.2. Montrer que si f, g sont deux fonctions convexes de R


dans R telles que la fonction f + g soit affine, les fonctions f et g sont
alors également affines.

Solution. On a f (x) + g (x) = h (x) = ax + b pour tout réel x. La fonction


convexe f = h − g est alors également concave comme somme de deux fonctions
concaves, elle est donc affine et aussi g = h − f.

Exercice 8.3. Soit f une fonctioncontinue


 de R+,∗ dans R et g la fonc-
1
tion définie sur R+,∗ par g (x) = xf . Montrer que f et g sont simul-
x
tanément convexes.

Solution. Pour 0 < x < y et 0 < λ < 1, on a :


 
1
g ((1 − λ) x + λy) = ((1 − λ) x + λy) f
(1 − λ) x + λy
 
1 1
= ((1 − λ) x + λy) f (1 − μ) + μ
x y
Exercices 247

1 1 1 x−y 1
où μ est défini par = (1 − μ) + μ = μ + , ce qui nous
(1 − λ) x + λy x y xy x
λy
donne μ = ∈ ]0, 1[ . Si f est convexe, on a alors :
(1 − λ) x + λy
      
λy 1 1 λy 1 1
g ((1 − λ) x + λy) = f (1 − μ) + μ ≤ (1 − μ) f + μf
μ x y μ x y
μ
ce qui donne, en écrivant que 1 − μ = (1 − λ) x :
λy
   
λy μ 1 λy 1
g ((1 − λ) x + λy) ≤ (1 − λ) x f + μf = (1 − λ) g (x) + λg (y)
μ λy x μ y
 
1
ce qui signifie que g convexe. En remarquant que f (x) = xg , on obtient la
x
réciproque.

Exercice 8.4. Soit f une fonction convexe de R+ dans R.


f (x)
1. Montrer que la fonction g : x → admet une limite finie ou égale à
x
+∞ quand x tend vers +∞.
f (x)
2. Montrer que si lim = α ∈ R, la fonction h : x → f (x) − αx
x→+∞ x
admet alors une limite finie ou égale à −∞ quand x tend vers +∞.

Solution.
f (x) − f (0)
1. Si f est convexe sur R+ , la fonction τ0 : x → est alors croissante de
x
f (0)
R+ dans R, elle admet donc une limite α ∈ R ∪ {+∞} et avec lim =0
x→+∞ x
f (x) f (x)
on déduit que lim = α. Pour f : x → x2 on a lim = +∞.
x→+∞ x x→+∞ x
2. On montre tout d’abord que la fonction h est décroissante de R+ dans R. Cette
fonction est convexe comme somme de deux fonctions convexes, donc pour tout
h (x) − h (a)
réel a ∈ R+ la fonction τa : x → est croissante sur R+ \ {a} et
x−a
avec :
   
f (x) − f (a) f (x)
lim τa (x) = lim − α = lim −α =0
x→+∞ x→+∞ x−a x→+∞ x

on déduit que τa (x) ≤ 0 pour tout x ∈ R+ \ {a} et en particulier pour x > a


on en déduit que h (x) ≤ h (a) . La fonction h est donc décroissante sur R+
et en conséquence elle admet une limite β ∈ R ∪ {−∞} . Par exemple pour
f (x)
f : x → − ln (1 + x) on a lim = 0 et lim (f (x) − αx) = −∞.
x→+∞ x x→+∞
248 Fonctions convexes

Exercice 8.5. Soit f : I → R une fonction convexe. Montrer que f est


bornée sur tout segment [a, b] ⊂ I.

Solution. C’est une conséquence du théorème 8.7. On peut aussi le démontrer


directement comme suit. Tout x ∈ [a, b] ⊂ I s’écrit x = (1 − λ) a + λb avec λ ∈
[0, 1] , donc par convexité, on a, f (x) ≤ (1 − λ) f (a)+λf (b)) ≤ max (f (a) , f (b)) .
a+b
En écrivant tout point x de [a, b] ⊂ I sous la forme x = + t, où t est dans
  2
b−a b−a
− , , on a :
2 2
      
a+b 1 a+b 1 a+b
f =f +t + −t
2 2 2 2 2
   
1 a+b 1 a+b
≤ f +t + f −t
2 2 2 2
soit :
       
a+b a+b a+b a+b
f (x) = f +t ≥ 2f −f −t ≥ 2f −M =m
2 2 2 2
donc la restriction de f à [a, b] est minorée.

Exercice 8.6. Montrer qu’une fonction f : R+,∗ → R convexe et T -


périodique (avec T > 0) est constante.

Solution. Soit f : R+,∗ → R convexe et T -périodique. De l’égalité f (x) =


f (x + T ) pour tout réel x > 0, on déduit que lim+ f (x) = lim+ f (x + T ) =
x→0 x→0
f (T ) (une fonction convexe sur un ouvert est continue), donc f se prolonge par
x
continuité en 0. Pour x ≥ 0, en désignant par n la partie entière de , on a
T
nT ≤ x < (n + 1) T ≤ x + T, donc f (x) ≤ max (f (nT ) , f ((n + 1) T )) = f (0) et
f (0) = f ((n + 1) T ) ≤ max (f (x) , f (x + T )) = f (x) , donc f (x) = f (0) .

Exercice 8.7. En utilisant la caractérisation (3) du théorème 8.9, re-


trouver le fait que si f est convexe sur I, sa restriction à tout intervalle
◦ ◦
[a, b] ⊂ I est alors lipschitzienne (et f est continue sur I).

Solution. On utilise la croissance de τx , pour tout x ∈ [a, b] . Soient [a, b] ⊂ I
et ε > 0 tel que [a − ε, b + ε] ⊂ I. Pour a ≤ x < y ≤ b on a τx (a − ε) ≤ τx (y) ≤
τx (b + ε) ce qui se traduit par τx (a − ε) (y − x) ≤ f (y)−f (x) ≤ τx (b + ε) (y − x)
avec τx (a − ε) = τa−ε (x) ≥ τa−ε (a) = m et τx (b + ε) = τb+ε (x) ≤ τb+ε (b) =
M. On a donc m (y − x) ≤ f (y) − f (x) ≤ M (y − x) , soit |f (y) − f (x)| ≤
max (|m| , |M |) |y − x| pour tous réels x, y dans [a, b] (pour f (y) ≥ f (x) , on a
|f (y) − f (x)| = f (y) − f (x) ≤ M (y − x) = |M | |y − x| et pour f (y) ≤ f (x) , on
a |f (y) − f (x)| = f (x) − f (y) ≤ m (x − y) = |m| |y − x|). La fonction f est donc

lipschitzienne sur tout [a, b] ⊂ I.
Exercices 249

Exercice 8.8. Soient q une fonction continue de R dans R+ non identi-


quement nulle et y une solution à valeurs réelles de l’équation différentielle
y  − qy = 0.
1. Montrer que si y est bornée, elle est alors identiquement nulle.
2. Montrer que si y s’annule en deux points distincts, elle est alors identi-
quement nulle.

Solution. Le théorème de Cauchy-Lipschitz linéaire nous dit que l’ensemble des


solution de l’équation différentielle y  −qy = 0 est un espace vectoriel de dimension
2. Pour q = 0, on a y (x) = ax+b et les fonctions constantes sont les seules solutions
bornées.
1. La fonction z = y 2 est deux fois dérivable telle que :
# $ # $
2 2
z  = 2 (y  ) + yy  = 2 (y  ) + qy 2 ≥ 0

Il en résulte que z est convexe sur R et cette fonction est bornée si y l’est, elle
est alors constante et avec la continuité de y, on déduit que la solution y est
également constante, ce qui entraîne que qy = y  = 0, soit y = 0 puisque q
n’est pas la fonction nulle.
2. On utilise encore la fonction z = y 2 . Si y (x1 ) = y (x2 ) avec x1 < x2 , on a alors
z (x1 ) = z (x2 ) et avec la convexité de la fonction z qui est à valeurs positives on
déduit que z est nulle sur l’intervalle [x1 , x2 ] . En effet, tout x ∈ [x1 , x2 ] s’écrit
x = (1 − λ) x1 + λx2 avec λ ∈ [0, 1] et on a :

0 ≤ f (x) ≤ (1 − λ) f (x1 ) + λf (x2 ) = 0

On a donc y (x) = 0 pour tout x ∈ [x1 , x2 ] . En particulier, pour x ∈ ]x1 , x2 [


on a y (x) = y  (x) = 0 et le théorème de Cauchy-Lipschitz nous dit alors que
y = 0.

Exercice 8.9.
1. Montrer que si f est une fonction convexe et continue sur [0, 1] , pour
tout entier naturel non nul n la fonction polynomiale Bn (f ) définie par
n   
k n k n−k
Bn (f ) (x) = f x (1 − x) est alors convexe sur [0, 1]
n k
k=0
((Bn (f ))n≥1 est la suite des polynômes de Bernstein).
2. En déduire que toute fonction convexe et continue sur un intervalle com-
pact est limite uniforme d’une suite de fonctions convexes de classe C ∞ .

Solution.
1. Pour n = 1, la fonction B1 (f ) estaffine donc convexe.
 
 1
Pour n = 2, on a B2 (f ) (x) = 2 f (0) − 2f + f (1) et pour f convexe
2
250 Fonctions convexes
 
1 1 
on a f ≤ (f (0) + f (1)) , ce qui donne B2 (f ) ≥ 0 et la convexité de
2 2
B2 (f ) . Pour n ≥ 3, on a :


  k + 2
n−2 
k+1
  
k
Bn (f ) = n (n − 1) f − 2f +f Bn−2,k
n n n
k=0

et pour f convexe on a :
        
k+1 1k+2 1k 1 k+2 k
f =f + ≤ f +f
n 2 n 2n 2 n n

ce qui donne Bn (f ) ≥ 0 et la convexité de Bn (f ) .
2. Résulte du théorème sur l’approximation uniforme d’une fonction continue sur
un intervalle compact par la suite des polynômes de Bernstein (exercice 2.8).

Exercice 8.10. Déterminer, parmi toutes les ellipses d’aire donnée S >
0, celles de périmètre minimal.

Solution. Il suffit de considérer les ellipses de représentation paramétrique :


γ : t ∈ [0, 2π] → (a cos (t) , b sin (t))
avec 0 < b ≤ a. Le périmètre d’une telle ellipse est :
 2π  2π &
L (a, b) = 
γ (t) dt = a2 sin2 (t) + b2 cos2 (t)dt
0 0
 π
2
&
=4 a2 sin2 (t) + b2 cos2 (t)dt
0
et l’aire est :
⎛  ⎞
   a  1− x
2
a2
S (a, b) = dxdx = 4b ⎝ dy ⎠ dx
x2 2
a2
+ yb2 =1 0 0
 5  1
a
x2
= 4b 1− dx = 4ab 1 − t2 dt
0 a2 0
 π
2
&  π
2
2
= 4ab 1 − sin (θ) cos (θ) dθ = 4ab cos2 (θ) dθ = πab
0 0
Il s’agit alors de trouver le minimum de la fonction L, pour √ 0 < b ≤ a tels
que πab = S. En utilisant la concavité de la fonction x → x, on a en notant
λ = sin2 (t) :
& √ √
a2 sin2 (t) + b2 cos2 (t) = λa2 + (1 − λ) b2 ≥ λ a2 + (1 − λ) b2
≥ λa + (1 − λ) b = a sin2 (t) + b cos2 (t)
 π
2 √ √
et L (a, b) ≥ 4 a sin2 (t) + b cos2 (t) dt = π (a + b) ≥ 2π ab = 2 πS. Pour
0 √
a = b et πab = πa2 = S, on a L (a, a) = 2aπ = 2 πS. Le minimum est donc
atteint pour le cercle de rayon a.
Chapitre 9

Théorèmes de Rolle et des


accroissements finis

9.1 Le théorème de Rolle


Dans la mesure où les raisonnements ne sont pas plus compliqués, on se place
dans le cadre plus général des espaces vectoriels normés, en précisant ce qu’il se
passe dans le cas des fonctions d’une variable réelle.
Pour ce paragraphe, on se donne un espace vectoriel normé (E, ·) que l’on
peut remplacer par (R, |·|) .
Le théorème de Rolle est basé sur les théorèmes 1.21 et 7.25 qui sont des pro-
blèmes d’extrema. On se reportera au paragraphe 7.9 pour la notion de différen-
tiabilité.
Théorème 9.1. Rolle
Soient K un compact de (E, ·) d’intérieur non vide, f une fonction
continue de K dans R différentiable sur l’intérieur de K et constante sur
◦ ◦
la frontière de K, Fr (K) = K \ K. Dans ces conditions, il existe c ∈ K tel
que df (c) = 0.

Preuve. Si f est constante, sa différentielle est alors nulle. On suppose donc


f non constante. La fonction f étant continue sur le compact K est bornée et
atteint ses bornes, c’est-à-dire qu’il existe a, b dans K tels que f (a) = inf f (x)
x∈K
et f (b) = sup f (x) . Si a, b sont dans Fr (K) , on a alors f (a) = f (b) et f est
x∈K
◦ ◦
constante contrairement à l’hypothèse de départ, on a donc a ∈ K ou b ∈ K, ce
qui entraîne df (a) = 0 ou df (b) = 0 (théorème 7.25). 
La version réelle de ce théorème est la suivante.
Théorème 9.2. Rolle
Si f est une fonction à valeurs réelles définie sur un intervalle compact
[a, b] non réduit à un point, continue sur cet intervalle et dérivable sur
252 Théorèmes de Rolle et des accroissements finis

l’intervalle ouvert ]a, b[ avec f (a) = f (b) , il existe alors un point c ∈ ]a, b[
tel que f  (c) = 0.


Le cas de la fonction x → 1 − x2 sur [−1, 1] donne un exemple de situation
où f n’est pas dérivable au bord.
Il n’y a pas unicité du point c tel que f  (c) = 0.
Le théorème n’est plus vrai si f n’est pas continue au bord comme le montre
l’exemple de la fonction f définie par f (x) = x sur ]0, 1] et f (0) = 1.
Le théorème n’est plus vrai si f n’est pas dérivable sur ]a, b[ tout entier comme
le montre l’exemple de la fonction x → |x| sur [−1, 1] .
Ce théorème est encore valable sur une demi-droite fermée. Précisément on a
le résultat suivant.
Théorème 9.3.
Si f est une fonction à valeurs réelles définie sur un intervalle fermé
[a, +∞[ , continue sur cet intervalle et dérivable sur l’intervalle ouvert
]a, +∞[ avec lim f (x) = f (a) , il existe alors un point c ∈ ]a, +∞[ tel
x→+∞
que f  (c) = 0.

Preuve. Le changement de variable t = e−x nous ramène à un intervalle compact.


On définit la fonction g sur [0, e−a ] par :

f (− ln (t)) si t ∈ ]0, e−a ]
g (t) =
f (a) si t = 0

Cette fonction est continue sur ]0, e−a ] comme composée de fonctions continues
et avec lim g (t) = lim f (x) = f (a) , on déduit qu’elle est continue en a. Elle
t→0 x→+∞
f  (− ln (t))
est dérivable sur ]0, e−a [ avec g  (t) = − . Enfin avec g (0) = g (e−a ) =
t
f (a) , on peut utiliser le théorème de Rolle pour dire qu’il existe d ∈ ]0, e−a [ tel
que g  (d) = 0 et c = − ln (d) ∈ ]a, +∞[ est tel que f  (c) = 0. 
On a également le résultat suivant.
Théorème 9.4.
Si f : R → R est dérivable avec lim f (x) = lim f (x) , il existe alors
x→−∞ x→+∞
un réel c tel que f  (c) = 0.

Preuve. Le changement de variable 9t = arctan (x) nous ramène à un intervalle


π π8
compact. On définit la fonction g sur − , par :
2 2
⎧ 8 π π9

⎨ f (tan (t)) si t ∈ − ,
2 2
g (t) =

⎩  = lim f (x) si t = ± π
x→±∞ 2
Le théorème de Rolle 253
8 π π9
Cette fonction est continue sur − , comme composée de fonctions continues
2 2
π
et avec limπ g (t) = lim f (x) = , on déduit qu’elle est continue en ± . Elle
t→± 2 x→±∞
8 π π9 2
est dérivable sur − , avec g  (t) = 1 + tan2 (t) f  (tan (t)) . Le théorème de
2 2 8 π π9
Rolle nous dit alors qu’il existe d ∈ − , tel que g  (d) = 0 et c = tan (d) est
2 2
tel que f  (c) = 0. 
La version itérée suivante du théorème de Rolle est souvent utile.
Théorème 9.5.
Si f est une fonction à valeurs réelles de classe C m sur un intervalle réel
I, où m est un entier naturel, qui s’annule en m + 1 points de I distincts,
il existe alors c dans I tel que f (m) (c) = 0.

Preuve. Pour m = 0, le résultat est évident. On suppose donc que m est non
nul. Si a, b sont deux racines distinctes de f, le théorème de Rolle nous dit alors
qu’entre ces deux racines il existe une racine de f  . On déduit donc que la fonction
f  admet m racines distinctes dans I. Une récurrence finie nous permet alors de
montrer que la dérivée d’ordre m, f (m) admet au moins une racine dans I. 
On peut donner une autre démonstration du théorème de Rolle basée sur un
principe de dichotomie. L’idée repose sur les trois lemmes suivants, où f est une
fonction à valeurs réelles définie sur un intervalle compact [a, b] non réduit à un
point, continue sur cet intervalle et telle que f (a) = f (b) .

b−a
Lemme 9.1 Il existe un segment [α, β] contenu dans [a, b] tel que β − α =
2
et f (α) = f (β) .
   
b−a b−a
Preuve. Soit g définie sur J = a, a + par g (x) = f x + −
2 2
f (x) . Si la fonction g ne s’annule jamais sur J, elle garde alors un signe constant
(théorème des valeurs  intermédiaires),
 supposons que g (x) > 0 pour tout x ∈ J.
b−a b−a
On a alors f (x) < f x + pour tout x ∈ J et x = a, x = a+ donnent
  2 2
a+b
f (a) < f < f (b) en contradiction avec f (a) = f (b) . Il existe donc γ ∈ J
2  
b−a
tel que g (γ) = 0 et l’intervalle [α, β] = γ, γ + convient. 
2

b−a
Lemme 9.2 Il existe un segment [α, β] contenu dans ]a, b[ tel que β − α ≤
2
et f (α) = f (β) .

Preuve. En reprenant
 les notations
 de la démonstration précédente, on distingue
b−a b−a
deux cas. Soit γ ∈ a, a + et dans ce cas [α, β] ⊂ ]a, b[ avec β − α = ,
2   2
a+b a+b
f (α) = f (β) . Soit γ = a ou γ = et on a f (a) = f = f (b) . Le
2 2
254 Théorèmes de Rolle et des accroissements finis
 
b−a
lemme précédent appliqué à la fonction f sur l’intervalle [α, β] = a, a +
    2
b−a b−a
nous donne un intervalle δ, δ + = [δ, ε] avec δ ∈ a, a + tel que
 4 4
b−a b−a
f (δ) = f (ε) . Si δ ∈ a, a + , alors [δ, ε] ⊂ ]a, b[ avec ε − δ = ,
4     4
b−a a+b
f (δ) = f (ε) . Sinon on a f (a) = f a + =f et on applique le
 4  2
b−a a+b
lemme précédent à l’intervalle a + , ⊂ ]a, b[ . 
4 2
Lemme 9.3 Il existe une suite ([an , bn ])n≥1 d’intervalles strictement emboîtés (i.
e. [an+1 , bn+1 ]  ]an , bn [) dans ]a, b[ telle que pour tout n ≥ 1 on ait :
bn − an
0 < bn+1 − an+1 ≤ , f (an ) = f (bn )
2
Preuve. On construit [a1 , b1 ] en utilisant le lemme 9.2. Puis supposant construit
[an , bn ] , on applique à nouveau le lemme 9.2 à la fonction f sur cet intervalle pour
construire [an+1 , bn+1 ] . 
Le théorème de Rolle s’en déduit alors de la manière  suivante.
Le théorème des segments emboîtés nous dit que [an , bn ] = {c} avec c dans
n≥1
]an , bn [ ⊂ ]a, b[ pour tout n ≥ 1. Si on suppose de plus que f est dérivable sur
l’ouvert ]a, b[ , on a alors nécessairement f  (c) = 0. En effet si f  (c) = 0, supposons
f (bn ) − f (c) f (c) − f (an )
f  (c) > 0, avec lim = lim = f  (c) , on déduit
n→+∞ bn − c n→+∞ c − an
que pour n assez grand on aura f (an ) < f (c) < f (bn ) en contradiction avec
f (an ) = f (bn ) .
Avec cette construction il n’y a pas, a priori, d’extremum local pour f en c.

9.2 Applications du théorème de Rolle


Le théorème de Rolle est important pour ses nombreuses applications.

9.2.1 Le théorème de Darboux


On peut donner une démonstration du théorème de Darboux (théorème 7.18)
qui utilise le théorème de Rolle.
Théorème 9.6. Darboux
Si f est une fonction à valeurs réelles définie et dérivable sur un intervalle
I, sa fonction dérivée f  vérifie alors la propriété des valeurs intermédiaires.

Preuve. Soient a < b dans I. Si f  (a) = f  (b) il n’y a alors rien à montrer.
On suppose donc que f  (a) < f  (b) et on se donne λ ∈ ]f  (a) , f  (b)[ . On définit
la fonction ϕ sur [a, b] par ϕ (x) = f (x) − λx. Cette fonction est dérivable sur
[a, b] avec ϕ (a) < 0 < ϕ (b) et en conséquence elle ne peut être monotone sur
Applications du théorème de Rolle 255

I. Le théorème 6.28 nous dit alors que ϕ n’est pas injective (elle est continue
puisque dérivable), c’est-à-dire qu’il existe x < y dans I tels que ϕ (x) = ϕ (y)
et le théorème de Rolle nous dit qu’il existe c ∈ ]x, y[ tel que ϕ (c) = 0, ce qui
équivaut à f  (c) = λ. 

9.2.2 Racines de polynômes réels


Théorème 9.7.
Si P est un polynôme réel de degré n ≥ 2 scindé sur R, il en est alors
de même de son polynôme dérivé. Précisément si λ1 < λ2 < · · · < λp
sont les racines réelles distinctes de P avec p ≥ 2, la racine λj étant de
p
multiplicité mj ≥ 1 ( mj = n), le polynôme dérivé P  admet alors les
j=1
réels λj pour racines de multiplicités respectives mj − 1, pour 1 ≤ j ≤ p
(une multiplicité nulle signifie que λj n’est pas racine de P  ) et des racines
simples μj ∈ ]λj , λj+1 [ pour 1 ≤ j ≤ p − 1.

Preuve. Pour j ∈ {1, · · · , p} tel que mj ≥ 2, λj est racine d’ordre mj − 1


p
du polynôme P  . Ce qui donne (mj − 1) = n − p racines réelles pour P  .
j=1
D’autre part, le théorème de Rolle nous dit que pour tout j dans {1, · · · , p − 1}
il existe μj ∈ ]λj , λj+1 [ tel que P  (μj ) = 0, ce qui donne p − 1 racines réelles
supplémentaires et distinctes pour P  . On a donc un total de n − 1 racines réelles
pour P  et les μj sont nécessairement simples. En particulier les racines de P  sont
réelles et contenues dans l’intervalle [λ1 , λp ] . 

9.2.3 Racines des polynômes de Legendre, de Laguerre et


d’Hermite
n (n)
Pour tout n ∈ N, on note π2n (x) = x2 − 1 et Ln = π2n les polynômes
de Legendre sur [−1, 1] . Pour n = 0, on a L0 = 1. Pour n ≥ 1 le polynôme
n  
n−k n
π2n (x) = (−1) x2k est de degré 2n, donc sa dérivée d’ordre n, Ln (x) =
k

k=0  
n−k n (2k)!
(−1) x2k−n est de degré n, de même parité que n.
n k (2k − n)!
2 ≤k≤n

Théorème 9.8.
Pour n ≥ 1, le polynôme Ln admet n racines réelles distinctes dans
l’intervalle ]−1, 1[ .

Preuve. Pour n = 1, L1 (x) = 2x s’annule en 0. Pour n ≥ 2, on vérifie par


(k)
récurrence sur k ∈ {0, · · · , n − 1} , que le polynôme π2n s’annule en −1, 1 et en k
points distincts de ]−1, 1[ .
256 Théorèmes de Rolle et des accroissements finis

Le polynôme π2n admettant −1 et 1 comme racines d’ordre n, le résultat est


vrai pour k = 0. Supposons le acquis pour k − 1 ∈ {0, · · · , n − 2} (n ≥ 2). La
(k−1)
fonction π2n est nulle en −1 < t1 < · · · < tk−1 < 1 et avec le théorème de Rolle
(k)
on déduit que sa dérivée π2n s’annule en k points distincts de ]−1, 1[ . D’autre part,
−1 et 1 étant racines d’ordre n de π2n , elles sont aussi racines d’ordre n − k > 0
(k) (n−1)
de π2n . En appliquant le théorème de Rolle à la fonction π2n qui est nulle en
(n)
n + 1 points distincts −1 < t1 < · · · < tn−1 < 1, on déduit que Ln = π2n s’annule
en n points distincts de ]−1, 1[ . 
Soit α > −1. Pour tout entier naturel n, on définit le polynôme Lα,n par
(n)
(xn+α e−x ) = Lα,n (x) xα e−x . Les polynômes Lα,n sont les polynômes de La-
guerre sur ]0, +∞[ . Il est facile de vérifier que Lα,n est un polynôme de degré n.
En effet, on a Lα,0 (x) = 1, Lα,1 (x) = 1 + α − x. Supposons, pour n ≥ 1, que Lα,n
est polynomiale de degré n pour tout réel α > −1. Avec :
(n+1)
# $(n)
(n)
xn+1+α e−x = (n + 1 + α) xn+α e−x − xn+(1+α) e−x
= (n + 1 + α) Lα,n (x) xα e−x − Lα+1,n (x) xα+1 e−x
= ((n + 1 + α) Lα,n (x) − xLα+1,n (x)) xα e−x
on déduit que Lα,n+1 (x) = (n + 1 + α) Lα,n (x) − xLα+1,n (x) est polynomiale de
degré n + 1.
Théorème 9.9.
Pour tout réel α > −1 et tout entier n ≥ 1, le polynôme Lα,n admet n
racines réelles distinctes dans ]0, +∞[ .

Preuve. Pour α > −1 et n = 1, on a Lα,1 (x) = 1 + α − x de degré 1 nul en


1 + α > 0. En supposant le résultat acquis au rang n pour tout α > −1, la fonction
(n)
fn définie sur [0, +∞[ par fn (x) = xn+α+1 e−x = Lα+1,n (x) xα+1 e−x est nulle
en 0, +∞ et en n points distincts de ]0, +∞[ , on déduit alors des théorèmes de
Rolle (classique sur un compact et généralisé sur [0, +∞[) que sa dérivée fn (x) =
Lα,n+1 (x) xα e−x s’annule en n + 1 points distincts de ]0, +∞[ . D’où le résultat au
rang n + 1. 
# $
2 (n) 2
Pour tout n ∈ N, on définit le polynôme Hn par e−x = Hn (x) e−x . Les
polynômes Hn sont les polynômes d’Hermite sur R. Il est facile de vérifier que Hn
est un polynôme de degré n.
Théorème 9.10.
Pour n ≥ 1, le polynôme Hn admet n racines réelles distinctes.

Preuve. Pour n = 1, on a H1 (x) = −2x de degré 1 nul en 0. En supposant le


2
résultat acquis au rang n, la fonction fn définie par fn (x) = Hn (x) e−x est nulle
en ±∞ et en n points distincts, on déduit alors des théorèmes de Rolle (classique
sur un compact et généralisé sur un intervalle fermé de longueur infinie) que sa
2
dérivée fn (x) = Hn+1 (x) e−x s’annule en n + 1 points distincts. D’où le résultat
au rang n + 1. 
Applications du théorème de Rolle 257

Ces résultat sont vrais pour toute famille de polynômes orthogonaux et se dé-
montrent en utilisant uniquement les propriétés d’orthogonalité (chapitre 15).

9.2.4 Interpolation de Lagrange, majoration de l’erreur


Soient I = [a, b] un intervalle réel fermé borné avec a < b, n un entier naturel
non nul et (xi )0≤i≤n une suite de réels deux à deux distincts dans I. À toute
fonction f définie sur I et à valeurs réelles on associe le polynôme d’interpolation
de Lagrange Ln (f ) ∈ Rn [X] défini par Ln (f ) (xi ) = f (xi ) pour 0 ≤ i ≤ n.
Un tel polynôme est uniquement déterminé par f. On peut l’écrire sous la forme
n
Ln (f ) = f (xi ) Ln,i avec :
i=0

(
n
x − xj
Ln,i (x) = (0 ≤ i ≤ n)
xi − xj
j=0, j =i

Dans le cas où la fonction f est de classe C n+1 sur I, on peut donner une
expression de l’erreur d’interpolation f − Ln (f ) en tout point de l’intervalle I.
Précisément on a le résultat suivant où, pour n ≥ 1, πn+1 est la fonction polyno-
(n
miale définie par πn+1 (x) = (x − xi ) .
i=0

Théorème 9.11.

Soit f une fonction de classe C n+1 sur l’intervalle I. Pour tout x dans I
il existe un point cx appartenant à I tel que :
1
f (x) − Ln (f ) (x) = πn+1 (x) f (n+1) (cx )
(n + 1)!

Preuve. Si x est l’un des points xi , on a alors f (x) − Ln (f ) (x) = πn+1 (x) = 0
et tout point cx ∈ I convient. On se donne donc un point x dans I \ {x0 , · · · , xn } .
On désigne par Px ∈ Rn+1 [X] le polynôme d’interpolation de Lagrange associé à
la fonction f et aux points x0 , · · · , xn , x. Ce polynôme est défini par :

Px (x) = f (x) et Px (xi ) = f (xi ) (0 ≤ i ≤ n)

f (x) − Ln (f ) (x)
On vérifie facilement que Px = Ln (f ) + πn+1 . La fonction gx =
πn+1 (x)
f − Px est alors de classe C n+1 sur l’intervalle I, nulle en n + 2 points distincts (x
et les xi ), le théorème de Rolle itéré nous dit alors qu’il existe un point cx ∈ I tel
(n+1) (n+1) f (x) − Ln (f ) (x)
que gx (cx ) = 0, ce qui compte tenu de Px = (n + 1)!
πn+1 (x)
f (x) − Ln (f ) (x)
s’écrit f (n+1) (cx ) − (n + 1)! = 0, ou encore :
πn+1 (x)
1
f (x) − Ln (f ) (x) = πn+1 (x) f (n+1) (cx )
(n + 1)!
258 Théorèmes de Rolle et des accroissements finis


Une démonstration analogue nous permet d’obtenir une majoration de l’erreur
dans l’interpolation d’Hermite (voir [20] problème 33).

9.2.5 Convexité
Le théorème de Rolle peut être utilisé pour montrer le critère de convexité
suivant.
Théorème 9.12.
Soit I un intervalle réel non réduit à un point. Si f : I −→ R est une
fonction deux fois dérivable telle que f  (x) ≥ 0 pour tout x ∈ I, alors f
est convexe.

Preuve. Pour x < y fixés dans I et λ ∈ [0, 1] on pose :

ϕ (λ) = f (λx + (1 − λ) y) − λf (x) − (1 − λ) f (y)

Cette fonction est deux fois dérivable sur [0, 1] avec :


 
ϕ (λ) = (x − y) f  (λx + (1 − λ) y) + f (y) − f (x)
2
ϕ (λ) = (x − y) f  (λx + (1 − λ) y) ≥ 0

La fonction ϕ est donc croissante sur [0, 1] . D’autre part, on a ϕ (0) = ϕ (1) = 0,
le théorème de Rolle nous dit alors qu’il existe c ∈ ]0, 1[ tel que ϕ (c) = 0. Avec
la croissance de ϕ on a alors ϕ (λ) ≤ ϕ (c) = 0 pour tout λ ∈ [0, c] et ϕ (λ) ≥
ϕ (c) = 0 pour tout λ ∈ [c, 1] , c’est-à-dire que ϕ est décroissante sur [0, c] et
croissante sur [c, 1] , il en résulte que ϕ (λ) ≤ 0 pour tout λ ∈ [0, 1] , c’est-à-dire
que f est convexe. 

9.3 Théorème et inégalité des accroissements finis


Le théorème de Rolle pour les fonctions d’une variable réelle est équivalent au
théorème des accroissements finis qui suit.
Théorème 9.13. Accroissements finis
Si f est une fonction à valeurs réelles définie sur un segment [a, b] non
réduit à un point, continue sur cet intervalle et dérivable sur l’intervalle ou-
vert ]a, b[ , il existe alors un réel c ∈ ]a, b[ tel que f (b)−f (a) = f  (c) (b − a) .

Preuve. On se ramène aux hypothèses du théorème de Rolle en considérant la


fonction g définie sur [a, b] par g (x) = f (x) − f (a) − λ (x − a) , où la constante
f (b) − f (a)
réelle λ est telle que g (b) = g (a) (soit λ = ). Le théorème de Rolle
b−a
appliqué à la fonction g nous assure de l’existence d’un réel c ∈ ]a, b[ tel que
g  (c) = 0, ce qui équivaut à f (b) − f (a) = f  (c) (b − a) . 
Une autre démonstration de ce théorème est proposée avec l’exercice 9.7.
Théorème et inégalité des accroissements finis 259

Cette formule est encore valable en permutant les rôles de a et b. L’hypothèse


a < b n’est donc pas essentielle.
De manière plus générale ce résultat est valable pour les fonctions définies sur
un segment d’un espace normé. Précisément, on a le résultat suivant.
Théorème 9.14.
Soit f une fonction à valeurs réelles définie et différentiable sur un ouvert
non vide O d’un espace vectoriel normé (E, ·) . Si a, b sont deux points
distincts de O tels que le segment [a, b] soit contenu dans O, il existe alors
un point c de ]a, b[ tel que f (b) − f (a) = df (c) (b − a)

Preuve. On se ramène au cas des fonctions d’une variable réelle en considérant


la fonction g définie sur [0, 1] par g (t) = f (a + t (b − a)) . Cette fonction est bien
définie sur [0, 1] du fait que [a, b] ⊂ O et elle continue sur cet intervalle, dérivable
sur ]0, 1[ avec g  (t) = df (a + t (b − a)) (b − a) . On peut alors utiliser le théorème
9.13 qui nous assure l’existence d’un réel θ dans ]0, 1[ tel que g (1) − g (0) = g  (θ) ,
ce qui s’écrit f (b) − f (a) = df (c) (b − a) avec c = a + θ (b − a) dans ]a, b[ . 
Dans le cas d’une fonction de plusieurs variables réelles, le théorème précédent
prend la forme suivante.
Théorème 9.15.
Soit f une fonction à valeurs réelles définie et différentiable sur un ouvert
non vide O de Rn . Si a, b sont deux points distincts de O tels que le segment
[a, b] soit contenu dans O, il existe alors un point c ∈ ]a, b[ tel que :


n
∂f
f (b) − f (a) = (c) (bk − ak )
∂xk
k=1

Preuve. C’est tout simplement l’expression de la différentielle sur Rn . 


Le théorème 9.13 n’est plus vrai pour les fonctions à valeurs dans C (ou dans
Rn avec n ≥ 2) comme le montre l’exemple de la fonction x → eix sur [0, 2π] .
Toutefois on a le résultat suivant.
Théorème 9.16. Inégalité des accroissements finis

Si f est une fonction à valeurs dans un espace préhilbertien (E, · | ·) ,


définie sur un intervalle compact [a, b] non réduit à un point, continue sur
cet intervalle et dérivable sur l’intervalle ouvert ]a, b[ , il existe alors un
point c de ]a, b[ tel que f (b) − f (a) ≤ f  (c) (b − a) .

Preuve. On se ramène au cas des fonctions à valeurs réelles en introduisant


la fonction g définie sur [a, b] par g (x) = f (x) | f (b) − f (a) . Cette fonction
est continue sur [a, b] , dérivable sur ]a, b[ avec g  (x) = f  (x) | f (b) − f (a) . Le
théorème des accroissements finis nous assure de l’existence d’un réel c ∈ ]a, b[
2
tel que f (b) − f (a) = g (b) − g (a) = (b − a) f  (c) | f (b) − f (a) . Puis avec
260 Théorèmes de Rolle et des accroissements finis

l’inégalité de Cauchy-Schwarz, on déduit que :


2
f (b) − f (a) ≤ (b − a) f  (c) f (b) − f (a)

ce qui entraîne f (b) − f (a) ≤ f  (c) (b − a) . 


Dans le cas où la fonction dérivée f  est majorée sur ]a, b[ , en notant M un
majorant de cette fonction, on a, pour tout couple (x, y) de points de [a, b] :

f (y) − f (x) ≤ M |y − x|

c’est-à-dire que f est lipschitzienne sur [a, b] .



Réciproquement si f est M -lipschitzienne sur  [a, b] , la fonction f est alors
 f (x + h) − f (x) 
majorée par M sur ]a, b[ (de  
 ≤ M, on déduit par passage à la

h

limite quand h tend vers 0, que f (x) ≤ M ).
La version suivante, due à Cauchy, du théorème des accroissements finis est
parfois utile.
Théorème 9.17. Généralisé des accroissements finis
Si f, g sont deux fonctions à valeurs réelles définies sur un intervalle
compact [a, b] non réduit à un point, continues sur cet intervalle et déri-
vables sur l’intervalle ouvert ]a, b[ , il existe alors un point c de ]a, b[ tel que
(f (b) − f (a)) g  (c) = (g (b) − g (a)) f  (c) .

Preuve. On se ramène aux hypothèses du théorème de Rolle en considérant la


fonction h définie sur [a, b] par h (x) = λg (x) − μf (x) , où les constantes réelles
λ, μ sont choisies telles que h (a) = h (b) , soit λg (a) − μf (a) = λg (b) − μf (b) ,
ou encore λ (g (b) − g (a)) = μ (f (b) − f (a)) . On peut prendre λ = f (b) − f (a)
et μ = g (b) − g (a) . Le théorème de Rolle appliqué à la fonction h nous assure de
l’existence d’un réel c ∈ ]a, b[ tel que h (c) , ce qui équivaut à (f (b) − f (a)) g  (c) =
(g (b) − g (a)) f  (c) . 
On dispose également de la version suivante plus générale de l’inégalité des
accroissements finis.
Théorème 9.18.
Soient f une fonction définie sur [a, b] à valeurs dans un espace vecto-
riel normé (E, ·) et g une fonction définie sur [a, b] à valeurs dans R,
continues sur [a, b] et dérivables sur ]a, b[ . Si f  (x) ≤ g  (x) pour tout
x ∈ ]a, b[ , on a alors f (b) − f (a) ≤ g (b) − g (a) .

Preuve. On suppose dans un premier temps que f  (x) < g  (x) pour tout
x ∈ ]a, b[ . On se fixe un réel α ∈ ]a, b[ et on note :

I = {x ∈ [α, b] | f (x) − f (α) > g (x) − g (α)}

Cet ensemble est ouvert dans [α, b] comme image réciproque d’un ouvert par une
application continue. En le supposant non vide, on note γ sa borne inférieure. On
a γ = b du fait que I qui est ouvert ne peut être réduit à {b} . Si γ = α, par
Applications des théorèmes et inégalités des accroissements finis 261

définition de la borne inférieure, pour tout réel ε > 0 assez petit il existe alors
f (x) − f (α) g (x) − g (α)
x ∈ I ∩ ]α, α + ε[ (I est ouvert), donc > qui par
x−α x−α
 
passage à la limite quand ε tend vers 0 donne f (α) ≥ g (α) en contradiction
avec f  (α) < g  (α) . Donc γ ∈ ]α, b[ et γ ∈
/ I puisque I est ouvert. On a donc
f (γ) − f (α) ≤ g (γ) − g (α) et f  (γ) < g  (γ) , ce qui entraîne pour x > γ
f (x) − f (γ) g (x) − g (γ)
voisin de γ, que < et :
x−γ x−γ

f (x) − f (γ) < g (x) − g (γ) , f (γ) − f (α) ≤ g (γ) − g (α)

ce qui par addition donne :

f (x) − f (α) ≤ f (x) − f (γ) + f (γ) − f (α) < g (x) − g (α)

c’est-à-dire x ∈/ I, en contradiction avec γ borne inférieure de I. En définitive


l’ensemble I est vide et f (x) − f (α) ≤ g (x) − g (α) pour tout x ∈ [α, b] . En
particulier f (b) − f (α) ≤ g (b) − g (α) et faisant tendre α vers a on obtient
f (b) − f (a) ≤ g (b) − g (a) .
Le cas général s’obtient en remplaçant la fonction g par la fonction gε : x →
g (x) + εx avec ε > 0 quelconque. On a f  (x) < gε (x) = g  (x) + ε, donc
f (b) − f (a) ≤ g (b) − g (a) + ε (b − a) et en faisant tendre ε vers 0 on a le
résultat. 
Dans le cas où f  est majorée par M sur ]a, b[ , en prenant g (x) = M x, on
retrouve l’inégalité classique des accroissements finis.

9.4 Applications des théorèmes et inégalités des


accroissements finis
Comme le théorème de Rolle, le théorème des accroissements finis est important
pour ses nombreuses applications.

9.4.1 Sens de variation d’une fonction


Théorème 9.19.

Si f : I → R est continue sur I et dérivable sur I, elle est alors croissante

sur I si, et seulement si, f  (x) ≥ 0 pour tout x dans I.


Preuve. Si f est croissante sur I alors pour x = y dans I le taux d’accroissement
f (y) − f (x)
est positif ou nul et en passant à la limite quand y tend vers x,
y−x
on déduit que f  (x) ≥ 0. Réciproquement si f  (x) ≥ 0 pour tout x dans I, en
utilisant le théorème des accroissements finis on déduit alors que pour tout y > x

dans I on a f (y) − f (x) = f  (z) (y − x) ≥ 0 puisque z ∈ I. 
262 Théorèmes de Rolle et des accroissements finis

Au paragraphe 7.3, on propose deux démonstrations moins classiques du théo-


rème précédent qui n’utilisent pas le théorème des accroissements finis.
Si le théorème de Rolle n’est pas lié à la connexité de l’intervalle [a, b] on peut
1
remarquer que le résultat précédent l’est. Si on considère la fonction f : x → −
x
sur R∗ , on a f  (x) > 0 et f n’est pas croissante sur R∗ .

9.4.2 Prolongement par continuité ou par dérivabilité


Théorème 9.20.
Soient I un intervalle réel non réduit à un point, a un point de I, (F, ·F )
un espace de Banach et f : I → F une fonction continue sur I et dérivable
sur I \ {a} . Si f  a une limite à gauche [resp. une limite à droite, resp.
une limite]  en a, elle est alors dérivable à gauche [resp. dérivable à droite,
resp. dérivable] en a avec fg (a) =  [resp. fd (a) = , resp. f  (a) = ].

Preuve. Soit  = lim f  (x) [resp.  = lim f  (x)] et g la fonction définie


x→a− x→a+
sur I par g (x) = f (x) − f (a) − (x − a) . Cette fonction g est continue sur I,
dérivable sur I \ {a} et pour tout réel ε > 0, il existe un réel η > 0 tel que
g  (x)F = f  (x) − F < ε pour tout t ∈ Jη = ]a − η, a[ ⊂ I [resp. t ∈ Jη =
]a, a + η[ ⊂ I]. En utilisant l’inégalité des accroissements finis, on en déduit que
pour tout x ∈ Jη , on a g (x)F = g (x) − g (a)F ≤ ε |x − a| , ce qui prouve que
1 1
lim− g (x) = 0 et revient à dire que lim (f (x) − f (a)) =  [resp.
x→a x − a x→a x − a

1
lim (f (x) − f (a)) = ] et signifie que f est dérivable à gauche [resp. à
x→a+ x − a
droite] en a avec fg (a) =  [resp. fd (a) = ]. Dans le cas où f admet une limite
en a, on a  = lim f  (x) = lim f  (x) , donc  = fg (a) = fg (a) , ce qui signifie
x→a− x→a+
que f est dérivable en a avec f  (a) = . 
Dans le cas, où f  a une limite en a, on peut remarquer que f  est également
continue en c.
On peut utiliser ce résultat pour montrer que la fonction f : R → R définie par
1
f (0) = 0 et f (x) = e− x2 pour x = 0 est de classe C ∞ sur R avec f (n) (0) = 0
1
pour tout n ∈ N. En effet cette fonction est continue sur R ( lim e− x2 = 0 = f (0))
x→0
2 1
et dérivable sur R∗ avec lim f  (x) = lim 3 e− x2 = 0, donc elle est dérivable en
x→0 x→0 x
0 de dérivée nulle et f  est continue sur R. En supposant,
  pour n ≥ 1, que f est
1 1
(n)
de classe C sur R avec f (0) = 0, f (x) = Pn
n (n)
e− x2 pour x = 0, où
x
Pn est une fonction polynomiale
 de
 degré 3n, on
  que f est de
déduit  classe
 C n+1
2 1 1 1 1 1 1
sur R∗ avec f (n+1) (x) = 3
Pn − 2 Pn e− x2 = Pn+1 e− x2 , le
x x x x x
polynôme Pn+1 étant de degré 3n + 3. Puis avec lim f (n+1) (x) = 0, on déduit que
x→0
f est de classe C n+1 sur R avec f (n+1) (0) = 0.
Applications des théorèmes et inégalités des accroissements finis 263

On dispose ainsi d’une fonction de classe C ∞ qui n’est pas développable en série
entière au voisinage de 0.

Corollaire 9.1. Soit I un intervalle réel non réduit à un point Une fonction
f : I → R dérivable et convexe est continûment dérivable.

Preuve. Si f est convexe et dérivable de I dans R, sa dérivée f  est alors croissante


et en conséquence admet une limite à gauche et à droite en tout point a ∈ I. Du
théorème précédent, on déduit alors que f  (a) = fg (a) = lim f  (x) et f  (a) =
x→a−
fd (a) = lim+ f  (x) , donc f  (a) = lim f  (a) et f  est continue en a, ce qui signifie
x→a x→a
que f est continûment dérivable sur I. 
Le corollaire précédent peut aussi se montrer en utilisant le théorème de Dar-
boux (voir le théorème 7.19).
Dans le cadre plus général d’une fonction définie sur un ouvert d’un espace
de Banach et à valeurs dans un espace de Banach, on a le résultat suivant, où
Lc (E, F ) est l’espace des applications linéaires continues de E dans F.
Théorème 9.21.
Soient (E, ·E ) , (F, ·F ) deux espaces de Banach, O un ouvert non
vide de E, a un point de O et f : O → F une fonction continue sur O
et différentiable sur O \ {a} . Si la différentielle df admet une limite L
dans Lc (E, F ) quand x tend vers a, elle est alors différentiable en a de
différentielle df (a) = L.

Preuve. Comme lim df (x) = L, pour tout réel ε > 0, il existe un réel η > 0 tel
x→a
que la boule ouverte B (a, η) de centre a et de rayon η soit contenue dans l’ouvert
O et |||df (x) − L||| < ε pour tout x ∈ B (a, η) \ {a} . La fonction g définie sur O
par g (x) = f (x) − f (a) − L (x − a) est continue sur O, différentiable sur O \ {a}
avec dg (x) = df (x) − L pour tout x ∈ O \ {a} . On a donc |||dg (x)||| < ε pour tout
x ∈ B (a, η) \ {a} et de l’inégalité des accroissements finis, on déduit que :

g (x)F = g (x) − g (a)F ≤ ε x − aE

(le segment [a, x] est contenu dans O car B (a, η) est convexe et g est différentiable
sur ]a, x[). On a donc prouvé que :

f (x) − f (a) − L (x − a)F g (x)F


lim = lim =0
x→a x − aE x→a x − a
E

ce qui signifie que f est différentiable en a de différentielle égale à L. 


Théorème 9.22. L’Hospital

Soient f, g deux fonctions à valeurs réelles continues sur un intervalle


ouvert I, dérivables sur I \ {c} avec g  (x) = 0 pour tout x ∈ I \ {c} où
f  (x) f (x) − f (c)
c ∈ I. Si lim  = , on a alors lim = .
x→c g (x) x→c g (x) − g (c)
264 Théorèmes de Rolle et des accroissements finis

Preuve. De g  (t) = 0 pour tout t ∈ I \ {c} on déduit du théorème des ac-


croissements finis que g (x) = g (c) pour tout x ∈ I \ {c} . Le théorème des ac-
croissements finis généralisé appliqué aux fonctions f, g sur l’intervalle compact
f (x) − f (c) f  (dx )
d’extrémités x, c, où x ∈ I \ {c} permet d’écrire =  avec dx
g (x) − g (c) g (dx )
f  (t)
strictement compris entre x et c. Puis avec lim dx = c, lim  = , on déduit
x→c t→c g (t)
f (x) − f (c) f  (dx )
que lim = lim  = . 
x→c g (x) − g (c) x→c g (dx )
Si f, g sont dérivables en c avec g  (c) = 0 la règle de l’Hospital n’est pas utile.
f (x) − f (c) f (x) − f (c) x−c
Il suffit en effet d’écrire que = et d’utiliser
g (x) − g (c) x−c g (x) − g (c)
la définition du nombre dérivé.
La réciproque du résultat
  précédent est fausse. Considérons par exemple la
1
fonction f : x → x2 sin prolongé par continuité en 0 et g (x) = x sur [−1, 1] .
x    
  1 1
La fonction f est dérivable avec f (0) = 0, f (x) = 2x sin − cos pour
  x x
f (x) − f (0) 1 f  (x)
x = 0. On a lim = lim x sin = 0 et  n’a pas de limite en
x→0 g (x) − g (0) x→0 x g (x)
0.

9.4.3 Intégration et dérivation


On a vu au paragraphe 7.7, que si f est une fonction dérivable sur [a, b] on
 b
ne peut pas toujours affirmer que f  (x) dx = f (b) − f (a) . Dans le cas où la
a
dérivée est Riemann-intégrable, on a le résultat suivant.
Théorème 9.23.
Si f est une fonction dérivable sur [a, b] avec f  Riemann-intégrable sur
 b
[a, b] , on a alors f  (x) dx = f (b) − f (a) .
a

Preuve. Pour tout entier naturel non nul n et tout entier k compris entre 0 et
b−a
n, on note xk = a + k . En utilisant le théorème des accroissements finis, on
n
peut écrire pour tout n ≥ 1 :


n−1 
n−1
b−a  
n−1
f (b)−f (a) = (f (xk+1 ) − f (xk )) = f  (ck ) (xk+1 − xk ) = f (ck )
n
k=0 k=0 k=0

où ck ∈ ]xk , xk+1 [ et on reconnaît là une somme de Riemann pour la fonction f 


 b
qui tend vers f  (x) dx quand n tend vers l’infini. 
a
Le résultat qui suit est souvent utilisé pour montrer la dérivabilité d’une fonction
définie par une intégrale sur un segment.
Applications des théorèmes et inégalités des accroissements finis 265

Théorème 9.24.
Soient I est un intervalle réel non réduit à un point, a < b dans R et f
une fonction à valeurs réelles définie et continue sur I × [a, b] telle que la
∂f ∂f
dérivée partielle (x, t) existe en tout point de I × [a, b] , la fonction
∂x ∂x
étant continue sur I × [a, b] . La fonction ϕ définie sur I par :
 b
ϕ (x) = f (x, t) dt
a

est continûment dérivable sur I de dérivée ϕ définie sur I par :


 b
∂f
ϕ (x) = (x, t) dt
a ∂x

Preuve. On se fixe un réel x0 dans I et un réel r > 0 tel que l’intervalle


[x0 − r, x0 + r] soit contenu dans I. Pour tout h tel que 0 < |h| < r, on a :
 b
ϕ (x0 + h) − ϕ (x0 ) ∂f
τ (h) = − (x0 , t) dt
h a ∂x
 b  
f (x0 + h, t) − f (x0 , t) ∂f
= − (x0 , t) dt
a h ∂x
En utilisant le théorème des accroissements finis, on peut écrire pour tout t ∈ [a, b] :
f (x0 + h, t) − f (x0 , t) ∂f ∂f ∂f
− (x0 , t) = (x0 + θh,t , t) − (x0 , t)
h ∂x ∂x ∂x
∂f
où θh,t ∈ ]0, 1[ . La fonction continue sur le compact K = [x0 − r, x0 + r] ×
∂x
[a, b] y est uniformément continue, donc pour tout réel ε > 0 on peut trouver un
∂f ∂f
réel η ∈ ]0, r[ tel que (x, t) − (u, v) < ε pour tous (x, t) et (u, v) dans
∂x ∂x
K tels que (x, t) − (u, v)∞ < η. Pour tout réel h tel que 0 < |h| < η, on a
(x0 + θh,t h, t) − (x0 , t)∞ = |θh,t h| < |h| < η pour tout t ∈ [a, b] , ce qui entraîne
∂f ∂f
(x0 + θh,t h, t) − (x0 , t) < ε et en conséquence :
∂x ∂x
 b
f (x0 + h, t) − f (x0 , t) ∂f
|τ (h)| ≤ − (x0 , t) dt ≤ (b − a) ε
a h ∂x
Ce qui prouve la dérivabilité de ϕ en x0 et donne la valeur de ϕ (x0 ) . Enfin le
∂f
théorème 6.19, page 171, appliqué à nous assure de la continuité de ϕ . 
∂x
On peut, par
 +∞ exemple, utiliser ce résultat pour calculer la valeur de l’intégrale
2
de Gauss e−t dt. Pour ce faire, on considère les fonctions F, G définies sur
0  x 2  1 2 2
−x (t +1)
+ −t2
R par F (x) = e dt et G (x) = e
t2 +1 dt. Ces fonctions sont
0 0
266 Théorèmes de Rolle et des accroissements finis

dérivables sur R+ avec :


 x   1
 −t2 2 2 2 2
F (x) = 2 e dt e−x , G (x) = −2xe−x e−x t
dt
0 0

Le changement de variable y = xt, pour x > 0, dans G (x) donne :


 x
2 2
G (x) = −2e−x e−y dy = −F  (x)
0

ce résultat étant encore valable pour x = 0. On a donc F  (x) + G (x) = 0 pour


tout x ∈ R+ , ce qui entraîne :
 1
dt π
∀x ∈ R+ , F (x) + G (x) = F (0) + G (0) = 2
=
0 t +1 4
Puis avec :  1
−x2 dt
0 ≤ G (x) ≤ e → 0
0 t2 + 1 x→+∞
 +∞ √
π π 2 π
on déduit que lim F (x) = − lim G (x) = , soit e−t dt = .
x→+∞ 4 x→+∞ 4 0 2
Du théorème précédent, on déduit le résultat suivant.

Corollaire 9.2. Soient I un intervalle réel non réduit à un point, a < b


∂f
dans R et f : I × [a, b] → R continue telle que la dérivée partielle (x, t)
∂x
∂f
existe en tout point de I × [a, b] , la fonction étant continue sur I × [a, b] .
∂x
Si u, v sont deux fonctions dérivables de I dans [a, b] , alors la fonction ψ
 v(x)
définie sur I par ψ (x) = f (x, t) dt est dérivable sur I de dérivée ψ 
u(x)
définie sur I par :
 v(x)
∂f
ψ  (x) = f (x, v (x)) v  (x) − f (x, u (x)) u (x) + (x, t) dt
u(x) ∂x
 v(x)  u(x)
Preuve. En écrivant que ψ (x) = f (x, t) dt − f (x, t) dt, il suffit de
a
 v(x) a

considérer les fonctions de la forme α : x → f (x, t) dt, où v est une fonction


a
dérivable de I dans [a, b] .
On se fixe un réel x0 dans I et un réel r > 0 tel que l’intervalle [x0 − r, x0 + r]
soit contenu dans I et pour tout x dans ]x0 − r, x0 + r[ on peut écrire que :
 v(x0 )  v(x)
α (x) = f (x, t) dt + f (x, t) dt = β (x) + γ (x)
a v(x0 )

Le théorème précédent nous dit que la fonction β est dérivable sur ]x0 − r, x0 + r[
 v(x0 )
 ∂f
de dérivée définie par β (x) = (x, t) dt, ce résultat étant en particulier
a ∂x
Applications des théorèmes et inégalités des accroissements finis 267

valable pour x = x0 . Il nous suffit donc de montrer que la fonction γ est dérivable
en x0 de dérivée γ  (x0 ) = f (x0 , v (x0 )) v  (x0 ) . Pour ce faire, on considère pour h
tel que 0 < |h| < r, la quantité :

γ (x0 + h) − γ (x0 )
τ (h) = − f (x0 , v (x0 )) v  (x0 )
h
 v(x0 +h)
f (x0 + h, t)
= dt − f (x0 , v (x0 )) v  (x0 )
v(x0 ) h

et il s’agit de montrer que lim τ (h) = 0. Par définition du nombre dérivé, on peut
h→0
 v (x0 + h) − v (x0 )
écrire que v (x0 ) = + δ (h) avec lim δ (h) = 0 et :
h h→0

 v(x0 +h)
f (x0 + h, t) − f (x0 , v (x0 ))
τ (h) = dt − f (x0 , v (x0 )) δ (h)
v(x0 ) h

La fonction f étant continue sur le compact K = [x0 − r, x0 + r] × [a, b] est uni-


formément continue, donc pour tout ε > 0 on peut trouver η ∈ ]0, r[ tel que
|f (x, t) − f (x , t )| < ε pour (x, t) , (x , t ) dans K tels que (x, t) − (x , t )∞ < η.
De plus avec la continuité de la fonction v en x0 , on peut trouver un réel η  ∈ ]0, r[
tel que |v (x0 + h) − v (x0 )| < η dès que |h| < η  . Pour 0 < |h| < min (η, η  ) , on a
alors en notant Jh l’intervalle d’extrémités v (x0 ) et v (x0 + h) :
 v(x0 +h)
f (x0 + h, t) − f (x0 , v (x0 ))
dt
v(x0 ) h
v (x0 + h) − v (x0 )
≤ sup |f (x0 + h, t) − f (x0 , v (x0 ))|
h t∈Jh

≤ |v  (x0 ) − δ (h)| ε

ce qui donne pour 0 < |h| < min (η, η  ) , |τ (h)| ≤ |v  (x0 )| ε + |δ (h)| (1 + ε) et
|τ (h)| ≤ |v  (x0 )| ε+ε (1 + ε) pour h > 0 assez petit, ce qui prouve que lim τ (h) =
h→0
0. 

9.4.4 Longueur d’un arc géométrique


L’espace vectoriel Rn est muni de sa structure euclidienne classique.
Soit γ un arc géométrique compact paramétré par une application continue
γ : [a, b] → Rn . À toute subdivision de [a, b] :

σ = (t0 , t1 , ..., tp ) ∈ Rp+1 | a = t0 < t1 < ... < tp = b

on associe la ligne polygonale γσ de sommets Mi = γ (ti ) définie par la paramétri-


sation γσ : [a, b] → Rn , avec :

∀i ∈ {0, · · · , p − 1} , ∀t ∈ [ti , ti+1 ] , γσ (ti ) = (1 − t) Mi + tMi+1

(figure 9.1).
268 Théorèmes de Rolle et des accroissements finis

Mi = γ (ti )

Figure 9.1 – Longueur d’un arc géométrique

La longueur de γσ est naturellement définie par :


p−1 
p−1
L (γσ ) = Mi Mi+1  = γ (ti+1 ) − γ (ti )
i=0 i=0

On dit que l’arc paramétré continu γ : [a, b] → Rn est rectifiable si :

sup {L (γσ ) | σ subdivision de [a, b]}

est fini. Dans ce cas cette borne supérieure est la longueur de l’arc paramétré
(γ, [a, b]) et on la note L (γ, [a, b]) .
Si f = γ ◦ ϕ est une autre paramétrisation de γ sur l’intervalle [α, β] , l’homéo-
morphisme ϕ permet alors de réaliser une bijection de l’ensemble des subdivisions
de [α, β] sur l’ensemble des subdivisions de [a, b] (pour ϕ décroissante, cette bijec-
tion inverse l’ordre des points des subdivisions) et on a L (γ, [a, b]) = L (f, [α, β]) .
C’est-à-dire que la longueur d’un arc géométrique (quand elle est définie) ne dé-
pend pas du choix d’une paramétrisation. De manière précise, on peut donner la
définition suivante.

Définition 9.1. Soit γ un arc géométrique compact et continu. On dit


qu’il est rectifiable si pour toute paramétrisation γ : [a, b] → Rn , (γ, [a, b])
est rectifiable. La longueur de γ est alors la longueur de (γ, [a, b]) et on la
note L (γ) .

Théorème 9.25.

Si γ est un arc géométrique de classe C 1 paramétré par γ : [a, b] → Rn , il


 b
est alors rectifiable et sa longueur est donnée par L (γ) = γ  (t) dt.
a
Applications des théorèmes et inégalités des accroissements finis 269

Preuve. Soit σ une subdivision de [a, b] . On a :


p−1 p−1 


 ti+1 
L (γσ ) = γ (ti+1 ) − γ (ti ) =  γ  (t) dt
 
i=0 i=0 ti
p−1  ti+1
  b
≤ γ  (t) dt = γ  (t) dt < +∞
i=0 ti a

Donc :
 b
L (γ) = sup {L (γσ ) | σ subdivision de [a, b]} ≤ γ  (t) dt < +∞
a

La fonction γ  étant continue sur le compact [a, b] , pour tout ε > 0, on peut
ε
trouver η > 0 tel que |t − t | < η ⇒ γ  (t) − γ  (t ) < . En prenant une
2 (b − a)
subdivision σ de pas h = max (ti+1 − ti ) , on a :
0≤i≤p−1

 ti+1
γ  (t) dt − γ (ti+1 ) − γ (ti ) ≤ I1 + I2
ti

avec :
 ti+1  ti+1
I1 = γ  (t) dt − (ti+1 − ti ) γ  (ti ) = (γ  (t) − γ  (ti )) dt
ti ti
 ti+1
ε
≤ γ  (t) − γ  (ti ) dt ≤ (ti+1 − ti )
ti 2 (b − a)
et :

I2 = |γ (ti+1 ) − γ (ti ) − (ti+1 − ti ) γ  (ti )|


≤ γ (ti+1 ) − γ (ti ) − (ti+1 − ti ) γ  (ti ) = ϕ (ti+1 ) − ϕ (ti )

où on a noté ϕ (t) = γ (t) − tγ  (ti ) .


ε
En écrivant que ϕ (t) = γ  (t) − γ  (ti ) < sur [ti , ti+1 ] et en utili-
2 (b − a)
sant le théorème des accroissements finis, on déduit que :
ε
I2 = ϕ (ti+1 ) − ϕ (ti ) ≤ (ti+1 − ti )
2 (b − a)
ε
En définitive, on a I1 + I2 ≤ (ti+1 − ti ) et par addition :
b−a
 b
γ  (t) dt − L (γσ ) < ε
a

c’est-à-dire que pour tout ε > 0, on peut trouver une subdivision σ telle que :
 b  b

γ (t) dt − ε ≤ L (γ) ≤ γ  (t) dt
a a
270 Théorèmes de Rolle et des accroissements finis
'b
ce qui prouve que L (γ) = a γ  (t) dt. 
Une courbe continue non dérivable n’est pas nécessairement rectifiable. Par
2
exemple l’arc géométrique # π $γ : [0, 1] → R paramétré par γ (t) = (t, y (t)) , où
y (0) = 0 et y (t) = t sin pour t = 0 n’est pas rectifiable.
t

9.4.5 Points fixes attractifs et répulsifs


Pour ce paragraphe I est un intervalle fermé de R (non nécessairement borné)
et f une fonction définie sur I à valeurs réelles telle que f (I) ⊂ I.
Du théorème des accroissements finis on déduit que si f est une fonction déri-

vable sur I telle que sup |f  (x)| = λ < 1, elle est alors λ-contractante et en utilisant

x∈I
le théorème du point fixe (théorème 12.1), on en déduit le résultat suivant.
Théorème 9.26.

Si f : I −→ I est dérivable sur I avec sup |f  (x)| = λ < 1, elle admet

x∈I
alors un unique point fixe α ∈ I et ce point fixe est limite de toute suite
d’approximations successives de valeur initiale x0 ∈ I.

Une fonction f : I −→ I dérivable avec |f  (x)| < 1 pour tout x ∈ I n’a


pas nécessairement de point fixe dans I. Par exemple la fonction f définie sur
1 1
I = [1, +∞[ par f (x) = x + est telle que 0 ≤ f  (x) = 1 − 2 < 1 pour tout
x x
x ∈ I et l’équation f (x) = x n’a pas de solution. Une telle fonction n’est pas
strictement contractante.
Pour f : I −→ I dérivable c’est la pente de la tangente au voisinage de α ∈ I,
solution de f (x) = x, qui gouverne la convergence d’une suite d’approximations
successives. Plus f  est proche de 0 au voisinage de α plus rapide sera la conver-
gence. Le théorème qui suit précise cette remarque.
Théorème 9.27.

Soit f ∈ C 1 (I) admettant un unique point fixe α ∈ I.
1. Si |f  (α)| < 1, il existe alors un réel η > 0 tel que l’intervalle
[α − η, α + η] soit stable par f et pour tout x0 ∈ [α − η, α + η] la suite
(xn )n∈N définie par xn+1 = f (xn ) converge vers α.
2. Si |f  (α)| > 1 et f (I) ⊂ I, alors pour tout x0 ∈ I la suite (xn )n∈N
définie par xn+1 = f (xn ) est soit stationnaire (sur α) à partir d’un
certain rang soit divergente.

Preuve.
1. Si on suppose que |f  (α)| < 1, de la continuité de f  on déduit qu’il existe un réel
η > 0 tel que [α − η, α + η] ⊂ I (α est dans l’intérieur de I) et |f  (x)| < 1 pour
tout x ∈ [α − η, α + η] . On a alors λ = sup |f  (x)| < 1 (la borne supérieure
x∈I
Applications des théorèmes et inégalités des accroissements finis 271

d’une fonction continue sur un compact est atteinte) et en utilisant le théorème


des accroissements finis :

|f (x) − α| = |f (x) − f (α)| ≤ λ |x − α| < |x − α| ≤ η

pour tout x ∈ [α − η, α + η] , c’est-à-dire que f (x) ∈ [α − η, α + η] . L’intervalle


[α − η, α + η] est donc stable par f. La fonction f étant strictement contractante
sur cet intervalle, on a le résultat annoncé.
2. On suppose que |f  (α)| > 1. Avec la continuité de f  on déduit qu’il existe un
réel η > 0 et un réel λ > 1 tels que [α − η, α + η] ⊂ I et |f  (x)| ≥ λ > 1 pour
tout x ∈ [α − η, α + η] . Si on suppose de plus que I est stable par f on peut
alors définir la suite d’approximations successives (xn )n∈N de premier terme
x0 ∈ I. S’il existe n0 ∈ N tel que xn0 = α alors xn = α pour tout n ≥ n0
et la suite est stationnaire à partir du rang n0 . On suppose donc que xn = α
pour tout n ∈ N et dans ce cas la suite (xn )n∈N est divergente. En effet si
lim xn = β alors f (β) = β puisque f est continue et β = α puisque α est
n→+∞
l’unique point fixe de f dans I. Mais on peut alors trouver un entier n1 ∈ N tel
que xn ∈ [α − η, α + η] pour tout n ≥ n1 et avec le théorème des accroissements
finis on déduit que :

∀n ≥ n1 , |xn+1 − α| = |f (xn ) − f (α)| ≥ λ |xn − α|

et par récurrence sur n ≥ n1 , on a |xn − α| ≥ λn−n1 |xn1 − α| pour tout n ≥


n1 , ce qui entraîne lim |xn − α| = +∞ (λ > 1) et contredit lim xn = α.
n→+∞ n→+∞


Avec les notations du théorème précédent, on dit que α est un point fixe attractif
dans le premier cas et que c’est un point fixe répulsif dans le second (figure 9.2).

Figure 9.2 – Points fixes attractif, répulsif

Dans le cas où |f  (α)| = 1 on ne peut rien dire à priori (figure (9.3)).


272 Théorèmes de Rolle et des accroissements finis

Figure 9.3 – Point fixe ni attractif, ni répulsif

9.4.6 Majoration de l’erreur dans la méthode de Simpson


Théorème 9.28.

Soit f une fonction à valeurs réelles de classe C 4 sur un intervalle [a, b] .


En notant M4 = sup f (4) (x) , on a :
x∈[a,b]

    
b
b−a a+b M4 5
f (x) dx − f (a) + 4f + f (b) ≤ (b − a)
a 6 2 2880

Preuve. On se ramène à l’intervalle [−1, 1] en utilisant le changement de variable


a+b b−a
x= + t avec t ∈ [−1, 1] , ce qui conduit à introduire la fonction g définie
2 2  
a+b b−a
sur [−1, 1] par g (t) = f + t . L’erreur dans la méthode de Simpson
2 2
 b    
b−a a+b
sur [a, b] , E (f ) = f (x) dx− f (a) + 4f + f (b) , s’écrit alors :
a 6 2
 1 
b−a 1
E (f ) = g (t) dt − (g (−1) + 4g (0) + g (1))
2 −1 3

On désigne par ϕ la fonction définie sur [0, 1] par :


 x
x
ϕ (x) = g (t) dt − (g (−x) + 4g (0) + g (x))
−x 3
Applications des théorèmes et inégalités des accroissements finis 273

(erreur dans la méthode de Simpson sur [−x, x]). Cette fonction est de classe C 4
sur [0, 1] avec :
⎧ 2 4 x 
⎪  
⎪ ϕ (x) = 3 (g (−x) + g (x)) − 3 g (0) − 3 (g (x) − g (−x))




1 x
⎪ ϕ (x) = (g  (x) − g  (−x)) − (g  (x) + g  (−x))

⎪ 3 3


⎩ ϕ (x) = − x (g  (x) − g  (−x))
3
x2 (4)
Le théorème des accroissements finis nous dit que ϕ (x) = −2 g (cx ) pour
3
x2
x > 0, où cx ∈ ]−x, x[ , ce qui donne |ϕ (x)| ≤ 2 L4 , où :
3
 4
(4) b−a
L4 = sup g (x) = M4
x∈[−1,1] 2

On en déduit, tenant compte de ϕ (0) = ϕ (0) = ϕ (0) = 0, que :


⎧  x  x

⎪   2 2 x3

⎪ |ϕ (x)| = ϕ (t) dt ≤ L 4 t dt = 2 L4

⎪ 0 3 0 9

⎪  x  x
⎨ 2 x4
|ϕ (x)| = ϕ (t) dt ≤ L4 t3 dt = L4

⎪ 0 9 0 18

⎪  x  x



⎪ 1 x5
⎩ |ϕ (x)| = ϕ (t) dt ≤ L4 t4 dt = L4
0 18 0 90
Et pour x = 1, on obtient :
 1  4
1 1 1 b−a
|ϕ (1)| = g (t) dt − (g (−1) + 4g (0) + g (1)) ≤ L4 = M4
−1 3 90 90 2
 5 5
1 b−a (b − a)
ce qui donne |E (f )| ≤ M4 = M4 . 
90 2 2880
Cette méthode est valable pour la méthode du point milieu ou la méthode du
trapèze, mais elle ne s’applique pas aux méthodes de Newton-Cotes plus générales.

9.4.7 Suites de fonctions dérivables


Théorème 9.29.
Soit (fn )n∈N une suite de fonctions continues de [a, b] dans R, dérivables
sur ]a, b[ , qui converge simplement vers une fonction f. S’il existe une
constante M > 0 telle que |fn (x)| ≤ M pour tout n et tout x dans ]a, b[ ,
la suite (fn )n∈N converge alors uniformément et f est continue.

Preuve. En utilisant le théorème des accroissements finis, on voit que les fonctions
fn et f sont M -lipschitzienne. En effet, on a :
2
∀n ∈ N, ∀ (x, y) ∈ [a, b] , |fn (x) − fn (y)| ≤ M |x − y|
274 Théorèmes de Rolle et des accroissements finis

et en passant à la limite quand n tend vers l’infini, on obtient :

∀ (x, y) ∈ R2 , |f (x) − f (y)| ≤ M |x − y|

Ce qui entraîne déjà la continuité de f.


Pour tout ε > 0 il existe une subdivision a = x0 < x1 < · · · < xp = b telle que
xk+1 − xk < ε et de la convergence de chacune des suites (fn (xk ))n∈N vers f (xk ) ,
on déduit qu’il existe un entier n0 tel que :

∀k ∈ {0, 1, · · · , p} , ∀n ≥ n0 , |fn (xk ) − f (xk )| < ε

Pour tout x ∈ [a, b] , il existe un entier k compris entre 0 et p − 1 tel que x soit
dans [xk , xk+1 ] et pour n ≥ n0 , on a :

|fn (x) − f (x)| ≤ |fn (x) − fn (xk )| + |fn (xk ) − f (xk )| + |f (xk ) − f (x)|
≤ M |x − xk | + ε + M |x − xk | ≤ (2M + 1) ε

ce qui permet de conclure à la convergence uniforme de la suite de fonctions (fn )n∈N


vers f sur [a, b] . 
Théorème 9.30.
Soit (fn )n∈N une suite de fonctions dérivables de [a, b] dans R telle que
la suite (fn )n∈N converge uniformément sur [a, b] vers une fonction g. S’il
existe x0 ∈ [a, b] tel que la suite (fn (x0 ))n∈N soit convergente, la suite
(fn )n∈N converge alors uniformément vers une fonction dérivable f telle
que f  = g.

Preuve. Avec le théorème des accroissements finis, on peut écrire pour n, m


entiers naturels et x ∈ [a, b] :

|fn (x) − fm (x)| ≤ |(fn − fm ) (x) − (fn − fm ) (x0 )| + |fn (x0 ) − fm (x0 )|
≤ fn − fm

∞ |x − x0 | + |fn (x0 ) − fm (x0 )|

où on note pour toute fonction h continue sur [a, b] , h∞ = sup |h (x)| . Il en
x∈[a,b]
résulte que :

fn − fm ∞ ≤ (b − a) fn − fm

∞ + |fn (x0 ) − fm (x0 )|

ce qui permet, d’après les hypothèses, de conclure que la suite (fn )n∈N vérifie le
critère de Cauchy uniforme sur [a, b] et donc qu’elle converge uniformément vers
une fonction f.
Pour x, y dans [a, b] et n ∈ N on peut écrire :

|f (x) − f (y) − (x − y) g (x)| ≤ |f (x) − f (y) − (fn (x) − fn (y))|


+ |fn (x) − fn (y) − (x − y) fn (x)|
+ |(x − y) (fn (x) − g (x))|
Applications des théorèmes et inégalités des accroissements finis 275

avec :

|f (x) − f (y) − (fn (x) − fn (y))| = lim |(fm − fn ) (x) − (fm − fn ) (y)|
m→+∞

≤ lim fm − fn ∞ |x − y|
m→+∞

≤ g − fn ∞ |x − y|

et |(x − y) (fn (x) − g (x))| ≤ g − fn ∞ |x − y| . Ce qui donne, pour x = y :


f (x) − f (y) fn (x) − fn (y)
− g (x) ≤ 2 g − fn ∞ + − fn (x)
x−y x−y
Pour ε > 0 donné, on peut trouver un entier n tel que g − fn ∞ < ε et pour cet
entier, par définition du nombre dérivé, on peut trouver un réel η > 0 tel que pour
fn (x) − fn (y)
x = y dans [a, b] vérifiant |x − y| < η on ait − fn (x) < ε. On a
x−y
f (x) − f (y)
donc − g (x) ≤ 3ε pour x = y dans [a, b] tels que |x − y| < η, ce qui
x−y
signifie que f est dérivable en x avec f  (x) = g (x) . 

9.4.8 Dérivées partielles


On sait que si f est une fonction différentiable sur un ouvert O de Rn , elle
est alors continue et admet des dérivées partielles en tout point de O. Mais réci-
proquement une fonction peut très bien admettre des dérivées partielles en tout
point de O sans être différentiable. Par exemple la fonction f définie sur R2 par
xy
f (0, 0) = 0 et f (x, y) = 2 pour (x, y) = (0, 0) admet des dérivées partielles
x + y2
en tout point de R2 (pour (x, y) = (0, 0) c’est clair avec les opérations classiques,
f (x, 0) − f (0, 0) ∂f
en (0, 0) on a = 0 pour tout x = 0 qui entraîne (0, 0) = 0 et
x ∂x
pour la dérivée en y on conclut par symétrie) et n’est pas différentiable en (0, 0)
1
car non continue en ce point (f (x, x) = ne tend pas vers 0 quand x tend vers
2
0). On a quand même le résultat important suivant.
Théorème 9.31.
Soient O un ouvert de Rn et f une fonction définie sur O à valeurs
réelles (ou dans un espace normé) admettant des dérivées partielles par
rapport à toutes les variables en tout point de O. Si ces dérivées partielles
sont continues en un point a de O, f est alors différentiable en a.

Preuve. On se place dans le cas d’une fonction de deux variables à valeurs réelles
∂f ∂f
et on note (x, y) les variables. En supposant que , existent en tout point de
∂x ∂y
O et qu’elles sont continues en (a, b) , il s’agit de montrer, en notant h = x − a,
∂f ∂f
k = y − b, p = (a, b) , q = (a, b) que :
∂x ∂y
f (x, y) = f (a, b) + ph + qk + o (|h| + |k|)
276 Théorèmes de Rolle et des accroissements finis

Pour ce faire on écrit que :

f (x, y) − f (a, b) = f (x, y) − f (x, b) + f (x, b) − f (a, b)

et en utilisant le théorème des accroissements finis, on a :



⎪ ∂f

⎨ f (x, y) − f (x, b) = (y − b) (x, cx,y )
∂y


⎩ f (x, b) − f (a, b) = (x − a) ∂f (dx , b)
∂x
avec cx,y compris entre y et b et dx compris entre a et x, de sorte que :
 
∂f ∂f
f (x, y) − f (a, b) − ph − qk = h (dx , b) − (a, b)
∂x ∂x
 
∂f ∂f
+k (x, cx,y ) − (a, b)
∂y ∂y

Avec la continuité des dérivées partielles en (a, b) , on déduit que pour tout réel
ε > 0 il existe un réel η > 0 tel que les conditions |u − a| < η et |v − b| < η
∂f ∂f ∂f ∂f
entraînent (u, v) − (a, b) < ε, (u, v) − (a, b) < ε. On déduit alors
∂x ∂x ∂y ∂y
que pour |x − a| < η, |y − b| < η on a :

|f (x, y) − f (a, b) − ph − qk| < (|h| + |k|) ε

c’est-à-dire le résultat souhaité. 


La démonstration du théorème de Schwarz qui suit sur la symétrie des déri-
vées partielles d’ordre 2 en cas de continuité utilise également le théorème des
accroissements finis.
Théorème 9.32.

Soient O un ouvert de R2 et f une fonction définie sur O à valeurs


∂2f ∂2f
réelles admettant sur O des dérivées partielles et continues en
∂x∂y ∂y∂x
∂2f ∂2f
un point (a, b) de O. On a alors (a, b) = (a, b) .
∂x∂y ∂y∂x

Preuve. Pour h, k strictement positifs tels que [a, a + h] × [b, b + k] soit contenu
dans O, on note g (h, k) = f (a + h, b + k) − f (a + h, b) − f (a, b + k) + f (a, b) . En
notant ϕ (x) = f (x, b + k) − f (x, b) , on a g (h, k) = ϕ (a + h) − ϕ (a) qui avec le
théorème des accroissements finis s’écrit g (h, k) = hϕ (a + θh) , soit :
 
∂f ∂f
g (h, k) = h (a + θh, b + k) − (a + θh, b)
∂x ∂x
ce qui peut s’écrire en utilisant à nouveau le théorème des accroissements finis :

∂2f
g (h, k) = hk (a + θh, b + θ k)
∂y∂x
Applications des théorèmes et inégalités des accroissements finis 277

En procédant de même avec la fonction ψ définie par ψ (y) = f (a + h, y)−f (a, y) ,


on a :
 
∂f ∂f
g (h, k) = ψ (b + k) − ψ (b) = k (a + h, b + ηk) − (a, b + ηk)
∂y ∂y
∂2f
= hk (a + η  h, b + ηk)
∂x∂y

∂2f ∂2f
Ce qui donne (a + θh, b + θ k) = (a + η  h, b + ηk) où θ, θ , η, η  sont
∂y∂x ∂x∂y
dans ]0, 1[ . En faisant tendre (h, k) vers (0, 0) et en utilisant la continuité des
∂2f ∂2f
dérivées partielles d’ordre 2, en on déduit que (a, b) = (a, b) . 
∂x∂y ∂y∂x
2 2
xy x − y
L’exemple de f définie sur R2 par f (0, 0) = 0 et f (x, y) = pour
x2 + y 2
(x, y) = (0, 0) nous montre que le résultat précédent est faux si on en enlève
l’hypothèse de continuité des dérivées partielles d’ordre 2.

9.4.9 Le théorème de Darboux


On peut donner une démonstration du théorème de Darboux (théorème 7.18)
qui utilise le théorème des accroissements finis.
Théorème 9.33. Darboux
Si f est une fonction à valeurs réelles définie et dérivable sur un intervalle
I, sa fonction dérivée f  vérifie alors la propriété des valeurs intermédiaires.

Preuve. Il s’agit de montrer que f  (I) est connexe dans R, ce qui revient à dire
que c’est un intervalle
 (théorème 2.1). 
f (x) − f (y)
L’ensemble C = | (x, y) ∈ I 2 , x < y est connexe comme image
x−y 
du connexe de R2 , E = (x, y) ∈ I 2 , x < y (cet ensemble est convexe donc
f (x) − f (y)
connexe), par l’application continue (x, y) → . Le théorème des ac-
x−y

croissements finis nous dit que tout z ∈ C s’écrit z = f  (t) avec t ∈ I et en écrivant
f (t + h) − f (t)
que f  (t) = lim , on déduit que z est aussi dans C. On a donc
h→0 + h
C ⊂ f (I) ⊂ C avec C connexe, ce qui entraîne que f  (I) est connexe.



9.4.10 Nombres de Liouville


On dit qu’un réel (ou complexe) α est algébrique s’il existe un polynôme P non
nul à coefficients entiers relatifs tel que P (α) = 0. Parmi tous ces polynômes il
en existe un de degré minimal et en le divisant par son coefficient dominant on
dispose d’un polynôme Pα unitaire à coefficients rationnels de degré minimal qui
annule α. Il est facile de vérifier que ce polynôme est unique. Le polynôme Pα
est appelé le polynôme minimal de α et le degré de Pα est le degré du nombre
278 Théorèmes de Rolle et des accroissements finis

algébrique α. On vérifie facilement que Pα est irréductible dans Q [X] , c’est-à-dire


qu’il ne peut pas s’écrire comme produit de deux polynômes non constants.
On dit qu’un réel est transcendant s’il n’est pas algébrique.
Le théorème qui suit nous permet de construire une infinité de nombres trans-
cendants.
Théorème 9.34. Liouville
Soit α un nombre algébrique de degré d ≥ 1. Pour d = 1, α est rationnel
et il existe une constante Cα > 0 telle que pour tout nombre rationnel
p p Cα
r= (p ∈ Z, q ∈ N∗ ) distinct de α on a α − ≥ . Pour d ≥ 2, α
q q q
est irrationnel et il existe une constante Cα > 0 telle que pour tout nombre
p p Cα
rationnel r = on a α − ≥ d.
q q q

Preuve. Pour d = 1, le polynôme minimal de α s’écrit Pα (X) = X − s avec


a
s ∈ Q. De Pα (α) = 0 on déduit alors que α = s = avec a ∈ Z, b ∈ N∗ . De plus
b
p p aq − bp
pour r = ∈ Q distinct de α on a 0 < α − = , donc |aq − bp| = 0
q q qb
p aq − bp 11
dans N, ce qui équivaut à |aq − bp| ≥ 1. On a donc α − = ≥ .
q qb bq
Supposons maintenant que d ≥ 2. Le nombre α ne peut être rationnel, sans
quoi il serait annulé par un polynôme unitaire de degré 1, ce qui contredit le
caractère minimal de d. En notant Pα le polynôme minimal de α il existe un entier
p
naturel non nul n tel que Qα = nPα ∈ Z [X] et pour tout rationnel r = , on a
q
q d Qα (r) ∈ Z. De plus cet entier est non nul. En effet si q d Qα (r) = 0, r est alors
racine de Qα et Qα (X) = (X − r) R (X) avec X −r et R dans Q [X] non constants
(d ≥ 1), en contradiction avec Pα irréductible dans Q [X] . On a donc :

q d (Qα (α) − Qα (r)) = q d Qα (r) ≥ 1

D’autre part, le théorème des accroissements finis permet d’écrire :

Qα (α) − Qα (r) = (α − r) Qα (s)

avec s compris entre α et r. On distingue alors deux cas :


soit |α − r| ≤ 1 et dans ce cas s ∈ [α − 1, α + 1] de sorte que :
 
1 ≤ q d Qα (r) = q d |α − r| |Qα (s)| ≤ sup |Qα (s)| q d |α − r|
s∈[α−1,α+1]

1 1
donc C1 = sup |Qα (s)| > 0 et |α − r| ≥ ;
s∈[α−1,α+1] C1 q d
1
soit |α − r| > 1 et dans ce cas |α − r| > d .
  q
1 p Cα
En posant Cα = min 1, , on a alors α − ≥ d. 
C1 q q
Exercices 279

+∞
 an
Les nombres de Liouville sont définis par ξ = n!
où (an )n≥1 est une suite
n=1
10
d’entiers compris entre 0 et 9 avec an ≥ 1 pour n ≥ n0 . En notant pour k ≥ n0
k
an
donné, p = 10k! n!
, q = 10k! , on a :
n=1
10

+∞
 +∞

p an 9 1 9 10 1
0< ξ− = ≤ (k+1)!
= (k+1)! ≤ k
q 10n! 10 n=0
10n 10 9 q
n=k+1

Cξ p 1
Si ξ est algébrique de degré d ≥ 1, alors ≤ ξ− ≤ k pour tout k ≥ n0
qd q q
et faisant tendre k vers l’infini on aboutit à une absurdité. En conclusion ξ est
transcendant.
On peut utiliser ce résultat pour montrer qu’il y a autant de nombres transcen-
 an
dants que de réels. Pour ce faire on utilise l’application qui associe à ξ =
10n!
n≥1
 an
le réel ∈ ]0, 1[ et on vérifie que c’est une bijection (si x ∈ ]0, 1[ est décimal
10n
n≥1
on utilise son écriture décimale impropre comportant une infinité de 9).

9.5 Exercices

Exercice 9.1. Soit f : [a, b] → R une fonction continue.


1. On suppose que f est dérivable sur ]a, b[ et que f (a) = f (b) = 0. Montrer
que pour tout réel λ il existe cλ ∈ ]a, b[ tel que λf (cλ ) + f  (cλ ) = 0.
2. On suppose que f est deux fois dérivable sur [a, b] et que f (a) = f  (a) ,
f (b) = f  (b) . Montrer qu’il existe c ∈ ]a, b[ tel que f (c) = f  (c) .
f (a) f (b)
3. Pour a > 0, on suppose que f dérivable sur ]a, b[ et que = .
a b
f (c)
Montrer qu’il existe c ∈ ]a, b[ tel que f  (c) = .
c

Solution.
1. La fonction g définie sur [a, b] par g (x) = eλx f (x) est continue sur [a, b] ,
dérivable sur ]a, b[ avec g  (x) = eλx (λf (x) + f  (x)) et g (a) = g (b) = 0. Le
théorème de Rolle nous dit alors qu’il existe cλ ∈ ]a, b[ tel que g  (cλ ) = 0, ce
qui équivaut à λf (cλ ) + f  (cλ ) = 0.
2. La fonction g définie sur [a, b] par g (x) = ex (f (x) − f  (x)) est dérivable sur
[a, b] avec g  (x) = ex (f (x) − f  (x)) et g (a) = g (b) = 0. Le théorème de
Rolle nous dit alors qu’il existe c ∈ ]a, b[ tel que g  (c) = 0, ce qui équivaut à
f (c) = f  (c) .
280 Théorèmes de Rolle et des accroissements finis

f (x)
3. La fonction g définie sur [a, b] par g (x) = est continue sur [a, b] , dérivable
x
xf  (x) − f (x)
sur ]a, b[ avec g  (x) = et g (a) = g (b) . Le théorème de Rolle
x2
nous dit alors qu’il existe c ∈ ]a, b[ tel que g  (c) = 0, ce qui équivaut à f  (c) =
f (c)
.
c

Exercice 9.2. Soient f, g deux fonctions à valeurs réelles, continues sur


[a, b] et dérivables sur ]a, b[ .
1. On suppose que f (a) = f (b) = 0. Montrer qu’il existe c ∈ ]a, b[ tel que
g  (c) f (c) + f  (c) = 0.
2. On suppose que f (a) g (b) = f (b) g (a) . Montrer qu’il existe c ∈ ]a, b[ tel
f  (c) g  (c)
que = .
f (c) g (c)

Solution.
1. La fonction h définie sur [a, b] par g (x) = eg(x) f (x) est continue sur [a, b] ,
dérivable sur ]a, b[ avec h (x) = eg(x) (g  (x) f (x) + f  (x)) et h (a) = h (b) = 0.
Le théorème de Rolle nous dit alors qu’il existe c ∈ ]a, b[ tel que g  (c) = 0, ce
qui équivaut à g  (c) f (c) + f  (c) = 0.
f (x)
2. La fonction h définie sur [a, b] par g (x) = est continue sur [a, b] , dérivable
g (x)
g (x) f  (x) − f (x) g  (x)
sur ]a, b[ avec h (x) = 2 et h (a) = h (b) . Le théorème
g (x)
de Rolle nous dit alors qu’il existe c ∈ ]a, b[ tel que g  (c) = 0, ce qui équivaut
f  (c) g  (c)
à = .
f (c) g (c)

Exercice 9.3. Soient n ≥ 2, a, b réels et P la fonction polynomiale définie


par P (x) = xn +ax+b. Montrer que si n est pair alors P a au plus 2 racines
réelles et si n est impair alors P a au plus 3 racines réelles.

Solution. Supposons n pair. On a alors P  (x) = n (n − 1) xn−2 > 0 pour tout


réel non nul x et P  est strictement croissante sur R de degré impair, elle s’annule
donc une fois (théorème des valeurs intermédiaires) et une seule (P  est injective).
Avec le théorème de Rolle on déduit alors que P s’annule au plus 2 fois.
Supposons n impair. Alors P  est strictement décroissante sur ]−∞, 0[ , strictement
croissante sur ]0, +∞[ , avec P  (0) = a. Il résulte que P  a 2 racines réelles −ρ et
ρ > 0 si a < 0, 0 pour unique racine réelle si a = 0 et pas de racine réelle si a > 0.
Avec la théorème de Rolle, on déduit alors que P a au plus 3 racines réelles.

Exercice 9.4. Montrer que pour tout entier naturel n et toutes suites de
réels (ak )0≤k≤n et (λk )0≤k≤n , les ak étant tous non nuls et les λk deux à
Exercices 281


n
deux distincts, la fonction fn définie sur R+,∗ par fn (x) = ak xλk a au
k=0
plus n racines réelles distinctes dans R+,∗ .

Solution. On procède par récurrence sur n ≥ 0. Pour n = 0, f0 (x) = a0 xλ0 n’a


pas de racine dans R+,∗ puisque a0 est non nul. Supposons le résultat acquis au
rang n ≥ 0. Si la fonction fn+1 a plus de n + 1 racines distinctes dans R+,∗ , il en
est alors de même de la fonction gn+1 définie sur R+,∗ par :


n+1
gn+1 (x) = x−λn+1 fn+1 (x) = ak xλk −λn+1
k=0

et le théorème de Rolle nous dit que la fonction dérivée :



n

gn+1 (x) = (λk − λn+1 ) ak xλk −λn+1 −1
k=0

a plus de n racines distinctes dans R+,∗ , ce qui contredit l’hypothèse de récurrence.

Exercice 9.5. En utilisant les théorèmes de Rolle, montrer que pour tout
entier n, on a :
 (n)
1 Pn (x)
∀x ∈ R, =
1 + x2 (1 + x2 )
n+1

où Pn est un polynôme de degré n avec n racines réelles distinctes (l’exercice


7.3 propose une méthode de calcul des racines de Pn basée sur la décompo-
sition en éléments simples dans C (X)).


1 P1 (x)
Solution. Pour n = 0, c’est clair. Pour n = 1, on a 2
= 2
1+x (1 + x2 )
avec P1 (x) = −2x de degré 1 nul en 0. En supposant le résultat acquis au
Pn (x)
rang n, la fonction fn définie par fn (x) = n+1 est nulle en ±∞ et
(1 + x2 )
en n points distincts, on déduit alors des théorèmes de Rolle (classique sur un
compact et généralisé sur un intervalle fermé de longueur infinie) que sa déri-
Pn+1 (x)
vée s’annule en n + 1 points distincts, cette dérivée s’écrivant n+2 , où
(1 + x2 )
Pn+1 (x) = 1 + x2 Pn (x) − 2 (n + 1) xPn (x) est un polynôme de degré égal à
n + 1 (il a n + 1 racines, ou alors on peut calculer son coefficient dominant). D’où
le résultat. De ce résultat, on déduit que pour tout entier n ≥ 1 on a :
Pn−1 (x)
∀x ∈ R, arctan(n) (x) = n
(1 + x2 )
où Pn−1 est un polynôme de degré n − 1 avec n − 1 racines réelles distinctes.
282 Théorèmes de Rolle et des accroissements finis

 1
1
Exercice 9.6. Montrer que si f : [0, 1] → R est telle que f (t) dt = ,
0 2
elle a alors un point fixe dans ]0, 1[ .
 x
x2
Solution. La fonction g définie sur [0, 1] par g (x) = f (t) dt −
est continue
0 2
sur [0, 1] , dérivable sur ]0, 1[ avec g (0) = g (1) = 0. Le théorème de Rolle nous dit
alors qu’il existe c ∈ ]0, 1[ tel que g  (c) = 0, ce qui signifie f (c) = c.

Exercice 9.7. Soient f, g, h trois fonctions à valeurs réelles, continues


sur [a, b] , dérivables sur ]a, b[ et ϕ la fonction définie sur [a, b] par :
⎛ ⎞
f (x) g (x) h (x)
ϕ (x) = det ⎝ f (a) g (a) h (a) ⎠
f (b) g (b) h (b)

Montrer qu’il existe un réel c ∈ ]a, b[ tel que ϕ (c) = 0. Quels résultats
obtient-on pour h (x) = 1 ?

Solution. La fonction ϕ est continue sur [a, b] dérivable sur ]a, b[ et avec le
caractère 3-linéaire alterné du déterminant, on a :
⎛  ⎞
f (x) g  (x) h (x)
ϕ (x) = det ⎝ f (a) g (a) h (a) ⎠ et ϕ (a) = ϕ (b) = 0
f (b) g (b) h (b)

Le théorème de Rolle nous dit alors qu’il existe un réel c ∈ ]a, b[ tel que ϕ (c) = 0.
Pour h = 1, on obtient :
⎛  ⎞
f (c) g  (c) 0
ϕ (c) = det ⎝ f (a) g (a) 1 ⎠ = f  (c) (g (a) − g (b))−g  (c) (f (a) − f (b)) = 0
f (b) g (b) 1

soit (f (b) − f (a)) g  (c) = (g (b) − g (a)) f  (c) . C’est le théorème généralisé des
accroissements finis. Prenant g (x) = x, on a le théorème classique des accroisse-
ments finis.

Exercice 9.8. Soient (fk )1≤k≤n et (gk )1≤k≤n deux familles de fonctions
à valeurs réelles, continues sur [a, b] , dérivables sur ]a, b[ et telles que
gk (a) = gk (b) pour tout k compris entre 1 et n. Monter qu’il existe un

n 
n
fk (b) − fk (a)
réel c dans ]a, b[ tel que fk (c) = gk (c) .
gk (b) − gk (a)
k=1 k=1

Solution. On considère la fonction ϕ définie sur [a, b] par :



n
ϕ (x) = (fk (x) − fk (a) − λk (gk (x) − gk (a)))
k=1
Exercices 283

où les constantes λk sont choisies telles que ϕ (a) = ϕ (b) . On peut prendre :

fk (b) − fk (a)
λk = (1 ≤ k ≤ n)
gk (b) − gk (a)

Cette fonction est continue sur [a, b] , dérivable sur ]a, b[ avec ϕ (a) = ϕ (b) . Le
théorème de Rolle nous dit alors qu’il existe un réel c dans ]a, b[ tel que ϕ (c) , ce
qui donne le résultat annoncé.

Exercice 9.9. Soit f une fonction dérivable de ]0, +∞[ dans R telle que
f (x)
lim f  (x) = . Montrer que lim = .
x→+∞ x→+∞ x

Solution. Pour tout n ∈ N∗ , il existe θn ∈ ]0, 1[ tel que f (n + 1) − f (n) =


f  (n + θn ) et il en résulte que lim (f (n + 1) − f (n)) = . Avec le théorème de
n→+∞
Cesàro, on a alors :

f (n) (f (n) − f (n − 1)) + · · · + (f (2) − f (1)) f (1)


= + → 
n n n n→+∞

Et pour x ∈ ]0, +∞[ , en notant n la partie entière de x (n ≤ x < n + 1), on peut


écrire :
   
f (x) n f (x) − f (n) f (n) n x−n  f (n)
= + = f (n + θn,x (x − n)) +
x x n n x n n
 
n n 1
et avec lim = 1 (du fait que ∈ 1 − , 1 ), lim f  (n + θn,x (x − n)) = 
x→+∞ x x x x→+∞
f (n) f (x)
et lim =  on déduit que lim = .
x→+∞ n x→+∞ x

Exercice 9.10. Soit f une fonction dérivable de ]0, 1[ dans R de dérivée


bornée. Montrer que f se prolonge par continuité en 0 et 1.

Solution. La dérivée de f étant bornée il existe une constante M > 0 telle que
|f  (x)| ≤ M pour tout x ∈ ]0, 1[ . Si (xn )n∈N est une suite de points de ]0, 1[ qui
converge vers 0, en utilisant l’inégalité des accroissements finis, on a pour tous n, m
dans N, |f (xn ) − f (xm )| ≤ M |xn − xm | et il en résulte que la suite (f (xn ))n∈N
est de Cauchy dans R, elle est donc convergente vers un réel λ. Si (yn )n∈N est
une autre suite de points de ]0, 1[ qui converge vers 0, alors la suite (f (yn ))n∈N
converge vers un réel μ et :

|λ − μ| = lim |f (xn ) − f (yn )| ≤ M lim |xn − yn | = 0


n→+∞ n→+∞

c’est-à-dire que λ = μ. On peut donc prolonger par continuité la fonction f en 0


en posant f (0) = λ. On procède de même pour la limite en 1.
284 Théorèmes de Rolle et des accroissements finis

Exercice 9.11.
1
1. Montrer que la fonction f définie sur R par f (x) = e− x pour x > 0 et
f (x) = 0 pour x ≤ 0, est indéfiniment dérivable.
2. Construire une fonction indéfiniment dérivable sur R, nulle sur R− ,
strictement croissante sur [0, 1] et constante égale à 1 sur [1, +∞[ .
3. Construire une fonction indéfiniment dérivable sur R, nulle pour
 |x| ≥ 1,

1 1
constante égale à 1 pour |x| ≤ , strictement croissante sur −1, −
2  2
1
et strictement décroissante sur , 1 (fonction plateau).
2

Solution.
1. Avec lim f (x) = 0, on déduit que f est continue sur R. Cette fonction est
x→0
1 1
dérivable sur R∗ avec f  (x) = 0 pour x < 0 et f  (x) = 2 e− x pour x > 0.
x
Avec lim f  (x) = 0, on déduit qu’elle est dérivable en 0 de dérivée nulle et f 
x→0
est continue sur R. En supposant, pour n ≥   f est de classe C sur R
1, que n

1 1
avec f (n) (0) = 0 pour x ≤ 0 et f (n) (x) = Pn e− x pour x > 0, où Pn est
x
une fonction polynomiale de degré 2n, on déduit que f est de classe C n+1 sur
R∗ avec :


⎨ 0 si x < 0
(n+1)       
f (x) = 1 1 1 1

⎩ 2 Pn − Pn 
e
1
−x
= Pn+1
1
e− x si x > 0
x x x x

le polynôme Pn+1 étant de degré 2n+2. Puis avec lim f (n+1) (x) = 0, on déduit
x→0
que f est de classe C n+1 sur R avec f (n+1) (0) = 0.
2. La fonction g définie sur R par g (x) = f (x) f (1 − x) est indéfiniment dérivable,
nulle en dehors de ]0, 1[ et à valeurs strictement positives pour x ∈ ]0, 1[ . En
 1  x
dt
notant d = g (t) dt, on a d > 0 et la fonction h définie par h (x) = g (t)
0 0 d
est indéfiniment dérivable sur R, nulle sur R− , strictement croissante sur [0, 1]
et constante égale à 1 sur [1, +∞[ .
3. La fonction ϕ définie sur R par ϕ (x) = h (2x + 2) + h (2 − 2x) − 1 répond à la
question.

Exercice 9.12. Soit f une fonction à valeurs réelles définie et dérivable


sur un intervalle I. Montrer que s’il existe deux réels a < b dans I tels
f (c) − f (a)
que f  (a) = f  (b) , alors il existe c ∈ ]a, b[ tel que f  (c) =
c−a
(c’est-à-dire qu’il existe un point M du graphe de f tel que la tangente en
M passe par (a, f (a))).
Exercices 285

Solution. On suppose d’abord que f  (a) = f  (b) = 0 et on désigne par ϕ la


fonction définie sur [a, b] par :

⎨ f (x) − f (a)
si x ∈ ]a, b]
⎩ 0 si xx −
ϕ (x) = a
= a.
Cette fonction est continue sur [a, b] , dérivable sur ]a, b] avec :
(x − a) f  (x) − (f (x) − f (a))
∀x ∈ ]a, b] , ϕ (x) = 2
(x − a)
Le théorème des accroissements finis nous dit alors qu’il existe c ∈ ]a, b[ tel que :
 
b−a f (c) − f (a)
ϕ (b) − ϕ (a) = (b − a) ϕ (c) = f  (c) −
c−a c−a
f (b) − f (a)
avec ϕ (b) − ϕ (a) = . Si f (a) = f (b) , alors le point c est tel que
b−a
f (c) − f (a)
f  (c) = . Si f (a) = f (b) , alors :
c−a
 2
  (f (b) − f (a)) ϕ (b) − ϕ (a) (f (b) − f (a))
ϕ (b) ϕ (c) = − 2 =− 2 <0
(b − a) b−a (b − a)
et le théorème de Darboux nous dit qu’il existe un point d ∈ ]c, b[ tel que ϕ (d) = 0,
f (d) − f (a)
ce qui équivaut à f  (d) = .
d−a
Si f  (a) = f  (b) = λ, on introduit la fonction g définie par g (x) = f (x)−λ (x − a)
qui vérifie g  (a) = g  (b) = 0 et ce qui précède nous dit qu’il existe c ∈ ]a, b[ tel
g (c) − g (a) f (c) − f (a)
que g  (c) = , soit f  (c) − λ = − λ. D’où le résultat.
c−a c−a

Exercice 9.13. Soit f une fonction dérivable de R+,∗ dans R telle que
lim (f (x) + f  (x)) = 0. Montrer que lim f (x) = 0.
x→+∞ x→+∞

Solution. Le théorème généralisé des accroissements finis nous dit que pour x < y
ex f (x) − ey f (y)
dans R+,∗ on peut trouver t dans ]x, y[ tel que = f (t) + f  (t)
ex − ey
et en conséquence, |ex−y f (x) − f (y)| = (1 − ex−y ) |f (t) + f  (t)| , ce qui entraîne
que :
|f (y)| ≤ ex−y |f (x)| + 1 − ex−y |f (t) + f  (t)| (9.1)
Avec l’hypothèse lim (f (x) + f  (x)) = 0, on déduit que pour tout réel ε > 0
x→+∞
on peut trouver un réel λ > 0 tel que |f (t) + f  (t)| < ε pour tout t ≥ λ. Prenant
x = λ et y > λ quelconque dans l’inégalité (9.1) , on a :
∀y ≥ λ, |f (y)| ≤ eλ−y |f (λ)| + 1 − eλ−y ε = ε + eλ−y (|f (λ)| − ε)
et avec lim eλ−y = 0, on déduit qu’il existe un réel μ > λ tel que |f (y)| ≤ 2ε
y→+∞
pour tout y ≥ μ. On a donc ainsi montré que lim f (x) = 0.
x→+∞
286 Théorèmes de Rolle et des accroissements finis

Exercice 9.14. Soit f ∈ C 0 (R; R) telle que lim f (x) =  et


x→+∞

lim f (x) =  .
x→−∞
 +∞
1. Montrer que (f (t + 1) − f (t)) dt =  −  .
−∞
 +∞
2. Montrer que (arctan (t + 1) − arctan (t)) dt = π.
−∞

Solution.
1. En notant F la primitive de f nulle en 0, on a pour tout réel x > 0 :
 x
(f (t + 1) − f (t)) dt = F (x + 1) − F (x) − F (1)
0

et en utilisant le théorème des accroissements finis, on déduit qu’il existe un


réel cx dans l’intervalle ]x, x + 1[ tel que :
 x
(f (t + 1) − f (t)) dt = f (cx ) − F (1)
0

Avec lim f (x) = , on en déduit alors que :


x→+∞

 +∞
(f (t + 1) − f (t)) dt =  − F (1)
0

De manière analogue, pour x < 0 on a :


 0
(f (t + 1) − f (t)) dt = F (1) − (F (x + 1) − F (x)) = F (1) − f (dx )
x

avec dx ∈ ]x, x + 1[ et avec lim f (x) =  on obtient :


x→−∞

 0
(f (t + 1) − f (t)) dt = F (1) − 
−∞
 +∞
Ce qui donne en définitive, (f (t + 1) − f (t)) dt =  −  .
−∞
π π
2. Avec lim arctan (x) = et lim arctan (x) = − , on déduit que :
x→+∞ 2 x→−∞ 2
 +∞
(arctan (t + 1) − arctan (t)) dt = π
−∞
Chapitre 10

Les formules de Taylor

10.1 La formule de Taylor-Lagrange


Du théorème de Rolle on déduit le résultat suivant qui généralise le théorème
des accroissements finis.
Théorème 10.1. Formule de Taylor-Lagrange

Si f est une fonction à valeurs réelles définie sur un segment [a, b] non
réduit à un point, de classe C n sur ce segment et n + 1 fois dérivable sur
l’intervalle ouvert ]a, b[ , il existe alors un réel c ∈ ]a, b[ tel que :


n
f (k) (a) k f (n+1) (c) n+1
f (b) = (b − a) + (b − a)
k! (n + 1)!
k=0

Preuve. On se ramène aux hypothèses du théorème de Rolle en considérant la


fonction g définie sur [a, b] par :

n
f (k) (x) k λ n+1
g (x) = f (b) − (b − x) − (b − x)
k! (n + 1)!
k=0

où la constante réelle λ est telle que g (b) = g (a) . Le théorème de Rolle appliqué
à cette fonction nous assure de l’existence d’un réel c ∈ ]a, b[ tel que g  (c) = 0, ce
qui équivaut à :

n
f (k) (c) k−1

n
f (k+1) (c) k λ n
(b − c) − (b − c) + (b − c) = 0
(k − 1)! k! n!
k=1 k=0

(n+1)
ou encore à λ = f (c) . L’égalité g (a) = g (b) = 0 donne alors le résultat. 
Dans le cas où a = 0 cette formule est appelée formule de Mac-Laurin.
Pour n = 0 on retrouve le théorème des accroissements finis.
Corollaire 10.1. Inégalité de Taylor-Lagrange. Si f est une fonction à
valeurs dans un espace vectoriel normé (E, ·) définie sur un segment [a, b]
non réduit à un point, de classe C n sur ce segment et n + 1 fois dérivable
288 Les formules de Taylor

sur l’intervalle ouvert ]a, b[ avec f (n+1) majorée sur ]a, b[ par une constante
M, on a alors :
 
  n
f (k) (a) 
 k M n+1
f (b) − (b − a)  ≤ (b − a)
 k!  (n + 1)!
k=0

Preuve. Pour E = R, ce résultat est une conséquence immédiate du théorème


précédent.
En désignant par g, h les fonctions définies sur [a, b] respectivement par :


n
f (k) (x) k M n+1
g (x) = f (b) − (b − x) , h (x) = − (b − x)
k! (n + 1)!
k=0

on a :  (n+1) 
f (x) n M
 
g (x) =  (b − x)  ≤ h (x) = (b − x)
n
n!  n!
et l’inégalité généralisée des accroissements finis (théorème 9.18) nous donne :
 
 
n
f (k) (a) 
 k
g (b) − g (a) = f (b) − (b − a) 
 k! 
k=0
M n+1
≤ h (b) − h (a) = (b − a)
(n + 1)!

10.2 Formule de Taylor avec reste intégral


Parfois la formule de Taylor avec reste intégral permet d’obtenir des résultats
plus fins que la formule de Taylor-Lagrange. Cette formule nécessite une hypothèse
supplémentaire de continuité de la dernière dérivée et elle est valable pour les
fonctions à valeurs dans un espace de Banach.
Théorème 10.2.
Soit n ∈ N. Si f est une fonction à valeurs dans un espace de Banach
(E, ·) définie et de classe C n+1 sur un segment [a, b] non réduit à un point,
on a alors :
n  b (n+1)
f (k) (a) k f (t) n
f (b) = (b − a) + (b − t) dt
k! a n!
k=0
Cas des fonctions de plusieurs variables 289


n
f (k) (x) k
Preuve. La fonction g définie sur [a, b] par g (x) = f (b) − (b − x)
k!
k=0
b
étant de classe C 1 sur [a, b] on peut écrire que g (b) − g (a) = g  (t) dt, soit :
a


n 
f (k) (a) k
b
f (n+1) (t) n
−f (b) + (b − a) = − (b − t) dt
k! a n!
k=0

On peut aussi procéder par récurrence sur n ≥ 0. Pour n = 0 c’est la formule :


 b
f  (t) dt = f (b) − f (a)
a

valable pour f  continue (ou plus généralement Riemann-intégrable). En supposant


le résultat acquis au rang n − 1 ≥ 0, une intégration par parties nous donne pour
f de classe C n+1 sur [a, b] :
  n b  b (n)
b
f (n+1) (t) (b − t) f (t)
(b − t) dt = f (n) (t)
n n−1
+ (b − t) dt
a n! n! a a (n − 1)!

et avec l’hypothèse de récurrence :


  f (k) (a) n−1
f (n+1) (t)
n
b
(b − a)
(b − t) dt = −f (n) (a)
n k
+ f (b) − (b − a)
a n! n! k!
k=0

D’où la formule au rang n. 


Cette formule permet de retrouver l’inégalité de Taylor-Lagrange pour f de
classe C n+1 sur [a, b] et à valeurs dans un espace de Banach.

10.3 Cas des fonctions de plusieurs variables


Si f est une fonction définie sur un ouvert de Rn , à valeurs réelles et suffisam-
ment dérivable, en utilisant les formules de Taylor pour la fonction d’une variable
réelle ϕ : t → f (a + th) , on déduit des formules de Taylor pour f en a.
Dans un premier temps, pour simplifier, on s’intéresse aux fonctions de deux
variables réelles.
Théorème 10.3. Taylor-Lagrange

Soient p un entier naturel non nul, U un ouvert non vide de R2 , f une


fonction de classe C p de U dans R, A (a, b) un point de U et M (x, y) un
point de U tel que le segment [AM ] d’extrémités A et M soit contenu dans
290 Les formules de Taylor

U. Il existe un réel θ dans ]0, 1[ tel que :

 i j
(x − a) (y − b) ∂ i+j f
f (x, y) = (a, b)
i!j! ∂xi ∂y j
i+j≤p−1
 (x − a)i (y − b)j ∂ p f
+ (a + θu, b + θv)
i+j=p
i!j! ∂xi ∂y j

Preuve. On note u = x − a, v = y − b et on désigne par ϕ la fonction définie sur


[0, 1] par ϕ (t) = f (a + tu, b + tv) . Cette fonction est de classe C p sur [0, 1] avec
ϕ (0) = f (a, b) , ϕ (1) = f (x, y) , et on peut utiliser la formule de Taylor-Lagrange
relative aux fonctions d’une variable pour écrire que :


p−1 (k)
ϕ (0) ϕ(p) (θ)
ϕ (1) = + (10.1)
k! p!
k=0

où θ est un réel dans ]0, 1[ . En notant Mt (a + tu, b + tv) , on vérifie facilement par
récurrence que les dérivées successives de la fonction ϕ sont données par :
⎧ ∂f ∂f

⎪ ϕ (t) = (Mt ) u + (Mt ) v

⎨ ∂x ∂y
⎪  k  ∂ k f

⎪ ϕ(k)
(t) = (Mt ) ui v j (2 ≤ k ≤ p)
⎩ i ∂xi ∂y j
i+j=k

On a donc :
⎧  k! ∂ k f

⎪ (k)
(a, b) ui v j (0 ≤ k ≤ p − 1)

⎪ ϕ (0) =
⎨ i+j=k
i!j! ∂xi ∂y j

⎪  p! ∂ p f

⎪ ϕ(p)
(θ) = (Mθ ) ui v j
⎩ i!j! ∂x i ∂y j
i+j=p

L’égalité (10.1) s’écrit alors :


⎛ ⎞

p−1  1 ∂kf  1 ∂pf
f (x, y) = ⎝ (a, b) u i j⎠
v + (Mθ ) ui v j
i!j! ∂xi ∂y j i+j=p
i!j! ∂x i ∂y j
k=0 i+j=k

ou encore :
 i j
(x − a) (y − b) ∂ i+j f
f (x, y) = (a, b)
i!j! ∂xi ∂y j
i+j≤p−1
 (x − a)i (y − b)j ∂ p f
+ (a + θu, b + θv) .
i+j=p
i!j! ∂xi ∂y j


Cas des fonctions de plusieurs variables 291

Comme dans le cas du théorème de Rolle, cette formule n’est plus valable pour
les fonctions à valeurs dans Rq où q ≥ 2.
En munissant R2 de la norme (x, y) → (x, y) = max (|x| , |y|) (ou de n’importe
quelle autre norme), le théorème précédent nous fournit un développement limité
de f à l’ordre p au voisinage de (a, b) .

Corollaire 10.2. Taylor-Young. Avec les mêmes hypothèses que dans le


théorème précédent, on désigne par B une boule ouverte centré en A (a, b)
et de rayon r > 0 contenue dans U. Il existe alors une fonction ε : B → R
telle que lim ε (x, y) = 0 et pour tout (x, y) dans B on ait :
(x,y)→(a,b)

 (x − a)i (y − b)j ∂ i+j f p


f (x, y) = (a, b) + (x − a, y − b) ε (x, y)
i!j! ∂xi ∂y j
i+j≤p

Preuve. En reprenant les notations utilisées dans la démonstration du théorème


précédent, on écrit que ϕ(p) (θ) = ϕ(p) (0) + ϕ(p) (θ) − ϕ(p) (0) avec :
 p  ∂ p f ∂pf
ϕ(p) (θ) − ϕ(p) (0) ≤
i j
i j
(Mθ ) − i ∂y j
(A) |u| |v|
i+j=p
i ∂x ∂y ∂x

En remarquant que pour i, j entiers naturels tels que i + j = p, on a :


i j i j p
|u| |v| ≤ (u, v) (u, v) = (u, v) ,

on obtient :
 p  ∂ p f ∂pf
ϕ(p) (θ) − ϕ(p) (0) ≤ (u, v)
p
(Mθ ) − (A)
i+j=p
i ∂xi ∂y j ∂xi ∂y j

et en posant :
⎧ (p) (p)
⎨ ϕ (θ) − ϕ (0) pour (x, y) = (a, b)

p
ε (x, y) = (u, v)


0 pour (x, y) = (a, b)

la continuité des dérivées partielles d’ordre p nous donne lim ε (x, y) = 0 et


(x,y)→(a,b)
la formule de Taylor-Young. 
Cette formule est le plus souvent utilisée pour p = 2. En utilisant les notations
de Monge :

⎪ ∂f ∂f
⎪ p=
⎨ (a, b) , q = (a, b)
∂x ∂y

⎪ ∂2f ∂2f ∂2f
⎩ r= 2
(a, b) , s = (a, b) , t = (a, b)
∂x ∂x∂y ∂y 2
on a pour f de classe C 2 au voisinage de (a, b) :
1 # $
2
f (x, y) = f (a, b) + pu + qv + ru2 + 2suv + tv 2 + o (u, v)
2
292 Les formules de Taylor

toujours avec u = x − a et v = y − b.
Dans le cas des fonction de n variables de classe C 2 et à valeurs réelles, on a le
résultat suivant, où df (a) désigne la différentielle de f en a, c’est-à-dire la forme
linéaire définie sur Rn par :
n
∂f
∀h ∈ Rn , df (a) (h) = (a) hi
i=1
∂xi

et d2 f (a) désigne la forme quadratique définie sur Rn par :


n
∂2f  ∂2f
∀h ∈ Rn , d2 f (a) (h) = (a) h2i + 2 (a) hi hj
∂x2i ∂xi ∂xj
i=1 1≤i<j≤n

La matrice de cette forme quadratique est la matrice hessienne de f en a.


Théorème 10.4. Taylor-Young

Soient U un ouvert de Rn , f une fonction de classe C 2 de U dans R et


a un point de U. Pour x voisin de a dans U, on a :
1 # $
2
f (x) = f (a) + df (a) (x − a) + d2 f (a) (x − a) + o x − a
2

On a vu que si f admet un extremum relatif en a, alors df (a) = 0. Et récipro-


quement si df (a) = 0 (on dit alors que a est un point critique de f ), c’est l’étude
du signe de la forme quadratique d2 f (a) qui va nous renseigner sur le signe de
f (x) − f (a) pour x voisin de a (théorème 10.7).

10.4 Applications des formules de Taylor


10.4.1 Développements limités
Dans le cas des fonctions d’une variable réelle à valeurs réelles, la formule de
Taylor-Lagrange nous permet d’obtenir le résultat suivant.
Théorème 10.5. Taylor-Young

Soient f une fonction à valeurs réelles définie sur un intervalle I et a est


un point intérieur à I. Si f est dérivable à l’ordre n ≥ 1 en a, elle admet
alors, au voisinage de a, le développement limité d’ordre n :

n
f (k) (a) k n
f (x) = (x − a) + o ((x − a) )
k!
k=0

Preuve. Voir le théorème 11.3. 


L’étude des développements limités est faite au chapitre suivant.
Applications des formules de Taylor 293

10.4.2 Problèmes d’extrema


Dans un premier temps, on s’intéresse aux fonctions d’une variable réelle à
valeurs réelles.
On sait que si une fonction dérivable f : I → R admet un extremum local en un
point a intérieur au domaine de définition, on a alors f  (a) = 0, la réciproque étant
fausse comme le montre l’exemple de la fonction x3 au voisinage de 0. L’utilisation
de la formule de Taylor-Lagrange permet de donner une condition nécessaire et
suffisante d’extremum.
Théorème 10.6.
Soient f une fonction à valeurs réelles définie sur un intervalle ouvert I,
de classe C n avec n ≥ 2 et a dans I tel que f (k) (a) = 0 pour tout k compris
entre 1 et n − 1 et f (n) (a) = 0. La fonction f admet un maximum [resp.
minimum] local en a si, et seulement si, n est pair et f (n) (a) < 0 [resp.
f (n) (a) > 0].

Preuve. Soit η > 0 tel que ]a − η, a + η[ ⊂ I. Pour tout réel h tel que |h| < η il
existe un réel θ ∈ ]0, 1[ tel que :


n−1
f (k) (a) k f (n) (a + θh) n f (n) (a + θh) n
f (a + h) = f (a) + h + h = f (a) + h
k! n! n!
k=1

Si f (n) (a) < 0, du fait de la continuité de f (n) , on peut choisir η assez petit de
sorte que f (n) (x) < 0 pour tout x ∈ ]a − η, a + η[ et f (a + h) − f (a) et de signe
contraire à celui de hn . Il en résulte que pour n pair f admet un maximum local
en a et pour n impair on a f (a + h) > f (a) si h < 0, f (a + h) < f (a) si h > 0,
ce qui signifie qu’il n’y a pas d’extremum local en a.
Pour f (n) (a) > 0 le raisonnement est analogue. 
Dans le cas n = 2, si f  (a) = 0 et f  (a) = 0, on a donc :

(f  (a) < 0) ⇒ (maximum local en a)


(f  (a) > 0) ⇒ (minimum local en a)

Dans le cas des fonctions de plusieurs variables, la formule de Taylor-Young


nous permet d’obtenir le résultat suivant.
Théorème 10.7.

Soient U un ouvert de Rn , f une fonction de classe C 2 de U dans R et


a un point critique de f (c’est-à-dire un point de U tel que df (a) = 0).
Si la forme quadratique d2 f (a) est définie positive [resp. négative], f admet
alors un minimum [resp. maximum] local strict en a.
Si la forme quadratique d2 f (a) est de signature (p, q) avec p > 0 et q > 0,
alors a n’est pas un extremum local de f.

Preuve. Pour tout x dans une boule ouverte B (a, r) de centre a et de rayon
r > 0 contenue dans U, la formule de Taylor-Young à l’ordre 2 s’écrit, en tenant
294 Les formules de Taylor

compte du fait que a est un point critique de f :


1 2 2
f (x) − f (a) =d f (a) (x − a) + x − a ε (x)
2
avec lim ε (x) = 0, où · est une norme quelconque sur Rn (elles sont toutes
x→a
équivalentes).
Si la forme quadratique d2 f (a) est définie positive, sa forme polaire définit alors
un produit scalaire sur Rn et l’application x → d2 f (a) (x) définit une norme sur
Rn . Cette dernière norme étant équivalente à · , il existe deux constantes α > 0
et β > 0 telles que :
2 2
∀x ∈ Rn , α x ≤ d2 f (a) (x) ≤ β x
α
et pour η ∈ ]0, r[ tel que |ε (x)| < dès que x ∈ U vérifie x − a < η, on a pour
4
tout x dans U tel que 0 < x − a < η :
α 2 α 2 α 2
f (x) − f (a) ≥ x − a − x − a = x − a > 0
2 4 4
ce qui entraîne que f présente en a un minimum local strict.
Dans le cas où d2 f (a) est définie négative, en raisonnant avec −f on se ramène
au cas précédent.
Si d2 f (a) est de signature (p, q) avec p > 0 et q > 0, on peut alors trouver deux
vecteurs h1 et h2 non nul dans Rn tels que d2 f (a) (h1 ) < 0 et d2 f (a) (h2 ) > 0, de
sorte que pour t > 0 assez petit, on aura :


⎪ t2 2
⎨ f (a + th1 ) − f (a) = d f (a) (h1 ) + o (1) < 0
2

⎪ 2
⎩ f (a + th2 ) − f (a) = t d2 f (a) (h2 ) + o (1) > 0
2
et a n’est pas un extremum de f. 
Dans le cas où la forme quadratique d2 f (a) est dégénérée (c’est-à-dire de rang
r < n) de signature (p, q) avec p ou q nul, on ne peut rien dire a priori. Par exemple
pour a = (0, 0) , f (x, y) = x3 + y 3 et g (x, y) = x4 + y 4 , on a df (a) = 0, d2 f (a) = 0
avec a qui n’est pas un extremum de f et dg (a) = 0, d2 g (a) = 0 avec a qui est un
minimum global strict de g.
Dans le cas des fonctions de deux variables réelles, en utilisant les notations de
Monge, la forme quadratique d2 f (a, b) a pour expression :
d2 f (a, b) (u, v) = ru2 + 2suv + tv 2
 
r s
et sa matrice dans la base canonique de R2 est A = . Il en résulte que
s t
si (a, b) est un point critique de f, alors :
— pour r2 − st > 0, la forme quadratique d2 f (a, b) est définie positive [resp.
négative] si r > 0 [resp. r < 0] et f présente un minimum [resp. maximum]
local strict en (a, b) ;
— pour r2 − st < 0, la forme quadratique d2 f (a, b) est de signature (1, 1) et en
(a, b) il n’y a ni maximum ni minimum ;
— pour r2 − st = 0 on ne peut rien dire a priori.
Applications des formules de Taylor 295

10.4.3 Inégalités
L’utilisation de l’inégalité de Taylor-Lagrange permet d’obtenir facilement les
inégalités classiques suivantes :
⎧ 3

⎪ |x|

⎪ ∀x ∈ R, |sin (x) − x| ≤

⎪ 3!



⎪ x 3
|x|
5

⎪ ∀x ∈ R, sin (x) − x + ≤



⎨ 3! 5!
x2
⎪ ∀x ∈ R, |cos (x) − 1| ≤

⎪ 2



⎪ x2 x
⎪ ∀x ∈ R , |e − 1 − x| ≤

+ x
e

⎪ 2




2
⎩ ∀x ∈ R− , |ex − 1 − x| ≤ x
2

10.4.4 Développements en série entières


Pour simplifier, on se place au voisinage de 0.
 f (n) (0)
Si f est une fonction C ∞ au voisinage de 0, la série entière xn peut
n!
être de rayon de convergence nul ou converger vers une autre fonction que le
1
fonction f. Par exemple, la fonction f définie par f (0) = 0 et f (x) = e− x2 pour
x = 0 est indéfiniment dérivable sur R avec toutes ses dérivées en 0 qui sont nulles,
 f (n) (0)
donc la série entière xn converge vers g = 0 = f.
n!
On a toutefois le résultat classique suivant.
Théorème 10.8.
Soit f une fonction de classe C ∞ sur un voisinage ouvert I de 0 et à
valeurs réelles (ou complexes). La fonction f est développable en série en-
tière au voisinage de 0 si, et seulement si, il existe un réel r > 0 tel que
]−r, r[ ⊂ I et la suite de fonctions (Rn )n∈N définie par :


n
f (k) (0)
Rn (x) = f (x) − xk
k!
k=0

+∞ (n)
 f (0)
converge simplement vers 0 sur ]−r, r[ . Dans ce cas f (x) = xn
n=0
n!
pour tout x ∈ ]−r, r[ et le rayon de convergence de cette série entière est
supérieur ou égal à r.

Pour montrer que la suite (Rn )n∈N des restes converge simplement vers 0, on
f (n+1) (θx) n+1
peut utiliser l’expression de Lagrange du reste Rn (x) = x avec
(n + 1)!
296 Les formules de Taylor

0 < θ < 1 ou sa représentation intégrale :


 x (n+1) 
f (t) n xn+1 1 f (n+1) (θx) n
Rn (x) = (x − t) dt = (1 − θ) dθ
0 n! n! 0 n!
Par exemple dans le cas de la fonction exponentielle réelle, on a pour tout réel
x:
eθx n+1 e|x| n+1
|Rn (x)| = |x| ≤ |x| → 0
(n + 1)! (n + 1)! n→+∞

+∞
 1 n
Il en résulte que ex = x pour tout x ∈ R et le rayon de convergence de
n=0
n!
cette série est infini.
À partir de ce résultat on est amené à définir la fonction exponentielle complexe
+∞
 1 n
z
par e = z pour tout z ∈ C.
n=0
n!
Ce exemple est un cas particulier du résultat suivant.

Corollaire 10.3. Soit f une fonction de classe C ∞ sur un voisinage ouvert


I de 0 et à valeurs réelles (ou complexes). S’il existe un réel r > 0 tel que
]−r, r[ ⊂ I et pour tout x dans ]−r, r[ on peut trouver une constante Mx telle
que f (n) (x) ≤ Mx pour tout n ∈ N, cette fonction est alors développable
+∞ (n)
 f (0) n
en série entière sur ]−r, r[ avec f (x) = x .
n=0
n!

Au paragraphe 10.4.8 nous verrons, en application de la formule de Taylor


avec reste intégral, un théorème de Bernstein qui nous donne une autre condition
suffisante pour qu’une fonction de classe C ∞ soit développable en série entière.

10.4.5 Majorations de dérivées


Le résultat classique qui suit utilise la formule de Taylor-Lagrange et le fait que
sur l’espace vectoriel Rn [X] de dimension finie toutes les normes sont équivalentes.
Théorème 10.9.

Si f est une fonction de classe C n+1 , avec n ≥ 1, de R dans R telle que f


et f (n+1) soient bornées sur R, alors toutes les dérivées f (k) , pour k compris
entre 1 et n, sont également bornées sur R.

Preuve. Pour x ∈ R on désigne par Px le polynôme réel de degré au plus égal



n
f (k) (x) k
à n défini par Px (t) = t . Avec la formule de Taylor-Lagrange on peut
k!
k=0
f (n+1) (x + θt) n+1
écrire que Px (t) = f (x + t) − t avec 0 < θ < 1. Si f et f (n+1)
(n + 1)!
sont bornées sur R, on en déduit alors qu’il existe une constante M > 0 telle que :

∀ (x, t) ∈ R × [0, 1] , |Px (t)| ≤ M (10.2)


Applications des formules de Taylor 297


n
Sur Rn [X] on définit des normes en posant pour tout P = ak tk ∈ Rn [X] :
k=0

P ∞ = sup |P (t)| et P  = max |ak |


t∈[0,1] 0≤k≤n

L’espace vectoriel Rn [X] étant de dimension finie, toutes les normes y sont équi-
valentes, il existe donc une constante α > 0 telle que P  ≤ α P ∞ pour tout
P ∈ Rn [X] . De l’inégalité (10.2) on déduit alors que :

f (k) (x)
∀x ∈ R, Px  = max ≤ α Px ∞ ≤ αM
0≤k≤n k!
et :
∀k ∈ {1, · · · , n} , ∀x ∈ R, f (k) (x) ≤ αk!M

c’est-à-dire que toutes les dérivées f (k) , pour k compris entre 1 et n, sont bornées
sur R. 
On peut donner une autre démonstration de ce résultat en utilisant des matrices
de Vandermonde.
Pour tout réel x et tout entier p compris entre 1 et n, la formule de Taylor à
l’ordre n sur l’intervalle [x, x + p] s’écrit :

f (n+1) (x + pθp ) n+1  f (k) (x) k


n
f (x + p) − f (x) − p = p
(n + 1)! k!
k=1

avec 0 < θp < 1, ce qui peut s’écrire matriciellement V (x) = AU (x) , où on a


noté :
⎛ ⎞ ⎛ (1) ⎞
f (n+1) (x + θ1 ) f (x)
⎜ f (x + 1) − f (x) − ⎟
⎜ (n + 1)! ⎟ ⎜ 1! ⎟
⎜ . ⎟ ⎜ ⎟
⎟ , U (x) = ⎜
V (x) = ⎜ .. .. ⎟
⎜ ⎟ ⎜ . ⎟
⎝ ⎝ ⎠
f (n+1)
(x + nθn ) n+1 ⎠ (n)
f (x)
f (x + n) − f (x) − n
(n + 1)! n!
⎛ ⎞
1 1 ··· 1
⎜ 2 22 · · · 2n ⎟
⎜ ⎟
et A = ⎜ . .. .. .. ⎟ . On a alors :
⎝ .. . . . ⎠
2
n n · · · nn

1 1 ··· 1
1 2 ··· 2n−1 (
det (A) = n! .. .. .. .. = n! (i − j) = 0
. . . . 1≤1<j≤n
1 n ··· nn−1
298 Les formules de Taylor

(déterminant de Vandermonde), c’est-à-dire que la matrice


 A est inversible. On
peut donc écrire que U (x) = A−1 V (x) et U (x)∞ ≤ A−1 ∞ V (x)∞ , soit :

f (k) (x)   f (n+1) (x + pθp ) n+1


max ≤ A−1 ∞ max f (x + p) − f (x) − p
1≤k≤n k! 1≤p≤n (n + 1)!
  
  nn+1   (n+1) 
≤ A−1 ∞ 2 f ∞ + f 
(n + 1)! ∞

le réel x étant quelconque. On a donc pour tout entier k compris entre 1 et n :


    
 (k)    nn+1   (n+1) 
f  ≤ k! A−1 ∞ 2 f ∞ + f 
∞ (n + 1)! ∞

Les inégalités de Kolmogorov qui suivent nous donnent une majoration plus
précise.
Dans le cas n = 1 on a le résultat classique suivant.

Lemme 10.1 Si f est une fonction de classe C 2 de R dans R telle que f et f 


soient bornées sur R, alors f  est bornée sur R et on a f  ∞ ≤ 2 f ∞ f  ∞ .

Preuve. Si f  ∞ = 0, f est alors affine. Mais étant bornée elle est nécessai-
rement constante, donc f  = 0 et l’inégalité est triviale. On suppose donc que
f  ∞ > 0.
La formule de Taylor-Lagrange permet d’écrire pour x ∈ R et h > 0 :

⎪ f  (x + θ1 h) 2
⎨ f (x + h) = f (x) + hf  (x) + h
2


⎩ f (x − h) = f (x) − hf  (x) + f (x + θ2 h) h2
2
et en soustrayant ces deux égalités :

f (x + h) − f (x − h) h 
f  (x) = + (f (x + θ2 h) − f  (x + θ1 h))
2h 4
f ∞ h f  ∞
Il en résulte que |f  (x)| ≤ + et en conséquence :
h 2
f ∞ h f  ∞
∀h > 0, f  ∞ ≤ ϕ (h) = +
h 2
L’étude des variations
 de la fonction ϕ nous montre que cette fonction atteint son
2 f ∞
minimum en et que ce minimum vaut 2 f ∞ f  ∞ . D’où le résultat.
f  ∞

Théorème 10.10. Kolmogorov

Si f est une fonction de classe C n+1 de R dans R, où n est un entier


naturel non nul, telle que f et f (n+1) soient bornées sur R, alors toutes les
Applications des formules de Taylor 299

dérivées f (k) , pour k compris entre 1 et n, sont bornées sur R avec :


    k
 (k)  k(n+1−k) k
1− n+1  (n+1)  n+1
f  ≤2 2 f ∞ f  (10.3)
∞ ∞

Preuve. On procède par récurrence sur n ≥ 1. Pour n = 1 c’est le lemme


précédent. On supposant le résultat acquis&pour n − 1 ≥ 1 et en appliquant le
     
lemme précédent à f (n−1) , on a f (n) ∞ ≤ 2 f (n−1) ∞ f (n+1) ∞ . En utilisant
  1  1− n1
l’hypothèse de récurrence, on a f (n−1) ∞ ≤ 2 2 f ∞ n  (n) 
n−1
f ∞
, ce qui donne
avec l’inégalité précédente :
       1− n1  
 (n) 2    (n+1)  n+1 1    (n+1) 
f  ≤ 2 f (n−1)  f  ≤2 2 f ∞
n
f (n)  f 
∞ ∞ ∞ ∞ ∞
 
Si f (n) ∞ = 0, alors f est un polynôme de degré au plus égal à n borné sur R,
c’est donc une constante
 et les
 inégalités de Kolmogorov sont trivialement vérifiées.
On suppose donc que f (n) ∞ > 0 et on déduit de l’inégalité précédente que :
  1  
 (n) 1+ n n+1 1  
f  ≤ 2 2 f ∞
n
f (n+1) 
∞ ∞

soit :     n
 (n)  n 1  (n+1)  n+1
f  ≤ 2 2 f ∞
n+1
f 
∞ ∞

c’est-à-dire (10.3) pour k = n. En utilisant l’hypothèse de récurrence, pour k


compris entre 1 et n − 1, on a :
   k
 (k)  k(n−k) k
1− n  (n)  n
f  ≤2 2 f ∞ f 
∞ ∞
  k
n(n+1)  (n+1)  n+1
k(n−k) k k
1− n k
≤2 2 f ∞ 2 f ∞
2 f 

  1− k   k
soit f (k) ∞ ≤ 2 f ∞ n+1 f (n+1) ∞ , c’est-à-dire les inégalités de Kol-
k(n+1−k)
n+1
2

mogorov. 

10.4.6 Majoration de l’erreur dans les méthodes de Newton


et de Lagrange
Voir les théorèmes 12.11 et 12.13.

10.4.7 Estimation de l’erreur dans la méthode des rectangles


À toute fonction f ∈ C 0 ([0, 1] , R) on associe la suite de ses sommes de Riemann
définie par :
n−1  
1 k
∀n ≥ 1, Sn (f ) = f
n n
k=0
300 Les formules de Taylor

Théorème 10.11.

Pour toute fonction f ∈ C 3 ([0, 1] , R) on a le développement asympto-


tique :
 1  
1 1   1
Sn (f ) = f (t) dt − (f (1) − f (0)) + 2
(f (1) − f (0)) + O
0 2n 12n n3

 
k k+1
Preuve. La formule de Taylor-Lagrange en t ∈ , s’écrit :
n n
       2    3
k k  k 1 k  k 1 k
f (t) = f + t− f + t− f + t− f  (ck )
n n n 2 n n 3! n

ce qui donne :
       2  
λ k k k 1 k k λ
− ≤ f (t) − f − t− f − t− f  ≤ 3
n3 n n n 2 n n n

1 k k+1
où λ = sup |f  (t)| . En intégrant de à , on obtient :
3! t∈[0,1] n n
 k+1      
λ n 1 k 1  k 1 1  k λ
− 4 ≤ f (t) dt − f − 2f − f ≤ 4
n k
n
n n 2n n 3! n3 n n

et en sommant les inégalités obtenues :


 1
1 1 λ
f (t) dt − Sn (f ) − Sn (f  ) − 2 Sn (f  ) ≤ 3
0 2n 6n n

C’est-à-dire que :
 1  
1 1 1
Sn (f ) = f (t) dt − Sn (f  ) − 2 Sn (f  ) + O
0 2n 6n n3

Un raisonnement analogue appliqué à f  et f  donne :


 1  
1 1
Sn (f  ) = f  (t) dt − Sn (f  ) + O
0 2n n2
 
1 1
= f (1) − f (0) − Sn (f  ) + O
2n n2
 1    
1 1
Sn (f  ) = f  (t) dt + O = f  (1) − f  (0) + O
0 n n
Et en définitive :
 1  
1 1   1
Sn (f ) = f (t) dt − (f (1) − f (0)) + 2
(f (1) − f (0)) + O 3
0 2n 12n n
Applications des formules de Taylor 301


1
Par exemple, pour f (t) = , on obtient :
1+t
2n−1
  
1 1 1 1
= ln (2) + + +O
k 4n 16n2 n3
k=n

1
et pour f (t) = α avec α > 0, α = 1 :
(1 + t)
2n−1
        
1 1 1 1 1 α 1 1
nα−1 = −1 − − 1 + 1 − +O
kα 1−α 2α−1 2n 2α 12n2 2α+1 n3
k=n

10.4.8 Un théorème de Bernstein


1
On a vu avec l’exemple de la fonction f définie par f (0) = 0 et f (x) = e− x2
pour x = 0 qu’une fonction indéfiniment dérivable sur R n’est pas nécessairement
développable en série entière. Le théorème de Bernstein qui suit nous dit qu’avec
l’hypothèse supplémentaire de positivité des dérivées d’ordres pairs de la fonction
f, on est assuré du développement en série entière.

Lemme 10.2 Soit f une fonction à valeurs réelles de classe C ∞ sur ]−a, a[ avec
a > 0. Si f est paire et f (2k) (x) ≥ 0 pour tout entier naturel k et tout x ∈ ]−a, a[ ,
elle est alors développable en série entière sur ]−a, a[ .

Preuve. Pour tout entier naturel n et tout x ∈ ]−a, a[ on note :


n
f (k) (0)
Pn (x) = xk , Rn (x) = f (x) − Pn (x)
k!
k=0

Il s’agit alors de montrer que lim Rn (x) = 0 pour tout x ∈ ]−a, a[ .


n→+∞
Avec la parité de la fonction f on déduit que f (2k+1) (0) = 0 pour tout k ≥ 0
et avec la positivité des f (2k) que :

n
f (2k) (0)
∀x ∈ ]−a, a[ , P2n (x) = x2k ≥ 0, R2n (x) ≤ f (x)
(2k)!
k=0

D’autre part, avec la formule de Taylor avec reste intégral on peut écrire pour tout
x ∈ ]0, a[ :
 2n  1
x
(x − t) x2n+1 2n
R2n (x) = f (2n+1) (t) dt = (1 − u) f (2n+1) (xu) du
0 (2n)! (2n)! 0

et avec la croissance de f (2n+1) (du fait que f (2n) ≥ 0) on a pour tous r ∈ ]0, a[ ,
x ∈ ]0, r[ , u ∈ [0, 1] :

0 = f (2n+1) (0) ≤ f (2n+1) (xu) ≤ f (2n+1) (ru)


302 Les formules de Taylor

ce qui entraîne :
 1
x2n+1 2n x2n+1 x2n+1
0 ≤ R2n (x) ≤ (1 − u) f (2n+1) (ru) du = R 2n (r) ≤ f (r)
(2n)! 0 r2n+1 r2n+1

Il en résulte que lim R2n (x) = 0 pour tout x ∈ ]0, a[ et par parité le résultat
n→+∞
est également vrai sur ]−a, a[ . Enfin avec P2n (x) = P2n+1 (x) , on déduit que
R2n (x) = R2n+1 (x) et lim Rn (x) = 0 pour tout x ∈ ]−a, a[ . 
n→+∞

Théorème 10.12. Bernstein


Soit f une fonction à valeurs réelles de classe C ∞ sur ]−a, a[ avec a > 0.
Si f (2k) (x) ≥ 0 pour tout entier naturel k et tout x ∈ ]−a, a[ , f est alors
développable en série entière sur ]−a, a[ .

Preuve. On se ramène aux hypothèses du lemme précédent en introduisant la


fonction g définie sur ]−a, a[ par g (x) = f (x) + f (−x) . Cette fonction est de
classe C ∞ , paire avec g (2k) (x) = f (2k) (x) + f (2k) (−x) ≥ 0 sur ]−a, a[ .
En notant Rn,f [resp. Rn,g ] le reste intégral dans la formule de Taylor à l’ordre
n pour f [resp. g], on a pour tous x ∈ ]−a, a[ , u ∈ [0, 1] :

0 ≤ f (2n) (xu) ≤ g (2n) (xu) = g (2n) (|x| u)

et :
 1
x2n 2n−1
0 ≤ |R2n−1,f (x)| = (1 − u) f (2n) (xu) du ≤ R2n−1,g (x)
(2n − 1)! 0

En utilisant le lemme précédent, on déduit donc que lim R2n−1,f (x) = 0 pour
n→+∞
tout x ∈ ]−a, a[ , puis avec :

f (x) = P2n,f (x) + R2n,f (x) = P2n−1,f (x) + R2n−1,f (x)

on déduit que :

f (2n) (0) 2n 1 g (2n) (0) 2n


R2n,f (x) = − x + R2n−1,f (x) = − x + R2n−1,f (x)
(2n)! 2 (2n)!

g (2n) (0) 2n
et avec lim x = 0 (convergence de la série de Taylor de la fonction
n→+∞ (2n)!
paire g), on a lim R2n,f (x) = 0 pour tout x ∈ ]−a, a[ . D’où le résultat. 
n→+∞
Dans le cas particulier où toutes les dérivées de f sont positives, on peut donner
une démonstration plus simple du théorème de Bernstein.
Théorème 10.13. Bernstein
Soit f une fonction à valeurs réelles de classe C ∞ sur ]−a, a[ avec a > 0.
Si f (k) (x) ≥ 0 pour tout entier naturel k et tout x ∈ ]−a, a[ , f est alors
développable en série entière sur ]−a, a[ .
Exercices 303

Preuve. Pour r ∈ ]0, a[ fixé et x ∈ ]0, r[ on a pour tout entier naturel n, en


gardant les notations qui précèdent :
 x n  x n  n
(x − t) (n+1) (r − t) (n+1) x−t
Rn (x) = f (t) dt = f (t) dt
0 n! 0 n! r−t
x−t
La fonction ϕ : t → étant décroissante sur [0, x] , on en déduit que :
r−t
x
∀t ∈ [0, x] , 0 = ϕ (x) ≤ ϕ (t) ≤ ϕ (0) =
r
et : # x $n 
(r − t) (n+1)
r n # x $n
0 ≤ Rn (x) ≤ f (t) dt = Rn (r)
r 0 n! r
x
avec Rn (r) = f (r) − Pn (r) ≤ f (r) . Avec 0 < < 1, on en déduit alors que
r
lim Rn (x) = 0.
n→+∞
Pour x ∈ ]−a, 0[ , en écrivant x = −x avec x ∈ ]0, a[ , le changement de variable
u = −t donne, en tenant compte de 0 ≤ f (n+1) (−u) ≤ f (n+1) (u) (l’inégalité
f (n+2) ≥ 0 entraîne f (n+1) croissante) :
 x  x
(x − u) (n+1) (x − u) (n+1)
n n
|Rn (x)| = f (−u) du ≤ f (u) du = Rn (x )
0 n! 0 n!
et lim Rn (x) = 0. Pour x = 0, on a Rn (0) = 0. 
n→+∞

10.5 Exercices

Exercice 10.1. Soient n un entier naturel non nul et (αk )0≤k≤n


une suite de réels deux à deux distincts. Montrer que pour tout
polynôme P ∈ Rn [X] de degré n, la famille de polynômes
{Pk | Pk (X) = P (X + αk ) , 0 ≤ k ≤ n} est une base de Rn [X] .

Solution. Pour P de degré n, la famille P (j) est échelonnée en degrés et


0≤j≤n
n
il est facile de vérifier que c’est une base de Rn [X] . En effet, si P (X) = ak X k
k=0
alors la matrice de ce système dans la base canonique de Rn [X] est triangulaire
n!
supérieure avec les an pour éléments diagonaux. Avec la formule de Taylor-
(n − j)!
n
αkj (j)
Lagrange, on a Pk (x) = P (x + αk ) = P (x) , c’est à dire que la matrice
j!
 j=0 
1 (j)
du système (Pk )0≤k≤n dans la base P est la matrice de Vandermonde
j!
## $$ 0≤j≤n
An = αkj . Dans le cas particulier où les αi sont deux à deux distincts
0≤j,k≤n
304 Les formules de Taylor
(
cette matrice est inversible (det (An ) = (αk − αi ) = 0) et en conséquence
0≤i<k≤n
(Pk )0≤k≤n est une base de Rn [X] .

Exercice 10.2. Soit f une fonction deux fois dérivable de R dans R telle
f (x)
que lim = 0. Montrer qu’il existe un réel c tel que f  (c) = 0.
|x|→+∞ x

Solution. Pour f  = 0, f est constante et le résultat est trivial. On suppose donc


que f  = 0 et on se donne un réel a tel que f  (a) = 0. Supposons f  (a) > 0.
Si f  (a) = 0 c’est terminé. On suppose donc que f  (a) = 0. Avec la formule
de Taylor-Lagrange à l’ordre 2, on peut écrire pour tout réel x = a, f (x) =
f  (cx ) 2
f (a) + f  (a) (x − a) + (x − a) , où cx est un réel compris entre a et x.
2
2
f (x) f  (cx ) (x − a)
De lim = 0, on déduit que lim = −f  (a) , ou encore
|x|→+∞ x x→+∞ 2 x
f  (cx )
lim (x − a) = −f  (a) . On peut donc trouver c1 tel que f  (c1 ) < 0. De
x→+∞ 2
f (x) f  (cx )
même avec lim = 0, on déduit que lim (x − a) = −f  (a) et il
x→−∞ x x→−∞ 2
existe un réel c2 tel que f  (c2 ) < 0. Le théorème de Darboux nous assure alors
l’existence d’un réel c compris entre c1 et c2 tel que f  (c) = 0.

Exercice 10.3. Soit f : R+ → R deux fois dérivable de dérivée seconde


bornée. Montrer que si lim f (x) = 0, on a alors lim f  (x) = 0.
x→+∞ x→+∞

Solution. On note M = sup |f  (x)| . La formule de Taylor-Lagrange nous


x∈R+
f  (x + θh h) 2
permet d’écrire pour x > 0 et h > 0, f (x + h) = f (x) + hf  (x) + h
2
f (x + h) − f (x) h
avec 0 < θh < 1. On en déduit alors que |f  (x)| ≤ +M .
h 2
Comme lim f (x) = 0, on peut trouver, pour tout réel ε > 0, un réel a > 0 tel
x→+∞
que |f (x)| < ε pour tout x > a et on a :

ε h
∀x > a, ∀h > 0, |f  (x)| ≤ ϕ (h) = 2 +M
h 2
L’étude des variations de la fonction
5 ϕ sur ]0, +∞[ nous montre que cette fonc-
ε √
tion atteint son minimum en 2 et que ce minimum vaut 2 εM . On déduit
M √ √
alors de l’inégalité précédente que |f  (x)| ≤ 2 M ε pour tout x > a, ce qui
prouve que lim f  (x) = 0.
x→+∞
Exercices 305

Exercice 10.4. Soient f une fonction de classe C n+1 à valeurs réelles


définie sur un intervalle ouvert I et a est un point de I. Pour tout réel
h ∈ ]0, b − a[ , on désigne par θh un réel dans ]0, 1[ tel que :


n
f (k) (a) hn+1 (n+1)
f (a + h) = hk + f (a + θh h) (10.4)
k! (n + 1)!
k=0

Montrer que si f est dérivable à l’ordre n + 2 en a avec f (n+2) (a) non nul,
1
on a alors lim θh = .
h→0 n+2

Solution. En utilisant la formule de Taylor-Young, on a :



n+2
f (k) (a) k
f (a + h) = h + o hn+2
k!
k=0

et avec la formule de Taylor-Lagrange (10.4) , on déduit par soustraction que :


# $ hn+1 f (n+2) (a) n+2
f (n+1) (a + θh h) − f (n+1) (a) = h + o hn+2
(n + 1)! (n + 2)!
soit :
f (n+1) (a + θh h) − f (n+1) (a) f (n+2) (a)
θh = + o (1)
θh h n+2
et avec f (n+2) (a) = 0, on déduit que pour h voisin de 0, on a :
f (n+2) (a)
n+2 + o (1) 1
θh = →
f (n+1) (a+θh h)−f (n+1) (a) h→0 n+2
θh h

Exercice 10.5. Montrer que pour tout réel λ ∈ ]−1, 1[ , la fonction f


+∞

définie sur R par f (x) = sin (λn x) est développable en série entière et
n=0
préciser ce développement ainsi que son rayon de convergence.

+∞

n
Solution. Avec |sin (λn x)| ≤ |λ| |x| et |λ| < 1, on déduit que la série sin (λn x)
n=0
est uniformément convergente sur tout compact de R et sa somme f définie une
fonction continue sur R. En notant fn (x)#= sin (λn x)$, on a pour tout naturel non
(k) π nk
nul k et tout réel x, fn (x) = λnk sin λn x + k ≤ |λ| , ce qui entraîne la
2
+∞
 (k)
convergence uniforme sur R de la série fn . La fonction f est donc indéfiniment
n=0
dérivable sur R avec, pour tout k ≥ 1 et tout x ∈ R :
+∞
 # π$
+∞
 1 1
f (k) (x) =
nk
λnk sin λn x + k ≤ |λ| = ≤
n=0
2 n=0 1 − |λ|
k 1 − |λ|
306 Les formules de Taylor

Les dérivées successives de f étant uniformément majorées sur R, on en déduit


que f est développable en série entière de rayon de convergence infini avec :
 +∞ 
+∞ (k)
 +∞
f (0) k  1  nk # π$
f (x) = x = λ sin k xk
k! k! n=0 2
k=0 k=0

Pour k pair, on a f (k) (0)) = 0 et pour k = 2p + 1 impair, on a :


+∞
 p
(−1)
f (2p+1) (0) =
p
(−1) λn(2p+1) =
n=0
1 − λ2p+1

+∞
 p
1 (−1)
ce qui donne en définitive f (x) = 2p+1
x2p+1 .
p=0
(2p + 1)! 1 − λ
Chapitre 11

Développements limités

I désigne un intervalle réel non réduit à un point, a un point de I ou du bord


de I (a est dans l’adhérence I de I), f une fonction définie sur I à valeurs réelles
ou complexes et n un entier naturel.
On note Kn [X] l’espace vectoriel des polynômes de degré au plus égal à n à
coefficients dans K = R ou C.
Dans un premier temps, on suppose que a est réel.

Définition 11.1. On dit que f admet un développement limité à l’ordre n


en a s’il existe un polynôme P dans Kn [X] et une fonction ε définie sur I
à valeurs réelles ou complexes telles que :
 n
∀x ∈ I, f (x) = P (x − a) + (x − a) ε (x)
lim ε (x) = 0
x→a

En utilisant la notation de Landau, on peut écrire :


n
f (x) = P (x − a) + o ((x − a) )
x→a

On peut aussi considérer le cas où la fonction f est à valeurs dans un espace


vectoriel normé (E, ·) , les polynômes étant à coefficients dans E (voir l’exercice
11.4 pour un exemple d’utilisation).
Théorème 11.1.
Si f admet un développement limité à l’ordre n en a, ce dernier est alors
unique.

Preuve. Il suffit de remarquer que si R ∈ Kn [X] est tel que R (x − a) =


n
o ((x − a) ) , on a alors R = 0. 
x→a

n
k
La fonction polynomiale x → P (x − a) = ak (x − a) est la partie régulière
k=0
(ou principale) d’ordre n du développement limité au voisinage de a et la fonction
n
x → (x − a) ε (x) , le reste d’ordre n.
308 Développements limités

Si f admet un développement limité à l’ordre n en a, elle admet alors un


développement limité à tout ordre p compris entre 0 et n. La partie régulière

p
k
s’obtenant en tronquant le polynôme P à l’ordre p, c’est donc ak (x − a) .
k=0

Exemples 11.1
1. Une fonction polynomiale admet un développement limité à tout ordre en tout
point.
2. Avec 1 − xn+1 = (1 − x) (1 + x + · · · + xn ) , on déduit le développement limité
en 0 :

1 n
x  n
∀x ∈ ]−1, 1[ , = xk + xn = xk + o (xn )
1−x 1−x x→0
k=0 k=0

1
On peut aussi par changement de variable x = s’intéresser aux développe-
t
ments limités à l’infini. Si par exemple I = ]α, +∞[ avec α > 0, dire que f admet
un développement limité d’ordre n à l’infini signifie qu’il existe un polynôme P
dans Kn [X] et une fonction ε définie sur I à valeurs réelles ou complexes telles
que : ⎧  
⎨ ∀x ∈ I, f (x) = P 1 + ε (x) = % ak + ε (x)
⎪ n

x x n k xn
k=0 x

⎩ lim ε (x) = 0
x→+∞

De l’unicité du développement limité d’ordre n en 0, on déduit le résultat sui-


vant.
Corollaire 11.1. Si I est un intervalle centré en 0 et f une fonction paire
[resp. impaire] admettant un développement limité à l’ordre n en 0, sa partie
régulière P est alors paire [resp. impaire].

Des définitions de la continuité et de la dérivabilité en un point, on déduit les


résultats suivants.
Théorème 11.2.
La fonction f est continue (ou se prolonge par continuité) en a si, et
seulement si, elle admet un développement limité d’ordre 0 en a.
La fonction f est dérivable (ou se prolonge en fonction dérivable) en a si,
et seulement si, elle admet un développement limité d’ordre 1 en a.

La fonction f peut très bien admettre un développement limité à l’ordre 2 en


a sans admettre de dérivée seconde  en ce point comme le montre l’exemple de la
1
fonction définie par f (x) = x3 sin pour x = 0 et f (0) = 0 avec a = 0.
x
Le théorème de Taylor-Young 309

11.1 Le théorème de Taylor-Young


On rappelle qu’une fonction f définie dans un voisinage du réel a admet une
dérivée d’ordre n ≥ 2 en a si cette fonction admet des dérivées jusqu’a l’ordre n−1
dans un voisinage de a et si f (n−1) est dérivable en a.
On suppose ici que f est une fonction définie sur un intervalle réel I et que a
est un point intérieur à I.
Théorème 11.3. Taylor-Young

Si f est dérivable à l’ordre n ≥ 1 en a, elle admet alors, au voisinage de


a, le développement limité d’ordre n :

n
f (k) (a) k n
f (x) = (x − a) + o ((x − a) )
k! x→a
k=0


n
f (k) (a) k
Preuve. En définissant la fonction g sur I par g (x) = f (x)− (x − a) ,
k!
k=0
g (x)
il s’agit de montrer que lim n = 0. Pour ce faire on procède par récurrence
x→a (x − a)
sur n ≥ 1. Pour n = 1 le résultat découle de la définition du nombre dérivé f  (a) .
Supposons le résultat acquis pour n − 1 ≥ 1. La fonction g est dérivable dans un
 (f  )(k) (a)
n−1
  k
voisinage J de a avec g (x) = f (x) − (x − a) et l’hypothèse de
k!
k=0
 g  (x)
récurrence appliquée à f nous dit que lim = 0, c’est-à-dire que pour
x→a (x − a)n−1
tout réel ε > 0 il existe un réel η > 0 tel que [a − η, a + η] soit contenu dans J et :
# $
(|x − a| < η) ⇒ |g  (x)| ≤ ε |x − a|
n−1

On a alors :

≤ g  (x) ≤ ε (a − x)
n−1 n−1
∀x ∈ [a − η, a] , −ε (a − x)
≤ g  (x) ≤ ε (x − a)
n−1 n−1
∀x ∈ [a, a + η] , −ε (x − a)
il en résulte que :
⎧ ε ε
⎪ n
⎨ ∀x ∈ [a − η, a] , − (a − x) ≤ g (a) − g (x) ≤ (a − x)
n
n n

⎩ ∀x ∈ [a, a + η] , − ε (x − a)n ≤ g (x) − g (a) ≤ ε n
(x − a)
n n
(on utilise le fait que si u ≤ v  sur [α, β] , alors u (β) − u (α) ≤ v (α) − v (β)),
c’est-à-dire en définitive que :
ε n
∀x ∈ [a − η, a + η] , |g (x)| ≤ |x − a|
n
g (x)
ce qui signifie bien que lim n = 0. 
x→a (x − a)
310 Développements limités

Ce résultat permet d’obtenir les développements limités classiques en 0 :



n
xk
ex = + o (xn )
k! x→0
k=0


n
(−1) x2k
k 
n
(−1) x2k+1
k
cos (x) = + o x2n+1 , sin (x) = + o x2n+2
(2k)! (2k + 1)! x→0
k=0 k=0

α

n
α (α − 1) · · · (α − k + 1) k
(1 + x) = 1 + x + o (xn ) (α ∈ R \ N)
k! x→0
k=1

Le théorème de Taylor-Young n’est pas toujours très pratique pour obtenir


un développement limité étant donné, le plus souvent, la difficulté de calcul des
dérivées successives. Penser par exemple à la fonction arctan .
De plus on a vu qu’une fonction peut très bien admettre un développement
limité d’ordre n ≥ 2 en 0 sans être dérivable à l’ordre 2 en ce point.
Les techniques de calcul qui suivent sont plus efficaces et c’est la connaissance
d’un développement limité qui permet de déduire les dérivées successives en a.
Par exemple, à partir du développement limité à l’ordre 2n de la fonction cos,
on déduit le développement limité en 0 à l’ordre n de la fonction f définie sur R+
√ n k
(−1) xk
par f (x) = cos ( x) , soit f (x) = + o (xn ) et les dérivées en 0 de
(2k)! x→0
k=0
la fonction f sont données par :
k!
∀k ∈ N, f (k) (0) = (−1)
k
(2k)!

11.2 Opérations sur les développements limités


1
En utilisant le changement de variable x = t + a (pour a réel) ou x = (pour
t
a infini) on peut se contenter d’étudier les développement limités en 0.
Pour ce qui est des combinaisons linéaires et du produit des fonctions, on a le
résultat suivant.
Théorème 11.4.
Soient f, g deux fonctions définies dans un voisinage de 0 et admettant
des développements limités en 0 d’ordre n de parties régulières respectives
P et Q et λ, μ des réels. Les fonctions λf + μg et f g admettent alors les
développements limités :

(λf + μg) (x) = λP (x) + μQ (x) + o (xn )
x→0
(f g) (x) = R (x) + o (xn )
x→0

où R ∈ Kn [X] est la troncature de P Q définie par P (x) Q (x) = R (x) +


o (xn ) .
Opérations sur les développements limités 311

Preuve. Pour les combinaisons linéaires, cela se déduit de o (xn ) + o (xn ) =


x→0 x→0
o (xn ) . Pour ce qui est du produit il suffit de remarquer que pour tout polynôme
x→0
P, on a P (x) o (xn ) = o (xn ) et que o (xn ) o (xn ) = o (xn ) , puis en ef-
x→0 x→0 x→0 x→0 x→0
fectuant la division euclidienne de P Q par xn+1 que P (x) Q (x) = R (x)+ o (xn )
x→0
avec R dans Kn [X] . 
Par exemple, à partir des développements limités de la fonction exponentielle,
on déduit les développements des fonctions hyperboliques :

ex + e−x  x2kn
ch (x) = = + o x2n+1
2 (2k)! x→0
k=0

ex − e−x  x2k+1
n
sh (x) = = + o x2n+2
2 (2k + 1)! x→0
k=0
x
e
Pour f (x) = , on obtient :
1+x
1 1 3 11 53 6 103 7 2119 8
f (x) = 1 + x2 − x3 + x4 − x5 + x − x + x + o x8
2 3 8 30 144 280 5760 x→0

Pour la composition des applications, on a le résultat suivant.


Théorème 11.5.
Soient f, g deux fonctions définies dans un voisinage de 0 et admettant
des développements limités en 0 d’ordre n ≥ 1 de parties régulières respec-
tives P et Q avec g à valeurs réelles et g (0) = Q (0) = 0. La fonction f ◦ g
qui est définie au voisinage de 0 admet le développement limité :

(f ◦ g) (x) = R (x) + o (xn )


x→0

où R ∈ Kn [X] est la troncature de P ◦ Q définie par P (Q (x)) = R (x) +


o (xn ) .
x→0

Preuve. Pour x, y voisins de 0, on a f (y) = P (y) + y n η (y) et g (x) = Q (x) +


xn ε (x) avec lim η (y) = 0 et lim ε (x) = 0. Avec g (0) = 0 et la continuité de g
y→0 x→0
n
en 0, on peut écrire, pour x voisin de 0, (f ◦ g) (x) = P (g (x)) + (g (x)) η (g (x)) .
Comme n ≥ 1 et Q (0) = 0, on a g (x) = x Q1 (x) + xn−1 ε (x) avec Q1 dans
n
Rn−1 [X] et (g (x)) = xn ϕn (x) avec ϕn bornée au voisinage de 0. De plus avec
lim g (x) = g (0) = 0 et lim η (y) = 0, on déduit que lim η (g (x)) = 0, de sorte que
x→0 y→0 x→0

n

n
(g (x)) η (g (x)) = xn ε1 (x) avec lim ε1 (x) = 0. D’autre part, si P (y) = ak y k ,
x→0
k=0
312 Développements limités

on a alors :

n
k

n
k
P (g (x)) = ak (g (x)) = ak (Q (x) + xn ε (x))
k=0 k=0

n
k

n 
k
k−j j
= ak (Q (x)) + ak Ckj (Q (x)) xnj (ε (x))
k=0 k=1 j=1
n
= P (Q (x)) + x ε2 (x)

avec lim ε2 (x) = 0. On a donc en définitive (f ◦ g) (x) = P (Q (x)) + o (xn )


x→0 x→0
et par division euclidienne de P (Q (x)) par xn+1 on obtient P (Q (x)) = R (x) +
o (xn ) où le reste R est dans Kn [X] . 
x→0

Exemple 11.1 Si f (x) = sin (sh (x)) − sh (sin (x)) , on a alors :


1 7 1 11
f (x) = − x + x + o x14
45 1575 x→0

On en déduit que f (k) (0) = 0 pour 0 ≤ k ≤ 6 et 8 ≤ k ≤ 14. Sur cet exemple,


l’utilisation de la formule de Taylor-Young n’est pas conseillée.

Le théorème de composition des développements limités peut être utilisé pour


1
obtenir un développement limité de . Précisément si f définie au voisinage de
f
0 avec f (0) = 0 admet un développement limité d’ordre n ≥ 1 en 0 de partie
régulière P, en écrivant f (x) = f (0) (1 − g (x)) avec g (0) = 0, on déduit que
1 1 1
= admet un développement limité d’ordre n en 0 obtenu par
f (x) f (0) 1 − g (x)
1
composition des développements limités des fonctions g et u → .
1−u
Cette méthode permet, de manière plus générale, d’obtenir des développements
limités de (f (x)) avec α ∈ R∗ ou ln (f (x)) pour f telle que f (0) > 0. On écrit
α
α α α
que (f (x)) = (f (0)) (1 − g (x)) [resp. ln (f (x)) = ln (f (0)) + ln (1 − g (x))] et
α
on compose les développements limités en 0 de g et de (1 − u) [resp. ln (1 − u)].

Exemples 11.2 On a :
1 1 5 61 6
= 1 + x2 + x4 + x + o x7
cos (x) 2 24 720 x→0

&  
√ √ 1 5 2 21 3 429 4
1+ 1−x= 2 1− x− x − x − x + o x4
8 128 1024 32 768 x→0

1 1 1
ln (cos (x)) = − x2 − x4 − x6 + o x7
2 12 45 x→0

Le théorème de composition nous permet également d’obtenir les développe-


ments limités d’une fonction réciproque. Si f est une fonction indéfiniment déri-
vable de I (intervalle ouvert contenant 0) dans R de dérivée strictement positive
(ou négative) sur I elle définit alors une bijection de I sur f (I) et sa fonction
Opérations sur les développements limités 313

réciproque est également indéfiniment dérivable. En supposant connu le dévelop-


pement limité de f en 0 à l’ordre n, en écrivant que f −1 (f (x)) = x et en utilisant
l’unicité du développement limité, on peut déduire celui de f −1 dans le cas où
f (0) = 0.

Exemple 11.2 Considérons la fonction f définie par f (x) = x + ln (1 + x) pour


x+2
x > −1. Cette fonction est indéfiniment dérivable avec f  (x) = > 0 pour
1+x
x > −1, lim f (x) = −∞, lim f (x) = +∞, elle réalise donc une bijection de
+
x→−1 +
x→+∞
]−1, +∞[ sur R et sa fonction réciproque f −1 est également indéfiniment dérivable.
En écrivant les développements limités à l’ordre 3 :
⎧ 2 3

⎨ f (x) = 2x − x + x + o x3
2 3 x→0

⎩ f −1 (y) = ay + by 2 + cy 3 + o y 3
y→0

on a :
   2
x2 x3 x2 3
x = f −1 (f (x)) = a 2x − + + b 2x − + c (2x) + o (x3)
2 3 2 x→0
# a$ 2 #a $
= 2ax + 4b − x + − 2b + 8c x3 + o (x3)
2 3 x→0

et par unicité du développement limité à l’ordre 3 en 0, on déduit que :


a a
2a = 1, 4b − = 0, − 2b + 8c = 0
2 3
x x2 x3
ce qui donne f −1 (x) = + − + o x3 .
2 16 192 x→0
f
Le développement d’un quotient , avec g (0) = 0, peut s’obtenir en écrivant
g
f (x) 1
que = f (x) , où h (0) = 0. Par exemple pour la fonction tan,
g (x) g (0) (1 − h (x))
on obtient :
1 2 17 7
tan (x) = x + x3 + x5 + x + o x8
3 15 315 x→0

On peut également utiliser le théorème de division des polynômes suivant les


puissances croissantes.
Théorème 11.6.
Si P, Q sont deux polynômes à coefficients réels avec Q (0) = 0 et n un
entier naturel, il existe alors un unique couple (K, R) de polynômes tels que
P = QK + xn+1 R avec R de degré au plus égal à n.

On dit que K est le quotient et R le reste dans la division suivant les puissances
croissantes à l’ordre n de P par Q.
314 Développements limités

Exemple 11.3 Pour P (x) = 2x + 3x2 − x3 , Q (x) = 1 + 2x − x3 et n = 4, on


obtient P (x) = Q (x) 2x − x2 + x3 + x5 (−1 + x) et :

P (x)
= 2x − x2 + x3 + o x5
Q (x)

Théorème 11.7.
Soient f, g deux fonctions définies dans un voisinage de 0 et admettant
des développements limités en 0 d’ordre n de parties régulières respectives
f
P et Q avec g (0) = Q (0) = 0. La fonction qui est définie au voisinage de
g
0 admet un développement limité en 0 d’ordre n de partie régulière K égale
au quotient dans la division suivant les puissances croissantes à l’ordre n
de P par Q.

Preuve. Au voisinage de 0, on a :

f (x) P (x) + xn ε1 (x) K (x) Q (x) + xn+1 R (x) + xn ε1 (x)


= n
=
g (x) Q (x) + x ε2 (x) Q (x) + xn ε2 (x)
−ε2 (x) K (x) + xR (x) + ε1 (x)
= K (x) + xn = K (x) + o (xn ) .
Q (x) + xn ε2 (x) x→0

Exemple 11.4 En effectuant la division suivant les puissances croissantes de la


partie régulière d’ordre 7 du développement limité en 0 à l’ordre 7 de la fonction
sin par celle de cos, on retrouve le développement limité de tan :
1 2 17 7
tan (x) = x + x3 + x5 + x + o x8
3 15 315
Dans le cas des fonctions de classe C 1 , on a le résultat suivant conséquence du
théorème des accroissements finis.
Théorème 11.8.

Soit f une fonction de classe C 1 au voisinage de 0. Si la fonction dérivée



f admet un développement limité d’ordre n en 0 de partie régulière P, alors
f admet un développement limité d’ordre n + 1 de partie régulière Q égale
à la primitive de P qui vaut f (0) en 0, soit :


⎪ n
⎪ f  (x) =
⎪ ak xk + o (xn )

⎨ x→0
k=0

⎪ 
n


ak k+1
+ o xn+1

⎩ f (x) = f (0) + x
k+1 x→0
k=0

Preuve. On a f  (x) = P (x)+xn ε (x) . La fonction f  étant continue au voisinage


de 0, il en est de même de xn ε (x) et cette fonction admet des primitives. On
Utilisation des développements limités 315

désigne par ϕ la primitive xn ε (x) nulle en 0 et par Q celle de P valant f (0) en


0. La fonction Q + ϕ est alors une primitive de f  et sa valeur en 0 est f (0) , on
a donc f = Q + ϕ et il s’agit de montrer que ϕ est négligeable devant xn+1 . En
utilisant le théorème des accroissements finis, on peut écrire pour x = 0 dans I,
ϕ (x) = xϕ (θx x) avec 0 < θx < 1, soit :
n
ϕ (x) = x (θx x) ε (θx x) = xn+1 ε1 (x)
avec lim ε1 (x) = 0 du fait que |ε1 (x)| < |ε (θx x)| . D’où le résultat. 
x→0
Par exemple pour f (x) = ln (1 + x) , on a :
1  n
 k
f (x) = = (−1) xk + o (xn )
1+x x→0
k=0

ce qui donne par intégration :



n
(−1)
k
ln (1 + x) = xk+1 + o xn+1
k+1 x→0
k=0

1
De manière analogue, avec arctan (x) = , on déduit les développements
1 + x2
limités de arctan (x) en 0.
Pour ce qui est de la dérivation, en général il n’est pas possible de dériver un 
3 1
développement limité. Par exemple la fonction f définie par f (x) = x sin
x
pour x = 0 et f (0) = 0 admet un développement d’ordre 2 en 0 de  partie régulière
 
2  2 1 1
nulle (f (x) = o x ) mais sa dérivée, définie par f (x) = 3x sin −x cos
x x
pour x = 0 et f  (0) = 0, n’est pas dérivable en 0 et en conséquence n’a pas de
développement limité d’ordre 1 en 0. Toutefois, on a le résultat suivant conséquence
immédiate du théorème précédent et de l’unicité du développement limité d’ordre
n en 0.
Théorème 11.9.

Soit f une fonction de classe C 1 au voisinage de 0. Si f et f  admettent


des développements limités d’ordre n et n − 1 en 0 de parties régulières
respectives P et Q, on a alors Q = P  .

Par exemple si f admet une dérivée d’ordre n ≥ 1 en 0, le théorème de Taylor-


Young nous assure alors de l’existence des développements limités en 0 de f et f  ,
et le théorème s’applique.
1
Des développements limités de en 0 on déduit par dérivation ceux de
1−x
1
2.
(1 − x)

11.3 Utilisation des développements limités


On peut utiliser les développements limités dans les situations suivantes.
316 Développements limités

11.3.1 Étude de suites et de séries


Si f admet un développement limité à l’ordre n en a de partie régulière P nulle,
n
on a alors f (x) = o ((x − a) ) . Si la partie régulière P n’est pas le polynôme
x→a
nul, en désignant par p sa valuation (le plus petit indice compris entre 0 et n tel
p
que ap = 0), f (x) est alors équivalent à ap (x − a) au voisinage de a et la fonction
f (x)
p se prolonge en une fonction continue en a.
(x − a)
On a par exemple au voisinage de 0 :

x2
ex − 1  x, sin (x)  x, 1 − cos (x) 
x→0 x→0 x→0 2
1 7
ln (1 + x)  x, sin (sh (x)) − sh (sin (x))  − x
x→0 x→0 45
Les équivalents peuvent être utiles pour l’étude de suites ou de séries.
Dans le cas des séries à termes positifs (ou négatifs), on le résultat suivant.
Théorème 11.10.
Soient (un )n∈N et (vn )n∈N deux suites à valeurs réelles positives telles
que un  vn .
n→+∞

1. Si la série de terme général un est convergente, il en est alors de même de


la série de terme général vn et les restes de ces séries sont équivalentes,
+∞
 +∞

soit uk  vk .
n→+∞
k=n k=n
2. Si la série de terme général un est divergente, il en est alors de même de
la série de terme général vn et les sommes partielles de ces séries sont
n n
équivalents, soit uk  vk .
n→+∞
k=0 k=0

Preuve. Dire que les suites à termes positifs (un )n∈N et (vn )n∈N sont équivalentes
équivaut à dire que pour tout réel ε ∈ ]0, 1[ il existe un entier n0 tel que :

∀n ≥ n0 , (1 − ε) un ≤ vn ≤ (1 + ε) un

Dans ce qui suit on se donne un tel couple (ε, n0 ) .


1. Si la série de terme général un est convergente, des inégalités 0 ≤ vn ≤ (1 + ε) un
pour tout n ≥ n0 , on déduit qu’il en est de même de la série de terme général vn .
+∞
 +∞

On peut donc définir les restes d’ordre n de ces séries, Rn = uk , Sn = vk
k=n k=n
et on a :
∀n ≥ n0 , (1 − ε) Rn ≤ Sn ≤ (1 + ε) Rn
ce qui traduit l’équivalence de Rn et Sn quand n tend vers l’infini.
Utilisation des développements limités 317

2. Si la série de terme général un est divergente, des inégalités vn ≥ (1 − ε) un


pour tout n ≥ n0 avec 1 − ε > 0 et un ≥ 0, on déduit qu’il en est de même de
n n
la série de terme général vn . En notant Un = uk et Vn = vk les sommes
k=0 k=0
partielles d’ordre n de ces séries, on a Un > 0 à partir d’un certain rang n1 > n0
et :
∀n > n1 , (1 − ε) (Un − Un0 −1 ) ≤ Vn − Vn0 −1 ≤ (1 + ε) (Un − Un0 −1 )
ce qui entraîne que, pour tout n > n1 , on a :
   
Un0 −1 Vn −1 Vn Un0 −1 Vn −1
(1 − ε) 1 − + 0 ≤ ≤ (1 + ε) 1 − + 0
Un Un Un Un Un
1
Avec lim = 0, on en déduit alors qu’il existe n2 ≥ n1 tel que :
n→+∞ Un
Vn
∀n ≥ n0 , 1 − 2ε ≤ ≤ 1 + 2ε
Un
ce qui traduit l’équivalence de Un et Vn quand n tend vers l’infini.

L’hypothèse un et vn de mêmes signes (au moins à partir d’un certain rang) est
essentielle dans le théorème précédent. Considérons par exemple la série de terme
n
(−1)
général un = √ n . Un développement limité nous donne :
n + (−1)
n n   n
(−1) 1 (−1) 1 1 (−1) 1
un = √ (−1) n = √ − + O 3 = √ − + vn
n 1+ √ n n n→+∞ n 2 n n
n

1
avec |vn | ≤ λ 3 , ce qui implique que la série de terme général un est divergente
n2 n
(−1)
et pourtant un est équivalent √ qui est le terme général d’une série alternée
n
convergente.
Le théorème 11.10 peut être utilisé pour obtenir des développements asympto-
tiques de certaines suites. Considérons par exemple le cas de la série harmonique
n
1
(Hn )n∈N∗ définie par Hn = pour tout n ∈ N∗ . Cette série est à termes positifs
k

k=1 
1 1
divergente avec  ln 1 + , ce qui entraîne que :
n n→+∞ n
   n  
n
1 ( k + 1
Hn  ln 1 + = ln = ln (n + 1)
k k
k=1 k=1

ou encore Hn  ln (n) .
La suite (Kn )n≥1 définie par Kn = Hn − ln (n) est de même nature que la série
de terme général :
   
1 1 1
Kn+1 − Kn = + ln 1 − = O
n+1 n+1 n→+∞ n2
318 Développements limités

elle est donc convergente. Sa limite est la constante d’Euler γ. On considère ensuite
la suite (Ln )n≥1 définie par Ln = Hn − ln (n) − γ. Cette suite est convergente vers
0 de même nature que la série de terme général :
 
1 1 1
Ln+1 − Ln = Kn+1 − Kn = + ln 1 −  −
n+1 n + 1 n→+∞ 2n2
Cette série est donc convergente à termes négatifs à partir d’un certain rang, ce
qui entraîne l’équivalence des restes :
+∞
 +∞
1 1
(Lk+1 − Lk )  −
n→+∞ 2 k2
k=n k=n

avec :
+∞
 
m
(Lk+1 − Lk ) = lim (Lk+1 − Lk ) = lim Lm+1 − Ln = −Ln
m→+∞ m→+∞
k=n k=n

+∞
1 1
On a donc Ln ∼ . Enfin avec :
n→+∞ 2 k2
k=n
 k+1  k
dt 1 dt
∀k ≥ 2, ≤ 2 ≤
k t2 k k−1 t2

on déduit que :
 +∞ +∞
  +∞
dt 1 1 dt 1
∀n ≥ 2, 2
= ≤ 2
≤ 2
=
n t n k n−1 t n−1
k=n

+∞
1 1 1
ce qui implique que Ln  
. On a donc en définitive le
n→+∞ 2 k22n n→+∞
k=n  
1 1
développement asymptotique Hn = ln (n) + γ + + o .
2n n→+∞ n
En itérant ce procédé on peut obtenir des termes supplémentaires du dévelop-
pement asymptotique.
Dans le cadre des séries à termes positifs (ou négatifs), on dispose également
du critère de d’Alembert.
Théorème 11.11. d’Alembert
Soit (un )n∈N une suite à valeurs réelles strictement positives telle que
un+1
lim = λ. Pour λ < 1, la série de terme général un est convergente
n→+∞ un
et pour λ > 1, elle est divergente.

Le cas où λ = 1 ne permet pas de conclure en général comme le montre l’exemple


 1
des séries de Riemann . La règle de Raabe-Duhamel peut parfois être utile

dans ce cas.
Utilisation des développements limités 319

Théorème 11.12. Raabe-Duhamel


Soit (un )n∈N une suite à valeurs réelles strictement positives telle que :

un+1 1
= a 1
un 1+ n + O n2
n→+∞

λ
On a alors un ∼ où λ est une constante réelle et la série de terme
n→+∞ na
général un est convergente si, et seulement si, a > 1.

Preuve. Soit (vn )n∈N la suite définie par vn = ln (na un ) . Cette suite est de même
nature que la série de terme général :
 a   
n+1 un+1
wn = vn+1 − vn = ln + ln
n un
      
1 a 1 1
= a ln 1 + − ln 1 + + O = O
n n n2 n→+∞ n2

elle est donc convergente. Notant μ = lim ln (na un ) , on a lim na un = eμ > 0


n→+∞ n→+∞
et le résultat annoncé. 

11.3.2 Étude locale de la position d’une courbe par rapport


aux tangentes
Si la fonction f admet un développement limité d’ordre n ≥ 2 au voisinage
n
k n
d’un point a, f (x) = ak (x − a) + o ((x − a) ) , elle est alors dérivable
x→a
k=0
en a de dérivée égale à a1 et la tangente au graphe de f en a a pour équation
y = a0 + a1 (x − a) . En supposant les ak non tous nuls pour k compris entre 2 et
n et en désignant par p le plus petit entier compris entre 2 et n tel que ap = 0, on
p
a g (x) = f (x) − a0 − a1 (x − a) = (ap + ε (x)) (x − a) avec lim ε (x) = 0. Pour
x→a
x voisin de a la quantité ap + ε (x) est du signe de ap et on peut en déduire la
position du graphe de f par rapport à la tangente en a :
— si p est pair et ap > 0 alors g (x) > 0 pour x voisin de a et différent de a et
la courbe est localement au dessus de la tangente ;
— si p est pair et ap < 0 alors g (x) < 0 pour x voisin de a et différent de a et
la courbe est localement au dessous de la tangente ;
— si p est impair alors g (x) change de signe au voisinage de a, ne s’annulant
qu’en a dans ce voisinage, et la courbe traverse la tangente au voisinage de
a. On dit alors qu’on a un point d’inflexion ou que la tangente en a est une
tangente d’inflexion.
Une étude analogue peut être menée dans le cadre des courbes planes définies
par des équations paramétriques.
320 Développements limités

11.3.3 Étude locale de la position d’une courbe par rapport


aux asymptotes
Les développements limités à l’infini permettent de déterminer la position de
la courbe par rapport aux asymptotes. Si on a le développement limité en +∞ :
 
f (x)  ak
n
1
= + o
x xk x→+∞ xn
k=0

avec n ≥ 2, en supposant les ak non tous nuls pour k compris entre 2 et n et en


notant p le plus petit indice compris entre 2 et n tel que ap = 0, on a :
 
ap
f (x) − a0 x − a1 = p−1 1 + o (1)
x x→+∞

On en déduit que la droite d’équation y = a1 + a0 x est asymptote à la courbe et le


signe de ap nous renseigne sur la position de la courbe par rapport à l’asymptote.

11.3.4 Développements asymptotiques


On désigne toujours par a un élément de R.

Définition 11.2. On appelle échelle de comparaison au voisinage de a une


famille (ϕk )k∈K de fonctions définies au voisinage de a éventuellement privé
de a telles que :
— pour tout k ∈ K et tout voisinage V de a, il existe x dans V \ {a} tel
que ϕk (x) = 0 (ϕk n’est pas équivalente à 0 en a) ;
— pour tous j, k dans K, on a ϕj = o (ϕk ) ou ϕk = o (ϕj ) (la
x→a x→a
famille (ϕk )k∈K est totalement ordonnée par o (·)).
x→a

Exemple 11.5 On peut considérer les familles de fonctions suivantes :


# $
k
— (x − a) au voisinage de a ∈ R ;
k∈N
# $
k
— (x − a) au voisinage de a ∈ R ;
k∈Z
— xk k∈Z
au voisinage de +∞ ;
α
— au voisinage de ±∞ ou de 0 ;
(|x| )α∈R
# $
α β
— x ln (x) 2
au voisinage de +∞ ;
(α,β)∈R
α βx γ
— x e ln (x) (α,β,γ)∈R3
au voisinage de +∞.

On désigne par f une fonction à valeurs réelles (ou complexes) définie sur un
intervalle réel I non réduit à un point et par a un point de l’adhérence de I.
Utilisation des développements limités 321

Définition 11.3. On dit que la fonction f admet un développement asymp-


totique au voisinage de a relativement à l’échelle de comparaison (ϕk )k∈K ,
si au voisinage de a éventuellement privé de a, on a une écriture de la
forme :
 n
f (x) = aj ϕkj (x) + o (ϕkn (x))
x→a
j=0

où les aj sont des constantes réelles (ou complexes) et ϕkj+1 = o ϕkj


x→a
pour tout j compris entre 0 et n − 1.

Là encore on vérifie qu’un tel développement asymptotique d’ordre n, s’il existe,


est unique.

Exemple 11.6 Pour x > 0 tendant vers l’infini, on a :


 2  2 
1 ln(x) ln (x) 1 ln (x) ln (x)
x =e
x x =1+ + + o
x 2 x x→+∞ x

Dans ce qui suit nous allons voir comment les développements limités peuvent
être utilisés pour obtenir des développement asymptotiques de suites définies par
une relation de récurrence de la forme xn+1 = f (xn ) .
On se donne une fonction f à valeurs réelles définie et continue sur l’intervalle
ouvert ]−1, 1[ admettant un développement limité en 0 de la forme :

f (x) = x − αxp+1 + βx2p+1 + o x2p+1


x→0

avec α > 0, β ∈ R∗ , p > 0.


Dans cette situation 0 est l’unique point fixe de f au voisinage de 0.

Lemme 11.1 Il existe un réel η > 0 tel que :

∀x ∈ ]0, η] , 0 < f (x) < x ≤ η

ce qui permet de définir la suite (xn )n∈N dans ]0, η] par :



x0 ∈ ]0, η]
xn+1 = f (xn ) (n ≥ 0)

et cette suite converge vers 0.

Preuve. On a f (x) = xg (x) et x − f (x) = αxp+1 h (x) , avec lim g (x) =


x→0
lim h (x) = 1. On peut donc trouver un réel η ∈ ]0, 1[ tel que g (x) > 0 et h (x) > 0
x→0
pour tout x ∈ [−η, η] . En particulier, on a :

∀x ∈ ]0, η] , f (x) > 0, x − f (x) > 0

c’est-à-dire :
∀x ∈ ]0, η] , 0 < f (x) < x ≤ η
322 Développements limités

L’intervalle [0, η] étant stable par f, la suite (xn )n∈N est bien définie. De plus les
inégalités précédentes donnent :

∀n ∈ N, 0 < xn+1 < xn

c’est-à-dire que la suite (xn )n∈N est décroissante minorée par 0. Elle converge donc
vers un réel λ ∈ [0, η] qui vérifie f (λ) = λ (f est continue). Et avec f (x) < x sur
]0, η] , on déduit que λ = 0. 
Pour tout réel λ ≥ −p, on désigne par (yn )n∈N la suite définie par :

∀n ∈ N, yn = xλn+1 − xλn

1
Lemme 11.2 On a xn  √ .
n→+∞ p pnα

Preuve. Un développement limité au voisinage de 0 donne :


 λ )
2p 2p
λ
yn = xn 1 − αxn + βxn + o
p
xn −1
n→+∞
 
λ (λ − 1) 2
= −λαxn + λβ +
λ+p
α xλ+2p
n + o xλ+2p
n
2 n→+∞

En prenant λ = −p, on a :
 
p (p + 1) 2
yn = pα + p α − β xpn + o (xpn )
2 n→+∞

= pα + pγxpn + o (xpn ) = pα + o (1)


n→+∞

( lim xn = 0 et p > 0). En utilisant le théorème de Cesàro on déduit alors que :


n→+∞

−p
1
n−1
x−p
n − x0
= yk = αp + o (1)
n n n→+∞
k=0
 
x−p x−p
soit n
= 0 +αp+ o (1) = αp 1 + o (1) , ce qui donne en définitive
n n n→+∞ n→+∞
1 1
−p 1
xn = √p pnα
(1 + o (1))  √ . 
n→+∞ p pnα
(1 + p) α2
On note γ = − β et on suppose γ = 0.
2
Théorème 11.13.
On a le développement asymptotique :
 
1 γ ln (n) ln (n)
xn = √ − 2 2√ √ + o √
p pnα p α pα n p n n→+∞
p npn
Exercices 323


n−1 
n−1  
Preuve. On a yk = npα + pγ xpk 1+ o (1) avec :
n→+∞
k=0 k=0

p 1 1 1 1
(xn ) (1 + o (1))  
n→+∞ pα n n→+∞ pα (n + 1)
En remarquant que les séries considérées sont à termes positifs et que la série
+∞
 1
est divergente, on déduit que :
n=0
n + 1

  
1  1
n−1 n−1
1
xpk 1+ o (1)   ln (n)
n→+∞ n→+∞ αp k+1 n→+∞ αp
k=0 k=0

(théorème 11.10). Ce qui donne en définitive :


n−1  
γ
yk = npα + ln (n) 1 + o (1)
α n→+∞
k=0

et :
 
−p γ γ
x−p
n = x0 + npα + ln (n) 1 + o (1) = npα + ln (n) + o (ln (n))
α n→+∞ α n→+∞

Ou encore :
  − p1
1
−p γ ln (n) ln (n)
xn = (npα) 1+ 2 + o
pα n n→+∞ n
 
1 1 γ ln (n) ln (n)
= 1 1 − 2+ 1 1+ 1
+ o 1
(pα) p n p (pα) p n p n→+∞ n1+ p

On peut8 appliquer ce résultat à l’étude des suites définies par x = sin (x )
π9
n+1 n
avec x0 ∈ 0, ou xn+1 = ln (1 + xn ) avec x0 ∈ ]0, 1[ .
2
x 3 x5 1 1 1
Avec sin (x) = x− + + o x5 (p = 2, α = , β = ,γ = ) on déduit
√ √ 3! 5! x→0   6 120 30
3 3 3 ln (n) ln (n) x2 x3
que xn = √ − √ + o √ et avec ln (1 + x) = x − + +
n 10n n n→+∞ n n 2 3
1 1 1 2 2 ln (n) ln (n)
o x3 (p = 1, α = , β = , γ = − ) que xn = + + o .
x→0 2 3 12 n 3n2 n→+∞ n2

11.4 Exercices

Exercice 11.1. Montrer que pour tout entier n ≥ 81, la fonction9 f définie
π
par f (x) = tan (x)−th (x) a un unique zéro xn dans nπ, nπ + . Donner
4
324 Développements limités

un développement asymptotique de la forme :

xn = an + b + ce−δn + o e−δn
n→+∞

Donner un équivalent de f (xn ) quand n tend vers l’infini.

1 1 .π /
Solution. On a f  (x) = − > 0 pour tout x ∈ R \ + kπ | kZ
cos2 (x) ch2 (x) 9 2 π8
et f réalise alors un homéomorphisme strictement croissant de nπ, nπ + sur
8 # π $8 # π$
4
− th (nπ) , 1 − th nπ + , avec − th (nπ) < 0 et 1 − th nπ + > 0, d’où
4 8 π9
4
l’existence et l’unicité de xn dans nπ, nπ + .
4
De tan(xn ) = th (xn ) , on 8déduit qu’il9 existe k ∈ Z tel que xn = kπ +
π
arctan (th (xn )) et avec xn ∈ nπ, nπ + , on déduit que th (xn ) ∈ ]0, 1[ et
8 π9 4
arctan (th (xn )) ∈ 0, , ce qui entraîne k = n. Donc xn = nπ + arctan (th (xn )) .
4 #π $
−2xn
1−e −2xn π
Avec th (xn ) = −2x
= tan − arctan e et − arctan e−2xn ∈
8 π9 1+e n 4
π
4
0, , on déduit que arctan (th (xn )) = −arctan e−2xn . Avec xn ∼ nπ, on
4 4 n→+∞
π
a arctan e−2xn ∼ e−2xn . En écrivant que xn = nπ+ +εn avec lim εn = 0,
n→+∞
π π
4 n→+∞
on déduit que e−2xn = e− 2 e−2nπ eεn ∼ e− 2 e−2nπ et :
n→+∞

π π π
xn = nπ + − arctan e−2xn = nπ + − e− 2 e−2nπ + o e−2nπ
4 4 n→+∞

Exercice 11.2. Soit f une fonction de classe C 2 de R dans R telle que


f (0) = 1, f  (0) = 0 et f  (0) = −1. Montrer que pour tout réel a on a :
  x
a a2
lim f √ = e− 2
x→+∞ x

Solution. Pour a = 0 le résultat est évident. On suppose donc que a est non
nul. Comme f (0) = 1 et f est continue, on a f (t) > 0 pour t voisin de0 et  on
a
peut définir la fonction g sur un voisinage ]α, +∞[ de l’infini par g (x) = f √ .
x
2
t
Avec le développement limité en 0 à l’ordre 2, f (t) = 1 − + o t2 , on déduit
2 t→0 
a2 1 1
celui de g à l’ordre 1 en +∞, g (x) = 1 − + o , puis celui de
2 x x→+∞ x
x
h (x) = ln ((g (x)) ) :
 2  
a 1 1 a2
h (x) = x ln (g (x)) = x − + o = − + o (1)
2 x x→+∞ x 2 x→+∞
Exercices 325
  x
a2 a a2
ce qui permet de déduire que lim h (x) = − et lim f √ = e− 2 .
x→+∞ 2 x→+∞ x

Exercice 11.3. Calculer, pour tous réels a, b, c :


  x  2x  3x 
2 1 1 1
lim x a 1 + +b 1+ +c 1+
x→+∞ x 2x 3x

Solution. On a, pour tout entier k ≥ 1, le développement limité à l’infini :


 kx   
1 1 1 11 1 1
1+ =e 1− + + o
kx 2k x 24k 2 x2 x→+∞ x2

et si f est la fonction définie sur R+,∗ par :


  x  2x  3x 
2 1 1 1
f (x) = x a 1 + +b 1+ +c 1+
x 2x 3x
 
2
on obtient f (x) = e αx + βx + γ + o (1) avec :
x→+∞

   
1 b c 11 b c
α = a + b + c, β = − a+ + , γ= a+ +
2 2 3 24 4 9

de sorte que :



+∞ si α > 0 ou (α = 0 et β > 0)

⎨ −∞ si α < 0 ou (α = 0 et β < 0)
lim f (x) =  
x→+∞ ⎪
⎪ 11 b

⎩ γe = a+ e si α = β = 0
24 6

11
Par exemple pour (a, b, c) = (1, −4, 3) , on a lim f (x) = e.
x→+∞ 72

Exercice 11.4. Soient A, B dans Mn (C) . Montrer que et(A+B) =


etA etB pour tout réel t si, et seulement si, A et B commutent.

Solution. Pour tout réel t on a :


t2 2
et(A+B) = In + t (A + B) + (A + B) + o t2
2 t→0

t2
etA etB = In + t (A + B) + (A + 2AB + B) + o t2
2 t→0

et, du fait de l’unicité du développement limité d’ordre 2, l’égalité et(A+B) = etA etB
2
est réalisée si et seulement si (A + B) = A+2AB+B, ce qui équivaut à AB = BA.
326 Développements limités

Exercice 11.5. Pour tout  λ ∈ [2, +∞[ et tout x ∈ ]−2, −1[ , on note
x
fλ (x) = x − λ ln 1 + . Montrer que l’équation fλ (x) = 0 a une
1+λ
unique racine xλ dans ]−2, −1[ . Déterminer la limite de xλ quand λ tend
vers l’infini.

x+1
Solution. On a fλ (x) = < 0 pour x ∈ ]−2, −1[ , fλ (−2) = −λg (λ) ,
 x 1+λ
+
2 λ−1 2
avec g (λ) = + ln < 0 (g  (λ) = 2 2 > 0 et lim g (λ) = 0),
λ λ+1 λ (λ − 1) 
λ→+∞

1 λ
donc fλ (−2) > 0 et fλ (−1) = −λh (λ) , avec h (λ) = + ln > 0
λ λ+1
1
(h (λ) = − 2 < 0 et lim h (λ) = 0), donc fλ (−1) < 0. On déduit
λ (λ + 1) λ→+∞
donc que fλ a un unique zéro xλ ∈ ]−2,
 −1[ . Pour x fixé dans ]−2, −1[ , en posant
x
μ = 1+λ, on a fλ (x) = x−(μ − 1) ln 1 + et un développement limité donne :
μ
 
x2 + 2x 1 x2 + 2x x (x + 2)
fλ (x) = + o  
2μ μ→+∞ μ μ→+∞ 2μ λ→+∞ 2λ
x (x + 2)
Pour tout réel ε ∈ ]0, 1[ , en prenant x = −2 + ε, on a < 0 et il existe

λ0 ≥ 2 tel que fλ (x) < 0 pour λ > λ0 et nécessairement −2 < xλ < x = −2 + ε.
On a donc ainsi montré que lim xλ = −2.
λ→+∞

Exercice 11.6. On se donne une fonction f développable en série entière


sur un intervalle ]−R, R[ , avec R > 0 et deux entiers naturels p, q. On dit
que la fonction f admet une approximation de Padé d’ordre (p, q) s’il existe
deux polynômes non nuls P et Q premiers entre eux et un réel r ∈ ]0, R]
tels que : ⎧

⎨ deg (P ) = p, deg (Q) = q, Q (0) = 1
⎪ P (x)
⎩ f (x) − = O xp+q+1 sur ]−r, r[
Q (x) x→0
1. Montrer que f admet une approximation de Padé d’ordre (p, q) si, et
seulement si, il existe deux polynômes non nuls P et Q premiers entre
eux, un réel r ∈ ]0, R] et une fonction E développable en série entière
sur ]−r, r[ tels que :

deg (P ) = p, deg (Q) = q, Q (0) = 1
∀x ∈ ]−r, r[ , Q (x) f (x) − P (x) = xp+q+1 E (x)
P
2. En déduire que si f admet une approximation de Padé d’ordre (p, q) ,
Q
les polynômes P et Q sont alors uniquement déterminés.
3. Soient P et Q deux polynômes non nuls premiers entre eux tels que
deg (P ) = p, deg (Q) = q, Q (0) = 1. Montrer que la fraction rationnelle
Exercices 327

P
est l’approximant de Padé d’ordre (p, q) de f si, et seulement si :
Q
 (k)
P
(0) = f (k) (0) (0 ≤ k ≤ p + q)
Q

Solution. La condition Q (0) = 1 nous assure l’existence d’un réel r ∈ ]0, R] tel
que Q (x) = 0 pour x ∈ [−r, r] .
P
1. Supposons que soit une approximation de Padé d’ordre (p, q) de f. La fonc-
Q
tion g = Qf − P est alors développable en série entière sur ]−r, r[ . En notant
M la borne supérieure de Q sur [−r, r] , il existe une constante M  telle que :
P (x)
≤ M M  |x|
p+q+1
∀x ∈ ]−r, r[ , |g (x)| = |Q (x)| f (x) −
Q (x)
c’est-à-dire que g (x) = o (xp+q ) et avec l’unicité du développement limité en
x→0
0 à l’ordre p + q, on déduit que :
+∞

∀x ∈ ]−r, r[ , g (x) = an xn = xp+q+1 E (x)
n=p+q+1

avec E développable en série entière sur ]−r, r[ . Réciproquement supposons qu’il


existe deux polynômes non nuls P et Q premiers entre eux, un réel r ∈ ]0, R]
et une fonction E développable en série entière sur ]−r, r[ tels que :
∀x ∈ ]−r, r[ , Q (x) f (x) − P (x) = xp+q+1 E (x)
En prenant r assez petit on peut supposer que Q (x) = 0 pour tout x ∈ [−r, r]
et :
P (x) p+q+1 E (x) p+q+1
∀x ∈ ]−r, r[ , f (x) − = |x| ≤ C |x|
Q (x) Q (x)
P1 P2
2. Soient et deux approximants de Padé d’ordre (p, q) de f. Avec :
Q1 Q2

Q1 (x) f (x) − P1 (x) = xp+q+1 E1 (x)
Q2 (x) f (x) − P2 (x) = xp+q+1 E2 (x)
au voisinage de 0, les fonctions E1 et E2 étant développables en série entière en 0,
on déduit que Q1 (x) P2 (x)−Q2 (x) P1 (x) = xp+q+1 E3 (x) et avec Q1 P2 −Q2 P1
dans Rp+q [X] , on déduit que Q1 P2 − Q2 P1 = 0, ce qui équivaut à P1 = P2 et
Q1 = Q2 du fait que les polynômes P1 et Q1 sont premiers entre eux ainsi que
P2 et Q2 avec Q1 (0) = Q2 (0) = 1.
P P
3. Si est l’approximant de Padé d’ordre (p, q) de f, alors f − = O xp+q+1
Q Q
et avec l’unicité du développement limité en 0 à l’ordre p + q, on déduit que
 (k)
P
(0) = f (k) (0) pour tout k compris entre 0 et p + q. La réciproque se
Q
déduit immédiatement du développement de Taylor-Young.
328 Développements limités

Exercice 11.7. On se propose de montrer que tout polynôme à coeffi-


cients réels qui est à valeurs positives est somme de deux carrés de poly-
nômes. On désigne par E le sous-ensemble de R [X] formé des fonctions
polynomiales à valeurs positives ou nulles. et par F le sous-ensemble de
R [X] formé des fonctions polynomiales qui s’écrivent comme somme de
deux carrés de fonctions polynomiales.
1. Montrer que F contient tous les polynômes de degré 2 irréductibles à
coefficient dominant strictement positif et tous les polynômes du type
n
(x − a) où a est un réel et n un entier naturel pair.
2. Montrer que F est stable par multiplication.
3. Montrer que tout polynôme P appartenant à E et sans racines réelles
est dans F.
4. Montrer que E = F.

Solution.
n p 2
1. Il est clair que pour n = 2p, le polynôme (X − a) = ((X − a) ) est dans F.
Si P (X) = aX 2 + bX + c avec a5> 0 et Δ = b2 − 4ac < 0, on a P (X) =
  2
√ b 4ac − b2
a X+ + λ2 avec λ = ∈ R et P est dans F.
2a 4a
2. Si P = A2 + B 2 et Q = C 2 + D2 sont dans F avec A, B, C, D dans R [X] , on a
2 2
alors P Q = (AD + BC) + (AC − BD) ∈ F.
3. Si P ∈ E est sans racines réelles, il est non nul de degré pair et de coefficient
n
dominant strictement positif. En effet si P (X) = ak X k est sans racine
k=0
réelle il est nécessairement de degré pair non nul (avec le théorème des valeurs
intermédiaires, on voit facilement qu’un polynôme de degré impair a au moins
une racine réelle) et an < 0 entraîne que lim P (x) = −∞ et lim P (x) =
x→−∞ x→+∞
+∞ ce qui contredit encore le fait que P ne s’annule jamais. La décomposition
(p
en facteurs irréductibles de P est donc de la forme P = an Pj où les Pj sont
j=1
des polynômes unitaires de degré 2 irréductibles. Les Pj étant dans F qui est
stable par multiplication, on en déduit que P est dans F.
4. Comme F est contenu dans E, il s’agit de montrer que E est contenu dans F
et avec le résultat de la question précédente il nous suffit de montrer que tout
P dans E ayant des racines réelles est dans F. Soit donc P dans E admettant
m
une racine réelle a de multiplicité m ≥ 1. On a P (x) = (x − a) Q (x) avec
m
Q (a) = 0. Au voisinage de a, P (x) est équivalent à (x − a) Q (a) , ce qui
entraîne que m est nécessairement pair (si m est impair P change de signe au
voisinage de a). Le polynôme Q est alors nécessairement à valeurs positives,
c’est-à-dire qu’il est dans E. En raisonnant par récurrence sur les degrés, on
déduit que P est dans F comme produit de deux éléments de F.
Chapitre 12

Points fixes et
approximations successives

12.1 Le théorème du point fixe de Picard


Pour ce paragraphe, (E, d) est un espace métrique complet, F est un fermé non
vide dans E et f est une application de F dans E. Dans le cas où f (F ) ⊂ F, on
dit que F est stable par f.

Définition 12.1. On dit que f est strictement contractante s’il existe une
constante λ ∈ [0, 1[ telle que :

∀ (x, y) ∈ F 2 , d (f (x) , f (y)) ≤ λd (x, y)

On dit aussi que f est λ-contractante.

Il est facile de vérifier qu’une application contractante f : F → E est uniformé-


ment continue sur F.

Définition 12.2. Dans le cas où F est stable par f, on appelle orbite de


x ∈ F suivant f, la suite (xn )n∈N d’éléments de F définie par x0 = x et
xn+1 = f (xn ) pour tout n ∈ N.

La condition f (F ) ⊂ F est essentielle pour définir les orbites suivant f.

Lemme 12.1 Si une orbite suivant f converge (pour F stable par f ), sa limite α
est alors dans F et si de plus la fonction f est continue sur F, on a alors f (α) = α.

Preuve. Si lim xn = α, on a alors α ∈ F puisque cet ensemble est fermé. Si


n→+∞
de plus f est continue sur F, on a alors α = lim xn+1 = lim f (xn ) = f (α) .
n→+∞ n→+∞


Définition 12.3. On dit que α ∈ F est un point fixe de f si f (α) = α.


330 Points fixes et approximations successives

La seule hypothèse de continuité de f n’assure pas la convergence d’une orbite.


n
Par exemple pour f (x) = −x sur [−1, 1] on a xn = (−1) x0 pour tout n et cette
suite est divergente pour x0 = 0.
La fonction caractéristique de Q fournit un exemple de fonction discontinue en
tout point de R (exemples 6.2) pour laquelle toute orbite (xn )n∈N converge vers
l’unique point fixe de f. En effet pour x0 ∈ Q, on a xn = 1 pour tout n ≥ 1 et
pour x0 ∈ / Q on a x1 = 0 et xn = 1 pour tout n ≥ 2, donc dans tous les cas
lim xn = 1 est point fixe de 1Q .
n→+∞
Si une orbite (xn )n∈N suivant f est convergente vers un point fixe α de f, on dit
alors que cette suite est une suite d’approximations successives de α de premier
terme x.
Théorème 12.1. Picard
Si f : F → F est une application λ-contractante avec λ ∈ [0, 1[ , elle ad-
met alors un unique point fixe α dans F et ce point fixe est la limite de toute
toute orbite (xn )n∈N suivant f. Une majoration de l’erreur d’approximation
de α par les xn est donnée par :
λn
∀n ∈ N, d (α, xn ) ≤ d (x1 , x0 )
1−λ

Preuve. Pour l’existence d’un point fixe, on montre qu’une orbite (xn )n∈N est
de Cauchy dans l’espace métrique complet (E, d) . Pour q > p ≥ 0, on a :
d (xq , xp ) ≤ d (xq , xq−1 ) + · · · + d (xp+1 , xp )
avec pour tout k ≥ 1 :
d (xk+1 , xk ) = d (f (xk ) , f (xk−1 )) ≤ λd (xk , xk−1 ) ≤ · · · ≤ λk d (x1 , x0 )
ce qui nous donne :
⎛ ⎞

q−1
λp (1 − λq−p )
d (xq , xp ) ≤ ⎝ λk ⎠ d (x1 , x0 ) = d (x1 , x0 )
1−λ
k=p

λp
≤ d (x1 , x0 ) → 0
1−λ p→+∞

puisque λ ∈ [0, 1[ . On a donc ainsi montré que la suite (xn )n∈N est de Cauchy
dans (E, d) et en conséquence, elle converge vers un élément α ∈ F puisque E est
complet et F fermé dans E. Avec la continuité de f, on déduit que f (α) = α, c’est-
à-dire que α est un point fixe de f. Faisant tendre q vers l’infini dans la majoration
λp
précédente (à p fixé) on obtient la majoration d (α, xp ) ≤ d (x1 , x0 ) .
1−λ
Si β ∈ F est un autre point fixe, on a alors d (α, β) = d (f (α) , f (β)) ≤ λd (α, β)
et nécessairement α = β puisque λ ∈ [0, 1[ . 
Dans le cas des fonctions d’une variable réelle dérivables, le théorème des ac-
croissements finis nous fournit un critère pour vérifier qu’une application est stric-
tement contractante et nous conduit aux notions de points fixes attractifs et ré-
pulsifs. Cette étude est faite au paragraphe 9.4.5.
Le théorème du point fixe de Picard 331

Si (E, d) est un espace métrique complet et F une partie fermée de E, une


application f : F → F telle que d (f (x) , f (y)) < d (x, −y) pour tous x = y dans
F n’a pas nécessairement de point fixe dans F comme le montre l’exemple de la
1
fonction f : x → x + sur F = [1, +∞[ . Mais dans le cas où F est compact on a
x
le résultat suivant.
Théorème 12.2.
Soit K un compact dans un espace métrique (E, d) (non nécessairement
complet) et f : K → K telle que :

∀ (x, y) ∈ K 2 , (x = y ⇒ d (f (x) , f (y)) < d (x, y))

La fonction f admet un unique point fixe dans K et ce point fixe est limite
de toute orbite suivant f.

Preuve. La fonction f qui est lipschitzienne est en particulier continue. L’ap-


plication x → d (f (x) , x) étant continue sur le compact K et à valeurs réelles,
il existe α ∈ K tel que d (f (α) , α) = inf d (f (x) , x) . Si f (α) = α, on a alors
x∈K
d (f (α) , f (f (α))) < d (α, f (α)) avec f (α) ∈ K, ce qui est contradictoire avec la
définition de α. On a donc f (α) = α. Si β = α est un autre point fixe de f, on a
alors d (α, β) = d (f (α) , f (β)) < d (α, β) , ce qui est impossible. En conclusion, f
admet un unique point fixe dans K.
Soit (xn )n∈N une orbite associée à f. Si il existe n0 ∈ N tel que xn0 = α, la suite
est alors stationnaire, donc convergente. On suppose donc que xn = α pour tout
n ∈ N. On a alors 0 < d (xn+1 , α) = d (f (xn ) , f (α)) < d (xn , α) pour tout n ∈ N,
c’est-à-dire que la suite (d (xn , α))n∈N est strictement décroissante minorée par 0,
donc convergente vers un réel d ≥ 0. La suite (xn )n∈N étant dans le compact K, on
peut en extraire une sous-suite xϕ(n) n∈N qui converge vers β ∈ K. On a alors :

d (f (β) , α) = lim d f xϕ(n) , α = lim d xϕ(n)+1 , α = d


n→+∞ n→+∞

et β = α entraîne d = d (α, f (β)) = d (f (α) , f (β)) < d (α, β) = d, ce qui est


impossible. On a donc β = α et d = 0, c’est-à-dire que lim xn = α. 
n→+∞
Le résultat précédent est faux si on suppose seulement que K est complet comme
1
le montre l’exemple de la fonction f : x → x + sur [1, +∞[ .
x
Corollaire 12.1. Soit K un compact convexe dans un espace de Banach
(E, ·) et f : K → K telle que :

∀ (x, y) ∈ K 2 , f (x) − f (y) ≤ x − y

La fonction f admet un point fixe dans K.

Preuve. On se fixe un point a dans K et on définit la suite de fonctions (fn )n≥1


sur K par :    
1 1
∀n ≥ 1, ∀x ∈ K, fn (x) = f a+ 1− x
n n
332 Points fixes et approximations successives

Cette suite est bien définie du fait la convexité de K, chaque fonction fn est à
valeurs dans K et pour x, y dans K, on a :
 
1
fn (x) − fn (y) ≤ 1 − x − y
n

Pour n ≥ 1 la fonction fn est donc strictement contractante de K dans K avec K


fermé dans l’espace de Banach E, elle admet donc un unique point fixe xn ∈ K. De
cette suite (xn )n≥1 dans le compact K on peut extraire une sous-suite xϕ(n) n∈N
qui converge vers un élément α ∈ K. En notant gn = fϕ(n) , et yn = xϕ(n) , on a
pour tout n ∈ N :

f (α) − gn (yn ) ≤ f (α) − gn (α) + gn (α) − gn (yn )

avec :
⎧     
⎪  1 1  1
⎪  
⎨ f (α) − gn (α) = f (α) − f ϕ (n) a + 1 − ϕ (n) α  ≤ ϕ (n) α − a

 

⎪   1  
⎩ gn (α) − gn (yn ) = fϕ(n) (α) − fϕ(n) xϕ(n)  ≤ 1 −
⎪ α − xϕ(n) 
n

ce qui entraîne que lim fϕ(n) xϕ(n) = f (α) . Tenant compte du fait que xϕ(n)
n→+∞
est point fixe de fϕ(n) , on a fϕ(n) xϕ(n) = xϕ(n) et f (α) = lim xϕ(n) = α,
n→+∞
c’est-à-dire que α est point fixe de f. 
Il peut arriver que la fonction f : F → F ne soit pas strictement contractante,
mais que l’une de ces itérées le soit. Dans ce cas on a encore existence et unicité
du point fixe de f qui est limite de toute orbite. Ce résultat est utilisé par exemple
dans la démonstration du théorème de Cauchy-Lipschitz linéaire.

Lemme 12.2 Soient p ∈ N∗ et (xn )n∈N une suite de points dans un espace mé-
trique (E, d) telle que pour tout r ∈ {0, · · · , p − 1} la suite extraite (xjp+r )j∈N
converge vers x ∈ E. La suite (xn )n∈N converge alors vers x.

Preuve. Soit ε > 0. Pour tout r ∈ {0, · · · , p − 1} , on peut trouver un entier jr tel
que d (xjp+r , x) < ε pour tout j ≥ jr . On note jε = max jr . Tout entier n ∈ N
0≤r≤p−1
s’écrit de manière unique n = jp + r avec j ∈ N, r ∈ {0, · · · , p − 1} et pour j ≥ jε
on a d (xn , x) < ε. On déduit donc que d (xn , x) < ε pour tout n ≥ (jε + 1) p. On
a donc ainsi prouvé que la suite (xn )n∈N converge vers x. 
Théorème 12.3.
Si f : F → F est telle que l’une de ses itérées f p = f ◦ · · · ◦ f , où p ∈ N∗ ,
; <= >
p fois
soit strictement contractante, elle admet alors un unique point fixe dans F
limite de toute orbite.

Preuve. L’application f p est strictement contractante sur le fermé F dans l’espace


métrique complet E, elle admet donc un unique point fixe α ∈ F. De f p (α) = α
Le théorème du point fixe de Picard 333

on déduit que f p (f (α)) = f (f p (α)) = f (α) et f (α) est aussi point fixe de f p .
On a donc f (α) = α du fait de l’unicité du point fixe de f p . L’application f admet
donc un point fixe dans F. En considérant que tout point fixe de f est aussi point
fixe de f p , on déduit que ce point fixe est unique dans F.
Si (xn )n∈N est définie par x0 ∈ E et xn+1 = f (xn ) pour tout n ∈ N, on a alors
j
xjp+r = f jp+r (x0 ) = (f p ) (f r (x0 )) pour tout r ∈ {0, · · · , p − 1} et tout j ∈ N,
c’est-à-dire que (xjp+r )j∈N est une orbite suivant f p de valeur initiale f r (x0 ) . On
a donc lim xjp+r = α pour tout r ∈ {0, · · · , p − 1} ce qui équivaut à dire que
j→+∞
lim xn = α. 
n→+∞
Si (F, ·) est un espace de Banach et a < b deux réels, l’espace vectoriel
E = C 0 ([a, b] , F ) muni de la norme de la convergence uniforme :
f → f ∞ = sup f (x)
x∈[a,b]

est aussi un espace de Banach (voir l’exercice 1.5).


Théorème 12.4.
2
Soient x0 ∈ [a, b] , K : [a, b] → F, h : [a, b] → F deux applications
continues et ϕ : E → E définie par :
 x
∀f ∈ E, ∀x ∈ [a, b] , ϕ (f ) (x) = K (x, t) f (t) dt + h (x)
x0

Il existe un entier naturel non nul p tel que l’application ϕp = ϕ ◦ · · · ◦ ϕ


; <= >
p fois
soit contractante. En conséquence, ϕ admet un unique point fixe dans E.

Preuve. Pour f ∈ C 0 ([a, b] , F ) et x ∈ [a, b] \ {x0 } , le changement de variable


t = x0 + θ (x − x0 ) , nous donne :
 x
g (x) = K (x, t) f (t) dt
x0
 1
= (x − x0 ) K (x, x0 + θ (x − x0 )) f (x0 + θ (x − x0 )) dθ
0
 1
= (x − x0 ) ψ (x, θ) dθ
0
cette égalité étant encore valable pour x = x0 . La fonction (x, θ) → ψ (x, θ) étant
continue sur [a, b] × [0, 1] et l’intégration se faisant sur un segment, on en déduit
que la fonction g est continue sur [a, b] et il en est de même de ϕ (f ) . L’application
ϕ est donc bien un endomorphisme de E.
Pour f, g dans E et x dans [a, b] on a :
 x 
 
ϕ (f ) (x) − ϕ (g) (x) =  K (x, t) (f (t) − g (t)) dt

x0
 x
≤M f (t) − g (t) dt ≤ M f − g∞ |x − x0 |
x0
334 Points fixes et approximations successives

où on a noté M = sup K (x, t) . Par récurrence sur k ≥ 1, on vérifie que :


(x,t)∈[a,b]2

 k  k
ϕ (f ) (x) − ϕk (g) (x) ≤ (M |x − x0 |) f − g

k!
En effet, on vient de voir que cela est vrai pour k = 1 et supposant le résultat
acquis pour k ≥ 1, on a :
 x
 k+1   k 
ϕ (f ) (x) − ϕ k+1 
(g) (x) ≤ M ϕ (f ) (t) − ϕk (g) (t) dt
x0
 x
Mk k
≤M f − g∞ |t − x0 | dt
k! x0
 k+1
x
k |x − x0 |
avec |t − x0 | dt = , ce qui nous donne :
x0 k+1

 k+1  (M |x − x0 |)k+1
ϕ (f ) (x) − ϕk+1 (g) (x) ≤ f − g∞
(k + 1)!
Il en résulte que :
  (M (b − a))
k
∀k ≥ 1, ϕk (f ) − ϕk (g)∞ ≤ f − g∞
k!
k
(M (b − a))
et, avec lim = 0, on en déduit que pour k ≥ 1 assez grand, l’ap-
k→+∞ k!
plication ϕk est contractante. Le théorème du point fixe itéré nous dit alors que ϕ
admet un unique point fixe dans E. 
Le théorème précédent est utile pour la démonstration du théorème de Cauchy-
Lipschitz linéaire.

12.2 Cas des fonctions d’une variable réelle


Pour ce paragraphe, I désigne un intervalle réel fermé et f une fonction définie
sur I à valeurs dans I.
Dans le cas où la fonction f est continue ou monotone sur un intervalle compact,
les problèmes de l’existence de points fixes et de la convergence des orbites peuvent
s’étudier de manière relativement simple.
Théorème 12.5.
Si f : [a, b] → [a, b] est continue ou croissante, elle admet alors au moins
un point fixe α ∈ I.

Preuve. Le cas d’une fonction continue de [a, b] dans [a, b] a été déjà vu avec
l’exercice 5.3.
Pour le cas d’une fonction croissante de [a, b] dans [a, b] , on introduit l’ensemble
E = {x ∈ [a, b] | f (x) ≥ x} . Cet ensemble étant non vide (f (a) ∈ [a, b] , donc
Cas des fonctions d’une variable réelle 335

f (a) ≥ a) et majoré par b, il admet une borne supérieure α ∈ [a, b] . Si α = a, on


1
a alors f (x) < x pour tout x ∈ I \ {a} et pour n0 ∈ N∗ tel que a + ≤ b on a,
n0
du fait de la croissance de f sur I :
 
1 1
∀n ≥ n0 , a ≤ f (a) ≤ f a + <a+
n n
qui par passage à la limite quand n tend vers l’infini donne a = f (a) . Si α > a,
par définition de la borne supérieure,
 on peut trouver pour tout entier naturel non
1
nul n un réel xn ∈ α − , α ∩ E et on a alors :
n
1
∀n ≥ 1, f (α) ≥ f (xn ) ≥ xn > α −
n
qui par passage à la limite quand n tend vers l’infini donne f (α) ≥ α, c’est-à-dire
que α est dans E. Si α = b, on a alors α ≤ f (α)≤ b = α et α = f (α) . Si α < b,
1 1
pour n assez grand on a α ≤ f (α) ≤ f α + < α + qui par passage à la
n n
limite donne α = f (α) . En définitive α est un point fixe de f dans [a, b] . 
Le résultat précédent n’est pas valable pour f décroissantecomme  le montre
1
l’exemple de la fonction f définie sur [0, 1] par f (x) = 1 si x ∈ 0, et f (x) = 0
  2
1
si x ∈ , 1 . Il n’est pas valable non plus sur un intervalle fermé non borné
2
comme le montre l’exemple de f (x) = x + 1 sur [0, +∞[ .
En ce qui concerne la convergence des orbites on a le résultat suivant où (xn )n∈N
est une orbite suivant f.
Théorème 12.6.
Dans le cas où f : I → I est croissante, la suite (xn )n∈N est croissante
si f (x0 ) ≥ x0 et décroissante si f (x0 ) ≤ x0 . Si l’intervalle I est borné,
cette suite est alors convergente et si de plus f est continue, sa limite est
un point fixe de f.

Preuve. Si x1 = f (x0 ) ≥ x0 , une récurrence élémentaire permet de déduire de la


croissance de f que la suite (xn )n∈N est croissante. Pour I = [a, b] , cette suite est
croissante et majorée par b, donc converge vers un réel α ∈ [a, b] . Pour f continue
sur I, de xn+1 = f (xn ) pour tout n ∈ N, on déduit que α est un point fixe de f
dans I. 
De manière générale, pour l’étude de la monotonie de la suite (xn )n∈N , la
connaissance du signe de la fonction x → f (x) − x permet de conclure.
Dans le cas où tous les xn sont strictement positifs, on peut étudier la position
xn+1
de par rapport à 1. Dans ce cas la connaissance du signe de la fonction
xn
f (x)
x → − 1 permet de conclure.
x
Dans le théorème précédent sans l’hypothèse de continuité sur le compact [a, b]
la suite (xn )n∈N ne converge pas nécessairement vers un point fixe de f. Si par
336 Points fixes et approximations successives
   
x 1 1 1
exemple f est définie sur [0, 1] par f (x) = + sur 0, , f (x) = 1 sur ,1 ,
2 4  2 2
1 1 1
l’orbite de x0 = 0 est définie par xn = 1 − n et cette suite converge vers
2 2 2
qui n’est pas point fixe de f.
Dans le cas où f est décroissante on a, toujours avec les mêmes notations, le
résultat suivant.
Théorème 12.7.
Si la fonction f : I → I est décroissante, elle admet alors au plus un point
fixe dans I. Si de plus l’intervalle I est borné et la fonction f continue, les
suites extraites (x2n )n∈N et (x2n+1 )n∈N convergent alors vers des points
fixes de f ◦ f. Dans le cas où f ◦ f admet un unique point fixe, la suite
(xn )n∈N converge et sa limite est ce point fixe qui est également l’unique
point fixe de f.

Preuve. Si α ≤ β sont deux points fixes de f dans I, on a alors pour f décrois-


sante, α = f (α) ≥ f (β) = β et α = β. La fonction f admet donc au plus un point
fixe dans I.
La fonction f étant décroissante il en résulte que f ◦f est croissante et les suites
(x2n )n∈N , (x2n+1 )n∈N sont monotones. Pour I borné, ces suites convergent vers
des réels α et β dans I qui sont des points fixes de f ◦ f si f est continue.
Dans l’hypothèse où f ◦ f a un seul point fixe on a α = β et la suite (xn )n∈N
converge vers ce point fixe qui est également l’unique point fixe de f. 
Dans le cas où, avec les hypothèses précédentes, la fonction f ◦f admet plusieurs
points fixes, la suite (xn )n∈N peut être divergente. Par exemple la fonction f définie

2 5−1
sur [0, 1] par f (x) = 1 − x admet pour unique point fixe α = dans [0, 1]
2
et la fonction f ◦ f admet les 3 points fixes 0, 1 et α dans [0, 1] . On peut alors
vérifier que pour x0 = α, on a lim x2n = 0 et lim x2n+1 = 1 (exercice 12.5).
n→+∞ n→+∞
Une condition nécessaire et suffisante de convergence d’une orbite sur un inter-
valle compact est donnée par le théorème 12.8 qui suit.

Lemme 12.3 Si (xn )n∈N est une suite de réels telle que lim (xn+1 − xn ) = 0,
n→+∞
alors l’ensemble de ses valeurs d’adhérences est soit vide soit un intervalle fermé.

Preuve. Notons V l’ensemble des valeurs d’adhérences de la suite (xn )n∈N , c’est-
à-dire l’ensemble des limites de suites extraites de (xn )n∈N . On sait que cet en-
semble est fermé (théorème 1.9). On suppose que cet ensemble est non vide, non
réduit à un point et on se donne a < b dans V. Il s’agit alors de montrer que ]a, b[
est inclus dans V.
Si c ∈ ]a, b[ n’est pas dans V, il existe alors un réel ε > 0 tel que ]c − ε, c + ε[
est contenu dans ]a, b[ et un entier n0 tel que pour tout n ≥ n0 , xn ∈
/ ]c − ε, c + ε[ .
Avec lim (xn+1 − xn ) = 0 on déduit qu’il existe un entier n1 ≥ n0 tel que
n→+∞
|xn+1 − xn | < 2ε pour tout n ≥ n1 . En particulier on a xn1 ∈ / ]c − ε, c + ε[ . Si
xn1 ≤ c − ε alors xn1 +1 < 2ε + xn1 ≤ c + ε et comme xn1 +1 ∈ / ]c − ε, c + ε[ cela
signifie que xn1 +1 ≤ c − ε. Par récurrence on déduit alors que xn ≤ c − ε pour tout
Suites homographiques 337

n ≥ n1 , ce qui contredit le fait que b est valeur d’adhérence de la suite (xn )n∈N .
De manière analogue xn1 ≥ c + ε va contredire le fait que a est valeur d’adhérence
de la suite (xn )n∈N . On aboutit donc ainsi à une contradiction. En conclusion, V
est un intervalle fermé. 
Théorème 12.8.
Soit f une fonction continue de [a, b] dans lui même et (xn )n∈N une
orbite suivant f. Cette suite est convergente si, et seulement si, on a
lim (xn+1 − xn ) = 0.
n→+∞

Preuve. Si la suite (xn )n∈N converge, on a alors lim (xn+1 − xn ) = 0. Réci-


n→+∞
proquement si lim (xn+1 − xn ) = 0, toute valeur d’adhérence de (xn )n∈N est un
n→+∞
point fixe de f. En effet si  est une valeur d’adhérence de cette suite et xϕ(n) n∈N
une suite extraite convergente vers , on a lim xϕ(n)+1 = lim f xϕ(n) = f ()
n→+∞ n→+∞
(f est continue) et avec lim xϕ(n)+1 − xϕ(n) = 0 on déduit qu’on a aussi
n→+∞
lim xϕ(n)+1 =  et donc  = f () . D’autre part, la suite (xn )n∈N étant à valeurs
n→+∞
dans un compact admet des valeurs d’adhérence et le lemme précédent nous dit
que l’ensemble de ces valeurs d’adhérence est un intervalle fermé. Si cet intervalle
n’est pas réduit à un point, on dispose de deux valeurs d’adhérence α < β et tout
point γ ∈ ]α, β[ étant valeur d’adhérence on dispose d’une infinité d’indices n tels
que xn ∈ ]α, β[ , puis considérant qu’un tel xn est alors valeur d’adhérence de
(xn )n∈N , donc point fixe de f, on a xn+1 = f (xn ) = xn , c’est-à-dire que la suite
(xn )n∈N est stationnaire à partir d’un certain rang, donc convergente et n’a qu’une
valeur d’adhérence contrairement à l’hypothèse de départ. En définitive (xn )n∈N
n’a qu’une valeur d’adhérence, elle est donc convergente et c’est nécessairement
vers un point fixe de f. 

12.3 Suites homographiques


Dans le cadre réel, on s’intéresse ici au cas particulier des suites arithmético-
géométriques et homographiques.
Pour a, b, c, d réels tels c = 0, on définit la fonction homographique f par :
 
d ax + b
∀x ∈ R \ − , f (x) =
c cx + d

Pour c = 0, la fonction f est définie sur R et affine.


On s’intéresse d’abord au cas où la fonction f : x → ax + b est affine. On peut
définir les orbites (xn )n∈N par la relation de récurrence xn+1 = axn +b et la donnée
de x0 .
Pour a = 0, la suite (xn )n∈N est stationnaire sur b qui est l’unique point fixe de
f.
Pour a = 1, b = 0, tous les réels sont fixes par f = IdR et toute orbite est
stationnaire sur x0 .
338 Points fixes et approximations successives

Pour a = 1, b = 0, la fonction f n’a pas de point fixe, la suite (xn )n∈N est
arithmétique de raison b et une récurrence immédiate donne xn = x0 + nb pour
tout n ∈ N. On a donc lim |xn | = +∞.
n→+∞
b
Pour a ∈
/ {0, 1} , l’unique point fixe de f est α = . De xn+1 = axn + b
1−a
et α = aα + b, on déduit que xn+1 − α = a (xn − α) et par récurrence xn − α =
an (x0 − α) , soit xn = α + an (x0 − α) . On en déduit alors les résultats suivants :
— pour a = −1 ou |a| > 1, la suite (xn )n∈N converge (vers α) si, et seulement
si, x0 = α ;
— pour |a| < 1, la suite (xn )n∈N converge vers α pour toute valeur initiale x0 .
Pour la suite de ce paragraphe, f est une fonction homographique de paramètres
 
d
a, b, c, d réels tels c = 0. Cette fonction est indéfiniment dérivable sur R \ −
c
avec :  
d ad − bc
∀x ∈ R \ − , f  (x) = 2
c (cx + d)
En particulier
 pour ad − bc = 0, cette fonction est constante sur chacun des
d d
intervalles −∞, − et − , +∞ . On suppose donc que ad − bc = 0 et dans ce
c c  
d .a/
cas f réalise un homéomorphisme de R \ − sur R \ .
c c  
ax + b a b
À une telle homographie f : x → on associe la matrice A =
cx + d c d
ax + b a x + b
dans GL2 (R) et on peut remarquer que si f : x → et g : x → 
cx + d  c x + d
d
sont deux fonctions homographiques définies respectivement sur R \ − et
  c
d
R \ −  avec c, c , ad − bc, a d − b c non nuls, alors la composée f ◦ g, définie a
c     
d d
priori sur R \ −  ∩ R \ g −1 − , est homographique et ses coefficients
c c  
aa + bc ab + bd
sont ceux de la matrice produit A = AA = . Pour
ca + dc cb + dd
c = 0, on a d = 0 (det (A ) = 0) 
et f ◦  g est affine définie sur R tout entier et
 d
pour c = 0, elle est définie sur R \ −  .
c
Pour tout entier naturel non nul n, on peut définir la  n-ème itérée
 de f, notée
n n a n bn
f et cette homographie est associée à la matrice A = , elle est donc
c n dn
 
dn
définie sur R si cn = 0 et sur R \ − si cn = 0.
cn
Si f est une homographie, on peut alors définir une orbite (xn )n∈N suivant f
de valeur initiale x0 si la condition suivante est réalisée :

∀n ≥ 1, cn x0 + dn = 0
Suites homographiques 339

an x 0 + bn
Cette suite étant définie par xn = pour tout n ∈ N en posant
c n x0 + dn
d d
a0 = d0 = 1 et b0 = c0 = 0. On a x0 = − et pour n ≥ 1 l’égalité xn = −
c c
implique (can + dcn ) x0 + (cbn + ddn ) = 0, soit à cn+1 x0 + dn+1 = 0, ce qui est
exclut. Le réel xn+1 = f (xn ) est donc bien défini. En supposant cette condition
vérifiée, on a axn + b = (cxn + d) xn+1 pour tout n ∈ N. Dans le cas où la suite
(xn )n∈N converge vers un réel α, ce réel est nécessairement solution de l’équation :

cα2 + (d − a) α − b = 0 (12.1)
2
On peut remarquer que le discriminant Δ = (d − a) + 4bc  de cette
 équation
a b
est celui du polynôme caractéristique de la matrice A = associé à
c d
l’homographie f. En effet ce polynôme caractéristique est λ2 − (a + d) λ + ad − bc
2
et son discriminant est (a + d) − 4 (ad − bc) = Δ.
Pour Δ < 0, l’équation (12.1) n’a pas de solution réelle. On a donc le premier
résultat suivant.
2
Lemme 12.4 Avec les hypothèses et notations qui précèdent, si Δ = (d − a) +
4bc < 0, l’orbite (xn )n∈N est alors divergente.

a−d
Pour Δ = 0, l’équation (12.1) a une unique racine réelle α = . De plus,
2c
d d
α = − . En effet, α = − équivaut à d = −a et Δ = 0 équivaut alors à a2 +bc = 0
c c
qui est en contradiction
 avec
 ad−bc = − a2 + bc = 0. Ce réel α est l’unique point
d
fixe de f dans R \ − (l’équation f (x) = x équivaut à cx2 + (d − a) x − b = 0).
c
Pour x0 = α, la suite (xn )n∈N est stationnaire sur α et donc convergente vers
l’unique point fixe de f. On suppose donc que x0 = α.
2
Lemme 12.5 Avec les hypothèses et notations qui précèdent, si Δ = (d − a) +
a−d
4bc = 0 et x0 = α = , on a alors xn = α pour tout n ∈ N.
2c
  .a/
d
Preuve. La fonction f réalisant un homéomorphisme de R \ − sur R \ ,
  c c
d . a /
l’équation f (α) = α avec α ∈ R \ − équivaut à α ∈ R \ et α = f −1 (α) .
  c c
d
Pour x0 ∈ R \ − , x1 = f (x0 ) = α équivaut à x0 = f −1 (x1 ) = α. On a donc
c
x1 = α si x0 = α. Et par récurrence, on montre que xn = α pour  tout n ∈  N. 
a−d 1
Pour x0 = α = , on peut donc définir la suite (yn )n∈N = .
2c xn − α n∈N

2c
Lemme 12.6 La suite (yn )n∈N est arithmétique de raison β = . Soit :
a+d
∀n ∈ N, yn+1 = β + yn
340 Points fixes et approximations successives

Preuve. On a vu que les conditions Δ = 0 et ad − bc = 0 entraînent a + d = 0


d
(équivalente à α = − ). Pour n ∈ N, on a alors :
c
1 1 (cxn + d) (cα + d)
yn+1 = = =
xn+1 − α f (xn ) − f (α) (ad − bc) (xn − α)

a+d a+d
En tenant compte de cα + d = , cxn + d = c (xn − α) + et Δ = 0
2 2
2
équivalent à (a + d) = 4 (ad − bc) , on obtient :

c (xn − α) + a+d
2
a+d
2 2c
yn+1 = (a+d)2
= + yn
(xn − α) a+d
4


Théorème 12.9.
2
Avec les hypothèses et notations qui précèdent, si Δ = (d − a) + 4bc = 0
et x0 = α, on a alors :
1
∀n ∈ N, xn = +α
y0 + nβ
a−d 1 2c
où α = est l’unique point fixe de f, y0 = ,β = . Il en
2c x0 − α a+d
résulte que lim xn = α.
n→+∞

1
Preuve. Résulte de yn = y0 + nβ = . 
xn − α
On peut essayer d’utiliser le théorème du point fixe, spécialement le théorème
9.27, pour étudier la convergence de la suite (xn )n∈N . Mais ici, on a f  (α) =
4 (ad − c)
2 = 1 et on ne peut conclure avec ce théorème. Un exemple de telle
(a + d)
x
situation est donné par la fonction f définie sur R \ {−1} par f (x) = .
1+x
xn
Pour x0 bien choisi la suite (xn )n∈N définie par xn+1 = converge vers
1 + xn
0 quiest l’unique
 point fixe de f. La matrice associée
 à cette homographie est
1 0 1 0 1
A= et pour n ≥ 1, on a An = et pour x0 = − la suite
1 1 n 1 n
x0 1
(xn )n∈N est bien définie par xn = (pour x0 = 0, on a y0 = et β = 1).
nx0 + 1 x0
Pour Δ > 0, l’équation (12.1) a deux racines réelles α, β qui sont les deux points
fixes de f (la condition ad − bc = 0 entraîne bien que α et β sont différents de
d
− ).
c
Pour x0 = α, la suite stationne sur α.
Suites homographiques 341

Pour x0 = α, on vérifie comme dans le cas Δ = 0 que xn = α pour tout n ∈ N


et on définit la suite (yn )n∈N par :

xn − β
∀n ∈ N, yn =
xn − α
Lemme 12.7 Avec le hypothèses et notations qui précèdent, la suite (yn )n∈N est
cα + d
géométrique de raison , soit :
cβ + d
cα + d
∀n ∈ N, yn+1 = yn
cβ + d
f (xn ) − f (β) cα + d xn − β
Preuve. On a yn+1 = = . 
f (xn ) − f (α) cβ + d xn − α
Théorème 12.10.
2
Avec les hypothèses et notations qui précèdent, si Δ = (d − a) + 4bc > 0
et x0 = α, on a alors :
β − αy0 λn
∀n ∈ N, xn =
1 − y 0 λn
√ √
a−d− Δ a−d+ Δ
où α = , β = sont les points fixes de f, y0 =
2c 2c
x0 − β cα + d
et λ = . De plus :
x0 − α cβ + d
— si |λ| < 1, alors lim xn = β ;
n→+∞
— si |λ| > 1, alors lim xn = α ;
n→+∞
β − αy0
— si |λ| = 1, alors λ = −1, lim x2n = γ = , lim x2n+1 =
n→+∞ 1 − y0 n→+∞
β + αy0
δ= = γ et la suite (xn )n∈N diverge.
1 + y0

xn − β
Preuve. Résulte de yn = y0 λn = et α = β. 
xn − α
ax + 1
Un exemple de telle situation est donné par f (x) = avec a > 0, a = 1
x+a
a−1
(d = a, b = c = 1). On a ici, Δ = 4, α = −1, β = 1, λ = et :
a+1
1 + y0 λ n
∀n ∈ N, xn =
1 − y0 λn
x0 − 1
avec y0 = pour x0 = −1. Pour a > 0 on a |λ| < 1 et lim xn = 1. La
x0 + 1   n→+∞
a 1
matrice associée à f est A = , cette matrice a deux valeurs propres
1 a
342 Points fixes et approximations successives

distinctes λ1 = a − 1, λ2 = a + 1 et :
    
−1 −1 1 a−1 0 1 −1 1
A = P DP =
1 1 0 a+1 2 1 1

ce qui donne :
  n  
1 −1 1 (a − 1) 0 −1 1
∀n ≥ 1, An = n
2 1 1 0 (a + 1) 1 1

soit :
 n n n n 
1 (a − 1) + (a + 1) − (a − 1) + (a + 1)
∀n ≥ 1, An = n n n n
2 − (a − 1) + (a + 1) (a − 1) + (a + 1)

La condition sur x0 pour définir une orbite est donc :


n n
(a − 1) + (a + 1) λn + 1
∀n ≥ 1, x0 = n n = n
(a − 1) − (a + 1) λ −1

et l’expression explicite de xn est :


n n n n
((a − 1) + (a + 1) ) x0 + ((a + 1) − (a − 1) )
xn = n n n n
((a + 1) − (a − 1) ) x0 + ((a − 1) + (a + 1) )
(λn + 1) x0 + (1 − λn ) λn (x0 − 1) + x0 + 1 1 + y0 λn
= = =
(1 − λn ) x0 + (λn + 1) −λn (x0 − 1) + x0 + 1 1 − y 0 λn

12.4 Applications à la résolution d’équations nu-


mériques
On se place à nouveau dans le cadre d’une fonction f définie sur un intervalle
réel I et à valeurs réelles.
La résolution d’une équation f (x) = 0 sur I peut se ramener à un problème
de recherche de point fixe en considérant la fonction g définie sur I par g (x) =
x − λ (x) f (x) , où la fonction λ définie sur I est telle que g (I) ⊂ I et λ (x) = 0
pour tout x ∈ I (l’intervalle I devra éventuellement être remplacé par un intervalle
plus petit).
On peut prendre pour λ une fonction constante non nulle (exercice 12.3), λ (x) =
1 b−x
quand cela est possible (méthode de Newton), ou λ (x) = avec
g  (x) g (b) − g (x)
b ∈ I quand cela est possible (méthode de la sécante).

12.4.1 Méthode de Lagrange (ou de la sécante)


L’idée de la méthode de la sécante pour résoudre l’équation f (x) = 0 est de
remplacer dans un voisinage ]a, b[ de la solution α de cette équation (en suppo-
sant que cette solution existe et est unique dans ]a, b[) le graphe de f par celui
Applications à la résolution d’équations numériques 343

de la sécante passant par les points M (x, f (x)) et B (b, f (b)) (interpolation de
Lagrange). L’équation de cette sécante est, en supposant x < b :
f (b) − f (x)
Y = f (x) + (X − x)
b−x
Dans le cas où f (b) = f (x) , le point d’intersection de cette sécante avec l’axe
b−x
des x est donné par g (x) = x − f (x) et la résolution de l’équation
f (b) − f (x)
f (x) = 0 est ainsi ramenée à la résolution du problème de point fixe g (x) = x, ce
qui revient à considérer la suite (xn )n∈N définie par x0 ∈ I et :

b − xn
xn+1 = xn − f (xn ) (n ≥ 0)
f (b) − f (xn )
quand cette dernière peut être définie.

Dans le cas où la fonction f : I → R est de classe C 2 , admet une racine α ∈ I
et est telle que f  f  garde un signe constant au voisinage de α (f est strictement
monotone et à convexité constante sur ce voisinage), la suite (xn )n∈N est bien
définie, strictement monotone ou stationnaire sur α, converge vers α et on peut
donner une majoration de l’erreur d’approximation. Pour démontrer ce résultat
nous aurons besoin du lemme suivant.

Lemme 12.8 Soit f une fonction de classe C 2 sur un intervalle [a, b] telle que
f (a) f (b) < 0 et f  (x) = 0 pour tout x ∈ [a, b] . L’équation f (x) = 0 admet
une unique solution α ∈ ]a, b[ , on peut définir la fonction g sur [a, b[ par g (x) =
b−x
x− f (x) et on a :
f (b) − f (x)
b − α M2
∀x ∈ [a, b[ , |g (x) − α| ≤ |x − α|
2 m1
où M2 = sup |f  (x)| et m1 = inf |f  (x)| .
x∈[a,b] x∈[a,b]

Preuve. L’existence d’une racine α de l’équation f (x) = 0 se déduit du théorème


des valeurs intermédiaires avec l’hypothèse f (a) f (b) < 0 et l’unicité est consé-
quence de la stricte monotonie de f. En utilisant le théorème des accroissements
finis, on peut écrire, pour tout x ∈ [a, b[ , que f (b) − f (x) = (b − x) f  (cx ) avec
cx ∈ ]x, b[ et f  (cx ) = 0. On a donc f (b) − f (x) = 0. On peut donc définir la
b−x
fonction g sur [a, b[ par g (x) = x − f (x) . Pour tout x ∈ [a, b[ , on a :
f (b) − f (x)
f (b) (x − α) − f (x) (b − α) h (x)
g (x) − α = =
f (b) − f (x) f (b) − f (x)

la fonction h étant de classe C 2 sur [a, b] avec h (α) = h (b) = 0. Pour x fixé dans
[a, b] , on définit la fonction ϕx sur [a, b[ par ϕx (t) = h (t) − kx (t − α) (t − b) , la
constante kx étant choisie de telle sorte que ϕx (x) = 0, ce qui équivaut à dire
h (x)
que kx = . Cette fonction est de classe C 2 sur [a, b] avec ϕx (α) =
(x − α) (x − b)
344 Points fixes et approximations successives

ϕx (b) = ϕx (x) = 0. En utilisant le théorème de Rolle itéré (théorème 9.5), on


déduit qu’il existe cx dans ]α, b[ tel que ϕx (cx ) = 0, ce qui équivaut à h (cx ) −
h (x) h (cx ) − (b − α) f  (cx )
2kx = 0, soit kx = = = . En notant
(x − α) (x − b) 2 2
b−α
M2 = sup |f  (x)| , on aboutit à |h (x)| ≤ |x − α| (b − x) M2 , inégalité
x∈[a,b] 2
encore valable pour x = α et x = b. On en déduit alors que pour tout x ∈ [a, b[ on
b−α b−x
a |g (x) − α| ≤ |x − α| M2 . En notant m1 = inf |f  (x)| et
2 |f (b) − f (x)| x∈[a,b]
en utilisant le théorème des accroissements finis, on a |f (b) − f (x)| ≥ m1 (b − x)
avec m1 > 0 (la borne inférieure de f  est atteinte et |f  | > 0), ce qui donne
b − α M2
|g (x) − α| ≤ |x − α| . 
2 m1
Théorème 12.11.

Soit f une fonction de classe C 2 sur un intervalle [a, b] telle que


f (a) f (b) < 0 et f  (x) f  (x) = 0 pour tout x ∈ [a, b] . Dans ces condi-
tions, l’équation f (x) = 0 admet une unique solution α ∈ ]a, b[ , pour tout
x0 dans [a, b[ , on peut définir la suite (xn )n∈N de points de [a, b[ par :

b − xn
∀n ∈ N, xn+1 = xn − f (xn )
f (b) − f (xn )

cette suite est monotone, converge vers α et on a la majoration de l’erreur


d’approximation :
 n
b − a M2
∀n ∈ N, |xn − α| ≤ (b − a)
2 m1

où M2 = sup |f  (x)| et m1 = inf |f  (x)| .


x∈[a,b] x∈[a,b]

Preuve. On peut supposer que f  (x) > 0 et f  (x) > 0 pour tout x ∈ [a, b] . En
effet, si f  < 0 et f  < 0, on remplace f par −f, si f  < 0 et f  > 0, on remplace
f par x → f (−x) et si f  > 0 et f  < 0, on remplace f par x → −f (−x) . Dans
la démonstration du lemme précédent, on a montré l’existence et l’unicité de la
racine α de l’équation f (x) = 0 et on a vu qu’on peut définir la fonction g sur
b−x
[a, b[ par g (x) = x − f (x) . Cette fonction est de classe C 2 sur [a, b[
f (b) − f (x)
f (b)
et peut se prolonger par continuité en b en posant g (b) = b −  . Pour tout x
f (b)
dans [a, b[ , on a :

f (b)
g  (x) = 2 (f (b) − f (x) − (b − x) f  (x))
(f (b) − f (x))
2
f (b) (b − x) 
= 2 f (cx )
(f (b) − f (x)) 2
Applications à la résolution d’équations numériques 345

où cx ∈ ]x, b[ (formule de Taylor à l’ordre 2 pour f entre x et b). Tenant compte


de f (b) > f (α) = 0 et f  (cx ) > 0, on déduit que g  (x) > 0 pour tout x ∈ [a, b[
et donc que g est strictement croissante sur [a, b] .
Pour tout x ∈ [a, α[ on a f (x) < f (α) = 0 et f (b)−f (x) > 0 (f est strictement
croissante) et donc g (x) > x. De plus, avec la stricte croissance de g on obtient
g (x) < g (α) = α. On a donc :
∀x ∈ [a, α[ , a ≤ x < g (x) < α
De même pour tout x ∈ ]α, b] , on a g (x) > g (α) = α et f (x) > f (α) = 0, donc
g (x) < x. D’où :
∀x ∈ ]α, b] , α < g (x) < x ≤ b
En définitive les intervalles [a, α] , [α, b] et donc [a, b] sont stables par g. On peut
donc définir la suite (xn )n∈N par x0 ∈ [a, b] et xn+1 = g (xn ) pour tout n ≥ 0.
Pour x0 = α, cette suite est stationnaire sur α. Des encadrements précédents, on
déduit que si x0 ∈ [a, α[ on a alors :
∀n ∈ N, a ≤ xn < xn+1 < α
Cette suite est donc strictement croissante majorée et en conséquence converge,
sa limite étant α (continuité de g). Pour x0 ∈ ]α, b[ , on a :
∀n ∈ N, α ≤ xn+1 < xn < b
Cette suite est donc strictement décroissante minorée et en conséquence converge,
sa limite étant α. En utilisant le lemme précédent, on déduit que pour tout n ∈ N
b − α M2
on a |xn+1 − α| = |g (xn ) − α| ≤ |xn − α| et par récurrence on aboutit
2 m1
à:  n  n
b − α M2 b − a M2
∀n ∈ N, |xn − α| ≤ |x0 − α| ≤ (b − a)
2 m1 2 m1


12.4.2 Méthode de Newton (ou de la tangente)


L’idée de la méthode de Newton pour résoudre l’équation f (x) = 0 est de
remplacer dans un voisinage ]a, b[ de la solution α de cette équation (en supposant
que cette solution existe et est unique dans ]a, b[) le graphe de f par celui de la
tangente à ce graphe en un point. Ce qui peut être illustré par la figure 12.1.
L’équation de la tangente en (x, f (x)) est Y = f (x) + f  (x) (X − x) . Dans
le cas où f  (x) = 0, le point d’intersection de cette tangente avec l’axe des x est
f (x)
donné par g (x) = x−  . La résolution de l’équation f (x) = 0 est ainsi ramené
f (x)
à la résolution du problème de point fixe g (x) = x, ce qui revient à considérer la
f (xn )
suite définie par x0 ∈ I et xn+1 = xn −  pour n ≥ 0, quand cette dernière
f (xn )
est définie.
Cette méthode peut s’appliquer quand α est racine simple de f, c’est-à-dire si
f (α) = 0 et f  (α) = 0. Dans ce cas on aura f  (x) = 0 pour x voisin de la racine
α. De manière plus précise, une condition suffisante de convergence est donnée par
le théorème qui suit.
346 Points fixes et approximations successives

x2 x1 x0

Figure 12.1 – Méthode de Newton

Théorème 12.12.

Soient f ∈ C 2 (I, R) et α ∈ I tel que f (α) = 0 et f  (α) = 0. Il existe un
réel η > 0 tel que pour tout x0 ∈ [α − η, α + η] la suite (xn )n∈N définie par
f (xn )
xn+1 = xn −  converge vers α.
f (xn )

Preuve. La fonction f  étant continue sur I avec f  (α) = 0, on peut trouver


un réel δ > 0 tel que J = [α − δ, α + δ] ⊂ I et f  (x) = 0 pour tout x ∈ J. On
f (x)
peut donc définir la fonction g sur J par g (x) = x −  . Si on suppose de plus
f (x)
f (x) f  (x)
que f est de classe C 2 alors g est de classe C 1 sur J avec g  (x) = 2 .
(f  (x))
De f (α) = 0 on déduit que g  (α) = 0 et le théorème du point fixe appliqué à la
fonction g permet alors de conclure. 
Le théorème suivant nous donne une majoration de l’erreur d’approximation.
Théorème 12.13.

Soit f une fonction de classe C 2 sur un intervalle [a, b] telle que


f (a) f (b) < 0 et f  (x) f  (x) = 0 pour tout x ∈ [a, b] . Dans ces condi-
tions, l’équation f (x) = 0 admet une unique solution α ∈ ]a, b[ , pour tout
x0 dans [a, b[ tel que f (x0 ) f  (x0 ) > 0, on peut définir la suite (xn )n∈N de
points de [a, b[ par :

f (xn )
∀n ≥ 0, xn+1 = xn −
f  (xn )

cette suite est monotone, converge vers α et une majoration de l’erreur


d’approximation est donnée par :
 2n −1
b − a M2
|xn − α| ≤ (b − a)
2 m1

où m1 = inf |f  (x)| et M2 = sup |f  (x)| .


x∈[a,b] x∈[a,b]
Applications à la résolution d’équations numériques 347

Preuve. Comme dans le cas de la méthode de Lagrange, on peut supposer que


f  (x) > 0 et f  (x) > 0 pour tout x ∈ [a, b] . L’hypothèse f (x0 ) f  (x0 ) > 0 se
traduit alors par f (x0 ) > 0.
Le théorème des valeurs intermédiaires et la stricte croissance de f nous garan-
tissent l’existence et l’unicité de la solution α ∈ ]a, b[ de f (x) = 0.
L’hypothèse f  (x) = 0 pour tout x ∈ [a, b] nous permet de définir la fonction g
f (x)
sur [a, b] par g (x) = x −  . Avec la formule de Taylor à l’ordre 2 appliquée à
f (x)
f entre x et α on a :

2 f  (cx )
∀x ∈ [a, b] , g (x) − α = (x − α)
2f  (x)

où cx est un réel strictement compris entre x et α. Les fonctions f  et f  étant


à valeurs strictement positives, on en déduit que g (x) ≥ α pour tout x ∈ [a, b] .
De plus pour tout x ∈ [α, b] , on a f (x) ≥ f (α) = 0 (f est croissante) et g (x) =
f (x)
x−  ≤ x. On a donc α ≤ g (x) ≤ x pour tout x ∈ [α, b] , ce qui entraîne que
f (x)
l’intervalle [α, b] est stable par g et la suite (xn )n∈N est bien définie si on choisit
x0 ∈ [α, b] , ce qui équivaut à dire que f (x0 ) > 0, soit f (x0 ) f  (x0 ) > 0. Dans ces
conditions, on a :
∀n ≥ 0, α ≤ xn+1 = g (xn ) ≤ xn ≤ b
c’est-à-dire que la suite (xn )n∈N est décroissante et minorée, elle est donc conver-
gente et c’est nécessairement vers la solution α ∈ ]a, b[ de f (x) = 0.
La majoration de l’erreur d’approximation se déduit immédiatement des inéga-
lités :

2 f (cn ) 2 M2
∀n ≥ 0, |xn+1 − α| = |xn − α| 
≤ |xn − α|
2f (xn ) 2m1


Exemple 12.1 Le calcul approché de la racine pème (p ∈ N − {0, 1}) d’un


√ réel
a > 0 peut se faire en utilisant la méthode de Newton. En effet α = p a est
racine de f (x) = xp − a et laméthode de Newton consiste à utiliser la suite
1 a
définie par x0 > 0 et xn+1 = (p − 1) xn + p−1 pour n ≥ 0, qui nous donne
√ p xn
p
a = lim xn . Pour n ≥ 0 on a :
n→+∞

2 f  (cn ) 2 (p − 1) cn
p−2
xn+1 − α = (xn − α) 
= (xn − α) p−1
2f (xn ) 2xn
f (xn )
et par récurrence xn > α pour n ≥ 1. De plus xn+1 = xn − < xn . La suite
f  (xn )
(xn )n∈N est donc décroissante minorée par α.

Dans la pratique, la méthode de Newton est très efficace si le point de départ


est choisi proche de la solution α. Dans le cas contraire la suite peut diverger ou
converger vers une autre racine. Ce dernier cas peut se produire si f  (x) change
de signe au voisinage de α.
348 Points fixes et approximations successives

Dans le cas où la racine α est multiple d’ordre p, on applique la méthode de


Newton à la fonction p f (x), ce qui revient à considérer la suite des approxima-
f (xn )
tions successives définie par xn+1 = xn − p  pour tout n ≥ 0.
f (xn )
Dans le cas où f est une fonction polynomiale à coefficients réels dont toutes les
racines sont réelles et distinctes, on est presque toujours assuré de la convergence
de la méthode de Newton. On a plus précisément le résultat suivant due à C.
Masse en 1984.
Théorème 12.14.
Soit f une fonction polynomiale de degré n ≥ 1 à coefficients réels dont
toutes les racines sont réelles et distinctes et E l’ensemble des réels x0 pour
lesquels la méthode de Newton associée à f de premier terme x0 diverge.
— Pour n ≤ 2, E est vide ou réduit à un point.
— Pour n = 3, E est dénombrable.
— Pour n ≥ 4, E est non dénombrable de mesure de Lebesgue nulle.

12.5 Exercices

Exercice 12.1.
1. Montrer qu’une suite numérique (xn )n∈N est arithmétique si, et seule-
ment si, xn + xn+2 = 2xn+1 pour tout n ∈ N.
2. Montrer qu’une suite numérique (xn )n∈N est géométrique de raison non
nulle si, et seulement si, x0 = 0, x1 = 0 et xn xn+2 = x2n+1 pour tout
n ∈ N.

Solution.
1. Si (xn )n∈N est arithmétique de raison b, on a alors :

∀n ∈ N, xn + xn+2 = 2x0 + (2n + 2) b = 2xn+1

Réciproquement supposons cette identité vérifiée, en posant b = x1 − x0 , on a


x1 = x0 + b et en supposant que xk = x0 + kb pour 0 ≤ k ≤ n avec n ≥ 1, on a
xn+1 = 2 (x0 + n) − (x0 + (n − 1) b) = x0 + (n + 1) b, c’est-à-dire que (xn )n∈N
est arithmétique de raison b.
2. Si (xn )n∈N est géométrique de raison a, on a alors :

∀n ∈ N, xn xn+2 = x20 a2n+2 = x2n+1

Réciproquement supposons cette identité vérifiée. Si x0 = 0 alors xn = 0 pour


tout n ∈ N (par récurrence) et (xn )n∈N est géométrique de raison a quelconque
dans R. Si x0 = 0 et x1 = 0 alors xn = 0 pour tout n ≥ 1 et (xn )n∈N est
géométrique de raison nulle. Si x0 = 0 et x1 = 0 alors xn = 0 pour tout n ∈ N
Exercices 349

x1
(par récurrence) et en posant a = , on a x1 = ax0 , puis en supposant que
x0
x2
xk = x0 ak pour 0 ≤ k ≤ n avec n ≥ 1, on a xn+1 = n = x0 ak+1 , c’est-à-dire
xn−1
que (xn )n∈N est géométrique de raison a.

1
Exercice 12.2. Soit (xn )n∈N définie par x0 > 0 et xn+1 = arctan (xn )
2
pour tout n ∈ N.
1. Montrer que lim (2n xn ) = λ > 0.
n→+∞
 
λ 4λ3 1 1
2. Montrer que xn = + + o .
2n 9 23n n→+∞ 23n

Solution.
1. Pour tout réel x > 0, on a 0 < arctan (x) < x. On déduit alors que, pour x0 > 0,
on a :
∀n > 0, 0 < 2n xn < 2n−1 xn−1 < x0
C’est-à-dire que la suite (2n xn )n≥0 est décroissante et minorée. Elle converge
donc vers un réel λ ≥ 0. La suite (ln (2n xn ))n≥0 est de même nature que la
série de terme général ln (2n xn ) − ln 2n−1 xn−1 . En remarquant que :
   
2xn arctan (xn−1 ) x2n−1
ln (2n xn ) − ln 2n−1 xn−1 = ln = ln  −
xn−1 xn−1 n→+∞ 3

x2
et x2n < n0 , on déduit que la série de terme général ln (2n xn ) − ln 2n−1 xn−1
4
est convergente, ce qui entraîne l’existence d’une limite réelle pour la suite
(ln (2n xn ))n≥0 et λ > 0 (sinon lim 2n xn = 0 et lim ln (2n xn ) = −∞).
n→+∞ n→+∞
yn+1
2. On note yn = 2n xn . De lim yn = λ > 0 et lim = 1, on déduit que
n→+∞ yn
 
n→+∞
λ yn+1 yn+1 yn+1 − yn
xn  et ln  −1  . Mais on a aussi :
n→+∞ 2n yn n→+∞ yn n→+∞ λ
   
yn+1 arctan (xn ) x2 1 λ2
ln = ln  − n  − n
yn xn n→+∞ 3 n→+∞ 3 4

1 λ3
Ce qui donne yn+1 − yn  − et assure la convergence de la série de
n→+∞ 3 4n
terme général yn+1 − yn . En écrivant que :

λ − yn = lim yk − yn = (yk+1 − yk ) + y0 − yn
k→+∞
k≥0
 λ3  1 4λ3 1
= (yk+1 − yk )  − k
=−
3 4 9 4n
k≥n k≥n
350 Points fixes et approximations successives

(les restes de séries équivalentes et convergentes à termes négatifs sont


  équiva-
4λ3 1 1
lents – théorème 11.10 –) on déduit que yn = λ + + o et en
  9 4n n→+∞ 4n
λ 4λ3 1 1
conséquence, xn = n + + o .
2 9 23n n→+∞ 23n

Exercice 12.3. Soit f une fonction à valeurs réelles continûment déri-


vable sur un intervalle I d’intérieur non vide telle que l’équation f (x) = 0

admette une unique racine α dans I. Cette équation est équivalente à l’équa-
tion fλ (x) = x − λf (x) = x, où λ est un réel non nul à choisir judicieuse-
ment. On suppose que f  (α) > 0.
1. Montrer qu’il existe un réel η > 0 tel que l’intervalle J = [α − η, α + η]
soit contenu dans I et f  (x) > 0 pour tout x ∈ J.
2. On note m = inf f  (x) , M = sup f  (x) . Montrer que 0 < m ≤ M et
x∈J x∈J
qu’il existe un unique réel λ > 0 tel que :
M −m
∀x ∈ J, |fλ (x)| ≤
M +m

3. Montrer que pour tout x0 ∈ J on peut définir la suite (xn )n∈N de points
de J par xn+1 = fλ (xn ) pour tout n ∈ N et que cette suite converge vers
α.
4.   par f la fonction définie par f (x) = tan (x) − x sur
On désigne
3π 5π
, .
2 2
(a) Montrer que l’équation f (x) = 0 admet une unique solution α dans
J = [a, b] = [7.65, 7.75] .
(b) Déterminer le coefficient λ qui intervient dans la question 2.
(c) Proposer un procédé d’accélération de la convergence de la suite
(xn )n∈N et donner une valeur approchée de α à 10−6 près.

Solution.
1. Avec la continuité de f  et l’hypothèse f  (α) > 0 on déduit que f  (x) > 0 dans
un voisinage de α et considérant que α est intérieur à I, on déduit qu’il existe
η > 0 tel que J = [α − η, α + η] ⊂ I et f  (x) > 0 pour tout x ∈ J.
2. La fonction f  étant continue sur le compact J est bornée sur cet intervalle et
atteint ses bornes, on peut donc poser m = inf f  (x) , M = sup f  (x) et on a
x∈J x∈J
0 < m = f  (u) ≤ M = f (v) , avec u, v dans J. Pour tout réel non nul λ et tout
x dans J, on a fλ (x) = 1 − λf  (x) et :
   
M −m  M −m 2m  2M
− ≤ fλ (x) ≤ ⇔ ≤ λf (x) ≤
M +m M +m M +m M +m
Exercices 351

Pour un tel λ on a alors nécessairement :


2m 2M
≤ λf  (u) = λm et λM = λf  (v) ≤
M +m M +m
2 2 2
soit ≤λ≤ , c’est-à-dire que λ = est la seule valeur
M +m M +m M +m
possible. On vérifie facilement que cette valeur convient.
2 M −m
3. Pour λ = , on a sup |fλ (x)| ≤ < 1. En utilisant le théorème
M +m x∈J M +m
des accroissements finis, on en déduit alors que l’intervalle J = [α − η, α + η]
est stable par fλ et que l’application fλ est strictement contractante sur cet
intervalle. En effet, pour tout x dans J, on a :
M −m
|fλ (x) − α| = |fλ (x) − fλ (α)| ≤ |x − α| < |x − α| ≤ η
M +m
ce qui signifie que fλ (x) ∈ J. Avec le même argument on vérifie que fλ est
strictement contractante. Il en résulte que pour tout x0 ∈ J la suite (xn )n∈N
est bien définie et que cette suite converge vers α. Une majoration de l’erreur
d’approximation étant donnée par :
 n  n
M −m M −m
|xn − α| ≤ |x0 − α| ≤ η
M +m M +m

4.
(a) La fonction f est continue strictement
8 croissante sur J (en effet, f  (x) =
2 π9
tan (x) > 0 pour tout x ∈ I ⊂ 2π, 5 ) avec f (a) f (b) < 0, en consé-
2
quence l’équation f (x) = 0 admet une unique solution α ∈ J.
(b) On a m = inf f  (x) = tan2 (a)  23.36 et M = sup f  (x) = tan2 (b) 
x∈J x∈J
2
91.82, ce qui donne λ =  7.73 × 10−2 . Un algorithme de calcul
M +m
approché de α est donc donné en considérant la suite (xn )n∈N définie par
x0 = 7.7 ∈ J et :

∀n ≥ 0, xn+1 = xn − λ (tan (xn ) − xn )

(c) On peut accélérer la convergence en procédant comme suit. On calcule tout


d’abord x1 et on a f (x1 ) < 0, f (b) > 0, ce qui nous amène à remplacer
l’intervalle [a, b] par [a1 , b1 ] = [x1 , b] et le triplet (m, M, λ) par (m1 , M1 , λ1 )
avec : ⎧
⎨ m1 = tan2 (a1 )  56.59, M1 = tan2 (b1 )  91.82
2
⎩ λ1 =  1.34 × 10−2
M 1 + m1
On calcule alors l’itéré correspondant, ce qui donne x2 = fλ1 (x1 )  7.72.
On regarde le signe de f (x2 ) et on recommence. Au bout de 9 itérations
on obtient α  7.725251 qui donne une approximation à 10−6 près de α.
352 Points fixes et approximations successives

Exercice 12.4. Soit I un intervalle réel fermé non réduit à un point et


f une fonction continue de I dans I admettant un unique point fixe α dans
I telle que :
∀x ∈ I \ {α} , |f (x) − α| < |x − α|
Montrer que pour tout x0 dans I on peut définir la suite (xn )n∈N de points
de I par xn+1 = f (xn ) pour tout n ∈ N et que cette suite converge vers α.

Solution. La suite (xn )n∈N est bien définie du fait que I est stable par f et pour
tout n ∈ N, en notant rn = |xn − α| , on a :

0 ≤ rn+1 = |f (xn ) − α| ≤ |xn − α| = rn

(l’égalité est réalisée si xn = α), c’est-à-dire que la suite (rn )n∈N est décroissante
minorée, elle est donc convergente. Avec :

∀n ∈ N, |xn | ≤ rn + |α| ≤ r0 + |α|

on déduit que la suite (xn )n∈N est bornée, on peut donc en extraire une sous-suite
xϕ(n) n∈N convergente vers β ∈ I (l’intervalle I est fermé). Avec la continuité de
f et lim rϕ(n)+1 = lim rϕ(n) on déduit que :
n→+∞ n→+∞

|f (β) − α| = lim f xϕ(n) − α = lim xϕ(n)+1 − α


n→+∞ n→+∞

= lim rϕ(n)+1 = lim rϕ(n) = lim xϕ(n) − α = |β − α|


n→+∞ n→+∞ n→+∞

ce qui implique β = α puisque β = α donnerait |f (β) − α| < |β − α| . En défini-


tive, la suite (xn )n∈N est bornée avec α pour unique valeur d’adhérence, elle est
donc convergente vers α.

Exercice 12.5. Soit f la fonction définie sur I = [0, 1] par f (x) = 1−x2 .
1. Montrer que l’intervalle I est stable par f et que f a un unique point
fixe α ∈ I.
2. Vérifier que f ◦ f a trois points fixes γ < α < δ dans I.
3. Soit (xn )n∈N une orbite suivant f avec x0 = α.
(a) Montrer que xn = α pour tout n ∈ N et que la suite (xn )n∈N diverge.
(b) On suppose que x0 < α. Montrer que lim x2n = γ et
n→+∞
lim x2n+1 = δ.
n→+∞

Solution.
1. L’équation f (x) = x√équivaut à x2 + x√− 1 = 0. Cette dernière équation a deux
5−1 5+1
racines réelles α = et β = − , seule α est dans I. La fonction
2 
2
f est strictement décroissante sur I (f (x) = −2x < 0 pour 0 < x < 1) avec
f (0) = 1 ∈ I et f (1) = 0 ∈ I, donc f (I) = [0, 1] = I.
Exercices 353

2
2. On a g (x) − x = f ◦ f (x) − x = 1 − 1 − x2 = 2x2 − x4 − x. Comme f et g
sont polynomiales et les points fixes de f sont aussi points fixes de g, il existe
des réels a, b, c tels que g (x) − x = (f (x) − x) ax2 + bx + c , soit :

−x4 + 2x2 − x = −x2 − x + 1 ax2 + bx + c

On trouve g (x) − x = (f (x) − x) x2 − x et trois points fixes pour g dans I,



5−1
γ=0<α= < δ = 1.
2
3. Si x0 = α, la suite (xn )n∈N est alors stationnaire sur α.
(a) On a, pour tout entier n ≥ 0 :

xn+1 − α = f (xn ) − f (α) = α2 − x2n = (α − xn ) (α + xn ) (12.2)

Pour n = 0, on a x0 = α et supposant que xn = α pour n ≥ 0, on a :

|xn+1 − α| = |α − xn | (α + xn ) ≥ α |α − xn | > 0

On a donc xn = α pour tout entier n ≥ 0. Si la suite (xn )n∈N converge, c’est


nécessairement vers α (l’unique point fixe de f dans I), mais de (12.2) ,
|xn+1 − α| √
on déduit que lim = 2α = 5 − 1 > 1, ce qui implique
n→+∞ |xn − α|
que lim |xn − α| = +∞ (critère de d’Alembert) et est incompatible
n→+∞
lim xn = α. Cette suite est donc divergente.
n→+∞
(b) Supposons que 0 ≤ x0 < α. Comme f ◦ f est strictement croissante sur I
et α est point fixe de f ◦ f, on a 0 ≤ x2n < α pour tout entier n. La limite
de la suite (x2n )n∈N est donc γ ou α (on sait que cette suite converge
vers un point fixe de f ◦ f et elle est à valeurs dans le fermé [0, α]). Si
lim x2n = α, on a alors lim x2n+1 = lim f (x2n ) = f (α) = α
n→+∞ n→+∞ n→+∞
et lim xn = α, ce qui contredit la divergence de (xn )n∈N . On a donc
n→+∞
lim x2n = γ = 0 et lim x2n+1 = f (γ) = δ = 1. Pour α < x0 ≤ 2, on
n→+∞ n→+∞
vérifie que lim x2n = δ et lim x2n+1 = f (δ) = γ.
n→+∞ n→+∞

Exercice 12.6. F est un fermé non vide d’un espace métrique complet
(E, d) . Soient (T, δ) un espace métrique et f : F × T → F une application
continue et uniformément contractante, c’est-à-dire qu’il existe λ ∈ [0, 1[
tel que :

∀ (x, y, t) ∈ F 2 × T, d (f (x, t) , f (y, t)) ≤ λd (x, y)

Montrer que pour tout t ∈ T, la fonction x → f (x, t) admet un unique point


fixe α (t) dans F et que la fonction α est continue sur T (théorème du point
fixe à paramètres).
354 Points fixes et approximations successives

Solution. Le théorème du point fixe nous assure l’existence et l’unicité du point


fixe α (t) pour tout t ∈ T. Pour t0 et t dans T, on a :

d (α (t) , α (t0 )) = d (f (α (t) , t) , f (α (t0 ) , t0 ))


≤ d (f (α (t) , t) , f (α (t0 ) , t)) + d (f (α (t0 ) , t) , f (α (t0 ) , t0 ))
≤ λd (α (t) , α (t0 )) + d (f (α (t0 ) , t) , f (α (t0 ) , t0 ))

d (f (α (t0 ) , t) , f (α (t0 ) , t0 ))
et en conséquence d (α (t) , α (t0 )) ≤ . La continuité
1−λ
de α se déduit alors de celle de f.
Chapitre 13

Équations fonctionnelles

13.1 Morphismes du groupe additif (R, +) dans lui


même
Un morphisme du groupe additif (R, +) dans lui même est une application
f : R → R qui vérifie l’équation fonctionnelle de Cauchy :

∀ (x, y) ∈ R2 , f (x + y) = f (x) + f (y) (13.1)

Lemme 13.1 Si f est un morphisme du groupe additif (R, +) dans lui même, on
a alors :
∀a ∈ R, ∀r ∈ Q, f (ra) = rf (a)

Preuve. En prenant (x, y) = (0, 0) dans (13.1) , on obtient f (0) = 2f (0) , ce qui
équivaut à f (0) = 0 (un morphisme de groupes transforme le neutre en neutre).
En prenant (x, y) = (x, −x) dans (13.1) , on obtient f (x) + f (−x) = 0. On a
donc f (−x) = −f (x) pour tout x ∈ R, c’est-à-dire que la fonction f est impaire
(un morphisme de groupes transforme l’opposé en opposé).
De (13.1) on déduit par récurrence que pour tout a ∈ R on a :

∀n ∈ N, f (na) = nf (a)

En effet, le résultat est vrai pour n = 0 et le supposant acquis pour n ≥ 0, on a :

f ((n + 1) a) = f (na) + f (a) = nf (a) + f (a) = (n + 1) f (a)

il est donc vrai pour tout n ∈ N. # a$ #a$


En écrivant, pour tout n ∈ N \ {0} , que f (a) = f n = nf , on déduit
#a$ n n
1
que f = f (a) pour tout a ∈ R et tout n ∈ N \ {0} . Il en résulte que pour
n n
p
tout rationnel positif r = , avec p ∈ N et q ∈ N \ {0} , on a :
q
   
a a p
f (ra) = f p = pf = f (a) = rf (a)
q q q
356 Équations fonctionnelles

Enfin avec l’imparité de f, on déduit que ce dernier résultat est encore vrai pour
les rationnels négatifs. On a donc f (ra) = rf (a) pour tout a ∈ R et tout r ∈ Q.

Pour a = 1, en notant λ = f (1) , on obtient f (r) = λr pour tout r ∈ Q.
En considérant R comme un espace vectoriel sur le corps Q des rationnels, le
lemme précédent s’exprime en disant que tout morphisme du groupe additif (R, +)
dans lui même est une application Q-linéaire.
Dans ce qui suit nous allons montrer que si f est un morphisme du groupe
additif (R, +) dans lui même, une hypothèse supplémentaire (continuité en un
point, monotonie, f bornée sur un intervalle) va entraîner que f est R-linéaire, ce
qui revient à dire que c’est une homothétie.
On peut montrer, en utilisant le lemme de Zorn, qu’il existe une fonction vé-
rifiant l’équation fonctionnelle de Cauchy qui n’est pas une homothétie. Pour ce
faire, on se donne une Q-base (ei )i∈I de R (utilisation du lemme de Zorn) et
l’application Q-linéaire f définie sur R par f (ej ) = 1 et f (ei ) = 0 pour tout
i ∈ I \ {j} où j est fixé dans I, vérifie bien l’équation fonctionnelle (13.1) sans être
une homothétie.
En utilisant les approximations décimales par défaut et par excès d’un réel
(théorème 4.20), on obtient le résultat suivant.
Théorème 13.1.
Les morphismes du groupe additif (R, +) dans lui même qui sont mono-
tones sont les homothéties.

Preuve. Soit f une fonction croissante qui vérifie (13.1) . En particulier, on a


λ = f (1) ≥ f (0) = 0. En notant, pour x ∈ R, par (rn )n∈N et (sn )n∈N les suites
d’approximations décimales par défaut et par excès de ce réel, on a pour tout
n∈N:
λrn = f (rn ) ≤ f (x) ≤ f (sn ) = λsn
et faisant tendre n vers l’infini, on en déduit que f (x) = λx.
On procède de manière analogue pour f décroissante. 

Corollaire 13.1. L’identité est le seul morphisme de corps non identique-


ment nul de R dans lui même.

Preuve. Si f est morphisme du corps R dans lui même, on a alors f (x + y) =


2
f (x) + f (y) et f (xy) = f (x) f (y) pour tous x, y dans R. Avec f (1) = (f (1)) ,
on déduit que f (1) = 0 ou f (1) = 1. Si f (1) = 0, on a alors pour tout x ∈ R,
f (x) = f (x) f (1) = 0 et f est identiquement nulle. C’est une homothétie de
rapport 0. On suppose donc que f n’est pas identiquement nulle et dans ce cas, on
2
a f (1) = 1. Avec f x2 = (f (x)) ≥ 0, on déduit que f (x) ≥ 0 pour tout x ≥ 0
et pour x ≥ y dans R, on a f (x) − f (y) = f (x − y) ≥ 0, ce qui signifie que f est
croissante. On déduit alors du théorème précédent que f (x) = x pour tout x ∈ R
(λ = f (1) = 1). L’identité est donc le seul morphisme de corps non identiquement
nul de R dans lui même. 
Ce résultat sera utilisé dans l’étude de l’équation fonctionnelle f (x ∧ y) =
f (x) ∧ f (y) sur R3 (paragraphe 13.10).
Morphismes de groupes de (R, +) dans (C, +) 357

Lemme 13.2 Si f vérifiant (13.1) est continue à droite en 0, elle est alors conti-
nue à droite en tout point de R.

Preuve. Pour x ∈ R et h > 0, on a f (x + h) = f (x) + f (h) et avec la continuité


à droite en 0 de f, on déduit que lim f (x + h) = f (x) , ce qui signifie que f est
h→0+
continue à droite en x. 
On a évidemment le même résultat avec la continuité à gauche. La valeur 0
peut également être remplacée par n’importe quelle valeur.
Théorème 13.2.
Si f vérifiant (13.1) est continue à droite en 0, c’est alors une homothétie.

Preuve. On note λ = f (1) . Si f est continue à droite en 0, elle l’est alors en


tout x ∈ R et en notant (sn )n∈N la suite d’approximations décimales par excès de
x, on a f (x) = lim f (sn ) = lim λsn = λx. 
n→+∞ n→+∞
Le théorème 13.1 peut aussi se déduire du précédent en utilisant le fait que
l’ensemble des points de discontinuité d’une fonction monotone sur un intervalle
est au plus dénombrable.
Théorème 13.3.
Si f vérifiant (13.1) est bornée sur un intervalle [a, b] avec a < b, c’est
alors une homothétie.

Preuve. Soient m ≤ M deux réels tels que m ≤ f (x) ≤ M pour tout x ∈ [a, b] .
Pour x ∈ [0, b − a] , on a x + a ∈ [a, b] , donc m ≤ f (x + a) ≤ M et avec (13.1) , on
obtient m = m − f (a) ≤ f (x) 
 ≤ M = M − f (a) pour tout x ∈ [0, b − a] . Pour
b−a
n ∈ N \ {0} et x ∈ 0, , on a nx ∈ [0, b − a] , de sorte que m ≤ f (nx) =
n
m M
nf (x) ≤ M  et ≤ f (x) ≤ . Si on se donne un réel ε > 0, il existe un entier
 n 
 n  
m M b−a
n ≥ 1 tel que , soit contenu dans ]−ε, ε[ et pour tout x ∈ 0, , on
n n n
a −ε < f (x) < ε. On a donc ainsi montré que f est continue à droite en 0. C’est
donc une homothétie. 
On peut montrer que si f vérifiant (13.1) est bornée sur un ensemble mesurable
de mesure non nulle (pour la mesure de Lebesgue), elle est alors bornée sur un
intervalle et c’est une homothétie (voir [12], p. 63).
On peut également montrer (voir [12], p. 75) que si f vérifiant (13.1) est mesu-
rable, c’est alors une homothétie.

13.2 Morphismes de groupes de (R, +) dans (C, +)


Si f est un morphisme de groupes de (R, +) dans (C, +) , g =  (f ) (partie
réelle de f ) et h =  (f ) (partie imaginaire de f ) sont alors des morphismes du
groupes (R, +) dans lui même. De l’étude précédente, on déduit le résultat suivant.
358 Équations fonctionnelles

Théorème 13.4.
Soit f un morphisme de groupes de (R, +) dans (C, +) . Si l’une des deux
conditions suivantes est réalisée :
— f est continue en 0 ;
— f est bornée sur un intervalle non réduit à un point ;
il existe alors un nombre complexe α tel que f (x) = αx pour tout réel x.

Preuve. Si f est continue en 0 [resp. bornée sur un intervalle non réduit à un


point] il en est alors de même des fonctions g et h. Ces deux fonctions vérifiant
l’équation fonctionnelle de Cauchy, ce sont des homothéties, ce qui entraîne f (x) =
ax + ibx = αx. 

13.3 Morphismes du groupe (C, +) dans lui même


Si f et un morphisme du groupe (C, +) dans lui même, on a alors pour tout
z = x + iy ∈ C, f (z) = f (x) + f (iy) .
Si, par exemple, f est continue en 0, il en est de même des fonctions d’une
variable réelle x → f (x) et y → f (iy) et le résultat du paragraphe qui précède nous
dit qu’il existe deux constantes complexes α, β telle que f (x) = αx et f (iy) = βy
z+z z−z
pour tous réels x, y. On a donc f (z) = α +β = γz + δz où γ, δ sont
2 2i
deux constantes complexes.
On a un résultat analogue pour f bornée sur un disque centré en 0 et non réduit
à un point.

13.4 Morphismes de groupes de (R∗ , ·) dans (R, +)


On voit facilement que la fonction identiquement nulle est la seule solution de
l’équation fonctionnelle f (xy) = f (x) + f (y) sur R. En effet f = 0 est solution
et réciproquement pour une telle fonction on a f (0) = f (x · 0) = f (x) + f (0) et
f (x) = 0 pour tout réel x. On s’intéresse donc à cette équation fonctionnelle sur
R∗ , ce qui revient à étudier les morphismes de groupes de (R∗ , ·) dans (R, +) . Si
f est un tel morphisme,# avec $ f (1) = f 12 = 2f (1) , on déduit que f (1) = 0,
2
puis avec 0 = f (1) = f (−1) = 2f (−1) que f (−1) = 0 et enfin avec f (−x) =
f (−1) + f (x) que f (−x) = f (x) pour tout x ∈ R, c’est-à-dire que f est paire. Il
suffit donc d’étudier l’équation fonctionnelle :
2
∀ (x, y) ∈ R+,∗ , f (xy) = f (x) + f (y) (13.2)

On s’intéresse tout d’abord aux solutions dérivables sur R+,∗ de cette équation
fonctionnelle.
Morphismes de groupes de (R∗ , ·) dans (R, +) 359

Lemme 13.3 Les solutions dérivables sur R+,∗ de (13.2) sont les fonctions défi-
nies par :  x
dt
∀x ∈ R+,∗ , f (x) = λ
1 t
où λ est une constante réelle.

Preuve. En se fixant x > 0 et en dérivant par rapport à la variable y, on


a xf  (xy) = f  (y) , ce qui donne en prenant y = 1 et en notant λ = f  (1) ,
x
λ dt
f  (x) = pour tout x > 0. Comme f (1) = 0, on en déduit que f (x) = λ .
x 1 t
Réciproquement si f est ainsi définie sur R+,∗ , alors f (1) = 0 et, pour tout
1
y > 0 fixé, la dérivée de la fonction x → f (xy) est égale à yf  (xy) = λy =
xy
1
λ = f  (x) , ce qui donne f (xy) = f (x) + C, la constante C étant égale à
x
f (y) − f (1) = f (y) . La fonction f vérifie bien l’équation fonctionnelle (13.2) . 
Ce résultat nous conduit à définir la fonction logarithme  x comme la primitive
+,∗ 1 dt
sur R nulle en 1 de la fonction x → , soit ln (x) = pour tout x > 0.
x 1 t
Les résultats précédents nous disent alors que les solutions dérivables sur R∗ de
l’équation fonctionnelle (13.2) sont les fonctions définies par f (x) = λ ln (|x|) pour
tout x ∈ R∗ .
Avec ln (x) > 0 sur R+,∗ on déduit que ln est strictement croissante sur R+,∗ et
avec ln (2) > ln (1) = 0, ln (2n ) = n
ln(2) que cette fonction n’est pas bornée.
  On a
1 1
donc lim ln (x) = +∞. Avec ln = − ln (x) (conséquence de ln x = 0),
x→+∞ x x
on déduit que lim ln (x) = −∞. La fonction ln est donc continue strictement
x→0
croissante de R+,∗ sur R, c’est donc un homéomorphisme et sa fonction réciproque
est la fonction exponentielle x → ex . Cette fonction est donc définie par :

(x ∈ R et y = ex ) ⇔ (y > 0 et x = ln (y))

Avec ln (x) > 0, on déduit du théorème de dérivation des fonctions réciproques

que la fonction exponentielle est dérivable avec (ex ) = ex pour tout x ∈ R.
De ln (xy) = ln (x) + ln (y) pour tous x, y dans R+,∗ , on déduit que la fonction
exponentielle est une solution de l’équation fonctionnelle :

∀ (x, y) ∈ R2 , f (x + y) = f (x) f (y) (13.3)

Si f est solution de (13.2) sur R+,∗ , alors la fonction g définie sur R par g (t) =
f (et ) vérifie l’équation fonctionnelle de Cauchy et on déduit le résultat suivant.
Théorème 13.5.

Soit f vérifiant l’équation fonctionnelle (13.2) sur R+,∗ . Si l’un des condi-
tions suivantes est vérifiée :
— f est monotone ;
— f est continue à droite en 1 ;
360 Équations fonctionnelles

— f est bornée sur un intervalle non réduit à un point dans R+,∗ ;


il existe alors une constante réelle λ telle que f (x) = λ ln (x) pour tout réel
x ∈ R+,∗ .

Preuve. Si f est monotone [resp. continue à droite en 1, resp. bornée sur [a, b]
avec 0 < a < b], g est alors monotone (la fonction exponentielle est croissante),
[resp. continue à droite en 0, resp. bornée sur [ln (a) , ln (b)]] donc g (t) = αt et
pour tout x > 0, on a f (x) = f (et ) = g (t) = αt = α ln (x) . 

13.5 L’équation fonctionnelle f (x + y) = f (x) f (y)


sur R
En utilisant la fonction ln et les résultats sur l’équation fonctionnelle de Cauchy,
on peut étudier l’équation fonctionnelle (13.3) .

Lemme 13.4 Si f non identiquement nulle vérifie l’équation fonctionnelle (13.3) ,


elle est alors à valeurs strictement positive et la fonction g = ln ◦f vérifie l’équation
fonctionnelle (13.1) .
#x x$ # # x $$2
Preuve. Pour x ∈ R on a f (x) = f + = f ≥ 0. Si il existe
2 2 2
x0 ∈ R tel que f (x0 ) = 0 alors pour tout x ∈ R on a f (x) = f (x − x0 + x0 ) =
f (x − x0 ) f (x0 ) = 0 et f est identiquement nulle. On a donc f (x) > 0 pour tout
x ∈ R si f non identiquement nulle vérifie (13.3) . La fonction g = ln ◦f est alors
bien définie et vérifie (13.1) . 
De l’étude des morphismes du groupe additif de R dans lui même, on déduit
les résultats suivants.
Théorème 13.6.
Soit f non identiquement nulle vérifiant l’équation fonctionnelle (13.3) .
Si l’une des conditions suivante est réalisée :
— f est monotone ;
— f est continue à droite en 0 ;
— f est bornée sur un intervalle réel non réduit à un point ;
il existe alors un réel α tel que f (x) = eαx pour tout x ∈ R.

Preuve.
1. Si f est monotone, il en est de même de g = ln ◦f (la fonction ln est croissante).
On a donc g (x) = αx pour tout x ∈ R avec α = g (1) = ln (f (1)) et f (x) =
eg(x) = eαx .
2. Avec la continuité de la fonction ln on déduit que si f est continue à droite en
0 alors il en est de même de g = ln ◦f (f (0) > 0 si f n’est pas identiquement
nulle). D’où le résultat.
L’équation fonctionnelle f (xy) = f (x) f (y) sur R+,∗ 361

3. Si f est bornée sur un intervalle [a, b] , on désigne par M un majorant stricte-


ment positif de f sur cet intervalle. Pour tout x ∈ [0, b − a] on a, a + x ∈ [a, b] ,
b − x ∈ [a, b] et :

f (b) f (b) f (x + a) M
f (x) =  > 0, f (x) = ≤
f (b − x) M f (a) f (a)

(f (t) > 0 pour tout t ∈ R). La fonction f est donc bornée sur [0, b − a] avec
une borne inférieure strictement positive. Il en résulte que la fonction g = ln ◦f
est bornée sur [0, b − a] (l’image d’un compact par l’application continue ln est
un compact) et on peut conclure.


13.6 L’équation fonctionnelle f (xy) = f (x) f (y) sur


R+,∗
Si f est solution de l’équation fonctionnelle :
2
∀ (x, y) ∈ R+,∗ , f (xy) = f (x) f (y)

la fonction g définie sur R par g (x) = f (ex ) vérifie alors l’équation fonctionnelle
(13.3) .
Si f est monotone, il en est de même de g (la fonction exponentielle est crois-
sante), donc g (x) = eαx et pour tout t > 0, on a :

f (t) = f (ex ) = g (x) = eαx = eα ln(t) = tα

Si f est continue à droite en 1, g est alors continue à droite en 0 et on a f (t) = tα


pour tout t > 0.
Si f est bornée sur un intervalle [a, b] avec 0 < a < b, g est alors bornée sur
[ln (a) , ln (b)] et on a f (t) = tα pour tout t > 0.

13.7 L’équation fonctionnelle f (x + y)+f (x − y) =


2f (x) f (y) sur R
Les fonctions cos et ch vérifient l’équation fonctionnelle :

∀ (x, y) ∈ R2 , f (x + y) + f (x − y) = 2f (x) f (y) (13.4)

Lemme 13.5 Si f est une fonction non identiquement nulle vérifiant (13.4) , elle
est alors paire et f (0) = 1.

Preuve. L’équation (13.4) appliquée au couple (x, 0) pour x ∈ R donne f (x) =


f (x) f (0) pour tout x ∈ R, ce qui équivaut à f (0) = 1 si f n’est pas identiquement
nulle. Cette équation appliquée au couple (0, y) pour y ∈ R donne f (y) + f (−y) =
2f (y) , soit f (−y) = f (y) , la fonction f est donc paire. 
362 Équations fonctionnelles

On suppose que f est une fonction continue sur R qui vérifie l’équation fonc-
tionnelle (13.4) . Avec la continuité en 0 et f (0) = 1 on déduit qu’il existe un
réel α > 0 tel que f (x) > 0 pour tout x ∈ [−α, α]9. On8se fixe un tel réel α. Si
π
|f (α)| ≤ 1, on peut alors trouver un unique réel θ ∈ 0, tel que f (α) = cos (θ) .
2
p
Lemme 13.6 Pour tout rationnel r = n avec (p, n) ∈ N2 , on a f (rα) =
2
cos (rθ) .

Preuve. On montre tout d’abord que :


#α$  
θ
∀n ∈ N, f n = cos
2 2n
Le résultat est vrai
# α pour n =$0 et le supposant vrai pour n ≥ 0, en appliquant
α
(13.4) au couple n+1
, n+1 , on obtient :
2 2
# α $ f α +1  
cos 2θn + 1 θ
f 2 n+1 = 2n
= = cos2
2 2 2 2n
# α $  
θ
ce qui entraîne f n+1 = cos n
du fait de la positivité de f sur [0, α] et de
9 π8 2 2
cos sur 0, . On en déduit alors que pour tout n fixé dans N on a :
2
# α$  
θ
∀p ∈ N, f p n = cos p n
2 2
Le résultat est vrai pour p = 0, p = 1 et en le supposant vrai pour p ≥ 1, on a :
# α$ # α$ #α$ # α$
f (p + 1) n = 2f p n f n − f (p − 1) n
2 2  2   2   
θ θ θ θ
= 2 cos p n cos − cos (p − 1) n = cos (p + 1) n
2 2n 2 2

Théorème 13.7.
Avec les hypothèses et notations qui précèdent, il existe un réel λ > 0 tel
que f (x) = cos (λx) pour tout x ∈ R.

Preuve. Avec f (0) = cos (0) = 1 et la parité de f et cos il suffit de montrer le


résultat pour x > 0.
Pour x > 0, on définit les suites (rn )n∈N et (sn )n∈N par :

[2n x] pn 1
∀n ∈ N, rn = = n , sn = rn + n
2n 2 2
1
et on a 0 ≤ x − rn < pour tout n ∈ N, ce qui entraîne la convergence de ces
2n
suites vers x (développement dyadique). Avec la continuité des fonctions f et cos,
L’exponentielle complexe 363

on en déduit que :
# α$  
θ
f (αx) = lim f (αrn ) = lim f pn n = lim cos pn n
n→+∞ n→+∞ 2 n→+∞ 2
= lim cos (rn θ) = cos (θx)
n→+∞
 
θ
Il en résulte que f (x) = cos x = cos (λx) . 
α
Dans le cas où |f (α)| > 1, en écrivant que f (α) = ch (θ) avec θ > 0, on aboutit
à f (x) = ch (λx) .
Si on suppose la fonction f non identiquement nulle et deux fois dérivable sur
R, la résolution de l’équation fonctionnelle (13.4) est beaucoup plus simple. En
dérivant deux fois l’équation (13.4) par rapport à x, pour y réel fixé, on obtient
f  (x + y) + f  (x − y) = 2f  (x) f (y) et pour x = 0, en tenant compte de la
parité de f, on a f  (y) = f  (0) f (y) avec f (0) = 1. D’autre part, en dérivant
par rapport à y et en faisant y = 0, on obtient 2f (x) f  (0) = 0 pour tout réel
x, ce qui entraîne f  (0) = 0 puisque f n’est pas la fonction nulle. En définitive,
f est solution de f  = f  (0) f avec f (0) = 1 et f  (0) = 0, ce qui équivaut à
f (x) = cos (λx) pour f  (0) = −λ2 ≤ 0 ou f (x) = ch (λx) pour f  (0) = λ2 ≥ 0.

13.8 L’exponentielle complexe


On note Γ = {z ∈ C | |z| = 1} le groupe unitaire dans C∗ .

Lemme 13.7 Les seuls morphismes de groupes continus de (R, +) dans (Γ, ·) sont
les applications x → eiαx avec α ∈ R.

Preuve. Il est clair que pour tout α ∈ R l’application x → eiαx est un morphisme
de groupes continu de (R, +) dans (Γ, ·) . Réciproquement si f : R → Γ est un
morphisme de groupes, il existe alors un unique réel α ∈ [0, 2π[ tel que f (1) = eiα .
Par récurrence
 on vérifie   facilement que f (n) 
= einα
pour tout n ∈ N, puis avec
n
1 1 1 α
eiα = f n = f on déduit que f = ei n pour tout n ≥ 1. Il
n n n
en résulte que f (r) = eirα pour tout r ∈ Q. Si de plus f est continue, avec la
densité de Q dans R, on déduit que f (x) = eiαx pour tout x ∈ R+ . Enfin avec
1 = f (x − x) = f (x) f (−x) (le neutre est transformé en neutre), on déduit que
1
f (−x) = = f (x) pour tout x ∈ R. Il en résulte que f (x) = eiαx pour tout
f (x)
x ∈ R. 
Théorème 13.8.
Les seuls morphismes de groupes continus de (R, +) dans (C∗ , ·) sont les
applications x → eαx avec α ∈ C.

Preuve. Si f est un morphisme de groupes continu de (R, +) dans (C∗ , ·) , |f |


est alors un morphisme de groupes continu de (R, +) dans (R∗ , ·) , il existe donc
un réel a tel que |f (x)| = eax pour tout x ∈ R. La fonction g : x → f (x) e−ax
364 Équations fonctionnelles

est alors un morphisme de groupes continu de (R, +) dans (Γ, ·) , il existe donc un
réel b tel que f (x) e−ax = eibx pour tout x ∈ R. On a donc f (x) = eαx pour tout
x ∈ R avec α = a + ib ∈ C. La réciproque est évidente. 

13.9 L’équation fonctionnelle f (x + 1) = xf (x)


Pour tout réel x strictement positif, la fonction t → f (x, t) = tx−1 e−t est
t
intégrable sur ]0, +∞[ . En effet avec lim tx−1 e− 2 = 0, on déduit que pour t assez
t→+∞
 +∞
t
grand on a 0 ≤ tx−1 e−t ≤ e− 2 , ce qui entraîne la convergence f (x, t) dt, et
 1 1

avec tx−1 e−t  tx−1 on déduit la convergence f (x, t) dt puisque x − 1 < 1.


t→0 0
On peut donc définir la fonction gamma d’Euler par :
 +∞
+,∗
∀x ∈ R , Γ (x) = tx−1 e−t dt
0

Lemme 13.8 La fonction gamma vérifie l’équation fonctionnelle :

∀x ∈ R+,∗ , Γ (x + 1) = xΓ (x)

Preuve. Une intégration par parties donne pour x > 0 et 0 < ε < R :
 R  R
6 7R
tx e−t dt = −tx e−t ε + x tx−1 e−t dt
ε ε

et le passage à la limite quand (ε, R) tend vers (0, +∞) donne le résultat. 
 +∞
Avec Γ (1) = e−t dt = 1, on déduit de cette équation fonctionnelle que
0
Γ (n + 1) = n! pour tout entier naturel n.
Une définition équivalente de la fonction gamma est donnée par le résultat
suivant.
n!nx
Lemme 13.9 (Euler) On a Γ (x) = lim pour tout x dans
n→+∞ x (x + 1) · · · (x + n)
R+,∗ .

Preuve. Pour x fixé dans R+,∗ , on désigne par (fn )n≥1 la suite de fonctions
définies sur ]0, +∞[ par :
⎧  n

⎨ 1− t tx−1 si t ∈ ]0, n[
fn (t) = n


0 si t ≥ n

Chaque fonction fn est continue et intégrable sur ]0, +∞[ avec :



lim fn (t) = e−t tx−1
∀t ∈ ]0, +∞[ , n→+∞
∀n ≥ 1, |fn (t)| ≤ f (t) = e−t tx−1
L’équation fonctionnelle f (x + 1) = xf (x) 365

la fonction f étant continue et intégrable sur ]0, +∞[ . On déduit alors du théorème
de convergence dominée que :
 n n  +∞
t
lim 1− tx−1 dt = e−t tx−1 dt = Γ (x)
n→+∞ 0 n 0

D’autre part, on a :
 n n  1
t n
In (x) = 1− tx−1 dt = (1 − t) tx−1 nx dx = nx Jn (x)
0 n 0

Une intégration par parties donne :


 1 
n+1 x−1 n+1 1 n n+1
Jn+1 (x) = (1 − t) t dt = (1 − x) tx dx = Jn (x + 1)
0 x 0 x
et par récurrence :
n!
Jn (x) = J0 (x + n)
x (x + 1) · · · (x + n − 1)
 1
n! n!
= tx+n−1 dt =
x (x + 1) · · · (x + n − 1) 0 x (x + 1) · · · (x + n − 1) (x + n)
n!nx
Donc Γ (x) = lim In (x) = lim . On peut aussi écrire que :
n→+∞ n→+∞ x (x + 1) · · · (x + n)

n  
 n k+x−1 n   k
n k t x n (−1)
In (x) = (−1) dt = n
0 k nk k k+x
k=0 k=0

et constater que la décomposition en éléments simples de la fraction rationnelle


1 %n αk
Pn (x) = s’écrit Pn (x) = , les coefficients αk étant
x (x + 1) · · · (x + n) k=0 k + x
k   k
(−1) n (−1)
donnés par αk = ((x + k) Pn (x))|x=−k = = . 
k! (n − k)! k n!
Lemme 13.10 La fonction gamma est indéfiniment dérivable sur R+,∗ avec pour
tout entier naturel k et tout réel strictement positif x :
 +∞
Γ(k) (x) = (ln (t)) tx−1 e−t dt
k

0
2
Preuve. La fonction f : (x, t) → tx−1 e−t est indéfiniment dérivable sur (R+,∗ )
avec pour k ∈ N, [a, b] ⊂ R+,∗ (avec a < b) et x ∈ [a, b] :

k
∂kf k x−1 −t |ln (t)| ta−1 si 0 < t ≤ 1
(x, t) = |ln (t)| t e ≤ g k (t) =
|ln (t)| tb−1 e−t si t > 1
k
∂xk
a
la fonction gk étant intégrable R+,∗ (on a lim |ln (t)| t 2 = 0, donc pour t > 0
k
t→0
a a
assez petit on a |gk (t)| ≤ t 2 −1 , la fonction t 2 −1 étant intégrable sur ]0, 1[ et
t t t
lim |ln (t)| tb−1 e− 2 = 0, donc |gk (t)| ≤ e− 2 pour t assez grand, la fonction e− 2
k
t→+∞
étant intégrable sur ]1, +∞[). On en déduit alors que la fonction Γ est indéfiniment
dérivable sur R+,∗ et qu’on peut dériver sous le signe d’intégration. 
366 Équations fonctionnelles

Lemme 13.11 La fonction Γ est log-convexe sur R+,∗ .


2
 ΓΓ − (Γ )
Preuve. On a (ln (Γ)) = et en utilisant l’inégalité de Cauchy-
Γ2
Schwarz, on a pour tout réel x > 0 :
 +∞ 2  +∞ # $ # x−1 t $ 2
 2 x−1 −t x−1
− 2t
(Γ (x)) = ln (t) t e dt = ln (t) t 2 e t 2 e− 2 dt
0 0
 +∞  +∞
≤ ln2 (t) tx−1 e−t dt tx−1 e−t dt = Γ (x) Γ (x)
0 0

ce qui donne (ln (Γ)) ≥ 0 et la log-convexité de la fonction Γ. 
Théorème 13.9. Bohr-Mollerup

Si f : R+,∗ → R+,∗ est une solution de l’équation fonctionnelle


f (x + 1) = xf (x) , continûment dérivable et logarithmiquement convexe,
il existe alors une constante λ telle que f = λΓ.

Preuve. La fonction g = ln (f ) est convexe, donc en notant, pour x = y dans


g (x) − g (y)
R+,∗ , p (x, y) = , on a pour tout réel x ∈ ]0, 1] :
x−y
p (n, n + 1) ≤ p (n + 1, n + 1 + x) ≤ p (n + 1, n + 2)
(inégalité des trois pentes, théorème 8.9), soit :
ln (f (n + 1 + x)) − ln (f (n + 1))
ln (f (n + 1)) − ln (f (n)) ≤
x
≤ ln (f (n + 2)) − ln (f (n + 1))
Tenant compte de f (n + 1) = nf (n) , cette inégalité s’écrit :
 
f (n + 1 + x) x
ln (nx ) ≤ ln ≤ ln ((n + 1) )
f (n + 1)
f (n + 1 + x) (x + n) (x + n − 1) · · · xf (x)
En écrivant que = , on a :
f (n + 1) n!f (1)
 
(x + n) (x + n − 1) · · · x f (x) x
ln (n ) ≤ ln
x
≤ ln ((n + 1) )
n! f (1)
n!nx
ce qui s’écrit aussi, en notant Γn (x) = :
x (x + 1) · · · (x + n)
 
nx f (x) x
ln (nx ) ≤ ln ≤ ln ((n + 1) )
Γn (x) f (1)
   x
1 f (x) (n + 1)
ou encore, 0 ≤ ln ≤ ln . Avec la croissance de la fonc-
Γn (x) f (1) nx
tion exponentielle, on peut donc conclure à :
 x
1 f (x) 1
∀x ∈ ]0, 1] , ∀n ≥ 1, 1 ≤ ≤ 1+
Γn (x) f (1) n
L’équation fonctionnelle f (x ∧ y) = f (x) ∧ f (y) sur R3 367

En faisant tendre n vers l’infini on déduit alors du lemme 13.9 que f (x) =
f (1) Γ (x) pour tout x ∈ ]0, 1] . En utilisant l’équation fonctionnelle f (x + 1) =
xf (x) vérifiée par les deux fonctions on déduit que f (x) = f (1) Γ (x) pour tout
x > 0. 

13.10 L’équation fonctionnelle f (x ∧ y) = f (x) ∧


f (y) sur R3
Pour ce paragraphe on note E l’espace vectoriel R3 muni de sa base canonique
B = (e1 , e2 , e3 ) et
 de sa structure  euclidienne canonique définie par le produit
3
 3
 3
scalaire (x, y) = xi ei , yi ei → x | y = xi yi , la norme associée étant
i=1 i=1 i=1
notée x .
On note det (x, y, z) le déterminant du système de vecteurs (x, y, z) dans la base
B.
Pour x, y fixé dans E l’application z → det (x, y, z) définit une forme linéaire
sur E, il existe donc un unique vecteur t dans E tel que det (x, y, z) = t | z pour
tout z ∈ E. Le vecteur t ainsi défini est noté x ∧ y et on dit que c’est le produit
vectoriel de x et y. On a donc :

∀ (x, y, z) ∈ E 3 , det (x, y, z) = x ∧ y | z

De cette définition on déduit l’expression du produit vectoriel dans la base B


(ou dans n’importe quelle base orthonormée directe) :
3
 3

x∧y = x ∧ y | ei  ei = det (x, y, ei ) ei
i=1 i=1
x2 y2 x1 y1 x1 y1
= e1 − e2 + e3
x3 y3 x3 y3 x2 y2

On en déduit en particulier (pour toute base orthonormée directe) que :

e2 ∧ e3 = e1 , e1 ∧ e3 = −e2 , e1 ∧ e2 = e3

Avec le théorème qui suit nous résumons quelques propriétés du produit vecto-
riel qui nous seront utiles.
Théorème 13.10.

1. Le produit vectoriel est une application bilinéaire anti-symétrique de E 2


dans E.
2. Les vecteurs x, y sont liés dans E si et seulement x ∧ y = 0.
3. Si les vecteurs x, y sont linéairement indépendants alors le vecteur x ∧ y
appartient à la droite orthogonale au plan engendré par x, y et le système
(x, y, x ∧ y) est une base de E.
368 Équations fonctionnelles

x | z y | z
4. Pour x, y, z, t dans E on a x ∧ y | z ∧ t = .
x | t y | t
2 2 2 2
5. Pour x, y dans E on a x ∧ y = x y − x | y . En particulier,
on a x ∧ y = x y si, et seulement si, x et y sont orthogonaux.
6. Si (f1 , f2 ) est un système orthonormé alors le système (f1 , f2 , f1 ∧ f2 )
est une base orthonormée directe de E.
7. Pour x, y, z dans E on a x ∧ (y ∧ z) = x | z y − x | y z (le produit
vectoriel n’est pas associatif).
8. Si x est un vecteur non nul dans E pour tout vecteur y ∈ E orthogonal
à x il existe un vecteur z ∈ E tel x ∧ z = y.

Preuve.
1. Se déduit des propriétés du déterminant.
2. Si le système (x, y) est lié il en de même de (x, y, ei ) pour i = 1, 2, 3 et
det (x, y, ei ) = 0 pour tout i, ce qui équivaut à x ∧ y = 0.
Si le système (x, y) est libre il se complète alors en une base (x, y, z) de E et
det (x, y, z) = x ∧ y | z = 0 entraîne x ∧ y = 0.
3. Avec x ∧ y | x = det (x, y, x) = 0, on déduit que x ∧ y est orthogonal à x.
Avec l’anti-symétrie du produit vectoriel on déduit que x ∧ y est également
orthogonal à y. Si x, y sont linéairement indépendants ils engendrent alors un
plan orthogonal à la droite engendrée par x ∧ y et le système (x, y, x ∧ y) est
une base de E.
4. Par 4-linéarité il suffit de vérifier la formule sur les vecteurs de base canonique,
ce qui ne pose pas de problème.
5. De la formule précédente, on déduit que :
2
2 x y | x 2 2 2
x ∧ y = 2 = x y − x | y
x | y y

6. f1 ∧ f2 est orthogonal à f1 et f2 et
2 2 2
det (f1 , f2 , f1 ∧ f2 ) = f1 ∧ f2  = f1  f2  = 1

7. Par 3-linéarité il suffit de vérifier la formule (de Grassmann) sur les vecteurs de
base canonique, ce qui ne pose pas de problème.
2 1
8. Si x | y = 0 alors x ∧ (y ∧ x) = x y et en posant z = 2 y ∧ x, on a
x
x ∧ z = y.

On rappelle qu’une application linéaire f : E → E est une rotation si, et
seulement si, f (x) | f (y) = x | y pour tous x, y dans E (f conserve le produit
scalaire) et det (f ) = 1. Il est encore équivalent de dire que f transforme une base
orthonormée directe en base orthonormée directe.
L’équation fonctionnelle f (x ∧ y) = f (x) ∧ f (y) sur R3 369

Si f : E → E est une rotation, on a alors pour tous vecteurs x, y, z dans E :

det (f (x) , f (y) , f (z)) = det (f ) det (x, y, z) = det (x, y, z)


= x ∧ y | z = f (x ∧ y) | f (z)

et du fait que f est un isomorphisme, cela peut s’écrire det (f (x) , f (y) , z) =
f (x ∧ y) | z pour tout z ∈ E. On a donc f (x ∧ y) = f (x) ∧ f (y) pour tous
vecteurs x, y dans E.
Dans ce qui suit nous allons montrer que les rotations sont les seules applications
non identiquement nulles de E dans E qui conservent le produit vectoriel.
Pour la suite de ce paragraphe, on se donne donc une application f : E → E
telle que :
∀ (x, y) ∈ E 2 , f (x ∧ y) = f (x) ∧ f (y) (13.5)
Avec f (0) = f (0) ∧ f (0) , on déduit que f (0) est orthogonal à lui même, donc
2
que f (0) = f (0) | f (0) = 0 et f (0) = 0.

Lemme 13.12 Si f s’annule en un vecteur x0 non nul, elle est alors identique-
ment nulle.

Preuve. En notant D = Rx0 la droite vectorielle engendrée par x0 et H = D⊥


le plan orthogonal à D, on a E = D ⊕ H et tout vecteur x ∈ E s’écrit de manière
unique x = λx0 + h avec λ ∈ R et h ∈ H.
Si λ = 0, x = h est alors un vecteur orthogonal à x0 , il existe donc un vecteur
z ∈ E tel x0 ∧ z = x et avec (13.5) on déduit que f (x) = f (x0 ) ∧ f (z) = 0. On a
donc f (h) = 0 pour tout h ∈ H.
En désignant par h0 un vecteur non nul dans H, pour tout λ ∈ R on peut
trouver z ∈ E tel h0 ∧ z = λx0 et f (λx0 ) = f (h0 ) ∧ f (z) = 0. On a donc f (x) = 0
pour tout x ∈ D.
Enfin si x = λx0 + h avec λ ∈ R∗ et h ∈ H − {0} , le vecteur z0 = x0 ∧ h est non
nul (x0 et h sont linéairement indépendants), f (z0 ) = 0 et en écrivant x = z0 ∧ t,
on déduit que f (x) = 0.
En définitive on a f (x) = 0 pour tout x ∈ E, c’est-à-dire que f est identique-
ment nulle. 
Dans ce qui suit on suppose que f est une solution non identiquement nulle
de l’équation fonctionnelle (13.5) . On a donc f (0) = 0 et f (x) = 0 pour tout
x ∈ E − {0} . Dans un premier temps nous allons montrer que l’application f est
nécessairement linéaire.

Lemme 13.13 Les vecteurs f (x) et f (y) sont liés si, et seulement si, les vecteurs
x et y le sont.

Preuve. On a :

f (x) , f (y) liés ⇔ f (x) ∧ f (y) = 0 ⇔ f (x ∧ y) = 0 ⇔ x ∧ y = 0 ⇔ x, y liés.

Lemme 13.14 Pour tous x, y dans E on a f (x + y) = f (x) + f (y) .


370 Équations fonctionnelles

Preuve. Pour x = 0 ou y = 0 le résultat est évident. On suppose donc que x = 0


et y = 0. Avec :
f (x + y) ∧ f (x) = f ((x + y) ∧ x) = f (y ∧ x) = f (y) ∧ f (x)
= (f (x) + f (y)) ∧ f (x)
on déduit que (f (x + y) − f (x) − f (y)) ∧ f (x) = 0, ce qui équivaut à dire que les
vecteurs f (x + y) − f (x) − f (y) et f (x) sont liés. Pour x = 0 on a f (x) = 0 et il
existe alors un réel α tel que f (x + y) − f (x) − f (y) = αf (x) . Les vecteurs x et
y jouant des rôles symétriques on obtient de même l’existence d’un réel β tel que
f (x + y) − f (x) − f (y) = βf (y) .
Si x et y sont linéairement indépendants il en est de même de f (x) et f (y) et
l’égalité αf (x) − βf (y) = 0 se traduit par α = β = 0 et f (x + y) = f (x) + f (y) .
Si les vecteurs x, y sont liés on a y = λx avec λ ∈ R∗ et pour z ∈ E linéairement
indépendant de x (et de y), le système (x + y, z) est soit libre soit égal à (0, z) ,
ce qui donne dans tous les cas f (x + y + z) = f (x + y) + f (z) . D’autre part avec
(x + z, y) et (x, z) libres on a aussi :
f (x + y + z) = f (x + z) + f (y) = f (x) + f (z) + f (y)
ce qui permet de conclure à f (x + y) = f (x) + f (y) . 
Lemme 13.15 Pour tout vecteur x et tout réel λ on a f (λx) = λf (x) .
Preuve. Pour x = 0 ou λ = 0 l’égalité est vérifiée.
Pour x = 0 fixé les vecteurs x et λx étant liés il en est de même des vecteurs
f (x) et f (λx) avec f (x) = 0, il existe donc un réel unique μx (λ) tel que f (λx) =
μx (λ) f (x) . Il est clair que μx (0) = 0 et μx (1) = 1.
Pour λ1 , λ2 dans R on a :
f ((λ1 + λ2 ) x) = μx (λ1 + λ2 ) f (x) = f (λ1 x + λ2 x) = f (λ1 x) + f (λ2 x)
= (μx (λ1 ) + μx (λ2 )) f (x)
ce qui entraîne μx (λ1 + λ2 ) = μx (λ1 ) + μx (λ2 ) .
Si y est un vecteur linéairement indépendant de x, avec :
f (λx ∧ y) = f (λx) ∧ f (y) = μx (λ) f (x) ∧ f (y)
= f (x ∧ λy) = f (x) ∧ f (λy) = μy (λ) f (x) ∧ f (y)
et f (x) ∧ f (y) = 0 (puisque f (x) et f (y) sont libres comme x et y), on déduit
que μx (λ) = μy (λ) pour tout réel λ. En posant z = x ∧ y, le système (x, y, z) est
libre, donc μx = μy = μz et pour λ1 , λ2 dans R on a :
f (λ1 λ2 z) = μz (λ1 λ2 ) f (z) = μx (λ1 λ2 ) f (z)
= f (λ1 x ∧ λ2 y) = f (λ1 x) ∧ f (λ2 y)
= μx (λ1 ) μx (λ2 ) f (x) ∧ f (y) = μx (λ1 ) μx (λ2 ) f (z)
ce qui entraîne μx (λ1 λ2 ) = μx (λ1 ) μx (λ2 ) .
En définitive μx est un morphisme de corps non identiquement nul de R sur
lui même, c’est donc l’identité (corollaire 13.1). On a donc f (λx) = λx pour tout
x ∈ E. 
De ces lemmes on déduit que f est linéaire.
Suites complexes définies par une relation de récurrence linéaire 371

Lemme 13.16 Si les vecteurs x, y sont orthogonaux dans E, il en est alors de


même des vecteurs f (x) et f (y) .
Preuve. Si x = 0 alors f (x) = 0 est orthogonal à f (y) .
Si x = 0, comme y est orthogonal à x, on peut trouver z ∈ E tel que y = x ∧ z
et f (y) = f (x ∧ z) = f (x) ∧ f (z) est orthogonal à f (x) . 
Lemme 13.17 Si x ∈ E est tel que x = 1, on a alors f (x) = 1.
Preuve. On complète x en une base orthonormée directe (x, y, z) et avec x = y∧z,
on a :
2 2 2 2 2 2 2
f (x) = f (y) ∧ f (z) = f (y) f (z) −f (y) | f (z) = f (y) f (z)
soit f (x) = f (y) f (z) .
De manière analogue, on montre que f (y) = f (x) f (z) et f (z) =
2
f (x) f (y) , ce qui donne f (y) = f (x) f (y) avec f (y) = 0, ce qui
entraîne f (x) = 1. 
Théorème 13.11.
Les seules solutions non identiquement nulles de l’équation fonctionnelle
(13.5) sont les rotations.

Preuve. On sait déjà que les rotations sont solution de (13.5) et si f vérifie cette
équation fonctionnelle, elle est alors linéaire et transforme la base canonique en une
base orthonormée (les deux lemmes qui précèdent), f est donc un endomorphisme
orthogonal. Avec :
det (f ) = det (f (e1 ) , f (e2 ) , f (e3 )) = det (f (e1 ) , f (e2 ) , f (e1 ∧ e2 ))
2
= det (f (e1 ) , f (e2 ) , f (e1 ) ∧ f (e2 )) = f (e1 ) ∧ f (e2 ) > 0
on déduit que f est une rotation. 

13.11 Suites complexes définies par une relation


de récurrence linéaire
Dans ce paragraphe on s’intéresse aux suites (un )n∈N de nombres complexes
définies par une relation de récurrence linéaire à coefficients constants de la forme :
∀n ∈ N, un+p = a0 un + a1 un+1 + · · · + ap−1 un+p−1 (13.6)
où p est un entier naturel non nul et a0 , · · · , ap−1 sont des nombres complexes.
Il s’agit là d’une équation fonctionnelle vérifiée par une fonction u : N → C.
Le cas particulier p = 1 correspond aux suites géométriques. On suppose donc
que p ≥ 2.
En notant ϕ l’endomorphisme de l’espace vectoriel E = CN des suites complexes
défini par :

p−1
∀u ∈ E, ϕ (u) : n → un+1 − ak un+k
k=0
372 Équations fonctionnelles

on constate que l’ensemble S des solutions de (13.6) est le noyau de ϕ, c’est donc
un sous-espace vectoriel de E. De plus le théorème de récurrence nous permet de
vérifier qu’un élément de S est uniquement déterminé par ces p premières valeurs
u0 , · · · , up−1 , soit plus précisément que l’application u → (u0 , · · · , up−1 ) réalise un
isomorphisme de S sur Cp . L’espace vectoriel S des solutions de (13.6) est donc
un espace vectoriel de dimension p.
On désigne par T l’opérateur linéaire de translation défini sur E par :

∀u ∈ E, T (u) : n → un+1

et on définit la suite de ses itérés T k k∈N par T 0 = Id et T k+1 = T k ◦ T pour


tout k ∈ N (pour tout u ∈ E, on a T k (u) : n → un+k ). À tout polynôme

p 
p
P (X) = αk X k dans C [X] on peut associer l’opérateur P (T ) = αk T k et il
k=0 k=0
est facile de vérifier que pour tous polynômes P et Q, on a :

P (T ) ◦ Q (T ) = Q (T ) ◦ P (T ) = (P Q) (T )


p−1
En désignant par P (X) = X p − ak X k le polynôme caractéristique de (13.6) ,
k=0
on a ϕ = P (T ) .
Si λ1 , · · · , λr sont les racines deux à deux distinctes de multiplicités respectives
m1 , · · · , mr du polynôme P, on a alors :

⎪ 2r

⎨ P (X) =
m
(X − λk ) k
k=1
⎪ 2
r

⎩ ϕ = P (T ) =
m
(T − λk Id ) k
k=1

Le résultat suivant, conséquence du théorème de Bézout dans l’anneau C [X] ,


est une première étape dans la détermination de la forme générale des solutions
de (13.6) .

Lemme 13.18 (lemme des noyaux) Avec les notations qui précèdent, on a :
r
mk
S = ker (ϕ) = ker ((T − λk Id ) )
k=1

m
Preuve. On procède par récurrence sur r ≥ 2, en notant Pk (X) = (X − λk ) k
pour tout k compris entre 1 et r. Pour r = 2, les polynômes P1 et P2 sont premiers
entre eux et le théorème de Bézout dans C [X] nous dit qu’il existe deux polynômes
A et B tels que AP1 + BP2 = 1. On a alors A (T ) ◦ P1 (T ) + B (T ) ◦ P2 (T ) = Id
et pour tout y ∈ S = ker (ϕ) , on a :

y = (A (T ) ◦ P1 (T )) (y) + (B (T ) ◦ P2 (T )) (y) (13.7)

avec :

y2 = (A (T ) ◦ P1 (T )) (y) ∈ ker (P2 (T )) , y1 = (B (T ) ◦ P2 (T )) (y) ∈ ker (P1 (T ))


Suites complexes définies par une relation de récurrence linéaire 373

du fait de la commutativité de C [T ] . On a donc ainsi montré que :

S = ker (P1 (T )) + ker (P2 (T ))

l’inclusion ker (P1 (T )) + ker (P2 (T )) ⊂ S étant évidente. De l’égalité (13.7) on


déduit immédiatement que ker (P1 (T )) ∩ ker#(P2 (T )) = {0} $ . On a donc bien la
m m2
somme directe S = ker ((T − λ1 Id ) 1 ) ⊕ ker (T − λ2 Id ) . On conclut par ré-
currence sur r en considérant que si P1 est premier avec P2 , · · · , Pr il est alors
premier avec leur produit. 
La détermination de S passe alors par celles des noyaux des endomorphismes
m
(T − λk Id ) k .
Le cas d’une racine nulle n’est pas très intéressant.

Lemme 13.19 Pour tout entier naturel non nul m, le noyau de T m est formé des
suites nulles à partir du rang m.

Preuve. La suite u est dans ker (T m ) si, et seulement si, un+m = 0 pour tout
n ∈ N. 

Lemme 13.20 Pour tout λ ∈ C∗ et tout k ∈ N∗ , la suite nk−1 λn est dans


# $ n∈N
k
ker (T − λId ) .

Preuve. On procède par récurrence sur k ≥ 1. Pour k = 1, on a :

(T − λId ) (λn )n∈N = λn+1 n∈N


− λ (λn )n∈N = 0

En supposant le résultat acquis jusqu’au rang k ≥ 1, on a :


# $ ## $ $
k
(T − λId ) nk λn n∈N = (n + 1) − nk λn+1
n∈N

k

k−1 
k i
avec (n + 1) − n = k
n , ce qui donne :
i=0
i

# $ 
k−1
k

(T − λId ) n k λn n∈N
=λ n i λn n∈N
i=0
i

et avec l’hypothèse de récurrence on en déduit que :

k+1
# $ 
k−1
k

k
# $
(T − λId ) k n
n λ n∈N
=λ (T − λId ) n i λn n∈N
=0
i=0
i


On en déduit alors le résultat suivant.

Lemme 13.21 Soient λ un nombre complexe non nul et m un entier naturel non
m
nul. Le noyau de (T − λId ) est un espace vectoriel de dimension m engendré par
les suites u(k) : n → nk−1 λn (1 ≤ k ≤ m) .
374 Équations fonctionnelles

Preuve. Le lemme précédent nous dit que les suites u(k) , pour k compris entre 1 et
m
m, sont dans ker ((T − λId ) ) . De plus ces 
suites sont linéairement
 indépendantes.

m 
m
En effet l’égalité αk u(k) = 0 équivaut à αk nk−1 λn = 0 pour tout n ∈ N,
k=1 k=1
m
ce qui équivaut à αk nk−1 = 0 puisque λ est non nul et tous les coefficients αk
k=1

m
sont nuls du fait que le polynôme αk X k−1 a une infinité de racines. L’espace
k=1
m
vectoriel ker ((T − λId ) ) étant de dimension m, le résultat en découle. 
De ces lemmes on déduit en définitive le résultat suivant.
Théorème 13.12.
Avec les notations qui précèdent, les solutions de l’équation fonctionnelle
(13.6) , où le coefficient a0 est non nul (λ = 0 n’est pas racine du polynôme
 r
caractéristique) sont les suites de la forme un = Qk (n) λnk où, pour
k=1
tout k compris entre 1 et r, Qk est une fonction polynomiale à coefficients
complexes de degré inférieur ou égal à mk − 1, ce qui revient à dire que
l’ensemble S des solutions de cette équation de récurrence est un C-espace
vectoriel de dimension p engendré par les suites :

n → nj λnk (1 ≤ k ≤ r, 0 ≤ j ≤ mk − 1)

Preuve. Le lemme des noyaux nous dit qu’une solution u ∈ S s’écrit de manière
%
p
unique u = u(k) , où pour tout k compris entre 1 et r, u(k) est dans le noyau de
k=1
m
(T − λk Id ) k . Le lemme précédent permet alors de conclure. 
Dans le cas où les coefficients ak sont réels, les racines du polynôme caractéris-
tique sont stables par conjugaison complexe, c’est-à-dire que :
(
s
mk
(
t
mk mk
P (X) = (X − αk ) (X − λk ) X − λk
k=1 k=s+1
iθk
les αk étant réels et les λk = ρk e complexes non réels (dans le cas où il n’y a
pas de racines réelles [resp. complexes non réelles] le produit correspondant vaut
1) et on a le résultat suivant.
Théorème 13.13.
Les suites réelles solutions de l’équation récurrente (13.6) sont de la forme


s 
t 
t
un = Qk (n) αkn + Qk (n) ρnk cos (nθk ) + Rk (n) ρnk sin (nθk )
k=1 k=s+1 k=s+1

où, pour tout k compris entre 1 et s, Qk est une fonction polynomiale à


coefficients réels de degré inférieur ou égal à mk − 1 et pour tout k compris
Exercices 375

entre s+1 et t, Qk et Rk sont des fonctions polynomiales à coefficients réels


de degré inférieur ou égal à mk − 1, ce qui revient à dire que l’ensemble S
des suites réelles solutions de cette équation de récurrence est un R-espace
vectoriel de dimension p engendré par les suites :
 j n
n αk , (1 ≤ k ≤ s, 0 ≤ j ≤ mk − 1)
nj ρnk cos (nθk ) , nj ρnk sin (nθk ) , (s + 1 ≤ k ≤ t, 0 ≤ j ≤ mk − 1)

Preuve. En utilisant les formules d’Euler, on constate que les suites proposées
forment une base de l’espace des solutions complexes. Ces suites de base étant à
valeurs réelles, elles forment bien une base de l’espace des solutions réelles. 
Cette méthode d’étude des équations récurrentes linéaires à coefficients constants
est analogue à celle utilisée pour la résolution d’équations différentielles linéaires
à coefficients constants d’ordre p (voir le chapitre 14).

13.12 Exercices

Exercice 13.1. Déterminer toutes les fonctions f : R → R continues en


0 telles que :

∀ (x, y) ∈ R2 , f (x + y) − f (x − y) = f (x) f (y) (13.8)

Solution. Prenant (x, y) = (0, 0) dans (13.8) , on obtient f (0) = 0. En pre-


2
nant (x, y) = (x, x) , où x est un réel quelconque, on obtient f (2x) = f (x)
et en conséquence f est à valeurs positives ou nulles. Par récurrence, on obtient
2n
f (2n x) = (f (x)) pour tout entier naturel n et tout réel x, ce qui peut aussi
# # x $$2n #x$ 1
s’écrire f (x) = f n , ou encore f n = (f (x)) 2n . S’il existe un réel x
2 2
tel que f (x) > 0, on a alors avec la continuité de f en 0 :
#x$ 1
0 = f (0) = lim f n = lim (f (x)) 2n = 1
n→+∞ 2 n→+∞

ce qui est impossible. En conclusion f est la fonction nulle.

Exercice 13.2. Soit f : R → R telle


 que
 f (1) = 1, f (x + y) = f (x) +
1
f (y) pour tout (x, y) ∈ R2 et f (x) f = 1 pour tout x ∈ R∗ .
x
Montrer que f (x) > 0 pour tout x ∈ R+,∗ , que f est croissante et conclure.

2
Solution. Avec f (x + y) = f (x) + f (y) pour  tout (x, y) ∈ R on déduit que f
1
est impaire (et donc f (0) = 0) et avec f (x) f = 1 pour tout x ∈ R∗ que
x
f (x) = 0 pour tout x ∈ R∗ . Pour tout x ∈ R \ {0, 1} , on a :
       
1 1 1 1 1
f =f + =f +f
x (1 − x) x 1−x x 1−x
376 Équations fonctionnelles

ce qui s’écrit aussi :


1 1 1 f (x) + f (1 − x) 1
= + = =
f (x (1 − x)) f (x) f (1 − x) f (x) f (1 − x) f (x) f (1 − x)

ou encore f (x) − f x2 = f x − x2 = f (x) f (1 − x) = f (x) (1 − f (x)) , soit


2
f x2 = (f (x)) pour tout x ∈ R \ {0, 1} . Ce résultat étant encore vrai pour
x = 0 et x = 1, on en déduit que f (x) > 0 pour tout x ∈ R+,∗ et pour x ≥ y on a
alors f (x) − f (y) = f (x − y) ≥ 0, ce qui signifie que la fonction f est croissante
sur R. Le théorème 13.1 nous dit alors que f (x) = f (1) x = x pour tout x ∈ R.

Exercice 13.3. Soit f : R → R vérifiant l’équation fonctionnelle de Jen-


sen :  
x+y f (x) + f (y)
∀ (x, y) ∈ R2 , f = (13.9)
2 2
1. Montrer que :
∀x ∈ R, f (2x) = 2f (x) − f (0)
2. Montrer que la fonction g définie sur R par g (x) = f (x) − f (0) vérifie
l’équation fonctionnelle de Cauchy.
3. Montrer que si f est monotone [resp. continue à droite en 0], elle est
alors affine.

Solution.
f (2x) + f (0)
1. L’équation (13.9) appliquée à (2x, 0) pour x ∈ R donne f (x) =
2
ou encore f (2x) = 2f (x) − f (0) .
2. Pour (x, y) ∈ R2 on a :
 
2x + 2y f (2x) + f (2y) g (2x) + g (2y)
g (x + y) = f − f (0) = − f (0) =
2 2 2
et pour x ∈ R on a g (2x) = f (2x) − f (0) = 2 (f (x) − f (0)) = 2g (x) . On a
donc g (x + y) = g (x) + g (y) .
3. Si f est monotone [resp. continue à droite en 0] il en est alors de même de g,
donc g (x) = ax et f (x) = ax + b avec b = f (0) .

Exercice 13.4. On dit qu’une


 n suite
 de réels (xn )n∈N converge au sens
1
de Cesàro vers  si la suite xk est convergente vers . On dit
n ∗
k=1 n∈N
qu’une fonction f : R → R conserve la convergence au sens de Cesàro si
pour toute suite (xn )n∈N qui converge au sens de Cesàro vers , la suite
(f (xn ))n∈N converge au sens de Cesàro vers f () . On se donne une fonc-
tion f : R → R qui conserve la convergence au sens de Cesàro.
1. Montrer que f vérifie l’équation fonctionnelle de Jensen (13.9) .
Exercices 377

2. Montrer que pour tout couple de réels (x, y) et tout couple d’entiers (n, k)
tels n ∈ N et 0 ≤ k ≤ 2n , on a :
 
k k
f x + n (y − x) = f (x) + n (f (y) − f (x))
2 2

3. Montrer que f est une fonction affine.

Solution.
1. Pour (x, y) ∈ R2 on définit la suite (xn )n∈N par x2k = x et x2k+1 = y pour tout
k ∈ N. Avec :
2n
 n 
1  1  
n−1
x+y
xk = x2k + x2k+1 =
2n 2n 2
k=1 k=1 k=0

2n+1
 
1  1 
n 
n
n (x + y) y
xk = x2k + x2k+1 = +
2n + 1 2n + 1 2n + 1 2n + 1
k=1 k=1 k=0
x+y
on déduit que cette suite converge au sens de Cesàro vers et donc la suite
  2
x+y
(f (xn ))n∈N converge au sens de Cesàro vers f . On a donc :
2
  2n
x+y 1  f (x) + f (y)
f = lim f (xk ) =
2 n→+∞ 2n 2
k=1

c’est-à-dire que f vérifie l’équation fonctionnelle de Jensen.


2. Pour tout n ∈ N et k ∈ {0, 2n } , le résultat est trivial. Pour n = 1 et k = 1,
c’est l’équation de Jensen. La propriété est donc vérifiée pour n = 0 et n = 1.
Supposons la vraie pour n ≥ 1 et tout couple de réels (x, y) .
Pour tout entier k compris entre 1 et 2n+1 − 1 on a :
     
k 1 k x
f x + n+1 (y − x) = f x + n (y − x) +
2 2 2 2
 
1 k f (x)
= f x + n (y − x) +
2 2 2

Si k est inférieur à 2n , on peut alors utiliser l’hypothèse de récurrence et on


obtient :
   
k 1 k f (x)
f x + n+1 (y − x) = f (x) + n (f (y) − f (x)) +
2 2 2 2
k
= f (x) + n+1 (f (y) − f (x))
2
378 Équations fonctionnelles

Si k est compris entre 2n + 1 et 2n+1 − 1, en effectuant la division euclidienne


de k par 2n , on a k = 2n + r avec r compris entre 1 et 2n − 1 et :
   $
k y 1# r
f x + n+1 (y − x) = f + (y − x) + x
2 2 2 2n
f (y) 1 # r $
= + f x + n (y − x)
2 2 2
f (y) 1 # r $
= + f (x) + n (f (y) − f (x))
2 2 2
k
= f (x) + n+1 (f (y) − f (x))
2
3. Si λ est un réel compris entre 0 et 1, en notant (kn )n∈N la suite d’entiers
kn
définie par kn = [2n λ] , on a 0 ≤ kn ≤ 2n et lim n = λ. Pour tout couple
n→+ 2
kn
de réels (x, y) la suite (zn )n∈N définie par zn = x + n (y − x) converge vers
2
z = x + λ (y − x) , elle converge donc vers z au sens de Cesàro et la suite
(f (zn ))n∈N va converger au sens de Cesàro vers f (z) . En écrivant que :

kn
f (zn ) = f (x) + (f (y) − f (x))
2n
on constate que cette suite converge au sens usuel et donc au sens de Cesàro
vers f (x) + λ (f (y) − f (x)) . Avec l’unicité de la limite, on peut donc conclure
que f (x + λ (y − x)) = f (x) + λ (f (y) − f (x)) . On a donc ainsi montré que
la fonction f est convexe sur R et en conséquence elle est continue (corollaire
8.2). En définitive f est continue et vérifie l’équation de Jensen, c’est donc une
fonction affine (exercice 13.3).

Exercice 13.5. Soit f : C → R telle que f (1) = 1 et f (z1 z2 ) =


f (z1 ) f (z2 ) pour tous z1 , z2 dans C.
1. Montrer que f (z) > 0 pour tout z ∈ C∗ .
On suppose que f est continue en 0 et en 1.
2. Montrer qu’il existe un réel α positif ou nul tel que f (x) = xα pour tout
x ∈ R+,∗ .
3. Montrer que f eit = 1 pour tout réel t.
4. Conclure.

Solution.
∗ 2
1. Tout z ∈ C peut
 s’écrire z=  u2 avec u ∈ C∗ et f (z) = (f (u)) ≥ 0. De plus
1 1
avec 1 = f z = f (z) f , on déduit que f (z) > 0 pour tout z ∈ C∗ .
z z
2. La restriction g de f à R+,∗ est continue en 1 et vérifie l’équation fonctionnelle
g (xy) = g (x) g (y) , il en résulte que g est une fonction exponentielle, c’est-à-
dire qu’il existe un réel α tel que f (x) = xα pour tout x ∈ R+,∗ . Si de plus
Exercices 379

f est continue en 0, on a alors lim g (x) = f (0) ∈ R et α est nécessairement


+
x→0
positif ou nul.
3. La fonction h : t → f eit est définie sur R, continue en 0 et vérifie l’équation
fonctionnelle h (x + y) = h (x) h (y) , il en résulte l’existence d’un réel β tel que
h (t) = eβt pour tout t ∈ R. Avec h (2nπ) = f (1) = 1, on déduit que eβ2nπ = 1
pour tout entier naturel n et nécessairement β = 0. On a donc f eit = 1 pour
tout réel t.
4. Pour z = ρeit dans C∗ , on a f (z) = f (ρ) f eit = ρα = |z| avec α ≥ 0. Si
α

α = 0 alors f (z) = 1 pour tout z ∈ C∗ et le résultat est encore vrai en 0 par


continuité. Si α > 0 alors f (0) = lim f (z) = 0. On a donc, pour tout z ∈ C,
z→0
α
f (z) = |z| avec α ≥ 0.

Exercice 13.6. On désigne par (un )n∈N la suite de nombres complexes


définie par la relation de récurrence :

1
p−1
un+p = un+k (13.10)
p
k=0

et les conditions initiales uj = aj pour j compris entre 0 et p − 1, où p est


un entier naturel supérieur ou égal à 2 et les aj sont des nombres complexes
donnés.
1. Montrer que 1 est racine simple de l’équation caractéristique de (13.10)
et que les autres racines complexes sont de module strictement inférieur
à 1.
2. Montrer que la suite (un )n∈N est convergente.

p−1
3. Montrer que la suite (vn )n∈N définie par vn = (k + 1) un+k est sta-
k=0
tionnaire sur v0 et en déduire la limite de la suite (un )n∈N .

Solution.

p−1
1. Le polynôme caractéristique de (13.10) est donné par P (X) = pX p − Xk.
k=0
On vérifie facilement que P (1) = 0 et P  (1) = 0, c’est-à-dire que 1 est
racine simple de P. Si z = ρeiθ est une racine de P avec ρ > 0 (0 n’est

p−1
pas racine) et θ est dans [0, 2π[ , on a alors pρp eipθ = ρk eikθ , ou encore
k=0

p−1 
p−1
1 − ρk−p ei(k−p)θ = 0 qui équivaut à 1 − ρk−p cos ((k − p) θ) = 0. Si
k=0 k=0
ρ > 1, on a alors ρk−p cos ((k − p) θ) ≤ ρk−p < 1 pour tout k compris entre 0 et
p − 1 et z = ρeiθ n’est pas racine de P. Si ρ = 1, l’équation P (z) = 0 équivaut
à 1 − cos ((k − p) θ) = 0 pour tout k compris entre 0 et p − 1 (tous les termes de
380 Équations fonctionnelles

la somme précédente sont positifs), ce qui donne cos (θ) = 1 pour k = p − 1 et


z = eiθ = 1. Donc toute racine de P différente de 1 est de module strictement
inférieur à 1.
2. En notant λ1 , · · · , λr les racines de P distinctes de 1 et m1 , · · · , mr les multipli-
 r
cités respectives, on a un = α + Qk (n) λnk , où Qk est un polynôme complexe
k=1
de degré au plus égal à mk − 1, pour tout k compris entre 1 et r. Avec |λk | < 1
pour tout k compris entre 1 et r, on déduit que la suite (un )n∈N converge vers
α.
3. On a :

p−1 
p−2
vn+1 = (k + 1) un+1+k = (k + 1) un+1+k + pun+p
k=0 k=0

p−1 
p−1 
p−1
= kun+k + un+k = (k + 1) un+k = vn
k=1 k=0 k=0

ce qui entraîne vn = v0 pour tout n ∈ N. On a alors :


p−1 
p−1
p (p + 1)
v0 = lim vn = (k + 1) lim un+k = α (k + 1) = α
n→+∞ n→+∞ 2
k=0 k=0

2v0 2  p−1
et α = = (k + 1) ak .
p (p + 1) p (p + 1)
k=0
Chapitre 14

Équations différentielles
linéaires

14.1 Équations différentielles linéaires du premier


ordre
Pour ce paragraphe, I désigne un intervalle réel d’intérieur non vide et a, b
deux fonctions continues de I dans R (ou dans C). On s’intéresse à l’équation
différentielle linéaire du premier ordre :
y  = ay + b (14.1)
On appelle solution de cette équation différentielle sur I toute fonction y dérivable
de I dans R telle que :
∀x ∈ I, y  (x) = a (x) y (x) + b (x)
Une équation différentielle de la forme αy  + βy + γ = 0 où α, β, γ sont des
fonctions continues de I dans R (ou dans C) avec α (x) = 0 pour tout x ∈ I se
β γ
ramène à un problème du type (14.1) en posant a = − et b = − .
α α
Dans un premier temps, on s’intéresse à l’équation homogène (ou sans second
membre) associée à (14.1) :
y  = ay (14.2)
Il est clair que la fonction identiquement nulle est solution de cette équation
sur I.
Si y est une solution non identiquement nulle de (14.2) , il existe alors un réel
x0 ∈ I tel que y (x0 ) = 0. Supposons que y (x0 ) > 0. Du fait de la continuité
de y sur I, on peut trouver un réel η > 0 tel que y (x) > 0 pour tout x dans
y  (x)
J = ]x0 − η, x0 + η[ ∩ I et on peut écrire pour tout x ∈ J, = a (x) , ce
y (x)

qui équivaut à (ln (y (x))) = a (x) ou encore à ln (y (x)) = A (x) + μ, où A est
la primitive
 de a nulle en x0 et μ une constante réelle. On a donc, en notant
x
A (x) = a (t) dt la primitive de a nulle en x0 , y (x) = λeA(x) pour tout x ∈ J,
x0
où λ est une constante réelle strictement positive.
382 Équations différentielles linéaires

Dans le cas où la fonction a est constante il est facile de montrer qu’une solution
définie sur R et non identiquement nulle de l’équation différentielle y  = ay ne
s’annule jamais (exercice 14.1).
Théorème 14.1.
Les solutions sur l’intervalle I de l’équation différentielle y  = ay sont
les fonctions définies par :
 x 
∀x ∈ I, y (x) = λ exp a (t) dt
x0

où x0 est un point de I et λ une constante réelle.

Preuve. Au vu de l’étude précédente, on se donne un point x0 dans I, on désigne


par A la primitive de a sur I qui est nulle en x0 et à toute fonction y dérivable
sur I on associe la fonction z définie sur I par z (x) = y (x) e−A(x) . Cette fonction
z est dérivable sur I avec :

∀x ∈ I, z  (x) = (y  (x) − a (x) y (x)) e−A(x)

et y est solution de (14.2) sur I si, et seulement si, z  (x) = 0 pour tout x ∈ J, ce
qui équivaut à dire que z est une fonction constante sur l’intervalle I. On a donc
z = λ ∈ R pour toute solution sur I de (14.2) et y = λeA . 
Ce théorème peut s’exprimer en disant que l’ensemble des solutions de (14.2)
est un espace vectoriel de dimension 1 engendré par la solution particulière eA .
Ce théorème nous montre également que si y est une solution non identiquement
nulle de (14.2) , elle ne s’annule alors jamais sur I et en conséquence garde un
signe constant. De manière pratique la résolution de cette équation peut se faire
en écrivant :
y 
y  = ay ⇔ = a ⇔ (ln (|y|)) = a ⇔ y = λeA
y
où y est une solution non nulle.
Dans le cas particulier où a est une fonction constante sur I = R, les solutions
de l’équation y  = ay sont les fonctions définies sur R par y (x) = λea(x−x0 ) = γeax .
Pour la résolution de l’équation avec second membre (14.1) , on dispose du
résultat suivant.
Théorème 14.2.
Les solutions sur l’intervalle I de l’équation différentielle y  = ay +b sont
les fonctions définies par :
 x 
∀x ∈ I, y (x) = u (x) + λ exp a (t) dt
x0

où x0 est un point de I, λ une constante réelle et u une solution particulière


sur I de l’équation y  = ay + b.
Équations différentielles linéaires du premier ordre 383

Preuve. Si u est une solution particulière sur I de (14.1) , alors pour toute autre
solution y, la fonction v = y − u est solution de y  = ay et le résultat se déduit du
théorème précédent. 
Exemples 14.1
1. Dans le cas où la fonction a est constante et le second membre est de la forme
b (x) = P (x) eαx , la fonction P étant polynomiale de degré n ≥ 0 et α étant
une constante réelle (ou complexe), on cherche une solution particulière de la
forme u (x) = Q (x) eαx avec Q polynomiale. L’équation u = au + b est alors
équivalente à Q + (α − a) Q = P. Si α = a, on peut chercher Q de même degré
que P et les coefficients du polynôme Q (dans la base canonique de R [X]) sont
solutions d’un système triangulaire dont les coefficients diagonaux sont tous
égaux à α − a. Si α − a = 0 alors Q = P et Q est de degré deg (P ) + 1.
2. Dans le cas où la fonction a est constante et le second membre est de la forme
b (x) = P (x) eαx + Q (x) eβx (ou une somme de p ≥ 2 fonctions de la forme
P (x) eαx ), les fonctions P, Q étant polynomiales et α, β étant des constantes
réelles (ou complexes), on cherche une solution particulière à chacune des équa-
tions y  = ay+P eαx et y  = ay+Qeβx , puis en faisant la somme de ces solutions
on obtient une solution particulière de y  = ay + b.
3. Soit à résoudre l’équation y  −y = cos (x) . Les solutions de l’équation homogène
eix + e−ix
associée sont de la forme y (x) = λex . En écrivant que cos (x) = , on
2
±ix
e
cherche des solutions particulières pour chacune des équations y  − y = ,
2
1
ce qui donne u (x) = qeix , (±i − 1) q = et on obtient la solution particulière
2
sin (x) − cos (x)
.
2
Dans le cas où une solution particulière de (14.1) ne peut être trouvée de manière
évidente, on peut utiliser la méthode de Lagrange dite de variation de la constante.

x
Le réel x0 étant fixé dans I, on dispose de la fonction v : x → exp a (t) dt
x0
qui est une solution particulière de l’équation homogène (14.2) et cette fonction
ne s’annule jamais sur I. On peut alors associer à toute fonction y dérivable sur I
y (x)
la fonction λ définie par λ (x) = . Cette fonction est dérivable sur I avec :
v (x)
v (x) y  (x) − v  (x) y (x) v (x) y  (x) − a (x) v (x) y (x)
∀x ∈ I, λ (x) = 2
=
v (x) v 2 (x)
et y est solution de (14.1) sur I si, et seulement si, λ est solution sur I de :
v (x) (a (x) y (x) + b (x)) − a (x) v (x) y (x) b (x)
λ (x) = =
v 2 (x) v (x)
b
ce qui équivaut à dire que λ est une primitive de sur I, soit :
v
 x
b (t)
∀x ∈ I, λ (x) = dt + μ = λ0 (x) + μ
x0 v (t)
384 Équations différentielles linéaires

En définitive, les solutions de (14.1) sont les fonctions définies par ;


∀x ∈ I, y (x) = (λ0 (x) + μ) v (x) = u (x) + μv (x)
où u = λ0 v est une solution particulière de (14.1) et μ une constante réelle.
Exemple 14.1 Les solutions sur I = R de l’équation différentielle y  + 2xy = 1
sont les fonctions définies par :
 x
2 2 2
∀x ∈ R, y (x) = et −x dt + μe−x
0

où μ est une constante réelle. La solution générale de l’équation homogène associée


2
y  + 2xy = 0 est de la forme y (x) = λe−x . En cherchant une solution particulière
2 2
−x
de
 la forme y (x) = λ (x) e , on obtient λ (x) = ex , ce qui donne λ (x) =
x
2
et dt et la solution générale.
0

Une conséquence importante du théorème précédent est le résultat suivant, cas


particulier du théorème de Cauchy-Lipschitz .

Corollaire 14.1. Pour tout x0 ∈ I et y0 ∈ R, l’équation différentielle y  =


ay +b admet une unique solution qui vérifie la condition initiale y (x0 ) = y0 .

Preuve. Une solution de (14.1) s’écrit y = u + λv, où u est une solution parti-
culière
 de (14.1)et v la solution de l’équation homogène (14.2) définie par v (x) =
x
exp a (t) dt . La condition y (x0 ) = y0 est alors équivalente à λ = y0 −u (x0 ) ,
x0
ce qui définit parfaitement la fonction y. 
Dans le cas d’une équation différentielle linéaire de la forme αy  + βy + γ = 0
où α, β, γ sont des fonctions continues de I dans R (ou dans C), la fonction α
s’annulant sur l’intervalle I, le théorème 14.2 et le corollaire 14.1 ne s’appliquent
pas comme le montrent les exemples suivants.
Exemples 14.2
1. Considérons l’équation différentielle homogène x2 y  − y = 0 sur R. Sur R+,∗
1
[resp. R−,∗ ] cette équation a pour solution particulière x → e− x , on en déduit
donc que si y est solution sur R de x2 y  − y = 0, il existe alors deux constantes
λ, μ telles que :  1
λe− x si x > 0
y (x) = 1
μe− x si x < 0
1
Tenant compte de y (0) = 0 (déduit de x2 y  − y = 0) et lim e− x = +∞, on
x→0−
déduit que la constante μ est nécessairement nulle. Réciproquement la fonction
définie sur R par :  1
λe− x si x ≥ 0
y (x) =
0 si x < 0
est dérivable et solution de l’équation différentielle et la valeur de y (x0 ) avec
x0 < 0 ne peut être imposée. Par exemple, il n’existe pas de solution telle que
y (−1) = 1.
Équations différentielles linéaires d’ordre 2 à coefficients constants 385

2. Considérons l’équation différentielle xy  + y = xn sur R, où n est un entier


naturel non nul. Sur R+,∗ [resp. R−,∗ ] l’équation homogène a pour solution
1
particulière x → et l’équation avec second membre a pour solution particulière
x
xn
x → . On en déduit donc que si y est solution sur R de xy  + y = xn , il
n+1
existe alors deux constantes λ, μ telles que :

⎪ xn λ

⎨ + si x > 0
n+1 x
y (x) =

⎪ xn μ
⎩ + si x < 0
n+1 x
Tenant compte de y (0) = 0 (déduit de xy  + y = xn avec n ≥ 1), on déduit que
les constantes λ et μ sont nécessairement nulles. Réciproquement la fonction
xn
définie sur R par y (x) = est solution de l’équation différentielle. En
n+1
définitive cette équation différentielle a une unique solution sur R.
3. Considérons l’équation différentielle xy  − ny = xn+1 sur R, où n est un entier
naturel supérieur ou égal à 2. Sur R+,∗ [resp. R−,∗ ] l’équation homogène a
pour solution particulière x → xn et l’équation avec second membre a pour
solution particulière x → xn+1 . On en déduit donc que si y est solution sur R
de xy  − ny = xn+1 , il existe alors deux constantes λ, μ telles que :
 n+1
x + λxn si x > 0
y (x) = n+1
x + μxn si x < 0

la condition y (0) = 0 étant bien vérifiée. Réciproquement, pour tous réels λ, μ,


la fonction définie sur R par :
 n+1
x + λxn si x ≥ 0
y (x) = n+1
x + μxn si x < 0

est bien dérivable pour n ≥ 2 (si n = 1 on a alors yg (0) = μ, yd (0) = λ et
y n’est pas dérivable en 0 si λ = μ) et solution de l’équation différentielle. En
définitive la solution générale sur R de cette équation différentielle s’écrit en
utilisant deux paramètres réels et la seule connaissance de y (x0 ) n’assure pas
l’unicité de la solution. Cette unicité est assurée par la donnée de deux valeurs
y (x0 ) et y (x1 ) où x0 , x1 sont non nuls et de signes contraires.

14.2 Équations différentielles linéaires d’ordre 2 à


coefficients constants
Pour ce paragraphe, on se donne trois réels (ou complexes) a, b, c avec a non
nul, une fonction f définie sur un intervalle réel I d’intérieur non vide à valeurs
réelles (ou complexes) et on s’intéresse à l’équation différentielle linéaire d’ordre 2
à coefficients constants :
ay  + by  + cy = f (14.3)
386 Équations différentielles linéaires

Dans un premier temps, on s’intéresse à l’équation homogène (ou sans second


membre) associée :
ay  + by  + cy = 0 (14.4)
Par analogie au cas, étudié précédemment, où le coefficient a est nul, on cherche
des solutions exponentielles à cette équation homogène.

Lemme 14.1 Pour λ dans C, la fonction x → eλx est solution sur R de l’équation
différentielle (14.4) si, et seulement si, λ est solution de l’équation polynomiale :

aλ2 + bλ + c = 0 (14.5)

Preuve. Si pour λ ∈ C on note y la fonction définie sur R par y (x) = eλx , cette
fonction est alors indéfiniment dérivable et pour tout réel x, on a :

ay  (x) + by  (x) + cy (x) = aλ2 + bλ + c eλx

et y est solution sur R de (14.4) si, et seulement si, λ est solution de (14.5) . 
Avec les notations qui précèdent on dit que l’équation (14.5) est l’équation
caractéristique de (14.4) ou que le polynôme P = aX 2 + bX + c est le polynôme
caractéristique de (14.4) . On note Δ = b2 − 4ac le discriminant de P.
Sur C l’équation (14.5) a au moins une solution λ et la fonction u : x → eλx
est une solution particulière de (14.4) qui ne s’annule jamais. On utilise alors la
méthode de variation de la constante pour en déduire toutes les solutions de (14.4) .
Pour ce faire, on associe à toute fonction y deux fois dérivable de R dans C, la
y (x)
fonction z définie par z (x) = = e−λx y (x) . Cette fonction z est deux fois
u (x)
dérivable sur R et on a pour tout réel x :

⎨ y (x) = z (x) eλx
y  (x) = (z  (x) + λz (x)) eλx
⎩ 
y (x) = z  (x) + 2λz  (x) + λ2 z (x) eλx

et :

ay  (x) + by  (x) + cy (x) = (az  (x) + P  (λ) z  (x) + P (λ) z (x)) eλx
= (az  (x) + P  (λ) z  (x)) eλx

où P  (λ) = 2aλ + b. On a ainsi montré le résultat suivant.

Lemme 14.2 Si λ est une solution complexe de l’équation caractéristique (14.5) ,


alors une fonction y deux fois dérivable de R dans C est solution de (14.4) si,
et seulement si, la dérivée z  de la fonction z : x → e−λx y (x) est solution de
l’équation différentielle d’ordre 1, aZ  (x) + (2aλ + b) Z (x) = 0.

On distingue alors deux cas de figure.


b
Soit Δ = 0 et l’équation caractéristique (14.5) a une racine double λ = − . On

2a
a alors P (λ) = 0 et avec les notations du lemme on est ramené à l’équation Z = 0.
On a donc z  = Z = α où α est une constante complexe et z (x) = αx + β, où β
Équations différentielles linéaires d’ordre 2 à coefficients constants 387

est une autre constante complexe. Les solutions de (14.4) sont alors les fonctions
y définies sur R par y (x) = eλx z (x) = (α + βx) eλx .
Soit Δ = 0 et l’équation caractéristique (14.5) a deux racines complexes dis-
2aλ1 +b
tinctes λ1 , λ2 et le lemme utilisé avec λ = λ1 donne Z (x) = γe− a x . En
b 2aλ1 + b b
remarquant que − = λ1 + λ2 , on a = 2λ1 + = λ1 − λ2 et :
a a a
 
z (x) = γe(λ2 −λ1 )x
γ
z (x) = e(λ2 −λ1 )x + α = βe(λ2 −λ1 )x + α
λ2 − λ1

où α, β sont deux constantes complexes (si γ décrit C il en est alors de même de


γ
β= ). Les solutions de (14.4) sont alors les fonctions y définies sur R par
λ2 − λ1
y (x) = eλ1 x z (x) = αeλ1 x + βeλ2 x .
Dans le cas des solutions complexes de (14.4) , on a ainsi montré le résultat
suivant.
Théorème 14.3.
Si Δ est non nul, alors en notant λ1 , λ2 les solutions complexes (dis-
tinctes) de l’équation caractéristique (14.5) , les solutions définies sur R
et à valeurs complexes de l’équation différentielle (14.4) sont les fonctions
définies sur R par y (x) = αeλ1 x + βeλ2 x , où α, β sont deux constantes com-
plexes.
Si Δ est nul, alors en notant λ l’unique solution complexe de (14.5) , les
solutions définies sur R et à valeurs complexes de (14.4) sont les fonctions
définies sur R par y (x) = (α + βx) eλx , où α, β sont deux constantes com-
plexes.

Ce théorème est un cas particulier d’un résultat plus général qui est le théorème
de Cauchy-Lipschitz pour les équations différentielles linéaires d’ordre n (à coef-
ficients non nécessairement constant). Précisément, le théorème précédent peut
aussi se traduire comme suit.
Corollaire 14.2. Soient a, b, c des constantes complexes avec a non nul.
L’ensemble des solutions définies sur R et à valeurs complexes de l’équation
différentielle ay  + by  + cy = 0 est un C-espace vectoriel de dimension 2.
Pour tous x0 ∈ R et y0 , z0 dans C, cette équation différentielle admet une
unique solution définie sur R et qui vérifie les conditions initiales y (x0 ) =
y0 , y  (x0 ) = z0 .

Preuve. En remarquant que, pour λ1 = λ2 , les fonctions u1 : x → eλ1 x et


v1 : x → eλ2 x (cas Δ = 0) sont linéairement indépendantes et que, pour λ ∈ C,
les fonctions u2 : x → eλx et v2 : x → xeλx (cas Δ = 0) sont aussi linéairement
indépendantes, (si αuj + βvj = 0, alors αuj + βvj = 0 et pour x = 0 on aboutit
à un système linéaire de déterminant non nul) on déduit du théorème précédent
que l’ensemble S des solutions définies sur R et à valeurs complexes de l’équation
différentielle (14.4) est un espace vectoriel de dimension 2 sur C.
388 Équations différentielles linéaires

Le deuxième point revient à montrer que l’application ϕ : y → (y (x0 ) , y  (x0 ))


réalise une bijection de S sur C2 . Cette application étant linéaire entre espaces
vectoriels de même dimension, il suffit de montrer que son noyau est réduit à {0} ,
ce qui se déduit encore du fait que le déterminant du système :

y (x0 ) = αu1 (x0 ) + βv1 (x0 ) = 0
y  (x0 ) = αu1 (x0 ) + βv1 (x0 ) = 0

est non nul (il vaut e(λ1 +λ2 )x0 (λ2 − λ1 ) dans le cas où Δ = 0 et e2λx0 dans le cas
où Δ = 0). 
La méthode de variation de la constante peut être utilisée dans le cas d’une
équation différentielle linéaire d’ordre 2 à coefficients non constants, ay  +by  +cy =
0, la fonction a ne s’annulant pas sur un intervalle I. Si on dispose d’une solution
y
particulière u qui ne s’annule pas sur I, alors la dérivée z  de la fonction z =
u
est solution d’une équation différentielle linéaire d’ordre 1, ce qui nous ramène à
des calculs de primitives.
Dans le cas où les coefficients a, b, c sont réels et où on s’intéresse aux solutions
à valeurs réelles, on a le résultat suivant.
Théorème 14.4.
Si les coefficients a, b, c de l’équation (14.4) sont réels, avec a non nul,
on a les trois possibilités suivantes.
Soit Δ est strictement positif et alors, en notant λ1 , λ2 les solutions réelles
(distinctes) de l’équation caractéristique (14.5) , les solutions définies sur
R et à valeurs réelles de l’équation différentielle (14.4) sont les fonctions
définies sur R par y (x) = αeλ1 x + βeλ2 x , où α, β sont deux constantes
réelles.
Soit Δ est nul et alors, en notant λ la racine double de (14.5) , les solutions
définies sur R et à valeurs réelles de (14.4) sont les fonctions définies sur
R par y (x) = (αx + β) eλx , où α, β sont deux constantes réelles.
Soit Δ est strictement négatif et alors, en notant λ = u + iv, λ = u − iv les
solutions complexes conjuguées de (14.5) avec (u, v) ∈ R × R∗ , les solutions
définies sur R et à valeurs réelles de (14.4) sont les fonctions définies sur
R par y (x) = (α cos (vx) + β sin (vx)) eux , où α, β sont deux constantes
réelles.

Preuve. Les cas Δ > 0 et Δ = 0 se traitent comme dans le cas complexe.


Dans le cas où Δ est strictement négatif, les solutions à valeurs complexes de
(14.4) sont les fonctions définies par :

∀x ∈ R, y (x) = γeivx + δe−ivx eux (14.6)

où γ, δ sont des constantes complexes. En particulier les fonctions à valeurs réelles :


 
1 ivx 1 −ivx ux
x → eux cos (vx) = e + e e
2 2
 
1 ivx 1
x → eux sin (vx) = e − e−ivx eux
2i 2i
Équations différentielles linéaires d’ordre n à coefficients constants 389

sont solutions de (14.4) et il en est de même de toute combinaison linéaire réelle.


Réciproquement si y est une solution réelle de (14.4) , c’est également une solu-
tion complexe, donc de la forme (14.6) et la condition y à valeurs réelles se traduit
par y (x) = y (x) pour tout réel x, ce qui équivaut à γeivx +δe−ivx = γe−ivx +δeivx
encore équivalent à δ − γ = δ − γ e2ivx pour tout réel x. En dérivant cette rela-
tion, on en déduit qu’elle équivaut à δ = γ puisque v est non nul. On a donc :

γeivx + δe−ivx = γeivx + γeivx = 2 γeivx = α cos (vx) + β sin (vx)

avec α, β réels. 
Comme dans le cas complexe, en vérifiant que les fonctions qui interviennent
dans l’expression des solutions sont linéairement indépendantes, on déduit le ré-
sultat suivant.
Corollaire 14.3. Soient a, b, c des constantes réelles. L’ensemble des
solutions définies sur R et à valeurs réelles de l’équation différentielle
ay  + by  + cy = 0 est un R-espace vectoriel de dimension 2. Pour tous
x0 ∈ R et y0 , z0 dans R, cette équation différentielle admet une unique
solution définie sur R et qui vérifie les conditions initiales y (x0 ) = y0 ,
y  (x0 ) = z0 .

14.3 Équations différentielles linéaires d’ordre n


à coefficients constants
Dans ce paragraphe on se limite à l’étude des équations différentielles linéaires,
homogènes (ou sans second membre), d’ordre n ≥ 1 à coefficients constants :

an y (n) (x) + an−1 y (n−1) (x) + · · · + a0 y (x) = 0 (x ∈ R) (14.7)

où les ak sont des nombres réels ou complexes avec an = 0.


Une solution de cette équation différentielle est une fonction f : R → C dérivable
jusqu’à l’ordre n telle que :

n
∀x ∈ R, ak f (k) (x) = 0
k=0

On peut remarquer que si f est une telle solution, f (n) est alors combinaison
linéaire des f (k) avec k compris entre 0 et n − 1, ce qui entraîne que f (n) est
dérivable sur R. Par récurrence, on en déduit facilement que la fonction f est en
fait indéfiniment dérivable sur R.
En notant ϕ l’endomorphisme de l’espace vectoriel C ∞ (R, C) des fonctions in-
n
définiment dérivables de R dans C défini par ϕ (y) = ak y (k) , on constate que
k=0
l’ensemble S des solutions de (14.7) est le noyau de ϕ, c’est donc un sous-espace
vectoriel de C ∞ (R, C) .
390 Équations différentielles linéaires

Dans ce qui suit, on note D l’opérateur de dérivation qui associe à toute fonction
y ∈ C ∞ (R, C) sa dérivée. Cet opérateur est un endomorphisme de C ∞ (R, C) et on
peut définir ses itérés Dk par D0 = Id et Dk+1 = Dk ◦ D pour tout k ∈ N (pour
 q
tout y ∈ C ∞ (R, C) , on a Dk (y) = y (k) ). À tout polynôme Q (X) = αk X k dans
k=0
%
q
C [X] on peut associer l’opérateur différentiel Q (D) = k
αk D et il est facile de
k=0
vérifier que si Q, R, sont deux polynômes alors Q (D) ◦ R (D) = R (D) ◦ Q (D) =
n
(QR) (D) . En particulier, on a ϕ = P (D) , où P (X) = ak X k est le polynôme
k=0
caractéristique de (14.7) . En notant λ1 , · · · , λp les racines deux à deux distinctes
de multiplicités respectives m1 , · · · , mp de ce polynôme P, on a :

⎪ 2
p

⎨ P (X) = an (X − λk ) k
m

k=1
⎪ 2
p

⎩ ϕ = P (D) = an
m
(D − λk Id ) k
k=1

Le résultat suivant, conséquence du théorème de Bézout dans l’anneau C [X] ,


est une première étape dans la détermination de la forme générale des solutions
de (14.7) .

Lemme 14.3 (Lemme des noyaux) Avec les notations qui précèdent, on a :
p
mk
S = ker (ϕ) = ker ((D − λk Id ) )
k=1
m
Preuve. On procède par récurrence sur p ≥ 2, en notant Pk (X) = (X − λk ) k
pour tout k compris entre 1 et p. Pour p = 2, les polynômes P1 et P2 sont premiers
entre eux et le théorème de Bézout dans C [X] nous dit qu’il existe deux polynômes
A et B tels que AP1 + BP2 = 1. On a alors A (D) ◦ P1 (D) + B (D) ◦ P2 (D) = Id
et pour tout y ∈ S = ker (ϕ) , on a :

y = (A (D) ◦ P1 (D)) (y) + (B (D) ◦ P2 (D)) (y) (14.8)

avec y2 = (A (D) ◦ P1 (D)) (y) dans ker (P2 (D)) et y1 = (B (D) ◦ P2 (D)) (y) dans
ker (P1 (D)) (commutativité de C [D]). Donc S = ker (P1 (D)) + ker (P2 (D)) , l’in-
clusion ker (P1 (D))+ker (P2 (D)) ⊂ S étant évidente. De l’égalité (14.8) on déduit
immédiatement que ker (P1 (D)) ∩ ker#(P2 (D)) = {0} $ . On a donc bien la somme
m1 m2
directe, S = ker ((D − λ1 Id ) ) ⊕ ker (D − λ2 Id ) . On conclut par récurrence
sur p en considérant que si P1 est premier avec P2 , · · · , Pp il est alors premier avec
leur produit. 
La détermination de S passe donc par celle des noyaux des endomorphismes
m
(D − λk Id ) k , ce qui revient à résoudre, pour tout scalaire λ et tout entier naturel
m
non nul m, l’équation différentielle (D − λId ) (y) = 0

Lemme 14.4 Soient λ un nombre complexe et m un entier naturel non nul. Les
m
solutions sur R de l’équation différentielle (D − λId ) (y) = 0 forment un espace
Équations différentielles linéaires d’ordre n à coefficients constants 391

vectoriel de dimension m engendré par les fonctions :

yk : x → xk eλx (0 ≤ k ≤ m − 1)

Preuve. Pour toute fonction y ∈ C ∞ (R, C) , la fonction z = ye−λx est dans


C ∞ (R, C) et (D − λId ) y = (D − λId ) zeλx = z  eλx . Par récurrence, on déduit
facilement que pour tout entier naturel non nul k, on a (D − λId ) y = z (k) eλx . Il
k
m
en résulte alors que l’équation différentielle (D − λId ) (y) = 0 est équivalente à
z (m) = 0 encore équivalent à dire que z est une fonction polynomiale de degré au
m
plus égal à m − 1. Les solutions de (D − λId ) (y) = 0 sont donc de la forme :


m−1
x → y (x) = P (x) eλx = αk xk eλx
k=0

les αk étant des constantes complexes. Considérant que les fonction xk eλx , pour k
compris entre 0 et m − 1, sont linéairement indépendantes, on en déduit le résultat
annoncé. 
On déduit de ces lemmes le résultat suivant.
Théorème 14.5.
Les solutions définies sur R et à valeurs complexes de l’équation diffé-

p
rentielle (14.7) sont de la forme x → y (x) = eλk x Pk (x) , où pour tout
k=1
k compris entre 1 et p, Pk est une fonction polynomiale à coefficients com-
plexes de degré inférieur ou égal à mk −1, ce qui revient à dire que l’ensemble
S des solutions de cette équation est un C-espace vectoriel de dimension n
engendré par les fonctions :

x → xj eλk x (1 ≤ k ≤ p, 0 ≤ j ≤ mk − 1)

Preuve. Le lemme des noyaux nous dit qu’une solution y ∈ S s’écrit de manière

p
unique y = yk , où pour tout k compris entre 1 et p, yk est solution de l’équation
k=1
m
différentielle (D − λk Id ) k (y) = 0. Le lemme précédent permet alors de conclure.

Dans le cas où les coefficients ak sont réels, les racines du polynôme caractéris-
tique sont stables par conjugaison complexe, c’est-à-dire que :
(
r
mk
(
s
mk mk
P (X) = an (X − αk ) (X − λk ) X − λk
k=1 k=r+1

les αk étant réels et les λk = βk + iγk complexes non réels avec βk , γk réels (dans
le cas où il n’y a pas de racines réelles [resp. complexes non réelles] le produit
correspondant vaut 1) et on a le résultat suivant qui généralise le théorème 14.4.
392 Équations différentielles linéaires

Théorème 14.6.
Les solutions définies sur R et à valeurs réelles de l’équation différentielle
(14.7) sont de la forme :


r 
s
y (x) = eαk x Pk (x) + eβk x cos (γk x) Pk (x)
k=1 k=r+1
s
+ eβk x sin (γk x) Qk (x)
k=r+1

où, pour tout k compris entre 1 et r, Pk est une fonction polynomiale à


coefficients réels de degré inférieur ou égal à mk − 1 et pour tout k compris
entre r +1 et s, Pk et Qk sont des fonctions polynomiales à coefficients réels
de degré inférieur ou égal à mk −1, ce qui revient à dire que l’ensemble S des
solutions réelles de cette équation est un R-espace vectoriel de dimension n
engendré par les fonctions :
 j α x
x e k , (1 ≤ k ≤ r, 0 ≤ j ≤ mk − 1)
xj eβk x cos (γk x) , xj eβk x sin (γk x) , (r + 1 ≤ k ≤ s, 0 ≤ j ≤ mk − 1)

Preuve. En utilisant les formules d’Euler, on constate que les fonctions proposées
forment une base de l’espace des solutions complexes. Ces fonctions de base étant
à valeurs réelles elles forment bien une base de l’espace des solutions réelles. 

14.4 Équations différentielles linéaires d’ordre n


Pour ce paragraphe, I est un intervalle réel non réduit à un point, a0 , · · · , an−1 ,
b des fonctions continues de I dans R (ou C) et on s’intéresse à l’étude des solutions
sur I de l’équation différentielle linéaire d’ordre n avec second membre :

y (n) + a0 y + a1 y  + · · · + an−1 y (n−1) = b (14.9)

Une telle équation différentielle se ramène à un système différentiel linéaire


d’ordre 1 avec second membre Y  (x) = A (x) Y (x) + B (x) , en notant :
⎛ ⎞ ⎛ ⎞
y (x) 0
⎜ y  (x) ⎟ ⎜ .. ⎟
⎜ ⎟ ⎜ ⎟
Y (x) = ⎜ .. ⎟ , B (x) = ⎜ . ⎟
⎝ . ⎠ ⎝ 0 ⎠
y (n−1) (x) b (x)
⎛ ⎞
0 1 0 ··· 0
⎜ 0 0 1 ··· 0 ⎟
⎜ ⎟
⎜ .. .. ⎟
A (x) = ⎜ . . . . . ⎟
⎜ ⎟
⎝ 0 0 ··· 0 1 ⎠
−a0 (x) −a1 (x) ··· −an−2 (x) −an−1 (x)
Équations différentielles linéaires d’ordre n 393

L’étude de ces systèmes différentiels est faite en détail dans [21]. On y montre
en particulier le résultat suivant.
Théorème 14.7. Cauchy-Lipschitz linéaire

Pour tout x0 dans I et tout Y0 dans Rn , le problème de Cauchy sur I :


 
Y (x) = A (x) Y (x) + B (x) (x ∈ I)
(14.10)
Y (x0 ) = Y0

a une unique solution.

De ce théorème on déduit le suivant.


Théorème 14.8.
Pour tous x0 dans I et y0 , y1 , · · · , yn−1 dans R, il existe une unique
solution de (14.9) vérifiant les conditions initiales :

y (x0 ) = y0 , y  (x0 ) = y1 , · · · , y (n−1) (x0 ) = yn−1

Ce qui entraîne que l’ensemble SI des solutions sur I de l’équation diffé-


rentielle linéaire d’ordre n sans second membre associé à (14.9) :

y (n) (x) + a0 (x) y (x) + a1 (x) y  (x) + · · · + an−1 y (n−1) (x) = 0 (x ∈ I)

est un espace vectoriel de dimension n, l’application :


# $
ϕ : y → y (x0 ) , y  (x0 ) , · · · , y (n−1) (x0 )

réalisant un isomorphisme de SI sur Rn .

Si (y1 , · · · , yn ) est une base de l’espace vectoriel des solutions sur I de l’équa-
tion sans second membre associée à (14.9) et u une solution particulière de cette
%n
équation, alors toute solution de (14.9) est de la forme y = λk yk + u, où les
k=1
λk , pour k compris entre 0 et n sont des constantes réelles.
La recherche d’une solution particulière de (14.9) peut se faire en utilisant la
méthode de variation des constantes (ou méthode de Lagrange). À partir d’une
base (y1 , · · · , yn ) de l’espace vectoriel des solutions sur I de l’équation sans second
membre associée à (14.9) , on obtient une base (Y1 , · · · , Yn ) de l’espace vectoriel
des solutions sur I du système différentiel Y (x) = A (x) Y (x) (en utilisant les
notations du début de ce paragraphe) et la fonction vectorielle Y définie sur I par
 n
Y (x) = λk (x) Yk (x) , où les λk sont des fonctions dérivables de I dans R, est
k=1
solution particulière sur I du système différentiel Y  (x) = A (x) Y (x) + B (x) si,
et seulement si, pour tout x ∈ I, le vecteur (λ1 (x) , · · · , λn (x)) est solution du
 n
système linéaire λk (x) Yk (x) = B (x) . On aura donc une solution particulière
k=1
394 Équations différentielles linéaires

de (14.9) en résolvant, pour tout x ∈ I, le système linéaire :


⎧ n
⎪ % 

⎪ λk (x) yk (x) = 0



⎪ k=1
⎪ ..

⎨ .
%n
(n−2)

⎪ λk (x) yk (x) = 0



⎪ k=1

⎪ %n
(n−1)

⎩ λk (x) yk (x) = b (x)
k=1

%
n
et en posant y (x) = λk (x) yk (x) , les λk étant des primitives des λk .
k=1
Le déterminant de ce système linéaire est le wronskien :

y1 (x) y2 (x) ··· yn (x)


y1 (x) y2 (x) ··· yn (x)
W (x) = .. .. .. ..
. . . .
(n−1) (n−1) (n−1)
y1 (x) y2 (x) ··· yn (x)

Ce déterminant est non nul en un point x de I si, et seulement si, (y1 , · · · , yn )


est une base de l’espace vectoriel des solutions sur I de l’équation sans second
membre associée à (14.9) . Tous ces résultats sont montrés dans [21].

14.5 Racines des solutions d’une équation diffé-


rentielle linéaire d’ordre 2
On désigne par I un intervalle réel non réduit à un point et on s’intéresse aux
racines des solutions non identiquement nulles de l’équation différentielle linéaire
d’ordre 2 :
y  + ay  + by = 0 (14.11)
où a, b sont deux fonctions continues de I dans R.
On sait que l’ensemble S des solutions sur I de l’équation (14.11) est un espace
vectoriel de dimension 2 (théorème de Cauchy-Lipschitz linéaire).
On appelle système fondamental de solutions de (14.11) toute base de S.
La connaissance d’un système fondamental de solutions de (14.11) permet de
trouver des solutions particulières de l’équation avec second membre :

y  + ay  + by = c (14.12)

(où c est une fonction continue de I dans R) en utilisant la méthode de variation


des constantes. Si (u, v) est une base de S, on cherche une solution particulière de
(14.12) de la forme y = λu + μv, où λ, μ sont deux fonctions dérivables de I dans
R telles que pour tout x dans I, (λ (x) , μ (x)) est solution du système linéaire :

u (x) λ (x) + v (x) μ (x) = 0
u (x) λ (x) + v  (x) μ (x) = c (x)
Racines des solutions d’une équation différentielle linéaire d’ordre 2 395

Le déterminant de ce système est le wronskien w (x) = u (x) v  (x) − u (x) v (x) .


Ce déterminant ne s’annule jamais sur I et une solution particulière de (14.12) est
donnée par :  x
u (t) v (x) − v (t) u (x)
y (x) = c (t) dt
x0 w (t)
où x0 est un point fixé dans I.
Le fait que le wronskien d’un système fondamental de solutions ne s’annule
jamais est valable pour les équations différentiels linéaires d’ordre n.
On peut facilement retrouver ces propriétés dans le cas n = 2 comme suit.
Si u, v sont deux solutions de (14.11) , ce sont alors des fonctions de classe C 2
sur I et la fonction w = uv  − u v est dérivable sur I de dérivée w = uv  − u v.
De l’équation (14.11) vérifiée par u et v, on déduit que :

uv  + auv  + buv = 0
vu + avu + bvu = 0

et par soustraction uv  − u v + a (uv  − u v) = 0, c’est-à-dire que w est solution


sur I de l’équation différentielle linéaire d’ordre 1, w + aw = 0. Ce qui donne
l’expression du wronskien :
  x 
w (x) = w (x0 ) exp − a (t) dt
x0

où x0 est un point quelconque de I.


Si w s’annule en un point de I, il est alors identiquement nul sur I et les
fonctions u, v sont linéairement dépendantes. En effet si u n’est pas la fonction
v (x1 )
nulle, pour x1 dans I tel que u (x1 ) = 0 la fonction y = v − u est solution
u (x1 )
de (14.11) avec les conditions initiales :

⎨ y (x1 ) = 0
v (x1 )  w (x1 )
⎩ y  (x1 ) = v  (x1 ) − u (x1 ) = =0
u (x1 ) u (x1 )

c’est donc la fonction nulle (théorème de Cauchy-Lipschitz) et les fonctions u, v


sont proportionnelles.
Théorème 14.9.
Si f est une solution sur I non identiquement nulle de l’équation dif-
férentielle (14.11) , les zéros de f dans I sont alors isolés. Dans le cas
particulier où l’intervalle I est compact, f n’a qu’un nombre fini de zéros
(éventuellement nul) dans I.

Preuve. Supposons que f admette au moins un zéro x0 dans I. Si f  (x0 ) = 0, f


est alors solution sur I du problème de Cauchy :
 
y + ay  + by = 0
y (x0 ) = y  (x0 ) = 0
396 Équations différentielles linéaires

et f est la fonction nulle contrairement à l’hypothèse. On a donc f  (x0 ) = 0 et le


théorème des accroissements finis nous permet d’écrire, pour tout x dans I \ {x0 } ,
on a f (x) = f  (x0 + θx (x − x0 )) (x − x0 ) avec θx dans ]0, 1[ . Avec la continuité
de f  , on déduit qu’il existe un réel η > 0 tel que :

∀t ∈ I ∩ ]x0 − η, x0 + η[ , f  (t) = 0

ce qui implique que f (x) = 0 pour tout x ∈ (I \ {x0 }) ∩ ]x0 − η, x0 + η[ . Le zéro


x0 de f est donc isolé dans I ∩ ]x0 − η, x0 + η[ .
Dans le cas où I est compact, l’ensemble f −1 {0} des zéros de f est compact
(puisque fermé et borné) et formé de points isolés, il est donc fini. 
Dans le cas où l’intervalle I est non borné, on peut l’écrire comme réunion
dénombrable d’intervalles compacts et l’ensemble des zéros sur I de f est fini ou
infini dénombrable.
Le théorème qui suit nous dit que si (u, v) est un système fondamental de
solutions de (14.11) , les zéros de u et v sont alors alternés.
Théorème 14.10.
Soit (u, v) un système fondamental de solutions de (14.11) . Entre deux
zéros consécutifs de u, il y a un unique zéro de v.

Preuve. Comme les zéros de u sont isolés dans I, on peut parler de zéros consé-
cutifs.
Première démonstration – On suppose que u a au moins deux zéros dans I et
on note x1 < x2 deux zéros consécutifs de u. La fonction u n’étant pas la fonction
nulle, on a u (x1 ) = 0 et u (x2 ) = 0. On a u (x) = 0 pour tout x ∈ ]x1 , x2 [ et
quitte à changer u en −u, on peut supposer que u (x) > 0 pour tout x ∈ ]x1 , x2 [ .
Il en résulte que :

u (x) u (x)
u (x1 ) = x→x
lim > 0, u (x2 ) = x→x
lim <0
1
x>x1
x − x1 x<x2
1 x − x
2

D’autre part le wronskien w = uv  − u v ne s’annulant pas sur I, on peut supposer,


quitte à changer v en −v, que w (x) > 0 pour tout x ∈ ]x1 , x2 [ . On a alors :

w (x1 ) = −u (x1 ) v (x1 ) > 0
w (x2 ) = −u (x2 ) v (x2 ) > 0

avec u (x1 ) > 0 et u (x2 ) < 0, ce qui implique v (x1 ) < 0 et v (x2 ) > 0. Le
théorème des valeurs intermédiaires nous dit alors qu’il existe x3 ∈ ]x1 , x2 [ tel que
v (x3 ) = 0. Si v s’annule en un autre point x4 dans ]x1 , x2 [ , le raisonnement qui
précède nous dit alors que u doit s’annuler en un point strictement compris entre
x3 et x4 , ce qui contredit le fait que u ne s’annule pas sur ]x1 , x2 [ . En définitive,
v s’annule en un unique point de ]x1 , x2 [ .
Deuxième démonstration – Le wronskien w ne s’annulant pas sur I, on déduit
de w (xj ) = −u (xj ) v (xj ) pour j = 1 et j = 2, que v ne s’annule ni en x1 ni en x2 .
# u $ w (x)
On supposant que v ne s’annule pas sur ]x1 , x2 [ , avec (x) = − 2 = 0 et
v v (x)
Racines des solutions d’une équation différentielle linéaire d’ordre 2 397

u
la continuité de w et v, on déduit que est strictement monotone sur [x1 , x2 ] nulle
v
en x1 et x2 , elle est donc identiquement nulle sur cet intervalle et en conséquence
la fonction u est nulle sur tout I (en un point x ∈ ]x1 , x2 [ on a u (x) = u (x) = 0 et
u est solution d’une équation linéaire d’ordre 2), ce qui contredit le fait que (u, v)
est un système fondamental de solutions de (14.11) . 
Le théorème précédent peut aussi se déduire du résultat plus général suivant.
Théorème 14.11.
Soient a, b, c des fonctions continues de I dans R telles que b (x) ≤ c (x)
pour tout x dans I, u une solution non identiquement nulle de l’équation
différentielle y  + ay  + by = 0 et v une solution non identiquement nulle
de l’équation différentielle y  + ay  + cy = 0. On suppose que u a au moins
deux zéros dans I. Si x1 < x2 sont deux zéros consécutifs de u dans I et si
les fonctions u et v ne sont pas proportionnelles dans ]x1 , x2 [ , alors v a au
moins un zéro dans ]x1 , x2 [ .

Preuve. Comme dans la démonstration précédente, on suppose que u (x) > 0


pour tout x ∈ ]x1 , x2 [ et on a u (x1 ) > 0, u (x2 ) < 0.
Supposons que v (x) = 0 pour tout x ∈ ]x1 , x2 [ . Quitte à changer v en −v on
peut supposer que v (x) > 0 pour tout x ∈ ]x1 , x2 [ . On définit la fonction w par
w = uv  − u v et on a :

w (x1 ) = −u (x1 ) v (x1 ) ≤ 0
w (x2 ) = −u (x2 ) v (x2 ) ≥ 0

En utilisant les équations différentielles vérifiées par u et v, on obtient :

w = uv  − u v = −aw + (b − c) uv
 x 
En définissant la fonction d par d (x) = exp a (t) dt , où x0 ∈ I, on a d = ad
x0

et dw + adw = d (b − x) uv, ce qui s’écrit (dw) = d (b − c) uv. Avec d (x) > 0,
u (x) > 0, v (x) > 0 et b (x) ≤ c (x) pour tout x dans ]x1 , x2 [ , on en déduit que la
fonction dw est continue décroissante sur ]x1 , x2 [ avec w (x1 ) ≥ 0 et w (x2 ) ≥ 0, ce
qui entraîne :

∀x ∈ [x1 , x2 ] , 0 ≤ w (x2 ) ≤ w (x) ≤ w (x1 ) ≤ 0

et donc w (x) = 0 pour tout x ∈ [x1 , x2 ] . En écrivant que :


# u $ w (x)
∀x ∈ ]x1 , x2 [ , (x) = − =0
v v 2 (x)

on en déduit que les fonctions u et v sont proportionnelles sur [x1 , x2 ] . Il en résulte


que si les fonctions u et v ne sont pas proportionnelles dans ]x1 , x2 [ , alors v a au
moins un zéro dans ]x1 , x2 [ . 
398 Équations différentielles linéaires

Corollaire 14.4. Soit q : I → R une fonction continue majorée par une


constante M strictement positive et f une solution non identiquement nulle
sur I de l’équation différentielle y  + qy = 0. Si f admet au moins deux
π
zéros distincts dans I, alors deux tels zéros sont distants d’au moins √ .
M

Preuve. Soient x1 < x2 deux zéros consécutifs


#√ de f dans
$ I. En désignant par g
la fonction définie sur I par g (x) = sin M (x − x1 ) , on est dans la situation
suivante :
— f est solution sur I de y  + qy = 0 ;
— g est solution sur I de y  + M y = 0 ;
— pour tout x dans I, on a q (x) ≤ M ;
— x1 < x2 sont deux zéros consécutifs de f.
π π
Si 0 < x2 − x1 < √ alors g (x2 ) = 0 (les zéros de g sont les x1 + k √
M M
avec k ∈ Z) et les fonctions f et g ne peuvent être proportionnelles sur ]x1 , x2 [ .
On déduit alors du théorème précédent que g doit s’annuler sur ]x1 , x2 [ , ce qui
π
contredit le fait que les zéros de g distincts de x1 sont à une distance k √ de x1
M
π
avec k dans N∗ . On a donc x2 − x1 ≥ √ . 
M

Corollaire 14.5. Soit q : I → R une fonction continue minorée par une


constante m strictement positive, l’intervalle I étant de longueur strictement
π
supérieure à √ . Toute solution f de l’équation différentielle y  + qy = 0
m
sur I a au moins un zéro dans tout intervalle fermé de longueur égale à
π
√ contenu dans I.
m
π
Preuve. Soit [x1 , x2 ] contenu dans I avec x2 = x1 + √ . Supposons que f ne
m
s’annule pas sur [x1 , x2 ] . En désignant par g la fonction définie sur I par :

∀x ∈ I, g (x) = sin m (x − x1 )

on est dans la situation suivante :


— f est solution sur I de y  + qy = 0 ;
— g est solution sur I de y  + my = 0 ;
— pour tout x dans I, on a 0 < m ≤ q (x) ;
— x1 et x2 sont deux zéros consécutifs dans I de g ;
— les fonctions f et g ne sont pas proportionnelles sur ]x1 , x2 [ (puisque f (x1 ) =
0 et g (x1 ) = 0).
Le théorème précédent nous dit alors que f doit s’annuler sur ]x1 , x2 [ , ce qui
contredit l’hypothèse de départ. En conclusion la fonction f s’annule sur [x1 , x2 ] .

Équations différentielles linéaires à coefficients développables en série entière 399

14.6 Équations différentielles linéaires à coeffic-


ients développables en série entière
On se donne des fonctions a0 , · · · , ap−1 , b à valeurs réelles ou complexes déve-
loppables en série entière sur un intervalle ouvert ]−R, R[ où p ≥ 1 et 0 < R ≤ +∞
et nous allons montrer que pour y0 , · · · , yp−1 donnés dans C, il existe une unique
fonction y développable en série entière sur ]−R, R[ solution du problème de Cau-
chy :  (p)
y = a0 y + a1 y  + · · · + ap−1 y (p−1) + b
(14.13)
y (k) (0) = yk (0 ≤ k ≤ p − 1)
On a les développements en série entière sur ]−R, R[ :
+∞
 +∞

ak (x) = ak,n xn , b (x) = bn x n
n=0 n=0

où k est compris entre 0 et p − 1.


En notant, pour toute fonction y : ]−R, R[ → C et tout réel x ∈ ]−R, R[ :
⎛ ⎞ ⎛ ⎞
y (x) 0
⎜ y  (x) ⎟ ⎜ .. ⎟
⎜ ⎟ ⎜ ⎟
Y (x) = ⎜ .. ⎟ , B (x) = ⎜ . ⎟
⎝ . ⎠ ⎝ 0 ⎠
(p−1) b (x)
y (x)
⎛ ⎞
0 1 0 ··· 0
⎜ 0 0 1 ··· 0 ⎟
⎜ ⎟
⎜ .. .. ⎟
A (x) = ⎜ . . . . . ⎟
⎜ ⎟
⎝ 0 0 ··· 0 1 ⎠
a0 (x) a1 (x) ··· ap−2 (x) ap−1 (x)
on est ramené au système différentiel linéaire d’ordre 1 avec second membre,
Y  (x) = A (x) Y (x) + B (x) avec la condition initiale Y (0) = (yk )0≤k≤p−1 .
Avec ces notations, on a les développements en série entière :
+∞
 +∞

∀x ∈ ]−R, R[ , A (x) = xn An , B (x) = xn Bn
n=0 n=0

où on a noté :
⎛ ⎞
0 1 0 ··· 0 ⎛ ⎞
⎜ 0 ⎟ 0
⎜ 0 1 ··· 0 ⎟ ⎜ .. ⎟
⎜ .. .. ⎟ ⎜ ⎟
A0 = ⎜ . . . . . ⎟ ∈ Mp (C) , Bn = ⎜ . ⎟ ∈ Cp
⎜ ⎟ ⎝ 0 ⎠
⎝ 0 0 ··· 0 1 ⎠
bn
a0,0 a1,0 ··· ap−2,0 ap−1,0
400 Équations différentielles linéaires

et, pour tout n ∈ N∗ :


⎛ ⎞
0 0 0 ··· 0
⎜ 0 0 0 ··· 0 ⎟
⎜ ⎟
⎜ .. .. ⎟
An = ⎜ . . . . . ⎟ ∈ Mp (C)
⎜ ⎟
⎝ 0 0 ··· 0 0 ⎠
a0,n a1,n ··· ap−2,n ap−1,n

l’espace vectoriel Cp étant muni d’une quelconque norme notée · et Mp (C) de
la norme subordonnée également notée · (pour simplifier).
Théorème 14.12.
Pour tout vecteur Y0 ∈ Cp , le problème de Cauchy :
 
Y (x) = A (x) Y (x) + B (x)
(14.14)
Y (0) = Y0

a une unique solution Y développable en série entière sur ]−R, R[ .

+∞

Preuve. Si une telle solution, Y : x ∈ ]−R, R[ → Y (x) = xn Cn ∈ Cn existe,
n=0
on a alors C0 = Y (0) = Y0 et pour tout x ∈ ]−R, R[ :
+∞
 +∞

Y  (x) = nxn−1 Cn = (n + 1) xn Cn+1
n=1 n=0

+∞
 
 
n
n
A (x) Y (x) = x Ak Cn−k
n=0 k=0

de sorte que Y est solution de (14.14) si, et seulement si :




⎨ C 0 = Y0
n
(14.15)
⎩ ∀n ≥ 0, (n + 1) Cn+1 =
⎪ Ak Cn−k + Bn
k=0

ce qui détermine les coefficients Cn ∈ C , pour n ≥ 0, de manière unique.


p

L’analyse du problème qui vient d’être faite nous conduit à introduire la suite
de vecteurs (Cn )n∈N définie par la relation de récurrence (14.15) et il s’agit de

montrer que la série entière xn Cn a un rayon de convergence au moins égal à
R, puis que sa somme est solution de (14.14) .
+∞
 +∞

On se fixe r ∈ ]0, R[ et on note α (r) = An  rn , β (r) = Bn  rn (ces
n=0  n=0
réels sont bien définis puisque les séries rn An et rn Bn sont normalement
r (α (r) + β (r))
convergentes). Comme lim = 0, il existe un entier naturel n (r)
n→+∞ n+1
Équations différentielles linéaires à coefficients développables en série entière 401

tel que :
r (α (r) + β (r))
∀n > n (r) , ≤1
n+1
 
et on note M (r) = max max Ck  rk , 1 . On vérifie alors,par récurrence sur
0≤k≤n(r)
n, que :
M (r)
∀n ≥ 0, Cn  ≤
rn

ce qui prouvera que le rayon de convergence de la série xn Cn est au moins égal

à R (ce rayon de convergence est sup r ∈ R+ | (rn Cn )n∈N est bornée ).
Pour k compris entre 0 et n (r) , on a Ck  rk ≤ M (r) par définition de M (r) .
En supposant le résultat acquis jusqu’au rang n ≥ n (r) , on a :
 n 
1 
(n + 1) Cn+1  ≤ n Ak  r Cn−k  r
k n−k
+ Bn  r n
r
k=0
 
1 n
≤ n M (r) Ak  rk + Bn  rn
r
k=0
1 M (r)
≤ n (M (r) α (r) + β (r)) ≤ (α (r) + β (r))
r rn
+∞

M (r) r (α (r) + β (r)) M (r)
soit Cn+1  ≤ ≤ . La fonction Y : x →
 xn Cn est
rn+1 n+1 rn+1 n=0
donc bien définie sur ]−R, R[ et la définition des coefficients Cn nous assure que
cette fonction est solution de (14.14) . L’unicité d’une telle solution a été prouvée
avec l’analyse du problème. 

Corollaire 14.6. Pour tous scalaires y0 , · · · , yp−1 , le problème de Cauchy :


 (p)
y = a0 y + a1 y  + · · · + ap−1 y (p−1) + b
y (k) (0) = yk (0 ≤ k ≤ p − 1)

a une unique solution qui est développable en série entière sur ]−R, R[ .

Exemple 14.2 On peut définir la fonction sin sur R comme la solution du pro-
blème de Cauchy :  
y = −y
y (0) = 0, y  (0) = 1
Le corollaire précédent nous dit qu’il existe une unique solution réelle qui est dé-
+∞

veloppable en série entière sur R. En notant y (x) = an xn cette solution, on a
n=0
+∞

y  (x) = (n + 2) (n + 1) an+2 xn et la suite (an )n∈N est définie par la relation
n=0
de récurrence : 
a0 = 0, a1 = 1
∀n ≥ 0, (n + 2) (n + 1) an+2 + an = 0
402 Équations différentielles linéaires

a2p−1
ce qui nous donne a2p = 0 pour tout p ≥ 0 et a2p+1 = − pour tout
(2p + 1) 2p
p
(−1)
p ≥ 1, ce qui est encore équivalent à a2p+1 = (vérification immédiate par
(2p + 1)!
récurrence). La solution cherchée est donc la fonction y définie sur R par y (x) =
+∞
 n
(−1)
x2n+1 . C’est la fonction sin . La fonction cos est définie comme la
n=0
(2n + 1)!
dérivée de sin .

Les séries entières peuvent aussi être utilisées pour déterminer des solutions
d’équations différentielle linéaire à coefficients non constants, développables en
série entière au voisinage de 0, de la forme :

ap y (p) = a0 y + a1 y  + · · · + ap−1 y (p−1) + b

la fonction ap pouvant s’annuler en 0. Cette méthode est illustrée par les exercice
14.7 et 14.8.
Inversement, on peut trouver le développement en série entière d’une fonction
en écrivant cette fonction comme solution d’une équation différentielle (exercices
14.9, 14.10 et 14.11).

14.7 Exercices

Exercice 14.1. Montrer, sans utiliser la fonction exponentielle ni le théo-


rème de Cauchy, qu’une solution définie sur R et non identiquement nulle
de l’équation différentielle y  = y ne s’annule jamais.

Solution. Soit f une solution définie sur R et non identiquement nulle de l’équa-
tion différentielle y  = y.
De f  = f on déduit facilement que f est indéfiniment dérivable sur R avec
(n)
f = f pour tout n ∈ N. Si f n’est pas la fonction nulle il existe alors un réel
b tel que f (b) = 0. Supposons qu’il existe un réel a = b tel que f (a) = 0. On
a alors f (n) (a) = 0 pour n ∈ N et la formule de Taylor à l’ordre n entre a et b
f (n) (cn ) n
s’écrit f (b) = (b − a) où cn est un réel strictement compris entre a et b.
n!
f (cn )
Tenant compte de f (n) = f, on a f (b) =
n
(b − a) et en utilisant le fait que
n!
la fonction continue f est bornée sur le segment d’extrémités a, b, on déduit qu’il
n
|b − a|
existe une constante M > 0 telle que |f (b)| ≤ M pour tout n ∈ N. Faisant
n!
tendre n vers l’infini, on en déduit que f (b) = 0, ce qui contredit l’hypothèse de
départ. En définitive la fonction f ne s’annule jamais sur R.
Une autre solution, en ajoutant l’hypothèse y (0) = 1, consiste à utiliser la
fonction g définie sur R par g (x) = f (x) f (−x) . Cette fonction est dérivable
avec :

∀x ∈ R, g  (x) = f  (x) f (−x) − f (x) f  (−x) = g (x) − g (x) = 0


Exercices 403

elle est donc constante non nulle si f (0) = 0 et f ne s’annule jamais sur R. Par
continuité, on peut préciser que f garde un signe constant.

Exercice 14.2. Soient f la solution sur R de l’équation différentielle


y  + 2xy = 1 vérifiant la condition initiale y (0) = 0 et D l’ensemble des
réels a strictement positifs tels que f  (a) = 0.
1. Donner une expression intégrale de f.
2. Montrer que :
2
∀x ≥ 0, 1 − e−x ≤ 2xf (x)
3. Montrer que :
 x 2 2
et ex
∀x ≥ 2, dt <
2 t4 x3
1
4. Montrer que f (x) est équivalent à au voisinage de l’infini.
2x
5. Montrer que D n’est pas vide.
6. Montrer qu’en tout point de D, la fonction f admet un maximum local
strict.
7. Montrer que D est réduit à un point et que la fonction f admet en ce
point un maximum global strict.

Solution.
1. On a vu avec l’exemple 14.1 que la fonction f est définie par :
 x
2 2
∀x ∈ R, f (x) = et −x dt
0

Cette fonction est impaire.


2. Pour x > 0, on a :
 x 9 8
2 2 2 2 2
2xf (x) ≥ e−x 2tet dt = e−x ex − 1 = 1 − e−x
0

l’égalité étant réalisée pour x = 0.


3. On définit la fonction ϕ par :
2  x 2
ex et
∀x ≥ 2, ϕ (x) = − dt
x3 2 t4

Cette fonction est dérivable avec :


2 2 2 2
2ex ex ex 2ex
∀x ≥ 2, ϕ (x) = − 3 − = x2 − 2 ≥ 0
x2 x4 x4 x4
e4
Il en résulte que ϕ est croissante et ϕ (x) ≥ ϕ (2) = > 0.
8
404 Équations différentielles linéaires

4. Pour x > 2, une intégration par parties donne :


 x  x 2  2
2 2 1 ex e4 1 x et
et dt = et t dt = − + dt
2 2 t 2x 4 2 2 t2
puis avec une deuxième intégration par parties on a :
 x t2  x 2  2
e t2 1 ex e4 3 x et
2
dt = e t dt = − + dt
2 t 2 t3 2x3 16 2 2 t4
et tenant compte de :
 x 2 2
et ex
∀x ≥ 2, dt <
2 t4 x3
on déduit que :

2
x
2 1 1 9e4 −x2 1 1
0 < e−x et dt < + 3− e < + 3
2 2x x 32 2x x
Enfin en écrivant, pour x ≥ 2, que :
 2  x
2 2 2 2
f (x) = e−x et dt + e−x et dt
0 2
on a :  2
2 2 2 2
1 − e−x ≤ 2xf (x) < 1 + 2xe−x et dt +
0 x2
et on en déduit que lim 2xf (x) = 1, c’est-à-dire que f (x) est équivalent à
x→+∞
1
au voisinage de l’infini.
2x
5. La fonction f est dérivable sur R avec f (0) = 0 et lim f (x) = 0. Le théorème
x→+∞
de Rolle généralisé (théorème 9.3) nous dit alors qu’il existe un réel a > 0 tel
que f  (a) = 0.
6. Avec l’équation différentielle y  + 2xy = 1, on déduit que f  (a) = 0 pour a > 0
1 1
entraîne f (a) = , puis avec y  = −2y − 2xy  on a f  (a) = −2f (a) = − .
2a a
Par continuité de f  on déduit que f  (x) < 0 pour x voisin de a et avec la
2
(x − a) 
formule de Taylor-Lagrange à l’ordre 2, on a f (x)−f (a) = f (cx ) < 0
2
pour x voisin de a et distinct de a (le réel cx est strictement compris entre x et
a), ce qui signifie que f admet un maximum local strict en a.
7. Supposons qu’il existe a < b dans D. La fonction f qui est continue sur [a, b] y est
bornée et atteint ses bornes, il existe donc c ∈ [a, b] tel que f (c) = inf f (t) .
t∈[a,b]
1 1
Avec f (a) = > = f (b) ≥ f (c) , on déduit que c = a. Avec f (x) < f (b)
2a 2b
pour x < b et x voisin de b, on déduit que f (c) ≤ f (x) < f (b) et c = b. En
définitive c ∈ ]a, b[ et f  (c) = 0. Mais alors pour x = c et x voisin de c dans
]a, b[ on aura f (x) < f (c) ce qui contredit la définition de c. L’ensemble D est
donc réduit à un point et avec f (0) = lim f (x) = 0, on déduit que f a un
x→+∞
maximum global strict en ce point.
Exercices 405

Exercice 14.3. On considère l’équation différentielle :

3 x2 + x y  + (8x + 3) y  + 2y = 0 (14.16)

1. Donner une solution développable en série entière autour de 0 de (14.16)


et vérifiant la condition y (0) = 1. On précisera l’intervalle I sur lequel
la fonction f obtenue est solution de (14.16) .
2. Exprimer f à l’aide des fonctions usuelles. On remarquera que f est la
α
restriction à I d’une fonction x → (1 + x) pour un choix convenable
de α.
3. En exploitant les résultats précédents, déterminer toutes les solutions de
(14.16). On en donnera l’expression au moyen des fonctions usuelles.

Solution.
+∞

1. Supposons qu’il existe une série entière y (x) = an xn de rayon de conver-
n=0
gence R > 0 solution de (14.16) , on a alors, pour tout x ∈ ]−R, R[ :
+∞
 +∞

y  (x) = nan xn−1 , y  (x) = n (n − 1) an xn−2
n=1 n=2

et (14.16) donne :
3n − 1
∀n ∈ N − {0} , an = − an−1
3n
soit :  
2
n 1
(
n −k
n 3k − 1 k=1 3
∀n ∈ N − {0} , an = (−1) a0 = a0 .
3k n!
k=1
+∞

On considère donc la fonction f définie sur I = ]−1, 1[ par f (x) = an xn , où
  n=0
2
n 1
−k
3
a0 = 1 et an = k=1 pour n ≥ 1 (le rayon de convergence de cette série
n!
an+1
entière est égal à 1 du fait que lim = 1) et on définit ainsi une fonction
n→+∞ an
de classe C ∞ sur I développable en série entière en 0 solution  de (14.16) avec
an+1 xn+1 3n + 2 1 1
f (0) = 1. Pour x = −1 on a = = 1− +O . On en dé-
an x n 3n + 3 3n n2
λ
duit qu’il existe λ > 0 tel que an xn  1 (théorème de Raabe-Duhamel 11.12)
n3
(n  
n 1 n
et la série diverge. Pour x = 1 on a an = (−1) 1− = (−1) αn .
3k
k=1
406 Équations différentielles linéaires

n  
3n − 1 1
En remarquant que αn = αn−1 < αn−1 et ln (αn ) = ln 1 −
3n 3k
  k=1
1 1
avec ln 1 −  − , on déduit que lim ln (αn ) = −∞ c’est-à-dire que
3k 3k n→+∞
%
+∞
lim αn = 0 et la série alternée an est convergente. En définitive la fonc-
n→+∞ n=0
tion f est définie sur ]−1, 1] .
2. Le développement en série entière trouvé à la question précédente est celui de
  13
− 23 1
la fonction (1 + x) , donc f (x) = 2 pour tout x ∈ ]−1, 1[ . On a
(1 + x)
ainsi une solution de (14.16) sur R − {−1} .
3. Sur chacun des intervalles I1 = ]−∞, −1[ , I2 = ]−1, 0[ et I2 = ]0, +∞[ on
peut utiliser le théorème de Cauchy-Lipschitz sur les équations différentielles
linéaires pour affirmer que l’ensemble des solutions réelles de (14.16) est un
espace vectoriel sur R de dimension 2.. On connaît déjà la solution f. Pour
déterminer une deuxième solution linéairement indépendante on peut utiliser
la méthode de variation de la constante. On cherche donc une solution de (14.16)
sur Ik (k = 1, 2, 3) la forme g = λf. Une telle fonction est solution de (14.16)
si, et seulement si :

3 x2 + x (λ f + 2λ f  ) + (8x + 3) λ f = 0


 
 8x + 3 f
ce qui est équivalent à λ + +2 λ = 0 (la fonction f ne s’annule
3 (x2 + x) f
4x + 3
jamais sur Ik ). La fonction λ est donc solution de z  + z = 0. Une
 3x (x + 1)
1 1
solution est λ (x) = 1 . Le calcul de 1 dx peut se faire avec
3
x (x + 1) x (x + 1) 3
le changement de variable u3 = x + 1 ce qui donne :
    
3u |u − 1| √ 2u + 1
λ (x) = du = ln √ + 3 arctan √ +C
u3 − 1 u2 + u + 1 3
En définitive une deuxième solution particulière de (14.16) sur Ik (k = 1, 2, 3)
est g = λf avec :
⎛ 1 ⎞  
(x + 1) 3 − 1 √
1
2 (x + 1) 3 + 1

λ (x) = ln & ⎠ + 3 arctan √
2 1
(x + 1) 3 + (x + 1) 3 + 1 3

Le système {f, g} étant libre on déduit que toute solution de (14.16) sur Ik
(k = 1, 2, 3) s’écrit y = (a + bλ) f avec a et b dans R.

Exercice 14.4. En utilisant le développement en série de Fourier de la


fonction x → |sin (x)| , donner une solution particulière π-périodique de
Exercices 407

l’équation différentielle y  (x) + y (x) = |sin (x)| et en déduire toutes les


solutions sur R.

Solution. La fonction x → |sin (x)| étant π-périodique continue et de classe C 1


par morceaux, est développable en série de Fourier, la convergence étant uniforme
sur R tout entier. Ces coefficients de Fourier trigonométriques sont donnés par :

2 π
an = sin (t) cos (2nt) dt
π 0

1 π −4
= (sin ((1 + 2n) t) + sin ((1 − 2n) t)) dt =
π 0 π (4n2 − 1)

et bn = 0 puisque la fonction f est paire. On a donc :


+∞
2 4 1
∀x ∈ R, |sin (x)| = − cos (2nx)
π π n=1 4n2 − 1

On cherche tout d’abord une solution particulière π-périodique (comme le second


membre). Si une telle solution existe alors elle est de classe C 2 et C 3 par morceaux
et elle peut se développer en série de Fourier sous la forme :
+∞
a0 
y (x) = + (an cos (2nx) + bn sin (2nx))
2 n=1

la convergence de cette série et des séries dérivées d’ordre 1 et 2 étant uniforme


% k
+∞ % k
+∞
sur R ( n an < +∞ et n bn < +∞ pour k = 0, 1, 2). On peut donc
n=0 n=1
+∞

dériver terme à terme et on a y  (x) = −4 n2 (an cos (2nx) + bn sin (2nx)) , de
n=1
sorte que l’équation différentielle s’écrit :
+∞ +∞
a0  2 4  cos (2nx)
+ an 1 − 4n2 cos (2nx) + bn 1 − 4n2 sin (2nx) = −
2 n=1
π π n=1 4n2 − 1

De l’unicité du développement en série de Fourier on déduit alors que :


4 4 1
a0 = , ∀n ≥ 1, an = , bn = 0
π π (4n − 1)2
2

+∞
2 4  cos (2nx)
Une solution particulière est y (x) = + et toute solution de
π π n=1 (4n2 − 1)2
l’équation différentielle est de la forme :
+∞
2 4  cos (2nx)
y (x) = λ cos (x) + μ sin (x) + +
π π n=1 (4n2 − 1)2
408 Équations différentielles linéaires

Exercice 14.5. On désigne par α un réel strictement positif.


1. Donner la forme générale des solutions de l’équation différentielle :

y  + αy = ϕ (14.17)

où ϕ est une fonction continue de R dans R.



2. Montrer si lim ϕ (x) = , on a alors lim y (x) = pour toute
x→+∞ x→+∞ α
solution y sur R de (14.17) .
3. Montrer que si f est une fonction continûment dérivable de R dans R

telle que lim (f  (x) + αf (x)) = , on a alors lim f (x) = .
x→+∞ x→+∞ α

Solution.
1. L’étude faite au paragraphe 14.1 nous  sur R de (14.17) sont
 dit que les solutions x
les fonctions définies y (x) = e−αx ϕ (t) eαt dt + μ , où μ est une constante
0
réelle.
2. Si lim ϕ (x) = , on peut alors trouver, pour tout réel ε > 0, un réel a > 0
x→+∞  x
tel que |ϕ (t) − | < ε pour tout t ≥ a et en posant g (x) = (ϕ (t) − ) eαt dt,
0
on a pour tout x ≥ a :
 a  x
|g (x)| ≤ |ϕ (t) − | eαt dt + |ϕ (t) − | eαt dt
0 a
ε αx ε
≤A+ (e − eαa ) ≤ A + eαx
α α
 a
en notant A = |ϕ (t) − | eαt dt. On a alors pour tout x ≥ a :
0
 x
−αx ε
e (ϕ (t) − ) eαt dt ≤ Ae−αx +
0 α
−αx
et avec lim e = 0, on déduit qu’il existe un réel b > a tel que :
x→+∞
 x
ε
∀x ≥ b, e−αx (ϕ (t) − ) eαt dt ≤ ε +
0 α
 x
ce qui signifie que lim e−αx (ϕ (t) − ) eαt dt = 0. En écrivant que :
x→+∞ 0
 x  x

e−αx ϕ (t) eαt dt = e−αx (ϕ (t) − ) eαt dt + 1 − e−αx
0 0 α
on en déduit que, pour toute solution y sur R de (14.17) , on a :
 x
−αx 
lim y (x) = lim e ϕ (t) eαt dt =
x→+∞ x→+∞ 0 α
Exercices 409

3. En prenant ϕ = f  + αf dans la question précédente, toute solution sur R


de l’équation différentielle y  + αy = ϕ est solution de l’équation différentielle

(y − f ) + α (y − f ) = 0, ce qui revient à dire que y − f = λe−αx et :

lim f (x) = lim y (x) =
x→+∞ x→+∞ α

Exercice 14.6. Soient q une fonction de classe C 1 de R+ dans R+ et f


une solution sur I de y  + qy = 0. On suppose qu’il existe un réel x0 dans
R+ tel que :
∀x ≥ x0 , q (x) > 0, q  (x) > 0.
En étudiant les variations de la fonction g définie par :
2
(f  ) (x)
∀x ≥ x0 , g (x) = f 2 (x) +
q (x)

montrer que f est bornée.

Solution. La fonction g est de classe C 1 sur [x0 , +∞[ avec :


2
(f  ) (x) q  (x)
∀x ≥ x0 , g  (x) = − ≤0
q 2 (x)
Cette fonction est donc décroissante et :
∀x ≥ x0 , f 2 (x) ≤ g (x) ≤ g (x0 )
c’est-à-dire que f est bornée sur [x0 , +∞[ . De la continuité de f, on déduit qu’elle
est également bornée sur le compact [0, x0 ] et en conséquence elle est bornée sur
R+ .

Exercice 14.7. Déterminer une solution développable en série entière de


chacune des équations différentielles :

xy  + (x − 2) y  − 2y = 0 (14.18)

2x (1 + x) y  + (5x + 3) y  + y = 0 (14.19)

Solution.
1. Supposons qu’il existe une solution f de (14.18) non identiquement nulle et
développable en série entière sur un intervalle ] − R, R[ où R ∈ R+ est à dé-
+∞

terminer. Notons, pour tout x ∈ ]−R, R[ , f (x) = an xn . Sur ]−R, R[ , on
n=0
a: ⎧
⎪ %
+∞ %
+∞

⎪ 
nan xn−1 = (n + 1) an+1 xn
⎨ f (x) =
n=1 n=0

⎪ %
+∞ %
+∞

⎩ xf  (x) = nan xn , xf  (x) = n (n + 1) an+1 xn
n=1 n=1
410 Équations différentielles linéaires

et f est solution de (14.18) si, et seulement si :


+∞

−2 (a0 + a1 ) + (n (n + 1) an+1 + nan − 2 (n + 1) an+1 − 2an ) xn = 0
n=1

ce qui est encore équivalent à dire que la suite (an )n∈N est solution de l’équation
de récurrence :

a1 + a 0 = 0
∀n ≥ 1, (n − 2) ((n + 1) an+1 + an ) = 0

(unicité du développement en série entière d’une fonction). Cette équation est


encore équivalente à :

⎨ a1 + a0 = 0, 2a2 + a1 = 0
1
⎩ ∀n ≥ 3, an+1 = − an
(n + 1)
Par récurrence, on en déduit que :
⎧ a0
⎨ a1 = −a0 , a2 =
2 n+1
⎩ ∀n ≥ 3, a = (−1) 6a3
n
n!
   +∞ 
x2  (−x)n
soit f (x) = a0 1 − x + − 6a3 . Le rayon de convergence de
2 n=3
n!
cette série étant égal à +∞. On peut aussi écrire ces solutions sous la forme :
   
x2 x2
f (x) = (a0 + 6a3 ) 1 − x + − 6a3 e−x = α 1 − x + + βe−x
2 2
où α et β sont deux constantes réelles.
2. Supposons qu’il existe une solution f de (14.19) non identiquement nulle et
développable en série entière sur un intervalle ]−R, R[ où R ∈ R+ est à dé-
+∞

terminer. Notons, pour tout x ∈ ]−R, R[ , f (x) = an xn . Sur ]−R, R[ , on
n=0
a: ⎧
⎪ %
+∞ %
+∞

⎪ f  (x) = nan xn−1 = (n + 1) an+1 xn



⎪ n=1 n=0

⎪ %
+∞ %
+∞

⎨ f  (x) = n (n − 1) an xn−2 = n (n + 1) an+1 xn−1
n=2 n=1

⎪ %
+∞ %
+∞

⎪ xf  (x) = nan xn , xf  (x) = n (n + 1) an+1 xn




n=1
%
+∞
n=1


⎩ x2 f  (x) = n (n − 1) an xn
n=1
et :
+∞

a0 + 3a1 + ((n + 1) (2n + 3) an+1 + (n + 1) (2n + 1) an ) xn = 0
n=1
Exercices 411

ce qui est encore équivalent à dire que la suite (an )n∈N est solution de l’équation
de récurrence :

a0 + 3a1 = 0
∀n ≥ 1, (2n + 3) an+1 + (2n + 1) an = 0

(unicité du développement en série entière d’une fonction). Par récurrence, on


(−1)n
en déduit que an = a0 pour tout n ≥ 0, soit :
2n + 1
+∞
 +∞ √ 2n+1 √
(−1)n a0  n x arctan ( x)
f (x) = a0 x =n
√ (−1) = a0 √
n=3
2n + 1 x n=0 2n + 1 x

Exercice 14.8. p désigne un entier naturel et on s’intéresse à l’équation


de Bessel d’indice p :

x2 y  + xy  + x2 − p2 y = 0 (14.20)

1. Soit f une solution réelle non identiquement nulle sur I = R+,∗ de


(14.20) et g la fonction définie sur I par :

∀x ∈ I, g (x) = xf (x)

Montrer que g est solution sur I d’une équation différentielle de la forme


y  + αy = 0 où la fonction α est à déterminer.
1
2. Montrer que la série entière de terme général xk , où k est un
k! (p + k)!
entier naturel, a un rayon de convergence infini et que la fonction Jp
définie par :
# x $p  # x $2 
∀x ∈ R, Jp (x) = Ip −
2 2
+∞
 1
où Ip (x) = xk , est solution sur R de l’équation différen-
k! (p + k)!
k=0
tielle (14.20) .

Solution.
1. On a :
⎧ 1 √ 
⎪ 
⎨ g = 2√x f + xf

   

⎪ 1 1 1 1
⎩ g  = 3 x2 f  + xf  − f = − 3 x2 − p2 + f
x2 4 x2 4
 

p2 − 14
c’est-à-dire que g est solution z + 1 − z = 0.
x2
412 Équations différentielles linéaires

2. En utilisant le critère de d’Alembert, on vérifie facilement que la série entière


1
de terme général xk a un rayon de convergence infini. On a alors :
k! (p + k)!
+∞
 k  +∞
(−1) xp+2k
Jp (x) = = αk xp+2k
k! (p + k)! 2p+2k
k=0 k=0

2
et en notant Kp = x Jp + xJp 2
+ x −p 2
Jp , on a :
+∞

Kp (x) = (p + 2k) (p + 2k − 1) + (p + 2k) − p2 αk xp+2k
k=0
+∞

+ αk xp+2(k+1)
k=0
+∞
 +∞

= 4k (p + k) αk xp+2k + αk xp+2(k+1)
k=1 k=0
+∞

= (4 (k + 1) (p + k + 1) αk+1 + αk ) xp+2(k+1) = 0
k=0

1
en utilisant αk+1 = − αk pour k ∈ N.
4 (k + 1) (p + k + 1)

α
Exercice 14.9. Soit f la fonction définie sur ]−1, 1[ par f (x) = (1 + x)
où α est un réel non entier naturel.
1. Montrer que f est l’unique solution sur ]−1, 1[ de l’équation différentielle
(1 + x) y  − αy = 0 avec la condition initiale y (0) = 1.
2. Retrouver le développement en série entière de f ainsi que son rayon de
convergence.

Solution.
1. On a bien f (0) = 1 et pour tout x ∈ ]−1, 1[ :

(1 + x) f  (x) − αf (x) = (1 + x) α (1 + x)
α−1 α
− α (1 + x) = 0
Le théorème de Cauchy-Lipschitz nous assure de l’unicité de cette solution.
2. Supposons qu’il existe une solution g de cette équation différentielle dévelop-
pable en série entière sur un intervalle ]−R, R[ où R ∈ R+ est à déterminer.
+∞

Notons, pour tout x ∈ ]−R, R[ , g (x) = an xn . On a :
n=0

⎪ %
+∞ %
+∞

⎪ 
nan xn−1 = (n + 1) an+1 xn
⎨ g (x) = n=1 n=0

⎪ %
+∞

⎩ xg  (x) = nan xn
n=1
Exercices 413

et g est solution de cette équation différentielle si, et seulement si :


+∞

((n + 1) an+1 + nan − αan ) xn = 0
n=0

α−n
encore équivalent à an+1 = an pour tout n ≥ 0, avec a0 = g (0) = 1, ce
n+1
qui donne par récurrence :
α (α − 1) · · · (α − n + 1)
∀n ≥ 1, an =
n!
+∞
 α (α − 1) · · · (α − n + 1)
soit g (x) = 1+ xn . Le théorème de d’Alembert nous
n=1
n!
dit que le rayon de convergence de série entière est égal à 1. Enfin f = g du
fait de l’unicité de la solution d’un problème de Cauchy. On retrouve ainsi le
α
développement en série entière de (1 + x) sur ]−1, 1[ .

Exercice 14.10. Montrer que la fonction f définie sur ]−1, 1[ par f (x) =
arcsin (x)
√ est solution d’une équation différentielle linéaire du premier
1 − x2
ordre. En déduire le développement en série entière de cette fonction.

1
Solution. Les fonctions x → arcsin (x) et x → √ étant développable
1 − x2 √
en série entière sur ]−1, 1[ , il en est de même du produit f. De 1 − x2 f (x) =
arcsin (x) , on déduit par dérivation (les fonctions considérées sont C ∞ ) que :
x 1
−√ f (x) + 1 − x2 f  (x) = √
1 − x2 1 − x2
ce qui se traduit en disant que f est solution sur ]−1, 1[ de l’équation différentielle
−xy + 1 − x2 y  = 1 avec la condition initiale y (0) = 1. En écrivant, pour tout
+∞

x ∈ ]−1, 1[ , f (x) = an xn , on a :
n=0

⎪ %
+∞ %
+∞

⎪ xf (x) = a x n+1
= an−1 xn


n

⎪ n=0 n=1

⎨ %
+∞ %
+∞
f  (x) = nan xn−1 = (n + 1) an+1 xn




n=1 n=0

⎪ %
+∞ %
+∞


⎩ x2 f  (x) = nan xn+1 = (n − 1) an−1 xn
n=1 n=2

et f est solution de cette équation différentielle si, et seulement si :


+∞

a1 + (2a2 − a0 ) x + (−an−1 + (n + 1) an+1 − (n − 1) an−1 ) xn = 1
n=2
414 Équations différentielles linéaires

+∞

soit a1 + ((n + 1) an+1 − nan−1 ) xn = 1, ce qui donne :
n=1

a1 = 1
∀n ≥ 1, (n + 1) an+1 − nan−1 = 0
avec a0 = f (0) = 0. On a donc 2pa2p = (2p − 1) a2(p−1) pour tout p ≥ 1, avec
a0 = 0, ce donne a2p = 0 pour tout p ≥ 0 (récurrence immédiate) et :
∀n ≥ 1, (2p + 1) a2p+1 = 2pa2p−1
(2p) · (2p − 2) · · · · · 2
qui donne par récurrence a2p+1 = a1 avec a1 = 1, soit :
(2p + 1) · (2p − 1) · · · · · 3
2 2
((2p) · (2p − 2) · · · · · 2) 22p (p!)
a2p+1 = =
(2p + 1)! (2p + 1)!
pour tout p ≥ 0. Le développement en série entière de f sur ]−1, 1[ est donc :
+∞ 2n
 2
2 (n!) 2n+1
f (x) = x
n=0
(2n + 1)!

Le fait que les coefficients a2n sont tous nuls était prévisible puisque la fonction f
est impaire.

Exercice 14.11. Montrer que la fonction f définie sur R par f (x) =


ch (x) cos (x) est solution d’une équation différentielle linéaire du quatrième
ordre à coefficients constants. En déduire le développement en série entière
de cette fonction.

Solution. Les fonctions ch et cos étant développable en série entière sur R, il en


est de même du produit f. On peut écrire que :
 x 
e + e−x ix 1 # $
f (x) =  e =  e(1+i)x + e(−1+i)x
2 2
et la dérivée quatrième de f est donnée par :
1 # 4 4
$
f (4) (x) =  (1 + i) e(1+i)x + (−1 + i) e(−1+i)x
2
1 # 4 4
$
=  (1 + i) e(1+i)x + (1 − i) e(−1+i)x
2
4 √ π 4
avec (1 ± i) = 2e±i 4 = 4e±iπ = −4, ce qui donne :
1 # $
f (4) (x) = −4  e(1+i)x + e(−1+i)x = −4f (x)
2
ce qui se traduit en disant que f est solution sur R de l’équation différentielle avec
conditions initiales :
 (4)
y + 4y = 0
y (0) = 1, y  (0) = 0, y  (0) = 0, y  (0) = 0
Exercices 415

+∞

En écrivant, pour tout x ∈ R, f (x) = an xn , on a a2n+1 = 0 pour tout n ≥ 0
n=0
+∞

puisque f est paire, donc f (x) = a2n x2n et :
n=0

+∞

f (4) (x) = (2n) (2n − 1) (2n − 2) (2n − 3) a2n x2n−4
n=2
+∞

= (2n + 4) (2n + 3) (2n + 2) (2n + 1) a2n+4 x2n
n=0

et f est solution de cette équation différentielle si, et seulement si :


+∞

((2n + 4) (2n + 3) (2n + 2) (2n + 1) a2n+4 + 4a2n ) x2n = 0
n=0

ce qui donne :
4
∀n ≥ 0, a2n+4 = − a2n (14.21)
(2n + 4) (2n + 3) (2n + 2) (2n + 1)

f  (0)
Pour n = 2p + 1, avec p ≥ 0, on a a4p+6 = −αp a4p+2 avec a2 = = 0, ce qui
2
donne a4p+2 = 0 pour tout p ≥ 0 par une récurrence immédiate. Sachant déjà que
les a4p+1 et a4p+3 , sont tous nuls, il reste à déterminer les a4p pour tout p ≥ 0.
Notant bp = a4p , on a en prenant n = 2p dans (14.21) :
4
∀p ≥ 0, bp+1 = − bp
(4p + 4) (4p + 3) (4p + 2) (4p + 1)
p
(−1) 4p
avec b0 = a0 = 1, et par récurrence bp = pour tout p ≥ 0. Le développe-
(4p)!
+∞
 n
(−1) 4n 4n
ment en série entière de f sur R est donc f (x) = x . On peut aussi
n=0
(4n)!
calculer les dérivées successives de f :
1 # $
f (n) (x) =  (1 + i) e(1+i)x + (−1 + i) e(−1+i)x
n n
2
1 # $
=  (1 + i) e(1+i)x + (−1) (1 − i) e(−1+i)x
n n n
2
f (n) (0)
ce qui donne an = avec :
n!
1
f (n) (0) =
n n n
 ((1 + i) + (−1) (1 − i) )
2
√ n √ n # π$
2 in π n −in−i π 2 n
=  e 4 + (−1) e 4 = (1 + (−1) ) cos n
2 2 4
416 Équations différentielles linéaires

Pour n = 2p + 1, on a bien a2n+1 = 0. Pour n = 4p + 2, on a :


# π$
f (n) (0) = 22p+1 cos (2p + 1) =0
2
et pour n = 4p, f (n) (0) = 4p cos (pπ) = 4p (−1) .
p

Exercice 14.12. On définit les fonctions f et g par :


+∞ n
 x
∀x ∈ R, f (x) = 2
et g (x) = ef (x)
n=1
n

Montrer que g est développable en série entière sur un intervalle à préciser.


 xn
Solution. Le rayon de convergence de la série est R1 = 1 (règle de d’Alem-
n2
bert), la série étant absolument convergente pour x = −1 et x = 1 (série de Rie-
1
mann ). Les fonctions f et g sont alors C ∞ sur ]−1, 1[ avec g  = f  ef = f  g.
n2
La fonction g est donc solution de l’équation différentielle y  = f  y avec la condition
initiale g (0) = 1. Supposons que cette équation différentielle avec condition initiale
admette une solution h développable en série entière sur un intervalle ]−R, R[ , soit
+∞

h (x) = an xn . On a alors pour |x| < min (R, 1) :
n=0

+∞
 +∞
 +∞
xn 
(n + 1) an+1 xn = an xn
n=1 n=0
n + 1 n=0

1  an−k
n
ce qui donne an+1 = avec a0 = 1. Par récurrence, on voit que
n+1 k+1
k=0
0 < an ≤ 1, ce qui entraîne R ≥ 1. Les fonctions g et h étant solutions de la même
équation différentielle linéaire d’ordre 1 avec condition initiale, on déduit que g = h
et g est développable en série entière sur ]−1, 1[ . Si le rayon de convergence de g
est strictement supérieur à 1, la fonction g est C ∞ sur un voisinage ouvert de 1,
π2 g  (x)
mais g  = f  g avec lim− g (x) = ef (1) = e 6 > 0 donne lim− f  (x) = lim
x→1 x→1 x→1 g (x)
+∞
 x n
ln (1 − x)
avec f  (x) = =− qui n’a pas de limite quand x tend vers 1− .
n=0
n + 1 x
On aboutit donc à une impossibilité. Le rayon de convergence de cette série est
donc R = 1.
Chapitre 15

Polynômes orthogonaux

On se donne un intervalle ouvert I = ]a, b[ avec −∞ ≤ a < b ≤ +∞, une


fonction continue π : I → R+,∗ et on désigne par E l’ensemble des fonctions
 b
continues par morceaux de I dans R telles que f 2 (x) π (x) dx < +∞ et qu’en
a
f (α− ) + f (α+ )
tout point α ∈ I où f est discontinue on ait f (α) = , où f (α− )
2
et f (α+ ) désignent respectivement les limites à gauche et à droite de f en α.
On rappelle qu’une fonction f : I → R est continue par morceaux si elle est
continue ou s’il existe une subdivision a < a1 < · · · < ap < b de I telle que f soit
continue sur chacun des intervalles ]a, a1 [ , ]ak , ak+1 [ (1 ≤ k ≤ p − 1), ]ap , b[ et
admette des limites à droite et à gauche en chacun des points ak (1 ≤ k ≤ p).
On note (en )n∈N la base canonique de l’espace vectoriel P des fonctions po-
lynomiales à coefficients réels, chaque fonction en étant définie par en (x) = xn .
Pour n ∈ N, la famille (ek )0≤k≤n est la base canonique de l’espace vectoriel Pn
des fonctions polynomiales de degré au plus égal à n.
On suppose de plus que la fonction π est telle que l’ensemble E contient l’en-
semble P de toutes les fonctions polynomiales, ce qui revient à dire que l’on a
 b
n
|x| π (x) dx < +∞ pour tout n ∈ N (exercice 15.4). On dit que π est une
a
fonction poids sur I.

15.1 Produit scalaire associé à une fonction poids


et polynômes orthogonaux
Dans ce paragraphe nous allons décrire une méthode de construction d’une
famille de polynômes orthogonaux associée à une fonction poids en utilisant le
théorème d’orthogonalisation de Gram-Schmidt (théorème 3.7).
Théorème 15.1.
L’ensemble E est un R-espace vectoriel et l’application · | · définie sur
 b
E 2 par f | g = f (x) g (x) π (x) dx définit un produit scalaire sur E.
a
418 Polynômes orthogonaux

Preuve. On vérifie tout d’abord que E est un sous-espace vectoriel de l’espace des
1 2
fonctions continues par morceaux de I dans R. De l’inégalité |f g| ≤ f + g2 ,
 2
b
on déduit que pour tous f, g dans E, on a |f (x)| |g (x)| π (x) dx < +∞ et il
 b a
2
en résulte que (f (x) + λg (x)) π (x) dx < +∞ pour tout réel λ, ce qui signifie
a
que f + λg est dans E.
Des propriétés de l’intégrale sur un segment, on déduit que l’application · | ·
est bilinéaire, symétrique et positive sur E. Si f ∈ E est telle que f | f  = 0, en
notant a1 < · · · < ap ses éventuels points de discontinuités dans ]a0 , ap+1 [ = ]a, b[ ,
on a :  b p  ak+1
2 2
0= (f (x)) dx = (f (x)) dx
a k=0 ak
 ak+1
2
donc (f (x)) dx = 0 pour tout k compris entre 0 et p et f est nulle sur
ak
chaque intervalle Ik = ]ak , ak+1 [ puisque f 2 est continue positive sur Ik . On a
f a−
k + f ak
+
alors f a±k = lim f (x) = 0 et en conséquence, f (a k ) = = 0.
x→a±k
2
La fonction f est donc nulle sur I. En définitive, l’application · | · est définie et
c’est un produit scalaire sur E. 
Muni de ce produit scalaire, l’espace préhilbertien E n’est pas un espace de
Hilbert (exercice 15.2).
Théorème 15.2.
Il existe une unique base orthonormée (Pn )n∈N de P (pour le produit
scalaire associé à la fonction poids π) telle que pour tout entier naturel n, Pn
est une fonction polynomiale de degré n de coefficient dominant strictement
positif.

Preuve. Le procédé de Gram-Schmidt fournit un unique système orthonormé


(Pn )n∈N dans P tel que :

Vect {P0 , · · · , Pn } = Vect {e0 , · · · , en } = Pn
∀n ∈ N,
Pn | en  > 0

1
Ces polynômes s’écrivent Pn = Qn , avec Q0 = e0 et pour tout n ∈ N∗ ,
Qn 

n−1
Qn = e n − en | Pk  Pk (théorème 3.7). Chaque polynôme Pn est donc de degré
k=0
égal à n et de terme dominant strictement positif. Ce système étant étagé en degrés,
il forme une base de P. Réciproquement si (Pn )n∈N est une telle base orthonormée
de P, les conditions deg (Pn ) = n pour tout entier naturel n entraînent que l’espace
vectoriel engendré par {P0 , · · · , Pn } est égal à l’espace engendré par {e0 , · · · , en }
Produit scalaire associé à une fonction poids et polynômes orthogonaux 419


n−1
1
et avec Pn = λn en + λk Pk , on déduit Pn | en  = > 0 si le coefficient
λn
k=0
dominant de Pn est strictement positif, ce qui assure l’unicité d’une telle base. 
Dans ce qui suit, (Pn )n∈N est une telle base orthonormée de P avec, pour tout
 n
(n) (n)
entier naturel n, Pn (x) = αk xk , le coefficient dominant αn étant strictement
k=0
positif.
De la construction on déduit le résultat suivant qui nous sera souvent utile.
Théorème 15.3.

Pour tout entier naturel non nul n, on a Pn−1 = Vect {Pk | k ≥ n} (où

Pn−1 est l’orthogonal de Pn−1 dans P). En particulier un polynôme de
degré n est orthogonal à Pn−1 si, et seulement si, il est proportionnel à Pn .

Preuve. De Pn−1 = Vect {P0 , · · · , Pn−1 } et de l’orthogonalité de la base (Pk )k∈N


de P, on déduit que :

∀k ≥ n, ∀P ∈ Pn−1 , P | Pk  = 0

ce qui équivaut à Pn−1 = Vect {Pk | k ≥ n} . 
Ce résultat nous permet de donner une propriété de parité des polynômes or-
thogonaux dans le cas où la fonction poids est paire sur un intervalle I = ]−c, c[
centré en 0.

Corollaire 15.1. Si ]a, b[ = ]−c, c[ avec 0 < c ≤ +∞ et si la fonction poids


π est paire, chaque polynôme Pn est alors de la parité de n.

Preuve. On note Qn le polynôme défini par Qn (x) = Pn (−x) . Pour tout po-
c
lynôme P dans Pn−1 on a Qn | P  = Pn (−x) P (x) π (x) dx et le change-
−c
ment de variable t =  c−x donne en tenant compte de la parité de la fonction
poids π, Qn | P  = Pn (t) P (−t) π (t) dt = 0 puisque la fonction polynomiale
−c
t → P (−t) est dans Pn−1 . Le polynôme Qn est donc de degré n et orthogonal à
Pn−1 , en conséquence il est proportionnel à Pn . On a donc Pn (−x) = λn Pn (x) et
n
l’identification des coefficients de xn donne λn = (−1) , ce qui signifie que Pn est
de la parité de n. 
Des propriétés d’orthogonalité, on déduit que, pour n ∈ N∗ , chaque polynôme
Pn est scindé à racines simples dans I.
Théorème 15.4.
Pour tout entier naturel non nul n, le polynôme Pn admet n racines
réelles simples dans l’intervalle ]a, b[ .
420 Polynômes orthogonaux

Preuve. Soit n ∈ N∗ . Si Pn garde un signe constant sur l’intervalle ]a, b[ , on a


 b
alors Pn | P0  = Pn (x) P0 (x) π (x) dx = 0, ce qui contredit l’orthogonalité de
a
Pn et P0 pour n ≥ 1. Il existe donc au moins une racine réelle de Pn dans ]a, b[ .
Si x1 ∈ ]a, b[ est une racine de Pn de multiplicité p ≥ 2, on peut alors écrire
2
Pn (x) = (x − x1 ) Qn−2 (x) avec Qn−2 ∈ Pn−2 \ {0} , ce qui entraîne que :
 b
2 2
0 = Pn | Qn−2  = (t − x1 ) Qn−2 (t) π (t) dt > 0
a

soit une impossibilité. On a donc montré que toutes les racines de Pn qui sont
dans ]a, b[ sont simples. Notons x1 , x2 , ..., xp ces racines. Si p < n, on peut alors
( p
écrire Pn (x) = (x − xk ) Qn−p (x) avec Qn−p ∈ Pn−p \ {0} de signe constant
k=1
dans ]a, b[ et on a :
, - 
( p b (
p
2
0 = Pn | (x − xk ) = (x − xk ) Qn−p (x) π (x) dx = 0
k=1 a k=1

soit encore une impossibilité. On a donc p = n, c’est-à-dire que toutes les racines
de Pn sont dans ]a, b[ et simples. 
Les propriétés d’orthogonalité nous permettent aussi d’obtenir des relations de
récurrence sur les polynômes orthogonaux.
Théorème 15.5.
La suite (Pn )n∈N vérifie la relation de récurrence :


⎨ P−1 (x) = 0, P0 (x) = α0(0) = 1
e0  (15.1)

⎩ b
n+1 Pn+1 (x) + an Pn (x) + bn Pn−1 (x) = xPn (x) (n ≥ 0)

(1) (n) (n+1) (n−1)


α0 αn−1 αn αn−1
où a0 = − (1)
, b0 = 0 et, pour n ≥ 1, an = (n)
− (n+1)
, bn = (n)
.
α1 αn αn+1 αn

 
 (0)  (0)
Preuve. De P0  = α0 e0  = 1 avec α0 > 0, on déduit que :

(0) 1 1
P0 = α0 = = &'
e0  b
a
π (t) dt

Pour n ∈ N, on a xPn ∈ Pn+1 = Vect {P0 , · · · , Pn+1 } , on peut donc écrire que

n+1
xPn = λk Pk , avec λk = xPn | Pk  = Pn | xPk  = 0 pour k + 1 < n (Pn est
k=0

dans Pn−1 ). Il reste donc xPn = λn+1 Pn+1 + λn Pn + λn−1 Pn−1 en posant P−1 = 0
et λ−1 = 0. En identifiant les coefficients de xn+1 et xn respectivement on obtient
Produit scalaire associé à une fonction poids et polynômes orthogonaux 421

(n) (n) (n+1) (n) (n+1)


αn αn−1 αn αn−1 αn
λn+1 = (n+1)
que l’on note bn+1 et λn = (n)
− λn+1 (n)
= (n)
− (n+1)
αn+1 αn αn αn αn+1
(n−1) 
n−1
αn−1
que l’on note an . En écrivant que xPn−1 = (n)
Pn + γk Pk , on déduit que
αn k=0
(n−1)
αn−1
λn−1 = Pn | xPn−1  = (n)
= bn . 
αn
Les polynômes Pn ayant été choisis de coefficient dominant strictement positif,
les bn sont également strictement positifs pour tout n ∈ N∗ .
Dans le cas où I = ]−c, c[ avec 0 < c ≤ +∞ et la fonction poids π est paire sur
cet intervalle, chaque polynôme Pn étant de la parité de n (corollaire 15.1), on en
(n)
déduit que pour n ∈ N∗ le coefficient αn−1 de xn−1 est nul et les coefficients an
qui interviennent dans la relation de récurrence (15.1) sont tous nuls.
Dans le cas où a et b sont finis, on a les majorations :

∀n ∈ N, a ≤ an ≤ b
∀n ∈ N∗ , 0 < bn ≤ max (|a| , |b|)

En effet, pour n ∈ N, on a :
 b  b  b
2 2 2
a= aPn (x) π (x) dx ≤ an = xPn (x) π (x) dt ≤ bPn (x) π (x) dx = b
a a a

et en posant c = max (|a| , |b|) , on a pour n ∈ N :
 b
0 < bn = Pn | xPn−1  = xPn−1 (x) Pn (x) π (x) dx
a

≤ c |Pn | | |Pn−1 | ≤ c Pn  Pn−1  = c

De la relation de récurrence (15.1) on déduit la relation de Darboux-Christoffel


suivante.
Théorème 15.6. Darboux-Christoffel
Pour tout entier naturel n et pour tous réels x, y on a :

n
(x − y) Pk (x) Pk (y) = bn+1 (Pn+1 (x) Pn (y) − Pn (x) Pn+1 (y)) (15.2)
k=0

(n)
αn
où bn+1 = (n+1)
.
αn+1

Preuve. Pour tout entier naturel k et pour tout réel x, on a :

xPk (x) = bk+1 Pk+1 (x) + ak Pk (x) + bk Pk−1 (x)

Multipliant les deux membres de cette égalité par Pk (y) , avec y ∈ R, il vient :

xPk (x) Pk (y) = bk+1 Pk+1 (x) Pk (y) + ak Pk (x) Pk (y) + bk Pk−1 (x) Pk (y)
422 Polynômes orthogonaux

Ce qui peut aussi s’écrire en permutant les rôles de x et y :

yPk (y) Pk (x) = bk+1 Pk+1 (y) Pk (x) + ak Pk (y) Pk (x) + bk Pk−1 (y) Pk (x)

Faisant la différence des deux égalités obtenues, on obtient :

(x − y) Pk (x) Pk (y) = bk+1 (Pk+1 (x) Pk (y) − Pk (x) Pk+1 (y))


− bk (Pk (x) Pk−1 (y) − Pk−1 (x) Pk (y))

puis la somme pour k allant de 0 à n donne :



n
(x − y) Pk (x) Pk (y) = bn+1 (Pn+1 (x) Pn (y) − Pn (x) Pn+1 (y))
k=0
− b0 (P0 (x) P−1 (y) − P−1 (x) P0 (y))
= bn+1 (Pn+1 (x) Pn (y) − Pn (x) Pn+1 (y))

(b0 = 0 et P−1 = 0). 


De cette relation, on peut déduire que pour tout entier n ∈ N∗ , les racines du
polynôme Pn+1 séparent celles de Pn .

Lemme 15.1 Pour tout entier naturel n et pour tout réel x, on a :

1 
n

Pn (x) Pn+1 (x) − Pn (x) Pn+1 (x) = Pk2 (x) > 0
bn+1
k=0

Preuve. Soient n ∈ N, x ∈ R et ϕn la fonction définie par :

∀y ∈ R, ϕn (y) = Pn+1 (x) Pn (y) − Pn (x) Pn+1 (y)

On a ϕn (x) = 0 et pour y = x, la formule de Darboux-Christoffel nous donne


1 
n
ϕn (y) − ϕn (x)
= Pk (x) Pk (y) , ce qui entraîne en faisant tendre y vers
x−y bn+1
k=0
1  2
n
x, ϕn (x) = Pk (x) , soit :
bn+1
k=0

1 
n
P02 (x)

Pn (x) Pn+1 (x) − Pn (x) Pn+1 (x) = Pk2 (x) ≥ >0
bn+1 bn+1
k=0


Pour tout entier naturel non nul n, on note x1,n < x2,n < · · · < xn,n les n
racines distinctes du polynôme Pn dans I.
Théorème 15.7.
Pour tout entier naturel non nul n et tout entier k compris entre 1 et
n, on a xk,n+1 < xk,n < xk+1,n+1 , ce qui signifie qu’entre deux racines
consécutives de Pn+1 il y a une racine de Pn .
Produit scalaire associé à une fonction poids et polynômes orthogonaux 423

Preuve. Le polynôme Pn+1 ayant n + 1 racines simples dans l’intervalle I, on



déduit du théorème des accroissements finis que le polynôme dérivé Pn+1 a n
racines ξ1,n+1 < · · · < ξn,n+1 dans I avec xk,n+1 < ξk,n+1 < xk+1,n+1 pour tout k
compris entre 1 et n. Il en résulte que :
 
∀k ∈ {1, · · · , n} , Pn+1 (xk,n+1 ) Pn+1 (xk+1,n+1 ) < 0

En effet ces produits ne sont jamais nuls puisque ξk,n+1 est l’unique racine de Pn+1

dans [xk,n+1 , xk+1,n+1 ] et si un tel produit est positif avec Pn+1 (xk,n+1 ) > 0 par

exemple, on a alors Pn+1 (x) > 0 pour tout x ∈ [xk,n+1 , xk+1,n+1 ] \ {ξk,n+1 } et
Pn+1 est croissante sur [xk,n+1 , xk+1,n+1 ] , ce qui entraîne :

0 = Pn+1 (xk,n+1 ) ≤ Pn+1 (ξk,n+1 ) ≤ Pn+1 (xk+1,n+1 ) = 0

et Pn+1 (ξk,n+1 ) = 0, ce qui n’est pas possible.



Avec Pn (x) Pn+1 (x) − Pn (x) Pn+1 (x) > 0, on déduit que si x est racine de
 
Pn+1 , on a alors Pn (x) Pn+1 (x) > 0 et Pn (x) est de même signe que Pn+1 (x) . Il
en résulte que :

∀k ∈ {1, · · · , n} , Pn (xk,n+1 ) Pn (xk+1,n+1 ) < 0

et le théorème des valeurs intermédiaires nous dit que Pn a une racine dans
]xk,n+1 , xk+1,n+1 [ . On obtient ainsi n racines distinctes de Pn , c’est-à-dire toutes
ses racines. 
L’utilisation des déterminants de Gram (paragraphe 3.6) nous permet d’obtenir
une expression explicite des polynômes orthogonaux associés à une fonction poids.

Définition 15.1. La suite des moments associés à la fonction poids π sur


l’intervalle I est la suite (μn )n∈N définie par :
 b
∀n ∈ N, μn = e0 | en  = xn π (x) dx
a

On peut remarquer que pour p, q dans N on a ep | eq  = μp+q et le déterminant


de Gram du système (e0 , · · · , en ) s’écrit :

μ0 μ1 ··· μn
μ1 μ2 ··· μn+1
g (e0 , · · · , en ) = .. .. .. ..
. . . .
μn μn+1 ··· μ2n
 1
1
Exemple 15.1 Pour π = 1 sur l’intervalle ]0, 1[ , on a μn = xn dx = et
0 n+1
 3
2n
j!
j=0
g (e0 , · · · , en ) = 2
n (exemple 3.3).
(n + j)!
j=0
424 Polynômes orthogonaux

Lemme 15.2 Soit (θn )n∈N une suite de fonctions dans E et (ϕn )n∈N la suite de
fonctions définie sur I par ϕ0 (x) = θ0 (x) et pour n ≥ 1 :
θ0 | θ0  ··· θ0 | θn−1  θ0 (x)
θ1 | θ0  ··· θ1 | θn−1  θ1 (x)
ϕn (x) = .. .. .. ..
. . . .
θn | θ0  · · · θn | θn−1  θn (x)
Pour tout n ∈ N la fonction ϕn est dans E et pour n, m dans N, on a :

0 si n < m
θn | ϕm  =
g (θ0 , · · · , θn ) si n = m
Preuve. En développant le déterminant ϕn (x) suivant la dernière colonne, on
voit que ϕn est combinaison linéaire des θk pour k compris entre 0 et n. On a donc
bien ϕn ∈ E. Pour n = m = 0, on a θ0 | ϕ0  = θ0 | θ0  = g (θ0 ) . Pour (m, n)
dans N∗ × N et x ∈ I, on a :
θ0 | θ0  ··· θ0 | θm−1  θ0 (x) θn (x) π (x)
θ1 | θ0  ··· θ1 | θm−1  θ1 (x) θn (x) π (x)
ϕm (x) θn (x) π (x) = .. .. .. ..
. . . .
θm | θ0  · · · θm | θm−1  θm (x) θn (x) π (x)
et le développement de ce déterminant suivant la dernière colonne donne :
θ0 | θ0  ··· θ0 | θm−1  θ0 | θn 
θ1 | θ0  ··· θ1 | θm−1  θ1 | θn 
θn | ϕm  = .. .. .. ..
. . . .
θm | θ0  · · · θm | θm−1  θm | θn 
Pour n < m les colonne n + 1 et m + 1 de cette matrice sont identiques, donc le
déterminant est nul et pour n = m, on a θn | ϕn  = g (θ0 , · · · , θn ) . 
En développant le déterminant ϕn (x) suivant la dernière colonne, on a :

n−1
ϕn (x) = αk θk (x) + g (θ0 , · · · , θn−1 ) θn (x)
k=0

Si le système (θ0 , · · · , θn ) est libre, on a alors g (θ0 , · · · , θn−1 ) > 0 (corollaire


3.3) et la fonction ϕn est non identiquement nulle. De plus avec θk | ϕn  = 0 pour
k compris entre 0 et n − 1, on déduit que :
ϕn | ϕn  = g (θ0 , · · · , θn−1 ) θn | ϕn  = g (θ0 , · · · , θn−1 ) g (θ0 , · · · , θn )
En prenant pour suite de fonctions (θn )n∈N la base canonique de P, les fonctions
ϕn du lemme précédent s’écrivent ϕ0 = e0 et pour n ≥ 1 :
μ0 ··· μn−1 1
μ1 ··· μn x
ϕn (x) = .. .. .. ..
. . . .
μn ··· μ2n−1 xn
Polynômes orthogonaux classiques, formules de Rodrigues 425

Pour tout entier n, ϕn est dans Pn , le coefficient de xn étant donné par :

μ0 μ1 ··· μn−1
μ1 μ2 ··· μn
λ(n)
n = .. .. .. .. = g (e0 , · · · , en−1 ) > 0
. . . .
μn−1 μn ··· μ2n−2

On a donc Vect {ϕ0 , · · · , ϕn } = Vect {e0 , · · · , en } pour tout n ∈ N et les condi-


tions en | ϕm  = 0 pour n < m entraînent ϕn | ϕm  = 0 pour n = m. Avec
l’unicité dans le théorème de Gram-Schmidt, on en déduit que la famille de poly-
nômes orthogonaux (Pn )n∈N du théorème 15.2 est également définie par :



1
⎨ P0 (x) =
e0 
⎪ 1
⎪ Pn (x) =
⎩ ϕn (x) (n ≥ 1)
g (e0 , · · · , en−1 ) g (e0 , · · · , en )

15.2 Polynômes orthogonaux classiques, formules


de Rodrigues
Nous allons décrire une méthode de construction de polynômes orthogonaux
associés à des fonctions poids particulières, comme vecteurs propres d’un opérateur
différentiel. Pour ce faire on se donne deux fonctions polynomiales respectivement
définies par A (x) = a0 + a1 x + a2 x2 , B (x) = b0 + b1 x et on leur associe l’opérateur
différentiel L défini sur C 2 (I, R) par :

∀f ∈ C 2 (I, R) , L (f ) = Af  + Bf 

Cet opérateur laissant stable chaque sous-espace Pn , on note pour tout entier
naturel n, Ln la restriction de L à cet espace, ce qui définit un endomorphisme
de Pn . La matrice de Ln dans la base canonique (ei )0≤i≤n de Pn est triangulaire
supérieure de termes diagonaux :

λk = k ((k − 1) a2 + b1 ) (0 ≤ k ≤ n)

Ces coefficients λk sont les valeurs propres de l’endomorphisme Ln .

Lemme 15.3 En supposant que ka2 + b1 = 0 pour tout k ∈ N, pour tout entier
naturel n l’endomorphisme Ln de Pn a n + 1 valeurs propres distinctes données
par :
λk = k ((k − 1) a2 + b1 ) (0 ≤ k ≤ n)
Il est diagonalisable et pour tout entier k compris entre 0 et n, l’espace propre
associé à la valeur propre λk est de dimension égale à 1 engendré par un polynôme
Lk de degré égal à k.

Preuve. L’égalité λp = λq équivaut à p2 − p − q 2 + q a2 + (p − q) b1 = 0, soit


à (p − q) ((p + q − 1) a2 + b1 ) = 0. En supposant que ka2 + b1 est non nul pour
426 Polynômes orthogonaux

tout entier k, l’égalité précédente équivaut à p = q. L’endomorphisme Ln a donc


n + 1 = dim (Pn ) valeurs propres distinctes et en conséquence il est diagonalisable,
chaque espace propre étant de dimension égale à 1. Si, pour k compris entre 0 et n,
Lk est un vecteur propre non nul de Ln associé à la valeur propre λk , c’est aussi un
vecteur propre de l’endomorphisme Lk de Pk associé à λk (Lk est la restriction à
Pk de Ln et les espaces propres sont de dimension 1), ce qui implique que Lk ∈ Pk .
Tenant compte du fait que (L0 , · · · , Lk ) est une base de Pk , on déduit que Lk est
nécessairement de degré k. 
Pour la suite de ce paragraphe, on fait les hypothèses suivantes :
(i) ka2 + b1 est non nul pour tout entier naturel k ;
(ii) π : I → R+,∗ est une fonction poids de classe C 2 sur I solution de l’équation
différentielle Ay  + A y = By ;
(iii) pour tout n ∈ N on a x→a
lim xn A (x) π (x) = lim xn A (x) π (x) = 0.
x→b
x>a x<b

On suppose toujours que l’ensemble E défini au paragraphe précédent contient


toutes les fonctions polynomiales.
Dans ces conditions, nous allons montrer, en notant toujours (Pn )n∈N la famille
de polynômes orthogonaux associée à la fonction poids π sur I (théorème 15.2),
1
que l’on a Pn = Ln pour tout n ∈ N, en désignant par Ln un vecteur propre
Ln 
de L associé à la valeur propre λn = n ((n − 1) a2 + b1 ) et de coefficient dominant
strictement positif. Pour ce faire, il nous suffit de vérifier que la base (Ln )n∈N de
P est orthogonale pour le produit scalaire défini par π.

Lemme 15.4 Pour toute fonction f ∈ C 2 (I, R) , on a πL (f ) = (πAf  ) .

Preuve. De la condition (Aπ) = Aπ  + A π = Bπ, on déduit que pour toute
fonction f ∈ C 2 (I, R) , on a :
 
πL (f ) = πAf  + Bπf  = (Aπ) f  + (Aπ) f  = (πAf  )

Lemme 15.5 L’opérateur L est symétrique pour le produit scalaire défini sur P
par la fonction poids π, ce qui signifie que :

∀ (P, Q) ∈ P 2 , L (P ) | Q = P | L (Q)

Preuve. Pour toute fonction polynomiale Q, une intégration par parties nous
donne, compte tenu du lemme précédent et de la condition (iii) :
 b  b
 
L (P ) | Q = (πAP ) (x) Q (x) dx = − A (x) P  (x) Q (x) π (x) dx
a a

L’expression obtenue étant une fonction symétrique de (P, Q) , on en déduit que


L (P ) | Q = L (Q) | P  = P | L (Q) . 
Polynômes orthogonaux classiques, formules de Rodrigues 427

Théorème 15.8.
La famille (Ln )n∈N des vecteurs propres de L est une base orthogonale
de P pour le produit scalaire défini par la fonction poids π sur I.

Preuve. Pour n = m sont N, on a λn = λm et :


λn Ln | Lm  = L (Ln ) | Lm  = Ln | L (Lm ) = λm Ln | Lm 
donc Ln | Pm  = 0. 
Chaque fonction polynomiale Ln étant de degré n et choisie de coefficient do-
1
minant strictement positif, on déduit du théorème 15.2 que Pn = Ln pour
Ln 
tout n ∈ N et Pn est un vecteur propre de L associé à la valeur propre λn .
Lemme 15.6 Pour tout entier naturel n, la fonction ϕn = πAn est de classe C n+2
1 (n)
sur I et la fonction Qn = ϕn est polynomiale de degré n.
π
1
Preuve. Pour n = 0, ϕ0 = π est de classe C 2 et Q0 = ϕ0 = 1.
π
Pour n ≥ 1, on vérifie d’abord par récurrence sur p compris entre 0 et n que ϕn
(p)
est de classe C p sur I avec ϕn = πAn−p Qn,p où Qn,p est un polynôme non nul
de degré p. Ce résultat est vrai pour p = 0 avec Qn,0 = 1. Supposant le résultat
acquis au rang p ≤ n − 1, on a :

ϕn(p+1) = πAn−p Qn,p = An−p−1 (π  A + (n − p) πA ) Qn,p + πAQn,p
= An−p−1 (πB − πA + (n − p) πA ) Qn,p + πAQn,p
= πAn−p−1 (B + (n − p − 1) A ) Qn,p + AQn,p = πAn−p−1 Qn,p+1
où Qn,p+1 = (B + (n − p − 1) A ) Qn,p + AQn,p ∈ Pp+1 . Notant cp le coefficient
dominant de Qn,p , celui de Qn,p+1 est cp+1 = (b1 + (2n − p − 2) a2 ) cp = 0 (pour
0 ≤ p ≤ n − 1, on a 2n − p − 2 ≥ 0), c’est-à-dire que Qn,p+1 est de degré p + 1. En
(n)
définitive pour n ≥ 1, la fonction ϕn est de classe C n sur I avec ϕn = πQn,n , où
2
Qn,n est polynomiale de degré n. Comme π est de de classe C , il en est de même
(n)
de ϕn , donc ϕn est de classe C n+2 . 
Lemme 15.7 Pour tout entier naturel n, on a :
Aϕ(n+2)
n + (2A − B) ϕ(n+1)
n = (n + 1) (b1 + (n − 2) a2 ) ϕ(n)
n

Preuve. Nous avons vu avec la démonstration du lemme 15.6 que ϕn = πAn−1 Q,
où Q = Qn,1 = B + (n − 1) A est polynomiale de degré 1, ce qui nous donne
Aϕn = πAn Q = ϕn Q. Dérivant n + 1 fois cette relation, la formule de dérivation
de Leibniz nous donne :
n (n + 1)  (n)
Aϕ(n+2)
n + (n + 1) A ϕ(n+1)
n + A ϕn = Qϕ(n+1)
n + (n + 1) Q ϕ(n)
n
2
# n $
(n+2) (n+1) (n)
soit Aϕn + ((n + 1) A − Q) ϕn = (n + 1) Q − A ϕn avec :
2
n #n $
(n + 1) A − Q = 2A − B et Q − A = B  + − 1 A = b1 + (n − 2) a2
2 2
428 Polynômes orthogonaux

(n+2) (n+1) (n)


On a donc Aϕn + (2A − B) ϕn = (n + 1) (b1 + (n − 2) a2 ) ϕn . 
Théorème 15.9. Formules de Rodrigues

Pour tout entier naturel n, il existe une constante non nulle αn telle que
αn (n)
Pn = (πAn ) ((Pn )n∈N étant la suite de polynômes orthogonaux du
π
théorème 15.2).

Preuve. Il nous suffit de montrer que chaque polynôme (non nul) Qn est vecteur
propre de L pour la valeur propre λn .

Le lemme 15.4 nous dit que, pour tout n ∈ N, on a πL (Qn ) = (πAQn ) . Avec
(n)   (n+1)
πQn = ϕn , on déduit que π Qn + πQn = ϕn , donc :

πAQn = Aϕ(n+1)
n − π  AQn = Aϕ(n+1)
n − (B − A ) πQn = Aϕ(n+1)
n − (B − A ) ϕ(n)
n

et avec le lemme précédent, on obtient :



πL (Qn ) = (πAQn ) = Aϕ(n+2)
n + (2A − B) ϕ(n+1)
n − (B  − A ) ϕ(n)
n

= ((n + 1) (b1 + (n − 2) a2 ) − (b1 − 2a2 )) ϕ(n)


n
= n ((n − 1) a2 + b1 ) πQn = λn πQn

soit L (Qn ) = λn Qn . L’espace propre associé à λn étant de dimension 1 et Qn


non nul, il en résulte qu’il existe βn ∈ R∗ tel que Qn = βn Ln , ce qui nous donne
1 αn (n)
Pn = L n = αn Q n = (πAn ) . 
Ln  π
Le théorème précédent peut aussi se montrer en vérifiant que la suite (Qn )n∈N
est orthogonale, chaque polynôme Qn étant de degré n. Pour ce faire, on utilise le
lemme suivant.

Lemme 15.8 Pour tout n ∈ N∗ et tout P ∈ P, on a :


 b
P (n) (x) An (x) π (x) dx
n
Qn | P  = (−1)
a

Preuve. Une première intégration par parties nous donne pour n ∈ N∗ et P ∈ P, :


 b  b
Qn | P  = Qn (x) P (x) π (x) dx = ϕ(n)
n (x) P (x) dx
a a
9 8b  b
= ϕn(n−1) (x) P (x) − ϕn(n−1) (x) P  (x) dx
a a

(n−1)
avec lim+ ϕn (x) P (x) = lim+ π (x) A (x) Qn,n−1 (x) P (x) = 0, la situation
x→a x→a
étant la même au voisinage de b. Au bout de n intégrations par parties, on aboutit
 b
ϕn (x) P (n) (x) dx.
n
donc à Qn | P  = (−1) 
a
Du lemme précédent, on déduit que Qn | P  = 0 pour tout P ∈ Pn−1 , donc
Qn est orthogonal à Pn−1 et étant de degré n, il est colinéaire à Pn (théorème
15.3).
Polynômes orthogonaux classiques, formules de Rodrigues 429

Ce lemme nous permet également de calculer Qn  pour tout n ∈ N. Pour


 b
2
n = 0, on Q0 = 1 et Q0  = π (x) dx. Pour n ∈ N∗ , on a :
a
 b
2
Q(n)
n
Qn  = Qn | Qn  = (−1) n
n (x) A (x) π (x) dx
a
 b
n n
= (−1) n!cn A (x) π (x) dx
a

où cn est le coefficient dominant de Qn .


En définitive, on a obtenu les expressions suivantes des polynômes orthogonaux
associés à une fonction poids vérifiant les conditions (i) à (iii) :
(n)
εn (πAn )
Pn = , où εn ∈ {−1, 1} est le signe du coefficient dominant de
Qn  π
(n)
(πAn )
Qn = .
π
Exemples 15.1
1. Les polynômes de Legendre correspondent au choix de A (x) = x2 −1, B (x) = 2x
sur ]−1, 1[ . L’opérateur différentiel associé est défini par :

∀f ∈ C 2 (]−1, 1[ , R) , L (f ) = x2 − 1 f  + 2xf  = x2 − 1 f 

et les valeurs propres de sa restriction à P sont les λn = n (n + 1) pour


n ∈ N. La fonction poids correspondante est solution de l’équation différen-
tielle x2 − 1 y  = 0 sur ]−1, 1[ , c’est donc une fonction constante réelle C
non nulle, que l’on peut prendre égale à 1. Les vecteurs propres correspondants
n (n)
sont les polynômes de Legendre définis par Ln (x) = x2 − 1 . Chaque
polynôme Ln est la solution polynomiale (à une constante multiplicative près)
de l’équation différentielle x2 − 1 y  + 2xy  − n (n + 1) y = 0. Le coefficient
(2n)!
dominant de Ln est cn = et sa norme est donnée par :
n!
 1 2n+1
2 n 2 2
Qn  = (2n)! 1 − x2 dx = (n!)
−1 2n + 1

(exercice 15.3), d’où l’expression des polynômes de Legendre normalisés :


5
1 2n + 1 # 2 $
n (n)
∀n ∈ N, Pn (x) = n x −1
2 n! 2
La fonction poids π étant paire sur ]−1, 1[ , chaque polynôme Pn est de la parité
de n. Ces polynômes sont aussi définis par la relation de récurrence 15.1 où
(n−1)
α n 1
bn = n−1(n)
=√ et an = 0, soit P−1 (x) = 0, P0 (x) = √ et :
4n 2−1 2
αn
n+1 n
& Pn+1 (x) + √ Pn−1 (x) = xPn (x) (n ≥ 0) (15.3)
2
4 (n + 1) − 1 4n2 − 1
430 Polynômes orthogonaux

2. Les polynômes de Tchebychev de première espèce correspondent au choix de


A (x) = x2 − 1 et B (x) = x sur ]−1, 1[ . L’opérateur différentiel associé est
défini par :
∀f ∈ C 2 (]−1, 1[ , R) , L (f ) = x2 − 1 f  + xf 
et les valeurs propres de sa restriction à P sont les λn = n2 pour n ∈ N. La fonc-
tion poids correspondante est solution de l’équation différentielle x2 − 1 y  =
1
−xy sur ]−1, 1[ , c’est donc π (x) = √ à une constante multiplicative
1 − x2
près. Les vecteurs propres correspondants sont les polynômes de Tchebychev de
# $
n√ n− 12 (n)
première espèce définis par Tn (x) = (−1) 1 − x2 1 − x 2 . Chaque
polynôme Tn est la solution polynomiale (à une constante multiplicative près)
de l’équation différentielle x2 − 1 y  + xy  − n2 y = 0. Si y est solution de cette
équation différentielle, la fonction z définie sur ]0, π[ par z (t) = y (cos (t)) est
telle que z  (t) = − sin (t) y  (cos (t)) et :

z  (t) = − cos (t) y  (cos (t)) + sin2 (t) y  (cos (t))


= − cos (t) y  (cos (t)) + 1 − cos2 (t) y  (cos (t)) = −n2 y (cos (t))
= −n2 z (t)

ce qui donne z (t) = αn cos (nt) + βn sin (nt) , où αn et βn sont deux constantes
réelles. L’application t → cos (t) réalisant un C ∞ -difféomorphisme de ]0, π[ sur
]−1, 1[ , on en déduit que Tn (x) = αn cos (n arccos (x)) + βn sin (n arccos (x)) .
Comme la fonction poids π est paire, Tn est de la parité de n. En particulier,
Tn est impaire pour n = 2p + 1, donc :
# π$ # π$ p
0 = T2p+1 (0) = α2p+1 cos (2p + 1) + β2p+1 sin (2p + 1) = β2p+1 (−1)
2 2
soit β2p+1 = 0. Pour n = 2p ≥ 2, Tn est paire, donc Tn est impaire avec

n (αn sin (n arccos (x)) − βn cos (n arccos (x)))


Tn (x) = √
1 − x2
ce qui nous donne :
# # π$ # π $$
 p+1
0 = T2p (0) = 2p α2p sin 2p − β2p cos 2p = β2p (−1)
2 2
soit β2p = 0. En définitive, on a Tn (x) = αn cos (n arccos (x)) pour tout n ∈ N.
Prenant αn = 1, on a :

 1 2  π ⎨ π pour n = 0
2 cos (n arccos (x))
Tn  = √ dx = cos2 (nt) dt =
−1 1 − x2 0 ⎩ π pour n ≥ 1
2
ce qui nous donne l’expression suivante des polynômes de Tchebychev normali-
sés : 5
∗ Tn (x) 2
∀n ∈ N , Pn (x) = = cos (n arccos (x))
Tn  π
Polynômes orthogonaux classiques, formules de Rodrigues 431

T0 (x) 1
et P0 (x) = = √ . La relation de récurrence :
T0  π

cos ((n + 1) t) + cos ((n − 1) t) = 2 cos (t) cos (nt)

nous donne la relation Tn+1 (x) + Tn−1 (x) = 2xTn (x) de laquelle on déduit que
le coefficient dominant de Tn est 2n−1 pour n ∈ N∗ . Les polynômes Pn vérifient
1
la même relation de récurrence avec P−1 = 0 et P0 = √ .
π
3. Les polynômes de Laguerre correspondent au choix de A (x) = x et B (x) =
α + 1 − x sur R+,∗ , où α est un réel strictement plus grand que −1. L’opérateur
différentiel associé est défini par :

∀f ∈ C 2 R+,∗ , R , L (f ) = xf  + (α + 1 − x) f 

et les valeurs propres de sa restriction à P sont les λn = −n pour n ∈ N.


La fonction poids correspondante est solution de l’équation différentielle xy  =
(α − x) y sur R+,∗ , c’est donc π (x) = xα e−x à une constante multiplicative
près. Les vecteurs propres correspondants sont les polynômes de Laguerre défi-
(n)
nis par Ln,α (x) = x−α ex (xα+n e−x ) . Chaque polynôme Ln,α est la solution
polynomiale (à une constante multiplicative près) de l’équation différentielle
xy  + (α + 1 − x) y  + ny = 0. La formule de dérivation de Leibniz nous donne
pour tout x ∈ R+,∗ :

   k−1
n (
n
n n−k
Ln,α (x) = (−1) x + n
(−1) (n + α − i) xn−k
k i=0
k=1

n
donc le coefficient dominant de Ln,α est cn = (−1) ) et sa norme est donnée
par :  +∞
2
xn+α e−x dx = n!Γ (n + α + 1)
n
Ln,α  = (−1) n!cn
0
d’où l’expression des polynômes de Laguerre normalisés :
n
(−1) (n)
∀n ∈ N, Pn (x) = x−α ex xα+n e−x
n!Γ (n + α + 1)

Pour n ≥ 1 les coefficients de xn et xn−1 dans Pn sont donnés par :

1 (n) −n (n + α)
αn(n) = et αn−1 = = −n (n + α) αn(n)
n!Γ (n + α + 1) n!Γ (n + α + 1)

ce qui nous donne les coefficients an = 2n + 1 + α et bn = n (n + α) pour la


1
relation de récurrence (15.1) , soit P−1 = 0, P0 = et :
Γ (α + 1)

(n + 1) (n + 1 + α)Pn+1 + (2n + 1 + α) Pn + n (n + α)Pn−1 = xPn (n ≥ 0)


432 Polynômes orthogonaux

4. Les polynômes d’Hermite correspondent au choix A (x) = 1 et B (x) = −2x sur


R. L’opérateur différentiel associé est défini par :

∀f ∈ C 2 R+,∗ , R , L (f ) = f  − 2xf 

et les valeurs propres de sa restriction à P sont les λn = −2n pour n ∈ N.


La fonction poids correspondante est solution de l’équation différentielle y  =
2
−2xy sur R, c’est donc π (x) = e−x à une constante multiplicative près.
Les vecteurs propres correspondants sont les polynômes d’Hermite définis par
2
# $
2 (n)
Hn (x) = ex e−x . Chaque polynôme Hn est la solution polynomiale (à
une constante multiplicative près) de l’équation différentielle y  −2xy  +2ny = 0.

En utilisant la relation Hn−1 (x) = 2xHn−1 (x) + Hn (x) , on déduit que les co-
efficients dominant de ces polynômes vérifient la relation cn = −2cn−1 pour
n
n ≥ 1 avec c0 = 1, ce qui donne cn = (−1) 2n . La norme de Hn , pour n ∈ N,
est donnée par :
 +∞
2 2 √
e−x dx = 2n n! π
n
Qn  = (−1) cn n!
−∞

d’où l’expression des polynômes d’Hermite normalisés :

(−1)
n
2
# $
2 (n)
∀n ∈ N, Pn (x) = 1√ ex e−x
π 4 2n n!
La fonction poids π étant paire sur R, chaque polynôme Pn est de la parité
de n. Ces polynômes sont aussi définis par la relation de récurrence 15.1 où
(n−1) 5
αn−1 n 1
bn = (n)
= et an = 0, soit P−1 (x) = 0, P0 (x) = 1 et :
αn 2 π4
√ √ √
n + 1Pn+1 (x) + nPn−1 (x) = 2xPn (x) (n ≥ 0)

15.3 Les polynômes de Legendre


Dans ce paragraphe nous étudions plus en détails la suite des polynômes de
Legendre sur ]−1,
5 1[ . Ces polynômes ont été définis au paragraphe précédent par
1 2n + 1 n (n)
Pn (x) = n x2 − 1 pour n ∈ N. En utilisant la formule de
2 n! 2
Leibniz, on a :
# $ n  
 n−k k
2 n (n) n n (n) n n! (x − 1) n! (x + 1)
x −1 = ((x − 1) (x + 1) ) =
k (n − k)! k!
k=0
n  2
 n n−k k
= n! (x − 1) (x + 1)
k
k=0
5 5
1 2n + 1 n 2n + 1
et l’évaluation en 1 nous donne Pn (1) = n n!2 = .
2 n! 2 2
Les polynômes de Legendre 433

Pour ce paragraphe, il sera commode d’utiliser la condition de normalisation


Ln (1) = 1, ce qui nous conduit à utiliser les polynômes de Legendre définis par :
5
2 1 # 2 $
n (n)
∀n ∈ N, Ln (x) = Pn (x) = n x −1
2n + 1 2 n!
5
2
La famille (Ln )n∈N est une base orthogonale de P avec Ln  = pour
2n + 1
tout n ∈ N.
n
Chaque polynôme Ln étant de parité de n, on a Ln (−1) = (−1) . Cette condi-
tion de parité nous dit aussi que L2p+1 (0) = 0 pour tout p ∈ N.
Pour n = 0 on a L0 = 1 et pour n ≥ 1, on a :
 n  
(n)
1  n n−k 2k
Ln (x) = n (−1) x
2 n! k
k=0

1  n  (−1)n−k (2k)!
= n x2k−n
2 n! n k (2k − n)!
2 ≤k≤n
  
1  n−k n 2k 2k−n
= n (−1) x
2 n k n
2 ≤k≤n

Cette expression
 nous permet de retrouver le coefficient dominant de Ln , soit
p 
1 2n (−1) 2p
αn = n . On en déduit aussi que L2p (0) = 2p pour tout p ∈ N.
2 n 2 p
Des relations de récurrence vérifiées par les polynômes Pn , on déduit le résultat
suivant, en posant L−1 = 0.
Théorème 15.10.
Pour tout n ∈ N et tous réels x, y on a : :

(n + 1) Ln+1 (x) + nLn−1 (x) = (2n + 1) xLn (x) (15.4)

n (n + 1) (Ln+1 (x) − Ln−1 (x)) = (2n + 1) x2 − 1 Ln (x) (15.5)

x−y 
n
(2k + 1) Lk (x) Lk (y) = Ln+1 (x) Ln (y) − Ln (x) Ln+1 (y)
n+1
k=0

(formule de Darboux-Christoffel).

Preuve. La relation (15.3) devient pour n ∈ N∗ :


& & &
√ n+1 2 2n+3
2 L n+1 (x) + √ n
2
2n−1
2 L n−1 (x) = x 2n+1
2 Ln (x)
4(n+1) −1 4n −1

2
soit en écrivant que 4n2 −1 = (2n − 1) (2n + 1) , 4 (n + 1) −1 = (2n + 1) (2n + 3) :
n+1 n √
√ Ln+1 (x) + √ Ln−1 (x) = x 2n + 1Ln (x)
2n + 1 2n + 1
434 Polynômes orthogonaux

c’est-à-dire (15.4) . Cette relation étant encore valable pour n = 0 en posant L−1 =
0 (on a L0 (x) = 1 et L1 (x) = x).

n+1
Pour n ∈ N∗ , on a x2 − 1 Ln ∈ Pn+1 , donc x2 − 1 Ln = βk Lk avec
 1
k=0
2
βn Ln  = x2 − 1 Ln (x) Ln (x) dx = 0 par imparité et :
−1
 1
2 3 2
4
βk Lk  = x −1 Ln | Lk = x2 − 1 Lk (x) Ln (x) dx
−1
 1
6 71
= x2 − 1 Lk (x) Ln (x) −1 − x2 − 1 Lk (x) + 2xLk (x) Ln (x) dx
−1
3 4
= − Ln | x2 − 1 Lk + 2xLk = 0

pour k + 1 < n. Il reste donc x2 − 1 Ln = βn+1 Ln+1 + βn−1 Ln−1 . L’évaluation
en 1 donne βn−1 = −βn+1 et l’identification des coefficients de xn+1 nous donne
nαn n+1
βn+1 = =n . On a donc la relation de récurrence :
αn+1 2n + 1

(2n + 1) x2 − 1 Ln = n (n + 1) (Ln+1 − Ln−1 )

cette relation étant encore valable pour n = 0.


La relation de Darboux-Christoffel devient :

n
2k + 1
(x − y) Lk (x) Lk (y)
2
k=0
5 5
n+1 2n + 1 2n + 3
=& (Ln+1 (x) Ln (y) − Ln (x) Ln+1 (y))
2 2 2
4 (n + 1) − 1

soit :

n
(x − y) (2k + 1) Lk (x) Lk (y) = (n + 1) (Ln+1 (x) Ln (y) − Ln (x) Ln+1 (y))
k=0


Les polynômes de Legendre peuvent s’exprimer par des formules intégrales qui
seront intéressantes pour obtenir certaines propriétés de ces polynômes.
Pour (x, r) ∈ [−1, 1] × R+,∗ , on note γx,r le lacet défini par γx,r (t) = x + reit
pour tout t ∈ [0, 2π] (cercle de centre x et de rayon r).
Théorème 15.11. Formules intégrales de Schläffi et de Laplace

Pour tout entier naturel n et tout (x, r) ∈ [−1, 1] × R+,∗ , on a :


 n
1 z2 − 1 dz
Ln (x) = n+1
2iπ γx,r (z − x) 2n
Les polynômes de Legendre 435

(formule intégrale de Schläffi) et :



1 2π # $n
Ln (x) = x + i 1 − x2 sin (t) dt
2π 0

1 π# $n
= x + i 1 − x2 cos (t) dt
π 0

(formule intégrale de Laplace).

Preuve. Pour toute fonction f holomorphe sur un voisinage du disque fermé


D (x, r) de centre x et de rayon r, on a pour tout nombre complexe z0 dans le

f (n) (z0 ) 1 f (z)
disque ouvert D (x, r) et tout entier naturel n, = dz
n! 2iπ γr,x (z − z0 )n+1
n
(formule de Cauchy), ce qui nous donne pour f (z) = 1 − z 2 et z0 = x :
# $n
(n)  2 n  2π x + reit 2 − 1
f (x) 1 z −1 1
2n Ln (x) = = dz = reit dt
n! 2iπ γr,x (z − x)n+1 2π 0 (reit )
n+1
  n
1 2π 1 − x2
= 2x + re −
it
dt
2π 0 reit

Pour x ∈ ]−1, 1[ et r = 1 − x2 , cela donne :

1 2π # $n dt
Ln (x) = 2x + 1 − x2 eit − 1 − x2 e−it
2π 0 2n
 2π # $n
1
= x + i 1 − x2 sin (t) dt
2π 0
π
Le changement de variable t = θ + nous donne compte tenu de la 2π-périodicité
2
de la fonction intégrée :
 π
1 32 # $n
Ln (x) = x + i 1 − x2 cos (θ) dθ
2π − π2

1 π # $n
= x + i 1 − x2 cos (θ) dθ
2π −π

1 π# $n
= x + i 1 − x2 cos (θ) dθ
π 0

Comme Ln (x) est réel, on a aussi par conjugaison complexe :



1 π# $n
Ln (x) = x − i 1 − x2 cos (θ) dθ
π 0
√ n
La fonction ϕ : (θ, x) → x + i 1 − x2 cos (θ) étant continue sur [0, π]×[−1, 1] et
 π
l’intégration se faisant sur un segment, la fonction x → ϕ (x, θ) dθ est continue
0
436 Polynômes orthogonaux

sur [−1, 1] comme Ln , il s’en suit que l’égalité précédente est encore valable pour
x = ±1 par continuité. 
Le théorème précédent peut aussi se montrer sans référence aux fonctions ho-
lomorphes (exercice 15.4).
En utilisant la formule intégrale de Laplace, on retrouve que pour tout n ∈ N,
n
on a Ln (±1) = (±1) .
Cette formule nous permet également de calculer Ln ∞ = sup |Ln (x)| .
x∈[−1,1]
Pour ce faire, on remarque que pour tout (t, x) ∈ [0, π] × [−1, 1] :
2
x+i 1 − x2 cos (t) = x2 + 1 − x2 cos2 (t) ≤ x2 + 1 − x2 = 1

ce qui nous donne |Ln (x)| ≤ 1 = Ln (1) et en conséquence, Ln ∞ = 1.

Corollaire 15.2. Pour tout n ∈ N et tout x ∈ ]−1, 1[ , on a :



π
|Ln (x)| ≤
2n (1 − x2 )

Preuve. Pour tout n ∈ N et tout x ∈ ]−1, 1[ , on a :



1 π n 1
|Ln (x)| ≤ x + i 1 − x2 cos (t) dt = In (x)
π 0 π
9π 8
et le changement de variable t → π − t dans l’intégrale sur , π nous donne :
2
 π2 n
 π n
In (x) = x + i 1 − x2 cos (t) dt + x + i 1 − x2 cos (t) dt
π
0 2
 π
2 n
=2 x+i 1 − x2 cos (t) dt
0
9 π8 √ 2
Pour (x, t) ∈ [−1, 1] × 0, , on a x + i 1 − x2 cos (t) = x2 + 1 − x2 cos2 (t)
2
2
avec cos2 (t) = 1 − sin2 (t) et sin (t) ≥ t, ce qui nous donne :
π
 
2 4 4
x + i 1 − x2 cos (t) ≤ x2 + 1 − x2 1 − 2 t2 = 1 − 2 1 − x2 t2
π π
puis en utilisant l’inégalité de convexité 1 − y < e−y pour y ≥ 0, on en déduit que :
2 4 2 2
x + i 1 − x2 cos (t) ≤ e− π2 (1−x )t
 π
2 2n 2 2
Il en résulte que In (x) ≤ 2 e− π2 (1−x )t dt et en effectuant le changement
0
2n (1 − x2 )
de variable θ = t, on obtient :
π
 +∞ √
π 2 π π
In (x) ≤ 2 e−θ dθ =
2
2n (1 − x ) 0 2n (1 − x2 )
Les polynômes de Legendre 437

π
et en conséquence, |Ln (x)| ≤ . 
2n (1 − x2 ) √
π
On en déduit que, pour tout δ ∈ ]0, 1[ , on sup |Ln (x)| ≤
, ce
2n (1 − δ 2 )
x∈[−δ,δ]
qui entraîne la convergence uniforme de (Ln )n∈N vers 0 sur [−δ, δ] .
Ce résultat peut aussi se montrer en utilisant le théorème de convergence do-
minée.
 Pour ce faire, on écrit que pour n ∈ N et x ∈ [−1, 1] , on a Ln (x) =
1 π √ n
fn (x, t) dt où fn (x, t) = x + i 1 − x2 cos (t) . Pour (t, x) ∈ [0, π]×[−δ, δ] ,
π 0
on a :
2
x + i 1 − x2 cos (t) = x2 + 1 − x2 cos2 (t) = x2 sin2 (t) + cos2 (t)
≤ δ 2 sin2 (t) + cos2 (t) = g 2 (t)

1 π n
donc |Ln (x)| ≤ εn = g (t) dt avec lim g n (t) = 0 pour tout t ∈ ]0, π[
π 0 n→+∞
(puisque 0 < g 2 (t) < sin2 (t) + cos2 (t)) = 1) et 0 ≤ g (t) ≤ 1 pour n ∈ N et
n

t ∈ [0, π] . On déduit alors du théorème de convergence dominée que lim εn = 0,


n→+∞
ce qui nous assure la convergence uniforme de (Ln )n∈N vers 0 sur [−δ, δ] .
Les polynômes de Legendre Ln peuvent aussi être définis en utilisant une fonc-
tion génératrice.

Lemme 15.9 Pour tout réel α, on a :


 π  π
dt 2 dt π
=2 =√
0 1 − iα cos (t) 0 1+ α2 2
cos (t) 2
α +1

Preuve. Pour α réel, on a 1 + α2 cos2 (t) = 0 et 1 − iα cos (t) = 0 pour tout


t ∈ [0, π] , donc les deux intégrale sont bien définies. Le changement de variable
t = π − θ nous donne :
 π  π2  π
dt dt dt
I (α) = = +
0 1 − iα cos (t) 0 1 − iα cos (t) π 1 − iα cos (t)
2
 π2  π2  π2
dt dθ dt
= + =2 2 2
0 1 − iα cos (t) 0 1 + iα cos (t) 0 1 + α cos (t)

dt
puis effectuant le changement de variable x = tan (t) (invariance de
1 + α2 cos2 (t)
par t → π + t), on obtient :
 +∞  +∞
dx 2 dx
I (α) = 2 2 2
= 2 2
0 α +1+x α +1 0 1 + α2x+1
 +∞
2 dt π
=√ 2
=√
2
α +1 0 1+t 2
α +1

438 Polynômes orthogonaux

Théorème 15.12.
Pour tout (x, y) ∈ [−1, 1] × ]−1, 1[ , on a :
+∞
 +∞

1 1
= Ln (x) y n et = Tn (x) y n
y 2 − 2xy + 1 n=0
y 2 − 2xy + 1 n=0

n 
(  

où T0 (x) = 1 et Tn (x) = 2 n
x − cos pour tout n ∈ N∗
n+1
k=1


Preuve. Notant ϕ (x, t) = x + i 1 − x2 cos (t) , on a pour (t, x) ∈ ]0, π[ × ]−1, 1[ :
2
|ϕ (x, t)| = x2 + 1 − x2 cos2 (t) < x2 + 1 − x2 = 1

ce qui nous donne pour tout y ∈ ]−1, 1[ :


+∞ #
 $n 1
f (t, x, y) = x+i 1 − x2 cos (t) yn = √
n=0
1 − xy − iy 1 − x2 cos (t)
√ n
D’autre part, en notant fn (t, x, y) = x + i 1 − x2 cos (t) y n pour (t, x, y) dans
2
]0, π[ × ]−1, 1[ , on dispose d’une fonction continue telle que :
+∞ 
 π +∞
 n
|fn (t, x, y)| dt ≤ π |y| < +∞
n=0 0 n=0

ce qui nous permet d’écrire que :


 π +∞ 
 π # $n +∞

f (t, x, y) dt = x+i 1 − x2 cos (t) y n dt = π Ln (x) y n
0 n=0 0 n=0

avec 1 − xy > 0 et :
   √ 
π π
dt 1 y 1 − x2
f (t, x, y) dt = √ = I
0
2
0 1 − xy − iy 1 − x cos (t) 1 − xy 1 − xy
1 π π
= & 2 =
1 − xy y (1−x ) + 1
2
y 2 − 2xy + 1
(1−xy)2

+∞

1
ce qui nous donne = Ln (x) y n , cette formule étant encore
y 2 − 2xy + 1 n=0
n
valable pour x = ±1 (puisque Ln (±1) = (±1) ).
Pour x fixé dans [−1, 1] , on a le produit de Cauchy des séries entières :
 +∞ 2 +∞
1  
n
= Ln (x) y = Tn (x) y n (15.6)
y 2 − 2xy + 1 n=0 n=0
Les polynômes de Legendre 439


n
pour y ∈ ]−1, 1[ , avec Tn (x) = Lk (x) Ln−k (x) ∈ Pn pour tout n ∈ N. Le

n  
k=0
1 2k  2 (n − k)
n
coefficient de x dans Tn étant n ∈ R+,∗ , ce polynôme est
2 k n−k
k=0
de degré n. Chaque Lk étant de la parité de k, le polynôme Tn est de la parité de
n.
+∞

La relation (15.6) s’écrit y 2 − 2xy + 1 Tn (x) y n = 1, soit :
n=0

+∞
 +∞
 +∞

Tn (x) y n+2 − 2x Tn (x) y n+1 + Tn (x) y n = 1
n=0 n=0 n=0

ce qui peut s’écrire :


+∞
 +∞
 +∞

Tn−1 (x) y n+1 − 2x Tn (x) y n+1 + Tn+1 (x) y n+1 = 1
n=1 n=0 n=−1

ou encore :
+∞

(Tn−1 (x) − 2xTn (x) + Tn+1 (x)) y n+1 + T0 (x) + (T1 (x) − 2xT0 (x)) y = 1
n=1

Par unicité du développement en série entière, on en déduit que les polynômes Tn


sont définis par la relation de récurrence :

T0 (x) = 1, T1 (x) = 2xT0 (x) = 2x
Tn+1 (x) = 2xTn (x) − Tn−1 (x) (n ∈ N∗ )

On en déduit que le coefficient dominant de Tn est 2n , ce qui nous donne en prime


n   
2k 2 (n − k)
l’égalité = 22n .
k n−k
k=0
On a sin (θ) T0 (cos (θ)) = sin (θ) , sin (θ) T1 (cos (θ)) = sin (2θ) et par récur-
rence, on vérifie que sin (θ) Tn (cos (θ)) = sin ((n + 1) θ) . C’est vrai pour n ∈ {0, 1}
et supposant le résultat acquis jusqu’au rang n ≥ 1, on a :

sin (θ) Tn+1 (cos (θ)) = 2 cos (θ) sin ((n + 1) θ) − sin (nθ)
= 2 cos (θ) (sin (nθ) cos (θ) + cos (nθ) sin (θ)) − sin (nθ)
= 2 cos2 (θ) − 1 sin (nθ) + cos (nθ) sin (2θ)
= cos (2θ) sin (nθ) + cos (nθ) sin (2θ) = sin ((n + 2) θ)
    
∗ kπ kπ
Pour n ∈ N et 1 ≤ k ≤ n, on a sin Tn cos = sin (kπ) = 0,
n+1 n+1

donc est une racine de Tn , ce qui nous donne n racines distinctes de ce
n+1
(n   

polynôme de degré n et en conséquence, Tn (x) = 2 n
x − cos . 
n+1
k=1
440 Polynômes orthogonaux

Corollaire 15.3. En désignant pour tout n ∈ N∗ , par xn = max xn,k la


1≤k≤n
 
π
plus grande des racines de Ln , on a cos < xn < 1 et en consé-
n+1
quence, lim xn = 1.
n→+∞

Preuve. Pour tout x ≥ xn , on a Lk (x) > 0 pour k compris entre 0 et n − 1 (car


n
xn > xk et L0 = 1) et Ln (x) ≥ 0, donc Tn (x) = Lk (x) Ln−k (x) > 0. Il en
k=0
 yn ≥ xn , on a alors 0 = Tn (yn ) > 0, ce qui est impossible).
résulte que yn < xn (si
π
On a donc yn = cos < xn < 1 et faisant tendre n vers l’infini, on en
n+1
déduit que lim xn = 1. 
n→+∞
La convergence de la suite (xn )n∈N∗ peut aussi se montrer en vérifiant que cette
suite est croissante (exercice 15.3).

15.4 Développement en série de polynômes or-


thogonaux
Pour ce paragraphe, (Pn )n∈N est une base orthonormée de P relativement à
une fonction poids π sur I = ]a, b[ avec −∞ ≤ a < b ≤ +∞ avec, pour tout

n
(n) (n)
entier naturel n, Pn (x) = αk xk , le coefficient dominant αn étant strictement
k=0
positif.

Définition 15.2. Soit f une fonction dans E. La suite de ses coeffi-


cients de Fourier relativement à la famille orthonormée (Pn )n∈N est la suite
(cn (f ))n∈N définie par :
 b
∀n ∈ N, cn (f ) = f | Pn  = f (t) Pn (t) π (t) dt
a

Pour toute fonction f ∈ E et pour tout entier n ∈ N on note Sn (f ) =



n
ck (f ) Pk la nème somme partielle de la série de Fourier de f relativement à
k=0
la famille orthonormée (Pn )n∈N .
Pour les exemples classiques des polynômes orthogonaux de Legendre, Tcheby-
chev, Laguerre ou Hermite la série correspondante est appelée série de Fourier-
Legendre„ Fourier-Tchebychev, Fourier-Laguerre ou Fourier-Hermite.
Pour toute fonction f ∈ E, Sn (f ) est la meilleure approximation (ou la projec-
tion orthogonale) de f dans Pn , c’est-à-dire que f − Sn (f ) = inf f − P  et
P ∈Pn
Développement en série de polynômes orthogonaux 441

+∞
 2 2
on a l’inégalité de Bessel, (cn (f )) ≤ f  qui implique que lim cn (f ) = 0
n→+∞
n=0
(théorèmes 3.8, 3.11 et 3.12).
Les opérateurs Sn : E → Pn sont des opérateurs à noyau comme les opérateurs
de Fourier trigonométriques.
Théorème 15.13.
Pour toute fonction f ∈ E et pour tout entier n ∈ N on a :
 b
∀x ∈ ]a, b[ , Sn (f ) (x) = Kn (t, x) f (t) π (t) dt
a

où la fonction Kn est continue sur R2 définie par :



n
Kn (t, x) = Pk (t) Pk (x)
k=0

⎨ bn+1 Pn+1 (t) Pn (x) − Pn (t) Pn+1 (x) si t = x

= t−x

⎩ b  
n+1 Pn (x) Pn+1 (x) − Pn (x) Pn+1 (x) si t = x

(n)
αn
avec bn+1 = (n+1)
.
αn+1

Preuve. La fonction Kn qui est polynomiale, est indéfiniment dérivable sur R2 .


Pour tout x ∈ ]a, b[ , on a :

n  b 
n

Sn (f ) (x) = ck (f ) Pk (x) = Pk (t) Pk (x) f (t) π (t) dt
k=0 a k=0
 b
= Kn (t, x) f (t) π (t) dt
a

En utilisant la formule de Darboux-Christoffel (théorème 15.6), on a pour x = t :

Pn+1 (t) Pn (x) − Pn (t) Pn+1 (x)


Kn (t, x) = bn+1
t−x
 
Pn+1 (t) − Pn+1 (x) Pn (t) − Pn (x)
= bn+1 Pn (x) − Pn+1 (x)
t−x t−x

et en faisant tendre t vers x on obtient :



Kn (x, x) = bn+1 Pn+1 (x) Pn (x) − Pn (x) Pn+1 (x)


442 Polynômes orthogonaux

Corollaire 15.4. Pour tout n ∈ N et tout x ∈ ]a, b[ , on a


 b
Kn (t, x) π (t) dt = 1.
a

Preuve. Pour f = 1 on a ck (1) = 1 | Pk  = 0 pour k ≥ 1, de sorte que :

Sn (1) = c0 (1) P0 = 1 | P0  P0 = P0 | P0  = 1


 b
et Kn (t, x) π (t) dt = 1 
a
Dans le cas où l’intervalle I est borné (i. e. a et b sont finis) on déduit du
théorème de Weierstrass (exercice 2.8) que l’égalité de Parseval est vérifiée pour
toute fonction f ∈ E qui est continue à droite en a et à gauche en b,
 ce qui équivaut
à la convergence en moyenne quadratique de la série de Fourier cn (f ) Pn vers
f.
Dans le cas où I est borné, on note E  le sous-espace vectoriel de E constitué
des fonctions continues par morceaux sur le segment I = [a, b] .

Lemme 15.10 Pour I borné, l’espace vectoriel C 0 ([a, b] , R) des fonctions conti-
nues de [a, b] dans R est dense dans (E  , ·) .

Preuve. On note a0 = a, ap+1 = b et a < a1 < · · · < ap < b les points de discon-
tinuités de f ∈ E  . Pour tout réel δ strictement positif tel que [ak − δ, ak + δ] ⊂ I,
on note fδ la fonction définie sur [a, b] par :

⎪ ?p
⎨ f (x) si x ∈ / [ak − δ, ak + δ]
fδ (x) = k=1


f (ak − δ) ak +δ−x
2δ + f (ak + δ) x−(a2δk −δ) si x ∈ [ak − δ, ak + δ]

Cette fonction est continue sur [a, b] (sur [ak − δ, ak + δ] elle est affine et coïncide
avec f en ak − δ et ak + δ) et on a :
p 
 ak +δ
2 2
f − fδ  = (f (t) − fδ (t)) π (t) dt
k=1 ak −δ

En notant M la borne supérieure de f sur [a, b] et M  celle de π sur [a1 − δ, ap + δ] ,


on a |fδ (x)| ≤ M pour tout x ∈ [a, b] et :
p 
 ak +δ
2 2
f − fδ  ≤ 4M π (t) dt ≤ 8pM 2 M  δ
k=1 ak −δ

Pour tout réel ε strictement positif, on peut choisir δ > 0 tel que 8pM 2 M  δ < ε2
et la fonction fδ dans C 0 ([a, b] , R) est telle que f − fδ  < ε. Ce qui prouve la
densité de C 0 ([a, b] , R) dans (E  , ·) . 
Développement en série de polynômes orthogonaux 443

Théorème 15.14.
Pour I borné, la famille orthonormée (Pn )n∈N est totale dans (E  , · | ·) .

Preuve. Soient f ∈ E  , ε > 0 et g ∈ C 0 ([a, b] , R) telle que f − g < ε. Le


théorème de Weierstrass nous dit qu’il existe une fonction polynomiale P telle
 b
2 2 2
que g − P ∞ < ε, donc g − P  ≤ g − P ∞ π (t) dt < ε2 1 et en consé-
a
quence, f − P  ≤ f − g + g − P  < (1 + 1) ε, ce qui prouve la densité de
P = Vect {Pn | n ∈ N} dans (E  , ·) , c’est-à-dire que la famille (Pn )n∈N est totale
dans (E  , · | ·) . 
Du théorème 3.13, on déduit alors le résultat suivant.

Corollaire 15.5. Pour I est borné, on a pour toute fonction f ∈ E  , f =


+∞

cn (f ) Pn dans (E  , ·) (convergence en moyenne quadratique de la série
n=0
 b +∞

2 2
de Fourier) et f  = f 2 (t) π (t) dt = (cn (f )) (égalité de Parseval).
a n=0

L’identité de Parseval nous dit aussi qu’une fonction f ∈ E  est uniquement


déterminée par ses coefficients de Fourier.
Dans ce qui suit on suppose I borné et pour f ∈ E, on s’intéresse à la conver-
gence simple ou uniforme de la série de fonctions cn (f ) Pn .

Théorème 15.15.
Dans le cas où l’intervalle I est borné, si x ∈ ]a, b[ est tel que la suite
(Pn (x))n∈N soit bornée et f ∈ E admet une dérivée à droite et à gauche en
+∞

x, on a alors f (x) = cn (f ) Pn (x) .
n=0

Preuve. Du théorème 15.13 et du corollaire 15.4, on déduit que pour tout n ∈ N


et tout x ∈ ]a, b[ , on a :
 b
Sn (f ) (x) − f (x) = Kn (t, x) (f (t) − f (x)) π (t) dt (15.7)
a

avec Kn (t, x) (f (t) − f (x)) = 0 pour t = x et :

f (t) − f (x)
Kn (t, x) (f (t) − f (x)) = bn+1 (Pn (x) Pn+1 (t) − Pn+1 (x) Pn (t))
t−x
444 Polynômes orthogonaux

pour t ∈ ]a, b[ \ {x} . Dans le cas où f est dérivable à droite et gauche en x, la


fonction ϕx définie sur ]a, b[ par :

⎪ f (t) − f (x)

⎨ si t = x
t−x
ϕx (t) =


 
⎩ fg (x) + fd (x) si t = x
2
est un élément de E (comme f ∈ E, la fonction ϕx est continue sur ]a, b[ privé de
x et des éventuels points de discontinuité de f et en tous ces points, ϕx admet des
limites à droite et à gauche puisque f ∈ E et f est dérivable à droite et gauche en
x). On a donc :

Sn (f ) (x) − f (x)
   
b b
= bn+1 Pn (x) ϕx (t) Pn+1 (t) π (t) dt − Pn+1 (x) ϕx (t) Pn (t) π (t) dt
a a

= bn+1 (Pn (x) cn+1 (ϕx ) − Pn+1 (x) cn (ϕx ))

avec 0 < bn ≤ c = max (|a| , |b|) pour n ∈ N∗ (voir le paragraphe 15.1), ce qui nous
donne la majoration :

|Sn (f ) (x) − f (x)| ≤ c (|Pn (x)| |cn+1 (ϕx )| + |Pn+1 (x)| |cn (ϕx )|)

avec lim cn (ϕx ) = 0. Dans le cas où la suite (Pn (x))n∈N est bornée, on en
n→+∞
+∞

déduit que lim Sn (f ) (x) = f (x) , ce qui signifie que f (x) = cn (f ) Pn (x) .
n→+∞
n=0


Exemples 15.2
1. Polynômes de Tchébychev. On se place sur ]−1, 1[ avec la fonction poids π
1 1
définie par π (x) = √ . Les polynômes Pn sont définis par P0 (x) = √
1−x 2 π
et : 5
2
∀n ∈ N∗ , ∀x ∈ [−1, 1] , Pn (x) = cos (n arccos (x))
π
1 1
et les coefficients bn sont donnés par b0 = 0, b1 = √ et bn = pour n ≥ 2.
2 2 5
2
Pour tout x ∈ [−1, 1] et tout entier naturel n on a la majoration |Pn (x)| ≤ .
π
On déduit alors que pour f ∈ E et x ∈ ]−1, 1[ où f admet une dérivée à droite
et à gauche, on a :
5 +∞
c0 (f ) 2
f (x) = √ + cn (f ) cos (n arccos (x))
π π n=1
Développement en série de polynômes orthogonaux 445
 1
1 f (t)
avec c0 (f ) = √ √ dt et :
2
π −1 1 − t
5  1
∗ 2 f (t) cos (n arccos (t))
∀n ∈ N , cn (f ) = √ dt
π −1 1 − t2
En posant x = cos (θ) avec θ dans [0, π] , on obtient :
+∞
a0 (f ) 
f (cos (θ)) = + an (f ) cos (nθ)
2 n=1

avec :  π
1
∀n ≥ 0, an (f ) = f (cos (θ)) cos (nθ) dθ
π −π
On retrouve ainsi le développement en série de Fourier trigonométrique de la
fonction paire θ → f (cos (θ)) .
2. Polynômes de Legendre. On se place sur ]−1, 1[ avec la fonction poids π = 1.
Les polynômes Pn sont définis par :
5
1 2n + 1 # 2 $
n (n)
∀n ∈ N, Pn (x) = n x −1
2 n! 2

∗ π
Pour tout x ∈ ]−1, 1[ et tout n ∈ N , on a la majoration |Pn (x)| ≤ √
1 − x2
(corollaire 15.2). On déduit alors que pour f ∈ E et x ∈ ]−1, 1[ où f admet
+∞

une dérivée à droite et à gauche, on a f (x) = cn (f ) Pn (x) , où cn (f ) =
5  n=0
1 2n + 1 1 n (n)
f (t) t2 − 1 dt.
2n n! 2 −1

Théorème 15.16.
Si l’intervalle I est borné et si pour tout x dans I la suite (Pn (x))n∈N est
bornée, alors pour toute fonction f ∈ E vérifiant une condition de Hölder
+ 1
de constante λ ∈ R et d’exposant α ∈ , 1 sur I, on a :
2
+∞

∀x ∈ ]a, b[ , f (x) = cn (f ) Pn (x)
n=0

Preuve. On a :
∀ (t, x) ∈ I 2 , |f (t) − f (x)| ≤ λ |t − x| .
α

En utilisant les notations de la démonstration du théorème précédent, on a pour


n ∈ N, x ∈ ]a, b[ et t ∈ [x − η, x + η] :
|Pn+1 (t) Pn (x) − Pn (t) Pn+1 (x)|
|Kn (t, x) (f (t) − f (x))| ≤ λbn+1 1−α ,
|t − x|
446 Polynômes orthogonaux

ce qui donne :
 x+η
Kn (t, x) (f (t) − f (x)) π (t) dt
x−η
  x+η 
x+η
π (t) dt π (t) dt
≤ λcMx |Pn+1 (t)| 1−α + |Pn (t)| 1−α ,
x−η |t − x| x−η |t − x|

les intégrales du membre de droite de cette inégalité étant convergents du fait que
1 − α < 1. En utilisant l’inégalité de Cauchy-Schwarz, on a :
 x+η  
x+η x+η
π (t) dt π (t) dt
|Pn (t)| 1−α ≤ |Pn2 (t)| π (t) dt 2(1−α)
x−η |t − x| x−η x−η |t − x|
 
1
(la dernière intégrale étant convergente du fait que 2 (1 − α) < 1 si α ∈ , 1 ),
2
puis avec :
 x+η  b
2 2
Pn (t) π (t) dt ≤ Pn2 (t) π (t) dt = Pn  = 1,
x−η a

on obtient :
 
x+η x+η
π (t) dt π (t) dt
|Pn (t)| 1−α ≤ 2(1−α)
,
x−η |t − x| x−η |t − x|
 x+η  
π (t) dt 1
avec lim = 0 pour α ∈ , 1 . Pour tout réel ε > 0 on peut
η→0 x−η |t − x|2(1−α) 2
donc choisir, à x fixé dans ]a, b[ , un réel η > 0 assez petit de sorte que :
 x+η
π (t) dt
∀n ∈ N, |Pn (t)| 1−α < ε.
x−η |t − x|
On en déduit alors que la suite (Sn (f ) (x))n∈N converge vers f (x) . 

15.5 Exercices

Exercice 15.1. Soit π : I → R+,∗ une fonction poids. Justifier l’équiva-


lence des assertions :
 b
1. P 2 (x) π (x) dx < +∞ pour toute fonction polynomiale P ;
a
 b
n
2. |x| π (x) dx < +∞ pour tout n ∈ N.
a

Solution. L’assertion (2) entraîne par linéarité et positivité de l’intégrale que


 b
|P (x)| π (x) dx < +∞ pour toute fonction polynomiale P et en particulier,
a
Exercices 447
 b
on aura P 2 (x) π (x) dx < +∞. Réciproquement, si (1) est vérifié, on a alors
 b a
2n+1 x4n + x2
x2n π (x) dx < +∞ pour tout n ∈ N et avec |x| ≤ , on en déduit
a  2
b
2n+1
que |x| π (x) dx < +∞.
a

Exercice 15.2. Soit I = [a, b] un intervalle réel fermé borné avec a < b.
Montrer
&' que l’espace vectoriel C 0 (I, R) muni de la norme f → f  =
b 2
a
|f (x)| dx n’est pas complet (ce n’est pas un espace de Hilbert).

Solution. Soit (fn )n≥2 la suite de fonctions définies sur I par :


⎧ 1

⎪ 1 si 0 ≤ x <

⎪ 2


⎨ 1 1

1 1 1
fn (x) = n + − x si ≤ x < +

⎪ 2 n 2 2 n



⎪ 1 1
⎩ 0 si + ≤ x ≤ 1
2 n
(faire une figure). Pour m > n > 0, on a :
 1 1  2  1 1  2
2+m 1 1 1 2+n
2 2
fn − fm  = (m − n) x− dx ++ −x n2 dx
1 2 1
2+m
1 2 n
2
 
1 # n $2 1 # n $3 1 1 1
= 1− + 1− ≤ +
3m m 3n m 3 m n

ce qui entraîne que cette suite est de Cauchy dans (E, ·) . D’autre part la suite
de fonctions (fn )n≥2 converge simplement vers la fonction continue par morceaux
1 1
f définie sur [0, 1] par f (x) = 1 si 0 ≤ x ≤ et f (x) = 0 si < x ≤ 1. Si
2 2
(fn )n≥2 converge dans C 0 (I, R) , · vers une fonction g, on peut alors écrire que
 2
2 ' 12 + n1 2 1 1 1
f − g ≤ f − fn +fn − g avec f − fn  = 1 n + − x dx =
2 2 n 3n
et en passant à la limite quand n tend vers l’infini on déduit
 que f − g = 0. Par
1 1
continuité on déduit alors que f = g sur [0, 1] \ avec f discontinue en
2 2
et g continue en ce point, ce qui est impossible. On a donc ainsi montré que
C 0 (I, R) , · n’est pas complet.

Exercice 15.3. En notant pour tout n ∈ N∗ , xn = max xn,k la plus


1≤k≤n
grande des racines de Ln , où (Ln )n∈N est la suite des polynômes de Legendre
normalisés par la condition Ln (1) = 1 (paragraphe 15.3), montrer que la
448 Polynômes orthogonaux

suite (xn )n∈N∗ est strictement croissante et en conséquence, convergente


(sa limite vaut 1 d’après le corollaire 15.3).

Solution. On vérifie par récurrence que la suite (xn )n∈N∗ est strictement crois-
1 x
sante. On a L1 (x) = x, L2 (x) = 3x2 − 1 et L3 (x) = 5x2 − 3 , donc
√ 2 2
1 3
x1 = 0 < x2 = √ < x3 = √ . Supposons que 0 < x1 < · · · < xn−1 < xn pour
3 5
n ≥ 3. Si xn+1 = xn , la relation de récurrence (15.4) nous donne Ln−1 (xn ) = 0
avec xn > xn−1 = max xn−1,k , ce qui n’est pas possible. Si xn+1 < xn , on a
1≤k≤n−1
alors α = max (xn−1 , xn+1 ) < xn et pour tout x > α :

(2n + 1) xLn (x) = (n + 1) Ln+1 (x) + nLn−1 (x) > 0

(puisque les coefficients dominants des Lk sont strictement positifs), ce qui est in-
compatible avec xn > α et Ln (xn ) = 0. On a donc xn < xn+1 . La suite (xn )n∈N∗
est donc croissante majorée par 1 (les xn sont dans ]0, 1[) et en conséquence conver-
gente vers un réel  ∈ ]0, 1] .

Exercice 15.4. Soient n ∈ N, x ∈ [−1, 1] et r ∈ R+,∗ .


1. Montrer que, pour tout entier k compris entre 0 et n, on a :
  
z 2k 2k 2k−n
n+1 dz = 2iπ n x
γr,x (z − x)

 n
z2 − 1
2. En déduire que n+1 dz = 2iπ2n Ln (x) .
γx,r (z − x)

Solution.
1. Pour tout entier k compris entre 0 et n, on a :
  2π 2k  2π
z 2k x + reit i 2k −int
n+1 dz = n+1 ireit dt = x + reit e dt
γr,x (z − x) 0 (reit ) rn 0
 2k 
2π  
i 2k j 2k−j i(2k−j)t −int
= n x r e e dt
r 0 j=0
j
2k 
  
i 2k j 2k−j 2π i(2k−j−n)t
= n x r e dt
r j=0
j 0

 2π
n
avec eimt dt = 0 pour tout entier relatif non nul m. Pour 0 ≤ k < , on a
0 2
n
2k − j − n < 0 pour tout j ≥ 0 et pour ≤ k ≤ n, il ne reste dans la somme
2
Exercices 449

ci-dessus que l’intégrale correspondante à j = 2k − n, ce qui nous donne :


    
z 2k i 2k 2k−n n 2k 2k−n
n+1 dz = r n 2k − n x r 2π = 2iπ x
γr,x (z − x) n

2. Il en résulte que :
 n
   
z2 − 1 n−k 2k n 2k−n
n+1 dz = 2iπ (−1) x = 2iπ2n Ln (x)
γx,r (z − x) n n k
2 ≤k≤n

Exercice 15.5. En désignant par L l’opérateur de Legendre défini sur


C 2 ([−1, 1] , R) par L (f ) = x2 − 1 f  + 2xf  , on note pour tout réel λ,
Eλ = ker (L − λId ) .
1. Déterminer l’ensemble Σ des réels λ tels que Eλ = {0} .
2. Montrer que, pour tout λ ∈ Σ, l’espace Eλ est une droite vectorielle dont
on donnera un vecteur directeur.
3. Déterminer l’ensemble des solutions de l’équation aux dérivées par-
tielles :
∂2u 2
2 ∂ u ∂u
(t, x) = 1 − x (t, x) − 2x (t, x)
∂t2 ∂x2 ∂x
de la forme u (t, x) = a (t) b (x) avec a de classe C 2 sur R et b de classe
C 2 sur [−1, 1] .

Solution. Pour cet exercice, les fonctions sont définies sur le segment [−1, 1] et
par intégration par parties, on vérifie facilement que l’on a L (f ) | g = f | L (g)

pour toutes fonctions f, g dans C 2 ([−1, 1] , R) (on a L (f ) = x2 − 1 f  ).
1. On sait déjà que Σ contient Σ = {λn = n (n + 1) | n ∈ N} (exemples 15.1) et
il nous reste à vérifier que pour réel λ ∈ R \ Σ , on a Eλ = {0} . Pour f ∈ Eλ
et n ∈ N, on a λ f | Ln  = L (f ) | Ln  = f | L (Ln ) = n (n + 1) f | Ln 
avec λ = n (n + 1) , donc f | Ln  = 0. Comme (Ln )n∈N est une base de P,
on en déduit f | Q = 0 pour toute fonction polynomiale Q. Par ailleurs, le
théorème de Weierstrass nous dit qu’il existe une suite (Qn )n∈N de fonctions
polynomiales qui converge uniformément vers f sur [−1, 1] (f est continue),
donc la suite
  (f Qn )n∈N converge uniformément vers f 2 sur [−1, 1] (puisque
f Qn − f 2  ≤ f  Qn − f  ) et on a :
∞ ∞ ∞

 1  1
2
f  = f 2 (x) dx = lim f (x) Qn (x) dx = lim f | Qn  = 0
−1 n→+∞ −1 n→+∞

ce qui impose la nullité de f.


2. Pour n ∈ N, l’espace Eλn contient Ln et c’est l’ensemble des solutions sur [−1, 1]
de l’équation différentielle linéaire d’ordre 2 :

x2 − 1 y  (x) + 2xy  (x) − n (n + 1) y (x) = 0


450 Polynômes orthogonaux

Le théorème de Cauchy-Lipschitz nous dit que l’ensemble Sλn des solution de


cette équation différentielle sur l’intervalle ouvert ]−1, 1[ est de dimension 2. On
dispose donc d’une base (Ln , fn ) de cet espace. Pour vérifier que l’espace Eλn ⊂
Sλn qui nous intéresse est de dimension 1, il suffit de vérifier que la solution fn
n’est pas dans Eλn , c’est-à-dire qu’elle ne peut pas se prolonger en fonction de
classe C 2 sur [−1, 1] . Pour ce faire, on utilise le wronskien wn = Ln fn − Ln fn .
Sur ]−1, 1[ , on a :

x2 − 1 wn + 2xwn = x2 − 1 (Ln fn − Ln fn ) + 2x (Ln fn − Ln fn )


= n (n + 1) (Ln fn − fn Ln ) = 0

 wn (0)
soit x2 − 1 wn (x) = 0 et en conséquence, wn (x) = avec wn (0) = 0
  1 − x2
fn
(sans quoi wn = 0 et = 0 en dehors des racines de Ln et fn = αLn , ce
Ln
qui n’est pas, ou de manière générale le wronskien d’une base de solution est
non nul). Il en résulte alors que :

lim |wn (x)| = lim |Ln (x) fn (x) − fn (x) Ln (x)| = +∞
|x|→1 |x|→1

et fn n’est pas dans Eλn . Donc Eλn est de dimension 1 engendré par Ln .
3. Pour u (t, x) = a (t) b (x) , notre équation aux dérivées partielles devient :

a (t) b (x) = −a (t) x2 − 1 b (x) + 2xb (x) = −a (t) L (b) (x)

Pour u non identiquement nulle, il existe t0 ∈ R tel que a (t0 ) = 0 et b est non
a (t0 )
identiquement nulle telle que L (b) = λb avec λ = − , il existe donc un
a (t0 )
entier n ∈ N tel que λ = n (n + 1) et b = αLn . Pour x = 1 et t ∈ [−1, 1] , on a
a (t) Ln (1) = −2Ln (1) a (t) avec Ln (1) = 1 et 2Ln (1) = n (n + 1) (qui résulte
de x2 − 1 Ln (x) + 2xLn (x) = n (n + 1)#Ln (x)), soit a$ (t) = −n # (n + 1) a (t)
$
et a (t) = β + γt pour n = 0, a (t) = β cos n (n + 1)t + γ sin n (n + 1)t
pour n ≥ 1. Les solutions
# cherchées
# sont donc
$ les fonctions
# de la forme
$$ u (t, x) =
a + bt ou u (t, x) = a cos n (n + 1)t + b sin n (n + 1)t Ln (x) avec
n ∈ N∗ .

Exercice 15.6. On désigne par (Pn )n∈N la suite des polynômes de Le-
gendre normalisés sur l’intervalle I = ]−1, 1[ et pour tout entier naturel n,
on définit la fonction ϕn par :

2 1 − x2 #  2
$
∀x ∈ I, ϕn (x) = (Pn (x)) + (Pn (x))
n (n + 1)
2
2x (Pn (x))
1. Montrer que ϕn (x) = .
n (n + 1)
Exercices 451

5
2n + 1
2. En déduire que sup |Pn (x)| = .
x∈[−1,1] 2

Solution.
1. On a pour tout x ∈ R :

2Pn (x)
ϕn (x) = n (n + 1) Pn (x) − xPn (x) + 1 − x2 Pn (x)
n (n + 1)
2
2x (Pn (x))
=
n (n + 1)

2. On en déduit que ϕn (x) ≥ 0 sur [0, 1] et la fonction ϕn est croissante sur
l’intervalle [0, 1] . Il en résulte que :
2 2
∀x ∈ [0, 1] , 0 ≤ (Pn (x)) ≤ ϕn (x) ≤ ϕn (1) = (Pn (1))
5
2n + 1
et |Pn (x)| ≤ |Pn (1)| = . Par parité ce résultat est encore valable sur
2 5
2n + 1
[−1, 1]. On peut donc conclure que sup |Pn (x)| = .
x∈[−1,1] 2

Exercice 15.7. (Ln )n∈N est la suite des polynômes de Legendre norma-
lisés par les conditions Ln (1) = 1 (paragraphe 15.3).
1. Montrer que l’on a pour tout n ∈ N∗ :

XLn − Ln−1 = nLn , Ln+1 = Ln−1 + (2n + 1) Ln


= XLn + (n + 1) Ln

2. Calculer les coefficients de Fourier-Legendre de la fonction f définie par :




⎪ 0 si x ∈ [−1, α[


1
∀x ∈ [−1, 1] , f (x) = si x = α

⎪ 2


1 si x ∈ ]α, 1]

où α est un réel strictement compris entre −1 et 1.


3. Étudier la série de Fourier-Legendre correspondante.
452 Polynômes orthogonaux

Solution.
1. Pour tout n ∈ N∗ , on a XLn − Ln−1 ∈ Rn [X] = Vect {L0 , · · · , Ln } , donc

n
XLn − Ln−1 = αk Lk avec :
k=0
2 3 4 3 4
αk Lk  = XLn − Ln−1 | Lk = Ln | XLk  − Ln−1 | Lk
1 3 4 1
= [xLn (x) Lk (x)]−1 − Ln | (XLk ) − [Ln−1 (x) Lk (x)]−1 + Ln−1 | Lk 
3 # $
4
+ Ln−1 | Lk 
n+k n−1+k
= 1 + (−1) − Ln | (XLk ) − 1 − (−1)
3 4
= Ln−1 | Lk  − Ln | (XLk )
= Ln−1 | Lk  − Ln | Lk  − Ln | XLk  = 0
pour k ≤ n − 1 et XLn − Ln−1 = αn Ln . Les coeeficients de X n dans cette
égalité donnent αn = n. La relation (15.5) nous donne par dérivation :
n (n + 1) Ln+1 − Ln−1 = (2n + 1) L (Ln ) = (2n + 1) n (n + 1) Ln
soit Ln+1 − Ln−1 = (2n + 1) Ln . De ces deux égalités, on déduit que :
Ln+1 = Ln−1 + (2n + 1) Ln = XLn − nLn + (2n + 1) Ln = XLn + (n + 1) Ln
 1
2. Les coefficients de Fourier-Legendre de f sont les cn (f ) = Pn (x) dx. Pour
α
1−α
n = 0, on a c0 (f ) = √ . Pour n ≥ 1, l’égalité :
2
 
1 1  1 
Pn = √ √ Pn+1 −√ Pn−1
2n + 1 2n + 3 2n − 1
 
1 Pn+1 (1) − Pn+1 (α) Pn−1 (1) − Pn−1 (α)
nous donne cn (f ) = √ √ − √
5 2n + 1 2n + 3 2n − 1
2k + 1 1 1
avec Pk (1) = , donc √ Pn+1 (1) − √ Pn−1 (1) = 0 et
2 2n + 3  2n − 1
1 Pn−1 (α) Pn+1 (α)
cn (f ) = √ √ − √ .
2n + 1 2n − 1 2n + 3
3. La fonction f étant lipschitzienne, on a pour tout x ∈ ]−1, 1[ :
+∞
  
1−α 1 Pn−1 (α) Pn+1 (α)
f (x) = √ P0 (x) + √ √ − √ Pn (x)
2 n=1
2n + 1 2n − 1 2n + 3

2
En utilisant les polynômes Lk = √ Pk , cela s’écrit :
2k + 1
+∞
1−α 1 
f (x) = + (Ln−1 (α) − Ln+1 (α)) Ln (x)
2 2 n=1
+∞
1 − α 1 1
Pour x = α, on obtient, + (Ln−1 (α) − Ln+1 (α)) Ln (α) = , ce qui
2 2 n=1 2
peut se vérifier directement (somme télescopique).
Bibliographie

[1] G. Auliac, J. Y. Caby. Analyse pour le Capes et l’Agrégation interne.


Ellipses (2002).
[2] R. P. Boas. A primer of real functions. Carus mathematical monograph 13.
Wiley (1960).
[3] A. Chambert-Loir, S. Fermigier. Analyse 2. Masson (1995).
[4] M. Crouzeix, A. Mignot. Analyse numérique des équations différentielles.
Masson. (1984).
[5] C. Deschamps, A. Warusfel. Mathématiques tout en un. Série E. Ramis.
Volumes 1 et 2. Dunod. (1999).
[6] J. Dieudonne. Calcul infinitésimal. Hermann (1968).
[7] J. Dieudonne. Eléments d’analyse, tome 1 . Gauthier Villars (1972).
[8] P. Doukhan, J. C. Sifre — Cours d’analyse. Analyse réelle et intégration.
Dunod. (2001).
[9] B. Gostiaux. Cours de Mathématiques Spéciales. Volumes 1 à 4. P. U. F.
(1995).
[10] X. Gourdon. Les Maths en tête. Analyse. Ellipses (1994).
[11] S. Gonnord, N. Tosel. Topologie et analyse fonctionnelle. Ellipses (1996).
[12] R. Jean. Mesure et intégration. Presses de l’Université du Québec (1975).
[13] W. J. Kaczor, M. T. Nowak. Problèmes d’analyse II. Continuité et déri-
vabilité. Edp Sciences (2008).
[14] J. Lelong-Ferrand. Les fondements de la géométrie. Presses universitaires
de France (1985).
[15] S. Lang. Real analysis. Addison-Wesley (1969).
[16] K. Madere. Préparation à l’oral de l’agrégation. Développements d’analyse.
Ellipses (1997).
[17] I. Niven — Irrational numbers. The Carus Mathematical Monographs
(1956).
[18] A. Pommellet. Agrégation de Mathématiques. Cours d’analyse. Ellipses
(1994).
[19] Ramis, Deschamps, Odoux. Analyse 2, exercices avec solutions. Masson.
(1972).
454 Bibliographie

[20] J. E. Rombaldi. Problèmes corrigés d’analyse numérique. Masson (1996).


[21] J. E. Rombaldi — Analyse matricielle. EDP Sciences (2000).
[22] J. E. Rombaldi. Interpolation et approximation. Vuibert (2005).
[23] J. E. Rombaldi. Exercices et problèmes pour l’agrégation de mathématiques.
Deboeck (2018).
[24] W. Rudin. Principes d’analyse mathématique. Ediscience (1995).
[25] W. Rudin. Analyse fonctionnelle. Ediscience (1995).
[26] A. Tissier. Agrégation interne de Mathématiques. Mathématiques générales.
Bréal. (1991).
Index

égalité du parallélogramme, 52 coefficient de convergence, 139


épigraphe, 225 coefficients de Fourier, 60
équivalents, 181 compact, 9, 27
complet, 29
Abel, 118 complet (espace métrique), 6
accroissements finis (inégalité), 259 concave (fonction), 225
accroissements finis (théorème), 258 connexe, 2
accroissements finis généralisés, 260 connexe par arcs, 29
adhérence, 4, 27 continue, 12, 28
adjacentes (suites), 95 continue à droite (fonction), 163
Aitken, 144 continue à gauche (fonction), 163
algébrique, 104, 277 continue par morceaux (fonction), 417
angle géométrique, 53 contractante (application), 329
approximation décimale, 100 convergence d’ordre r, 142
archimédien, 98 convergence géométrique, 139
Archimède, 98 convergence lente, 139
convergence rapide, 139
Banach, 29 convergente (suite), 5, 27
Bernstein, 45, 302 convexe, 29
Bernstein (polynômes), 250 convexe (fonction), 213, 225
Bessel, 58, 60, 411 corde, 213
Bessel (inégalité de), 441 croissante (suite), 93
Bohr-Mollerup, 366
Bolzano-Weierstrass, 9, 94, 96 d’Alembert, 318
borné, 2 décimale, 101
bornée, 27 décimaux (inversibles), 98
boule fermée, 2, 27 décimaux (nombres), 98
boule ouverte, 2, 27 décroissante (suite), 93
dérivé, 197
Cauchy, 355 dérivée logarithmique, 208
Cauchy (équation fonctionnelle de), 166 dérivable (fonction), 197
Cauchy (déterminant de), 70 dérivable à droite, 198
Cauchy (problème de), 393 dérivable à gauche, 198
Cauchy (suite de), 6, 27 déterminants de Gram, 65
Cauchy-Lipschitz, 384, 393 développement décimal illimité, 101
Cauchy-Schwarz, 26, 50, 77 développement décimal périodique, 104
Cesàro, 117, 118 développement décimal propre, 102
classe C201 développement limité, 307
classe Cn, 201 développements asymptotiques, 320

455
456 Index

Darboux, 211, 254, 277 inégalité triangulaire, 1, 25


Darboux-Christoffel, 433 indice, 209
Darboux-Christoffel (formule de), 421 intérieur, 4, 27
dense, 5, 27
diamètre, 2 Jensen, 240, 241, 376
dichotomie, 97
différentiable (fonction), 216 Kolmogorov, 298
discontinuité de deuxième espèce, 163
L’Hospital, 263
discontinuité de première espèce, 163
Lagrange, 257, 299, 342, 383, 393
distance, 1
Laguerre, 256
distance induite, 1
Laguerre (polynômes de), 431
divergente (suite), 5
Landau, 178, 179
dominée, 179
Laplace, 435
espace métrique, 1 Lebesgue, 10
espace préhilbertien, 49 Legendre, 255
Euler, 364 Legendre (polynômes de), 429, 445
Euler (constante), 318 Leibniz, 202
exponentielle complexe, 363 Leibniz (formule de), 202
limite, 161
fermé, 2, 27 limite à droite, 162
Fermat (nombre de), 133 limite à gauche, 162
fonction poids, 417 limite inférieure, 121
formule de la moyenne (deuxième), 172 limite supérieure, 121
formule de la moyenne (première), 172 Liouville, 278, 279
Fourier (coefficients de), 440 lipschitzienne (fonction), 14
Fourier (série de), 440 log-convexe (fonction), 228
fraction continue illimitée, 110 longueur d’un arc, 268
fraction continue limitée, 108
fractionnaire (partie), 106 Müntz, 69, 75
Mac-Laurin (formule de), 287
gamma (fonction), 364 matrice de Gram, 64
Gauss (intégrale de), 265 maximale (famille), 63
Gram (déterminant de), 423 meilleure approximation, 42
Gram-Schmidt, 55 Minkowski, 51
Grassmann, 368 moments, 423
groupe unitaire, 363 monotone (suite), 93
moyenne arithmétique, 242
Hölder, 38, 40 moyenne géométrique, 242
Hölder (inégalité de), 239 moyenne harmonique, 242
Hadamard (inégalité de), 67
Heine, 15 négligeable, 178
Hermite, 256 Newton, 299, 345
Hermite (polynômes de), 432 nombre d’or, 113
hessienne, 292 norme, 26
homéomorphisme, 15, 28 normes équivalentes, 34
homographique (suite), 337 noyau (d’une semi-norme), 25
noyaux (lemme des), 372, 390
inégalité des trois pentes, 232
Index 457

orthogonal, 54 totale (famille), 61


orthogonale (famille), 54 transcendant, 104, 278
orthogonaux, 53
orthonormée, 54 uniformément continue, 13, 28, 166
ouvert, 2, 27
valeur d’adhérence, 7
période, 169 valeurs intermédiaires, 97, 174
périodique (fonction), 169 Van der Waerden, 199
Padé (approximants de), 326 Vandermonde, 297
Parseval, 61, 443 voisinage, 2
partie entière, 99
plateau (fonction), 284 Weierstrass, 45, 200
point fixe, 329, 330
point fixe attractif, 153, 271
point fixe répulsif, 271
polynôme caractéristique, 372, 386, 390
prépondérant, 178
produit scalaire, 49
produit vectoriel, 367
Projection orthogonale, 56
Pythagore, 53

réciproques (fonctions), 175


Raabe-Duhamel, 319
rectangles (méthode des), 299
rectifiable (arc), 268
relèvement, 209
Richardson, 146, 148
Riemann-Lebesgue, 61
Riesz, 37
Rodrigues, 428
Rolle, 251

séparable, 5
série de Fourier, 60
Schläffi, 435
Schwarz, 276
semi-norme, 25
Simpson, 272
sous-groupe discret, 114

Taylor, 288
Taylor-Lagrange, 289
Taylor-Lagrange (formule de), 287
Taylor-Lagrange (inégalité), 287
Taylor-Young, 291, 292, 309
Tchebychev (polynômes de), 430, 444
topologie induite, 2
E N S E I G N E M E N T S U P M AT H
A g r é g at io n – M as ter

Jean-Étienne Rombaldi

Cette deuxième édition du cours d’analyse réelle est destinée


aux étudiants préparant l’agrégation externe de Mathématiques
et aux enseignants préparant l’agrégation interne. Cette
nouvelle édition revue et corrigée est augmentée de quatre
chapitres : espaces métrique, espaces normés, espaces
préhilbertiens et polynômes orthogonaux.

Ce livre n’est pas organisé comme un cours suivant strictement


les programmes des concours cités. Il est centré sur des notions
fondamentales tant pour la préparation à l’écrit que pour la préparation
à l’oral. C’est un ouvrage de synthèse où les chapitres sont rédigés
de manière relativement indépendante avec pour lignes directrices :
— approfondir les notions de base ;
— privilégier les applications à d’autres domaines des mathématiques ;
— bien analyser les hypothèses des théorèmes en proposant
de nombreux contre-exemples ;
— élargir le champs des connaissances du lecteur.
C’est ce travail de synthèse et d’approfondissement que l’on demande
de réaliser dans l’élaboration d’une leçon d’oral d’Agrégation.
Chaque chapitre se termine par une série d’exercices tous corrigés en
détails et constituant un bon entraînement pour les épreuves écrites.

Jean-Étienne Rombaldi est professeur agrégé de mathématiques,


son dernier poste étant à l’institut Fourier de Grenoble (université
Grenoble-Alpes). Il a longtemps été préparateur à l’agrégation interne
et externe de mathématiques.

ISBN : 978-2-7598-2339-0

9 782759 823390 www.edpsciences.org

Vous aimerez peut-être aussi