Académique Documents
Professionnel Documents
Culture Documents
Elements D Analyse Reelle Ed1 v1 Compressed
Elements D Analyse Reelle Ed1 v1 Compressed
E N S E I G N E M E N T S U P M AT H Master
Jean-Étienne Rombaldi
ÉLÉMENTS
D’ANALYSE RÉELLE
2e édition
Jean‐Étienne ROMBALDI
Avant-propos vii
1 Espaces métriques 1
1.1 Topologie associée à une distance . . . . . . . . . . . . . . . . . . . 1
1.2 Suites à valeurs dans un espace métrique . . . . . . . . . . . . . . . 5
1.3 Limites et continuité . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.4 Propriétés globales des fonctions continues . . . . . . . . . . . . . . 13
1.5 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2 Espaces normés 25
2.1 Semi-normes et normes . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.2 Applications linéaires continues . . . . . . . . . . . . . . . . . . . . 30
2.3 Espaces vectoriels normés de dimension finie . . . . . . . . . . . . . 34
2.4 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3 Espaces préhilbertiens 49
3.1 Inégalités de Cauchy-Schwarz et Minkowski . . . . . . . . . . . . . 50
3.2 Orthogonalité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
3.3 Orthogonalisation de Gram-Schmidt . . . . . . . . . . . . . . . . . 54
3.4 Meilleure approximation dans un espace préhilbertien . . . . . . . 56
3.5 Inégalité de Bessel et égalité de Parseval . . . . . . . . . . . . . . . 60
3.6 Déterminants de Gram . . . . . . . . . . . . . . . . . . . . . . . . . 64
3.7 Les théorèmes de Müntz . . . . . . . . . . . . . . . . . . . . . . . . 69
3.8 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
4 Suites numériques 87
4.1 Suites numériques convergentes . . . . . . . . . . . . . . . . . . . . 87
4.2 Suites réelles monotones, adjacentes . . . . . . . . . . . . . . . . . 93
4.3 Développement décimal d’un réel . . . . . . . . . . . . . . . . . . . 98
4.4 Fractions continues . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
4.5 Sous-groupes additifs de R . . . . . . . . . . . . . . . . . . . . . . . 114
4.6 Moyennes de Cesàro . . . . . . . . . . . . . . . . . . . . . . . . . . 116
4.7 Limites supérieure et inférieure . . . . . . . . . . . . . . . . . . . . 120
4.8 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
iv
Bibliographie 453
Index 455
Avant-propos
Espaces métriques
Exemple 1.1 La valeur absolue [resp. le module] sur R [resp. sur C] induit une
distance en posant d (x, y) = |y − x| pour tous x, y dans R [resp. dans C].
Définition 1.3. On dit qu’une partie O de (E, d) est un ouvert si elle est
vide ou si elle est non vide et voisinage de chacun de ses points, ce qui
signifie que pour tout a ∈ O il existe un réel r > 0 tel que B (a, r) ⊂ O. On
dit qu’une partie F de (E, d) est un fermé si son complémentaire E \ F est
un ouvert.
Exemples 1.1
1. Une boule ouverte [resp. fermée] de E est un ouvert [resp. un fermé] de (E, d) .
En effet, pour tout x ∈ B (a, r) , on a r = r − d (a, x) > 0 et B (x, r ) ⊂ B (a, r)
(pour y ∈ B (x, r ) on a d (y, a) ≤ d (y, x) + d (x, a) < r + d (x, a) = r). De
même pour x ∈ E \ B (a, r) , on a r = d (a, x) − r > 0 et B (x, r ) ⊂ E \ B (a, r)
(pour y ∈ B (x, r ) on a d (y, a) ≥ d (x, a) − d (x, y) > d (a, x) − r = r).
2. Pour toute partie non vide A de E et tout réel r ∈ R+,∗ , l’ensemble Vr (A) =
{x ∈ E | d (x, A) < r} est un ouvert qui contient A. En effet, il est clair que
Vr (A) contient A (on a d (x, A) = 0 pour x ∈ A) et pour tout x ∈ Vr (A) ,
on a r = r − d (A, x) > 0 et B (x, r ) ⊂ Vr (A) (pour y ∈ B (x, r ) on a
d (y, A) ≤ d (y, x) + d (x, A) < r + d (x, A) = r).
Le résultat qui suit nous sera utile pour montrer que les connexes (et convexes)
de R sont les intervalles (corollaire 2.1).
Preuve. Supposons qu’il existe deux ouverts O1 , O2 dans R tels que [0, 1] ⊂
O1 ∪ O2 et [0, 1] ∩ O1 ∩ O2 = ∅. On peut supposer que 0 ∈ O1 . Il existe alors un
réel ε ∈ ]0, 1[ tel que [−ε, ε] ⊂ O1 et l’ensemble I = {x ∈ ]0, 1] | [0, x] ⊂ O1 } est
non vide majoré par 1. On peut donc poser α = sup (I) et on a 0 < α ≤ 1. Par
définition de la borne supérieure, pour tout x ∈ ]0, α[ on peut trouver y ∈ ]x, α] ∩ I
et on a x ∈ [0, y] ⊂ O1 . On a donc ainsi montré que ]0, α[ ⊂ O1 . Si α ∈ O2 , il
existe alors ε ∈ ]0, α[ tel que [α − ε, α + ε] ⊂ O2 et [α − ε, α[ ⊂ [0, 1] ∩ O1 ∩ O2
ce qui est impossible. On a donc α ∈ O1 et [0, α] ⊂ O1 . Si α < 1, il existe alors
ε ∈ ]0, 1 − α[ tel que [0, α + ε] ⊂ O1 et α+ε ∈ I en contradiction avec α = sup (I) .
On a donc α = 1 et [0, 1] ⊂ O1 , ce qui entraîne [0, 1] ∩ O2 = ∅. En conclusion,
[0, 1] est connexe.
Théorème 1.1.
L’ensemble vide, l’ensemble E, une réunion d’ouverts et une intersection
finie d’ouverts sont des ouverts de (E, d) . L’ensemble vide, l’ensemble E,
une réunion finie de fermés et une intersection de fermés sont des fermés
de (E, d) .
De manière plus générale, un fermé de (E, d) est l’intersection d’une suite dé-
croissante d’ouverts et un ouvert est la réunion d’une suite croissante de fermés
(exercice 1.4).
◦
Définition 1.5. L’intérieur d’une partie A de (E, d) , noté A, est le plus
grand ouvert de E contenu dans A. L’adhérence d’une partie A de (E, d) ,
notée A, est le plus petit fermé de E contenant A.
On vérifie facilement que l’intérieur de A est aussi la réunion de tous les ouverts
de E contenus dans A et que l’adhérence de A est l’intersection de tous les fermés
de E qui contiennent A.
Théorème 1.2.
◦
Pour tout sous-ensemble A de (E, d) , on a A ⊂ A [resp. A ⊂ A], l’égalité
étant réalisée si, et seulement si, A est ouvert [resp. fermé].
◦
Preuve. Par définition, on a A = Oi ⊂ A où (Oi )i∈I est la famille de tous
i∈I
◦
les ouverts de E contenus dans A. L’égalité A = A nous dit que A est ouvert
comme réunion d’ouverts. Réciproquement si A est ouvert, c’est alors l’un des Oi
◦ ◦
et nécessairement, A ⊂ A, cequi donne l’égalité A = A.
De même, on a A ⊂ A = Fi où (Fi )i∈I est la famille de tous les fermés de E
i∈I
qui contiennent A. L’égalité A = A nous dit que A est fermé comme intersection de
Réciproquement si A est fermé, c’est alors l’un des Fi et nécessairement,
fermés.
A= Fi ⊂ A, ce qui donne l’égalité A = A.
i∈I
Théorème 1.3.
L’adhérence d’une partie A de (E, d) est l’ensemble des éléments x de E
tels que d (x, A) = 0, ce qui revient à dire que x ∈ A si, et seulement si, pour
tout réel ε > 0, il existe y ∈ A tel que d (x, y) < ε (soit A ∩ B (x, ε) = ∅).
Preuve. Il revient au même de montrer que d (x, A) > 0 si, et seulement si,
x ∈ E \ A.
Si δ = d (x, A) > 0, on a alors d (x, y) ≥ δ pour tout y ∈ A et E \ B (x, δ) est un
fermé qui contient A, donc A ⊂ E \ B (x, δ) et en conséquence, B (x, δ) ⊂ E \ A,
donc x ∈ E \ A. Réciproquement, si x ∈ E \ A, comme cet ensemble est ouvert, il
existe un réel ε > 0 tel que B (x, ε) ⊂ E \ A, donc A ⊂ A ⊂ E \ B (x, ε) et on a
d (x, y) ≥ ε pour tout y ∈ A, ce qui implique que d (x, A) ≥ ε > 0.
Du théorème précédent, on déduit que A ⊂ E est fermé si, et seulement si,
d (x, A) = 0 pour tout x ∈ A.
Suites à valeurs dans un espace métrique 5
Définition 1.7. On dit que l’espace métrique (E, d)est séparable s’il existe
dans E une partie dense dénombrable.
Exemples 1.2
1. De la densité de Q dans R (corollaire 4.2 ou exercice 4.1), on déduit que (R, |·|)
est séparable.
2. Un espace métrique compact est séparable (exercice 1.6).
Définition 1.8. On dit qu’une suite (xn )n∈N d’éléments de (E, d) est
convergente s’il existe un élément de E tel que lim d (xn , ) = 0. Une
n→+∞
suite non convergente est dite divergente.
Dans l’assertion (1.1) , les deux dernières inégalités peuvent être strictes ou
larges et il est parfois commode de se limiter à ε ∈ ]0, 1[ sans que cela ne soit
restrictif.
Cette notion de convergence dépend de la distance choisie sur E (exercice 1.2
et le paragraphe 2.1).
En utilisant l’inégalité triangulaire, on vérifie facilement que si une suite (xn )n∈N
d’éléments de (E, d) est convergente, sa limite est alors unique, ce qui nous permet
de noter = lim xn ou xn → .
n→+∞ n→+∞
Une suite convergente est bornée. En effet, si lim xn = , il existe alors un
n→+∞
entier n0 tel que d (xn , xm ) ≤ d (xn , ) +d (xm , ) < 2 pour tout n > n0 et tout
m > n0 , donc sup d (xn , xm ) ≤ max max d (xn , xm ) , 2 , ce qui signifie
(n,m)∈N2 0≤n,m≤n0
que (xn )n∈N est bornée.
6 Espaces métriques
Définition 1.9. On dit qu’une suite (xn )n∈N d’éléments de (E, d) est de
Cauchy si :
Preuve. De lim (εn ) = 0, on déduit que pour tout réel ε > 0 on peut trouver
n→+∞
un entier n1 ≥ n0 tel que εn < ε pour tout n ≥ n1 , ce qui entraîne d (xm , xn ) < ε
pour m > n ≥ n1 .
Théorème 1.5.
Toute suite de Cauchy dans (E, d) est bornée et toute suite convergente
est de Cauchy.
◦
Preuve. Si x ∈ A, il existe alors un réel ε > 0 tel que B (x, ε) ⊂ A et pour toute
suite (xn )n∈N d’éléments de E qui converge vers x, il existe un entier n0 tel que
◦
d (xn , x) < ε pour tout n ≥ n0 , ce
qui implique que xn ∈ A. Si x ∈/ A, alors
pour
1 1
tout entier n ≥ 1, la boule B x, n’est pas contenue dans A (comme B x,
n n
Suites à valeurs dans un espace métrique 7
◦ ◦
dans A, elle est aussi contenue dans A et x ∈ A),
est ouverte, si elle estcontenue
1
donc il existe xn ∈ B x, \ A, ce qui nous donne une suite qui converge vers x
n
avec tous ses termes en dehors de A. D’où la définition séquentielle de l’intérieur.
L’adhérence de A est A = {x ∈ E | d (x, A) = 0} (théorème 1.3), donc pour tout
1
x ∈ A et tout entier n ≥ 1, il existe xn ∈ A tel que d (xn , x) < , ce qui nous donne
n
une suite de points de A qui converge vers x. Réciproquement si x est la limite
d’une suite (xn )n∈N d’éléments de A, des encadrements 0 ≤ d (x, A) ≤ d (xn , x) ,
on déduit que d (x, A) = 0, soit que x ∈ A.
De ce théorème, on peut déduire des définitions séquentielles des notions d’ou-
verts et de fermés. Un ensemble O est ouvert dans (E, d) si, et seulement si, pour
toute suite (xn )n∈N d’éléments de E qui converge vers x ∈ O, il existe un entier
◦
n0 tel que xn ∈ O pour tout n ≥ n0 (cela résulte de O = O). Un ensemble F est
fermé dans (E, d) si, et seulement si, toute suite convergente d’éléments de F a sa
la limite dans F (cela résulte de F = F).
On en déduit aussi qu’une partie A de E est dense dans (E, d) si, et seulement
si, tout x ∈ E est la limite d’une suite de points de A.
Définition 1.10. Soit (xn )n∈N une suite d’éléments de (E, d) . On dit qu’un
élément a de E est valeur d’adhérence de (xn )n∈N s’il est limite d’une suite
extraite, ce qui signifie qu’il existe une application ϕ : N → N strictement
croissante telle que a = lim xϕ(n) .
n→+∞
Preuve. Si a = lim xϕ(n) est une valeur d’adhérence de (xn )n∈N , pour tout
n→+∞
réel ε > 0, il existe alors un entier n0 tel que d xϕ(n) , a < ε pour tout n ≥ n0 .
Pour n ∈ N et p = max (n0 , n) , on a m = ϕ (p) ≥ p, donc m ≥ n, p ≥ n0 et
d (xm , a) = d xϕ(p) , a < ε. Réciproquement si a ∈ E vérifie (1.2) , on construit
1
alors par récurrence une suite extraite xϕ(n) n∈N telle que d xϕ(n) , a <
n+1
pour tout n ∈ N. Pour initialisation, on part de m = ϕ (0) ≥ 0 tel que d (xm , a) < 1.
Supposant obtenus, pour n ≥ 0, une suite d’entiers ϕ (0) < · · · < ϕ (n) tels que
1
d xϕ(k) , a < pour tout k compris entre 0 et n, il existe un entier m =
k+1
1
ϕ (n + 1) ≥ ϕ (n) + 1 tel que d (xm , a) < . On a alors lim d xϕ(n) , a = 0,
n+2 n→+∞
ce qui signifie que a est une valeur d’adhérence de (xn )n∈N .
8 Espaces métriques
Une suite peut être sans valeur d’adhérence comme le montre l’exemple de la
suite réelle (n)n∈N . De manière plus générale, si (xn )n∈N est une suite d’éléments
de (E, d) pour laquelle il existe un réel r > 0 tel d (xi , xj ) ≥ r pour tous i = j
dans N, il est alors impossible d’en extraire une suite convergente.
Théorème 1.8.
Une suite convergente a pour unique valeur d’adhérence sa limite.
Preuve. Soit (xn )n∈N suite d’éléments de (E, d) convergente vers . Pour tout réel
ε > 0, il existe n0 ∈ N tel que d (xn , ) pour tout n ≥ n0 et pour toute application
ϕ : N → N strictement croissante, on a ϕ (n) ≥ n ≥ n0 pour tout n ≥ n0 , ce qui
entraîne que d xϕ(n) , < ε. La suite xϕ(n) n∈N est donc convergente vers .
La réciproque du théorème précédent est fausse comme le montre l’exemple de
la suite réelle (xn )n∈N définie par x2n = n et x2n+1 = 0 (elle est divergente avec 0
pour unique valeur d’adhérence), mais elle vraie pour une suite à valeurs dans un
compact (théorème 1.11).
Étant donnée une suite (xn )n∈N d’éléments de (E, d) , on note V l’ensemble de
ses valeurs d’adhérence et pour tout n ∈ N, Rn = {xk | k ≥ n} l’ensemble des
valeurs de la suite (xk )k≥n .
Théorème 1.9.
Preuve. Pour toute valeur d’adhérence a = lim xϕ(k) de (xn )n∈N et tout k ∈ N,
k→+∞
on a ϕ (k) ≥ k, donc pour tout n ∈ N, la suite xϕ(k) k≥n
est à valeurs dans Rn
et en conséquence sa limite a est dans Rn . On a donc V ⊂ Rn pour tout n ∈ N et
comme Rn ⊂ Rn , on a Rn ∪ V ⊂ Rn . Tout a ∈ Rn est limite d’une suite de points
(yk )k∈N de Rn . Si a est dans Rn , il est alors dans Rn ∪ V, sinon pour tout ε > 0, il
existe un entier k0 tel que 0 < d (yk , a) < ε pour tout k ≥ k0 . En écrivant chaque
yk sous la forme yk = xψ(k) , on peut trouver pour tout n ∈ N un entier k ≥ k0
tel que m = ψ (k) > n (s’il existe n ∈ N tel que ψ (k) ≤ n pour tout k ≥ k0 , la
suite (yk )k≥k0 ne prend qu’un nombre fini de valeurs et sa limite est l’une de
ces valeurs, donc dans Rn contrairement à notre hypothèse) ce qui nous donne
d (xm , a) = d (yk , a) < ε. Du théorème (1.7) , on déduit alors que a est valeur
d’adhérence de (xn )n∈N , soit a ∈ V ⊂ Rn ∪ V. D’où l’égalité Rn = Rn ∪ V pour
tout n ∈ N.
On en déduit que l’ensemble V est contenu dans tous les Rn , donc dans Rn .
n∈N
Du théorème (1.7) , on déduit que pour tout a ∈ E \ V il existe un réel ε > 0 et un
entier n ∈ N tels que d (xm , a) ≥ ε pour
tout m ≥ n, ce qui implique
que a n’est
pas dans Rn et en conséquence, a ∈ / Rn . D’où l’égalité V = Rn .
n∈N n∈N
Du théorème précédent, on déduit que l’ensemble des valeurs d’adhérence de la
suite (xn )n∈N est fermé dans E comme intersection de fermés.
Suites à valeurs dans un espace métrique 9
Lemme 1.2 Soit K un compact de (E, d) . Pour tout réel r > 0, il existe une suite
n
finie (ak )1≤k≤n d’éléments de K telle que K ⊂ B (ak , r) .
k=1
Preuve. Supposons qu’il existe r > 0 tel que K ne puisse être recouvert par un
nombre fini de boules ouvertes de rayon r et centrée en a ∈ K. Partant de x0 ∈ K,
il existe x1 ∈ K \ B (x0 , r) (puisque K n’est pas contenu dans B (x0 , r)), donc
d (x0 , x1 ) ≥ r. Supposant obtenus x0 , · · · , xn dans K tels que d (xi , xj ) ≥ r pour
n
tous i = j compris entre 1 et n, comme K n’est pas contenu dans B (xk , r) ,
k=1
il existe xn+1 ∈ K tel que d (xn+1 , xk ) ≥ r pour tout k compris entre 1 et r. On
construit donc ainsi une suite (xn )n∈N d’éléments de K telle que d (xi , xj ) ≥ r
pour tous i = j dans N et d’une telle suite il est impossible d’extraire une suite
convergente, ce qui n’est pas possible pour K compact.
Théorème 1.10.
Un compact dans un espace métrique est fermé et borné.
Preuve. Soit K un compact de (E, d) . Pour toute suite (xn )n∈N d’éléments de K
qui converge vers ∈ E, on peut extraire une suite qui converge vers un élément
de K, donc ∈ K. L’ensemble K est donc fermé. Le lemme précédent nous dit
n
qu’il existe une suite finie (ak )1≤k≤n d’éléments de K telle que K ⊂ B (ak , 1) ,
k=1
donc pour tous x, y dans K il existe j, k compris entre 1 et n tels que (x, y) ∈
B (aj , 1) ∩ B (ak , 1) et en conséquence :
d (x, y) ≤ d (x, aj ) + d (aj , ak ) + d (ak , y) < 2 + d (aj , ak )
ce qui nous donne δ (K) ≤ 2 + max d (aj , ak ) et signifie que K est borné.
1≤j,k≤n
La réciproque du théorème précédent est fausse en général, mais elle est vraie
dans le cas des espaces vectoriels normés de dimension finie (théorème 2.9).
Théorème 1.11.
Soient K un compact de (E, d) et (xn )n∈N une suite d’éléments de K.
1. Si (xn )n∈N a un nombre fini a1 , · · · , ar de valeurs d’adhérences, alors
r
pour tout réel ε > 0, il existe un entier n0 tel que xn ∈ B (ak , ε) pour
k=0
tout n ≥ n0 .
2. La suite (xn )n∈N est convergente si, et seulement si, elle a un unique
valeur d’adhérence.
10 Espaces métriques
Preuve. Comme K est compact, (xn )n∈N a au moins une valeur d’adhérence.
1. En notant V l’ensemble des valeurs d’adhérence de (xn )n∈N , on suppose que
V = {a1 , · · · , ar } . S’il existe ε > 0 tel que pour tout entier n ∈ N, il existe
r
un entier pn ≥ n tel que xpn ∈ / B (ak , ε) , soit d (xpn , ak ) ≥ ε pour tout k
k=0
compris entre 1 et r, on peut alors construire par récurrence une suite (ϕ (n))n∈N
strictement croissante d’entiers telle que d xϕ(n) , ak ≥ ε pour tout k compris
entre 1 et r et de cette suite dans le compact K, on peut extraire une sous suite
xψ(n) n∈N qui converge vers a ∈ K tel que d (a, ak ) ≥ ε > 0, donc a est une
valeur d’adhérence de (xn )n∈N qui n’est pas dans V, c’est impossible. D’où le
résultat annoncé.
2. On sait déjà que si (xn )n∈N converge, elle a alors une unique valeur d’adhérence
(que cette suite soit à valeurs dans un compact ou pas). Réciproquement, si
V = {} , on déduit alors du premier point que pour tout ε > 0, il existe
n0 ∈ N tel que xn ∈ B (, ε) pour tout n ≥ n0 , ce qui revient à dire que (xn )n∈N
converge vers .
Lemme 1.3 (Lebesgue) Soient K un compact de (E, d) et (Oi )i∈I une famille
d’ouverts de E telle que K ⊂ Oi (on dit qu’on a un recouvrement ouvert de K).
i∈I
Il existe un réel r > 0 tel que toute boule ouverte de centre x ∈ K et de rayon r
soit contenue dans l’un des Oi .
Preuve. Supposons que pour tout réel r > 0, il existe une boule ouverte de
centre x ∈ K et de rayon r qui ne soit contenue dans aucun des Oi . On peut
∗ 1
alors trouver, pour tout entier n ∈ N , une boule B xn , centrée en xn ∈ K
n
qui ne soit contenue dans aucun des Oi . De la suite (xn )n∈N∗ d’éléments de K,
on peut extraire une suite xϕ(n) n∈N∗ qui converge vers x ∈ K ⊂ Oi . Cette
i∈I
limite étant dans l’un des ouverts Oi , il existe r > 0 tel que B (x, r) ⊂ Oi . Comme
1 1 ε
lim = 0 et lim xϕ(n) = x, il existe un entier n0 tel que < et
n→+∞ ϕ (n) n→+∞ ϕ (n) 2
ε 1
d xϕ(n) , x < pour tout n ≥ n0 , donc B xϕ(n) , ⊂ B (x, r) ⊂ Oi (pour
2 ϕ (n)
1 ε 1
y ∈ B xϕ(n) , , on a d (x, y) ≤ d x, xϕ(n) + d xϕ(n) , y < + < ε),
ϕ (n) 2 ϕ (n)
contrairement à l’hypothèse de départ.
Théorème 1.12.
Un sous-ensemble K de (E, d) est compact si, et seulement si, de tout
recouvrement ouvert de K, on peut extraire un sous-recouvrement fini.
toute boule ouverte de rayon r et de centre x ∈ K soit contenue dans l’un des Oi
et le lemme 1.2 qu’il existe une suite finie (ak )1≤k≤n d’éléments de K telle que
n
K⊂ B (ak , r) . Chaque boule B (ak , r) étant contenue dans un ouvert Oik , on
k=1
n
en déduit que K ⊂ Oi k .
k=1
Réciproquement, soit K tel que de tout recouvrement ouvert de K, on puisse
extraire un sous-recouvrement fini. S’il existe une suite (xn )n∈N d’éléments de K
sans valeur d’adhérence dans K, on peut alors trouver pour tout x ∈ K, un réel
rx > 0 tel que B (x, rx ) ne contienne qu’un nombre
fini de valeurs de la suite
(xn )n∈N . Mais du recouvrement ouvert K ⊂ B (x, rx ) , on peut extraire un
x∈K
p
recouvrement fini K ⊂ B aj , raj et la suite (xn )n∈N ne peut prendre qu’un
k=1
nombre fini de valeurs qui en sont des valeurs d’adhérence, ce qui est contraire à
l’hypothèse de départ. L’ensemble K est donc compact.
Comme pour les suites, on peut vérifier en utilisant l’inégalité triangulaire que
si la fonction f admet une limite en α ∈ I, cette dernière est alors unique et on
peut la noter = lim f (x) .
x→α
Le théorème qui suit nous donne une caractérisation séquentielle de la notion
de limite.
Théorème 1.13.
Preuve. Si f admet une limite en α, alors pour tout ε > 0 il existe η > 0
tel que d (x, α) < η dans I \ {α} entraîne d (f (x) , ) < ε et si (xn )n∈N est une
suite de points de I \ {α} qui converge vers α, il existe alors un entier n0 tel que
0 < d (xn , α) < η pour tout n ≥ n0 , ce qui implique d (f (xn ) , ) < ε. On a donc
lim f (xn ) = .
n→+∞
12 Espaces métriques
Donc toute suite (xn )n∈N de points de I \ {α} convergente vers α est transformée
en une suite (f (xn ))n∈N qui converge vers un même élément de F. Si f n’admet
pas pour limite en α, il existe alors un réel ε > 0 tel que pour tout entier n ≥ 1
1
on peut trouver xn ∈ I \ {α} tel que d (xn , α) < et d (f (xn ) , ) ≥ ε. On a donc
n
ainsi une suite (xn )n∈N de points de I \ {α} qui converge vers α pour laquelle la
suite (f (xn ))n∈N ne converge pas vers , ce qui est une contradiction d’après ce
qui précède.
D’un point de vue pratique, le théorème précédent s’exprime aussi en disant
que lim f (x) = si, et seulement si, on a lim f (xn ) = pour toute suite de
x→α n→+∞
points (xn )n∈N de points de I \ {α} qui converge vers α.
Preuve. Soit α ∈ I. Pour ε > 0, il existe η > 0 tel que d (g (y) , g (f (α))) < ε
pour y dans J tel que d (y, f (α)) < η et il existe η > 0 tel que d (f (x) , f (α)) < η
pour x dans I tel que d (x, α) < η, ce qui nous donne d (g (f (x)) , g (f (α))) < ε
pour x dans I tels que d (x, α) < η.
Théorème 1.17.
La composée de deux fonctions uniformément continues f : I → J ⊂ F et
g : J → G (où (G, d ) est un espace métrique) est uniformément continue.
Preuve. Pour tout ε > 0, il existe η > 0 tel que d (g (u) , g (v)) < ε pour u, v
dans J tels que d (u, v) < η et il existe η > 0 tel que d (f (x) , f (y)) < η pour
x, y dans I tels que d (x, y) < η, ce qui nous donne d (g (f (x)) , g (f (y))) < ε
pour x, y dans I tels que d (x, y) < η.
Exemples 1.3
√
1. La fonction x → x est uniformément continue sur R+ . Cela se déduit de :
√ √
∀ (x, y) ∈ R2 , x− y ≤ |x − y|
Cette inégalité est triviale pour x = y et pour y > x ≥ 0 (x, y jouent des rôles
√ √ 2 √
symétriques), on a x − y = y − 2 xy + x > y − x.
2. Une fonction f : I → F lipschitzienne (ce qui signifie qu’il existe λ ≥ 0 tel que
d (f (x) , f (y)) ≤ λd (x, y) pour tous x, y dans I) est uniformément continue
sur I.
3. Si f est une fonction à valeurs réelles et dérivable sur un intervalle réel I avec
f bornée, le théorème des accroissements finis (chapitre 9) nous dit que cette
fonction est lipschitzienne et en conséquence uniformément continue sur I.
Une fonction f : I ⊂ R → R peut très bien être uniformément continue sur tout
intervalle strictement contenu dans I sans être uniformément continue sur I tout
1
entier. C’est le cas, par exemple, pour la fonction f : x → sur I = ]0, 1] . Elle est
x
lipschitzienne sur tout [a, 1] où 0 < a < 1 (conséquence des accroissements finis),
1
donc uniformément continue sur ces intervalles. Mais pour tout réel η ∈ 0, ,
2
η 1 1 1 2
x = η, y = x + , on a |y − x| < η avec − = > .
2 x y 3η 3
Le théorème qui suit nous donne une caractérisation séquentielle de l’uniforme
continuité.
Théorème 1.18.
Une fonction f : I → F est uniformément continue si, et seule-
ment si, pour toutes suites (xn )n∈N et (yn )n∈N d’éléments de I telles que
lim d (xn , yn ) = 0, on a lim d (f (xn ) , f (yn )) = 0.
n→+∞ n→+∞
Définition 1.15. Soit J une partie non vide de F. On dit que f : I → J est
est un homéomorphisme si elle est continue bijective d’inverse f −1 continue.
Preuve. Soit (yn )n∈N une suite dans f (K) avec yn = f (xn ) pour tout n ∈ N.
De la suite (xn )n∈N dans le compact K on peut extraire une suite xϕ(n) n∈N
qui converge vers un élément x de K et avec la continuité de f on déduit que
lim yϕ(n) = lim f xϕ(n) = f (x) ∈ f (K) , donc f (K) est compact.
n→+∞ n→+∞
Théorème 1.21.
Soient K un compact de (E, d) et f : K → R une fonction continue.
Cette fonction est bornée et atteint ses bornes, ce qui signifie qu’il existe
α, β dans K tels que f (α) = inf f (x) et f (β) = sup f (x) .
x∈K x∈K
Preuve. Comme f (K) est compact, il est en particulier borné dans R et étant
non vide, il admet une borne inférieure et une borne supérieure :
Par définition de la borne inférieure m, pour tout entier n > 0 on peut trouver
1
xn dans K tel que m ≤ f (xn ) < m + et de la suite (xn )n∈N ainsi définie dans le
n
compact K on peut extraire une sous-suite xϕ(n) n∈N qui converge vers α ∈ K.
1
On a donc pour tout n > 0, m ≤ f xϕ(n) < m+ avec lim ϕ (n) = +∞, ce
ϕ (n) n→+∞
qui nous donne avec la continuité de f, f (α) = lim f xϕ(n) = m. On procède
n→+∞
de manière analogue pour la borne supérieure.
Corollaire 1.1. Une partie A de (E, d) est connexe si, et seulement si,
toute application continue de A dans {0, 1} est constante.
1.5 Exercices
d2 (P, Q) = deg (P − R + R − Q) + 1
≤ deg (P − R) + deg (R − Q) + 2 = d2 (P, R) + d2 (R, Q)
Solution.
1.
(a) La fonction ϕ est à valeurs positives puisque croissante avec ϕ (0) = 0.
Comme ϕ n’est pas identiquement nulle avec ϕ (0) = 0, il existe t0 > 0 tel
que ϕ (t0 ) > 0. De la croissance de ϕ, on déduit que ϕ (t) > 0 pour tout
t ≥ t0 . S’il existe t ∈ ]0, t0 [ tel que ϕ (t) = 0, on a alors ϕ (nt) = 0 pour
tout n ∈ N. En effet, c’est vrai pour n ∈ {0, 1} et si c’est vrai pour n ≥ 1,
de 0 ≤ ϕ ((n + 1) t) ≤ ϕ (nt) + ϕ (t) , on déduit que ϕ ((n + 1) t) = 0. Mais
prenant n ∈ N∗ tel que nt > t0 , on aboutit à une contradiction. On a donc
ϕ (t) > 0 pour tout t > 0.
(b) Pour tous x, y, z dans E, on a dϕ (y, x) = ϕ (d (y, x)) = ϕ (d (x, y)) =
dϕ (x, y) ; l’égalité dϕ (x, y) = ϕ (d (x, y)) = 0 est réalisée si, et seulement
si, d (x, y) = 0 d’après la question précédente, ce qui équivaut à x = y ;
dϕ (x, z) = ϕ (d (x, z)) avec d (x, z) ≤ d (x, y) + d (y, z) , donc dϕ (x, z) ≤
dϕ (x, y) + dϕ (y, z) .
2. Pour tout réel t fixé dans R+ , la fonction γ : t → ϕ (t + t ) − ϕ (t) − ϕ (t ) est
dérivable sur R+,∗ avec γ (t) = ϕ (t + t )−ϕ (t) ≤ 0 (ϕ est décroissante), donc
γ est décroissante sur R+ (elle est continue en 0) et on a γ (t) ≤ γ (0) = 0, soit
ϕ (t + t ) ≤ ϕ (t) + ϕ (t ) . De la question précédente, on déduit que dϕ = ϕ ◦ d
est une distance.
3. Les fonctions 1R+,∗ et t → min (t, 1) vérifiant les hypothèses de la première
question, on en déduit que :
0 si y = x 1 si d (x, y) > 1
1R+,∗ ◦d : (x, y) → et min (d, 1) : (x, y) →
1 si y = x d (x, y) si d (x, y) ≤ 1
20 Espaces métriques
t
sont des distances. Les fonctions t → et t → tα pour α ∈ ]0, 1[ vérifiant
1+t
d
les hypothèses de la deuxième question, on en déduit que et dα sont des
1+d
distances.
4.
(a) Pour tout y ∈ Bϕ (x, ϕ (r)) , on a dϕ (y, x) = ϕ (d (y, x)) < ϕ (r) , ce qui
implique que d (y, x) < r puisque ϕ est croissante (si d (y, x) ≥ r, on a alors
ϕ (d (y, x)) ≥ ϕ (r)), soit y ∈ B (x, r) . On a donc Bϕ (x, ϕ (r)) ⊂ B (x, r)
que ϕ soit continue ou pas en 0.
(b) Dans le cas où ϕ est continue en 0, pour r > 0 donné il existe r > 0
tel que |ϕ (t)| = |ϕ (t) − ϕ (0)| < r pour tout réel t tel que |t| < r , donc
pour tout y ∈ B (x, r ) , la condition d (y, x) < r entraîne que dϕ (y, x) =
ϕ (d (y, x)) < r, soit y ∈ Bϕ (x, r) . On a donc B (x, r ) ⊂ Bϕ (x, r) .
(c) Si O ⊂ E est ouvert non vide dans (E, d) et x ∈ O, il existe alors r > 0 tel
que B (x, r) ⊂ O, donc Bϕ (x, ϕ (r)) ⊂ O avec ϕ (r) > 0 et O est ouvert
dans (E, dϕ ) . Réciproquement si O est ouvert dans (E, dϕ ) et x ∈ O, il
existe alors r > 0 tel que Bϕ (x, r) ⊂ O et pour r > 0 tel que B (x, r ) ⊂
Bϕ (x, r) , on a B (x, r ) ⊂ O et O est ouvert dans (E, d) . Les distances d
et dϕ définissent donc la même topologie sur E.
Exercice 1.4. Montrer que tout fermé d’un espace métrique (E, d) peut
s’écrire comme l’intersection d’une suite décroissante d’ouverts et que tout
ouvert peut s’écrire comme la réunion d’une suite croissante de fermés.
Exercice 1.5. Soient (E, d) , (F, d ) deux espaces métriques, I une partie
non vide de E et Cb (I, F ) l’ensemble des fonctions continues et bornées de
I dans F.
1. Montrer que l’application d∞ définie par :
2
∀ (f, g) ∈ (Cb (I, F )) , d∞ (f, g) = sup d (f (x) , g (x))
x∈I 2
donc le réel d∞ (f, g) est bien défini. Il est clair que pour toutes fonctions f, g, h
dans Cb (I, F ) , on a d∞ (f, g) = d∞ (g, f ) , d∞ (f, h) ≤ d∞ (f, g) + d∞ (g, h)
et l’égalité d∞ (f, g) = 0 équivaut à d (f (x) , g (x)) pour tout x ∈ I, soit à
f (x) = g (x) pour tout x ∈ I, ou encore à f = g. L’application d∞ est donc
bien une distance sur Cb (I, F ) .
2. Soient (fn )n∈N une suite de Cauchy dans l’espace métrique (Cb (I, F ) , d∞ ) et ε
un réel strictement positif. Il existe un entier n0 tel que :
donc pour x fixé dans I, la suite (fn (x))n∈N est de Cauchy dans (F, d ) et en
conséquence converge vers un élément f (x) de F. Faisant tendre m vers l’infini
dans (1.3) , on en déduit que :
d (fn (x) , f (x)) ≤ d (fn (x) , fm (x)) + d (fm (x) , f (x)) ≤ ε + d (fm (x) , f (x))
pour tout m > n avec lim d (fm (x) , f (x)) = 0, ce qui donne en faisant
m→+∞
tendre m vers l’infini, d (fn (x) , f (x)) ≤ ε. Il en résulte que pour tous x, y
dans I, on a :
d (f (x) , f (y)) ≤ d (f (x) , fn0 (x)) + d (fn0 (x) , fn0 (y)) + d (fn0 (y) , f (y))
< 2ε + δ (fn0 (I)) < +∞
d (f (x) , f (y)) ≤ d (f (x) , fn0 (x)) + d (fn0 (x) , fn0 (y)) + d (fn0 (y) , f (y))
< 2ε + d (fn0 (x) , fn0 (y))
pour tous x, y dans I, on déduit que f est continue sur I. En définitive, f est
dans Cb (I) et de (1.4) , on déduit que d∞ (fn , f ) ≤ ε pour tout n ≥ n0 , ce qui
achève de prouver que (Cb (I, F ) , d∞ ) est complet.
Exercice 1.7. Soit (un )n∈N une suite dans un espace métrique (E, d) .
1. Montrer que la suite (un )n∈N est convergente si, et seulement si, les
suites extraites (u2n )n∈N et (u2n+1 )n∈N convergent vers une même li-
mite.
2. Montrer que la suite (un )n∈N est convergente si, et seulement si, les
suites extraites (u2n )n∈N et (u2n+1 )n∈N et (u3n )n∈N convergent.
3. Dans le cas où (un )n∈N est une suite périodique, montrer qu’elle converge
si, et seulement si, elle est constante.
Solution.
1. Supposons que (u2k )k∈N et (u2k+1 )k∈N convergent respectivement vers et .
Si = , alors (un )n∈N a au moins deux valeurs d’adhérence distinctes et en
conséquence ne peut converger. Si = , il existe alors, pour tout réel ε > 0,
des entiers k1 et k2 tels que :
Exercice 1.8. Soit (un )n∈N une suite dans un espace métrique (E, d) .
1. Montrer que si lim (un ) = , on a alors lim d (un+1 , un ) = 0. La
n→+∞ n→+∞
réciproque est-elle vraie ?
2. Montrer que si lim (un ) = , on a alors pour toute application stric-
n→+∞
tement croissante ϕ : N → N, lim d uϕ(n) , un = 0.
n→+∞
n
n
1
3. Montrer que, dans (R, |·|) , les suites ((−1) )n∈N , et
k
k=1 n∈N∗
(ln (n))n≥1 sont divergentes.
4. Montrer que, dans (R, |·|) , la suite réelle (ln (ln (n)))n≥2 est telle que
lim (u2n − un ) = 0 et divergente.
n→+∞
Solution.
1. Si lim (un ) = , on peut alors trouver, pour tout réel ε > 0, un entier n0 tel
n→+∞
que :
∀n > n0 , d (un+1 , un ) ≤ d (un+1 , ) + d (, un ) < ε
ce qui signifie que lim d (un+1 , un ) = 0. La réciproque est fausse comme le
n→+∞
√
montre l’exemple de la suite ( n)n∈N dans (R, |·|) . Cette suite est divergente
puisque non bornée et pour n ≥ 1, on a :
√ √ 1
lim n+1− n = lim √ √ =0
n→+∞ n→+∞ n+1+ n
On peut aussi considérer, plus généralement, la suite réelle (nα )n∈N avec α dans
]0, 1[ . Cette suite est divergente puisque non bornée et pour n ≥ 1, on a :
n+1
α n+1 α α
(n + 1) − n = α
[tα ]n = dt ≤ → 0
n t1−α n1−α n→+∞
1
n
n 1
3. Résulte de |un+1 − un | = 2, |v2n − vn | = ≥ = et |w2n − wn | =
n+k 2n 2
k=1
ln (2) , les notations étant évidentes. On peut remarquer que
pla deuxième
suite
1
est telle que pour tout p ≥ 1, lim (vn+p − vn ) = lim = 0.
n→+∞ n→+∞ n+k
k=1
4. On a :
ln (n) + ln (2) ln (2)
u2n − un = ln (ln (2n)) − ln (ln (n)) = ln = ln 1 +
ln (n) ln (n)
ln (2)
et comme tend vers 0 lorsque n tend vers l’infini, il en est de même
ln (n) n≥2
ln (2)
pour la suite (u2n − un )n≥2 = ln 1 + . Comme :
ln (n) n≥2
2 2 ln (n)
un2 − un = ln (ln n ) − ln(ln (n)) = ln = ln 2
ln (n)
Dans ces conditions l’intersection de toutes les boules Bn est non vide ré-
duite à un point.
Solution. Étant donné un réel ε > 0, il existe un entier n0 tel que 0 < rn < ε
pour tout n ≥ n0 . Du fait que pour m ≥ n, on a xm ∈ Bm ⊂ Bn , on déduit que :
ce qui signifie que la suite (xn )n∈N est de Cauchy dans (E, d) . Cet espace métrique
étant complet, la suite (xn )n∈N est convergente dans E. On note x sa limite. Pour
tout entier naturel n et tout entier m ≥ n, on a xm ∈Bn , la boule Bn étant fermée,
il en résulte que x = lim xm ∈ Bn . Donc x ∈ Bn et cette intersection est
m→+∞
n∈N
m≥n
non vide. Si y ∈ Bn , on a alors d (y, xn ) ≤ rn pour tout entier naturel n et
n∈N
y = lim xn = x, cette intersection est donc réduite au point x.
n→+∞
Chapitre 2
Espaces normés
Pour ce chapitre, E est un espace vectoriel (de dimension finie ou infinie) sur
le corps K des réels ou des complexes.
Le résultat qui suit nous dit qu’une semi-norme est nécessairement à valeurs
positives ou nulles et nous donne une formulation équivalente de l’inégalité trian-
gulaire souvent utile.
Preuve.
1. Pour tout x ∈ E, on a p (0) = p (0 · x) = 0 · p (x) = 0 et 0 = p (x − x) ≤ 2p (x) ,
donc p (x) ≥ 0.
2. L’ensemble p−1 {0} est non vide puisqu’il contient 0 et avec les propriétés d’une
semi-norme, on déduit facilement que c’est un sous-espace vectoriel de E.
3. Cette inégalité se déduit de p (x) = p (x − y + y) ≤ p (x − y) + p (y) et de
p (y) = p (y − x + x) ≤ p (x − y) + p (x) .
On vérifie facilement que l’inégalité 3. du théorème précédent est équivalente à
l’inégalité triangulaire.
Le sous-espace vectoriel p−1 {0} est le noyau de la semi-norme p.
26 Espaces normés
Définition 2.2. Une norme sur E est une semi-norme dont le noyau est
réduit à {0} .
Une norme sur E est notée x → x et le couple (E, ·) est un espace normé.
Exemples 2.1
1. Sur R, une norme est de la forme Nα : x → α |x| , où α est un réel strictement
positif. En effet il est clair que chaque Nα est une norme. Si N est une norme
sur R, on a alors α = N (1) > 0 et pour tout x ∈ R, N (x) = N (x · 1) =
|x| N (1) = α |x| .
2. Pour toute forme linéaire non nulle ϕ sur un R-espace vectoriel E, l’application
x → |ϕ (x)| définit une semi-norme sur E et c’est une norme si, et seulement
si, ker (ϕ) = {0} , ce qui équivaut à dire, en dimension finie, que E est de
dimension 1.
3. Pour toute forme bilinéaire symétrique positive ϕ sur un R-espace vectoriel
E, l’application p définie par p (x) = ϕ (x, x) pour tout x ∈ E définit une
semi-norme sur E et c’est une norme si, et seulement si, ϕ est définie positive
(i. e. est un produit scalaire). Cela résulte de l’inégalité de Cauchy-Schwarz,
|ϕ (x, y)| ≤ p (x) p (y) pour tous x, y dans E (voir le paragraphe 3.1).
4. Soient E un R-espace vectoriel de dimension finie et B = (ei )1≤i≤n une base
de E. Les applications définies par :
n
n
x∞ = max |xi | , x1 = |xi | , x2 = x2i
1≤i≤n
i=1 i=1
n
pour tout x = xi ei ∈ E, définissent des normes sur E (l’exercice 3.3).
i=1
5. Pour toute partie non vide I d’un espace normé E, en notant Fb (I) l’espace
des fonctions bornées de I dans R ou C, l’application f → f ∞ = sup |f (x)|
x∈I
définit une norme sur Fb (I) .
6. Sur l’espace vectoriel E = C 0 ([a, b] , K) des applications continues de [a, b] (pour
a < b) dans K = R ou C, les applications définies par :
b b
f ∞ = sup |f (x)| , f 1 = |f (t)| dt, f 2 = f 2 (t) dt
x∈I a a
On vérifie facilement qu’à partir d’une norme · sur E, on définit une distance
en posant d (x, y) = y − x pour tous x, y dans E.
Un espace vectoriel normé est naturellement muni d’une structure d’espace
vectoriel topologique, ce qui signifie que l’on peut associer à une norme sur E une
topologie (i. e. une famille d’ouverts) telle que les applications d’addition interne
et de multiplication externe soient continues.
Semi-normes et normes 27
Nous rappelons brièvement ce que deviennent les notions étudiées dans le cadre
des espaces métriques (chapitre 1), en désignant par (E, ·) et F, · deux
espaces vectoriels normés.
— Pour tout a ∈ E et tout r ∈ R+,∗ , B (a, r) = {x ∈ E | x − a < r} [resp.
B (a, r) = {x ∈ E | x − a ≤ r}] désigne la boule ouverte [resp. la boule
fermée] de centre a et de rayon r. En particulier, B (0, 1) est la boule unité
et S (0, 1) = {x ∈ E | x = 1} est la sphère unité.
— Une partie non vide A de (E, ·) est bornée s’il existe une constante λ > 0
telle que x ≤ λ pour tout x dans A, ce qui revient à dire qu’elle est
contenue dans une boule fermée centrée en 0.
— Un sous-ensemble O de (E, ·) est un ouvert s’il est vide ou s’il est non vide
et pour tout a dans O il existe un réel r > 0 tel que B (a, r) ⊂ O.
◦
— L’intérieur d’une partie A de (E, ·) est le plus grand ouvert A de E contenu
dans A.
— Un sous-ensemble F de (E, ·) est un fermé si son complémentaire dans E
est un ouvert de E.
— L’adhérence d’une partie A de (E, ·) est le plus petit fermé A de E conte-
nant A.
— Une suite (xn )n∈N d’éléments de (E, ·) est convergente s’il existe un élé-
ment de E tel que lim xn − = 0, un tel est unique. La convergence
n→+∞
de (xn )n∈N vers se traduit par :
— Soient I une partie non vide de (E, ·) et f une fonction définie sur I à
valeurs dans F, · . La fonction f est continue en α ∈ I si :
∀ε > 0, ∃η > 0 | (x ∈ I, x − α ≤ η) ⇒ f (x) − f (α) ≤ ε
Elle est continue sur I si elle est continue en tout point de I, ce qui équivaut
à dire que l’image réciproque par f de tout ouvert [resp. fermé] de F est
un ouvert [resp. fermé] de I ou encore que toute suite de points convergente
dans I est transformée par f en une suite convergente dans F.
— Si J est une partie non vide de F, on dit alors que f : I → J est est un
homéomorphisme si elle est continue bijective d’inverse f −1 continue.
— Une fonction f : I → F est uniformément continue sur I si :
∀ε > 0, ∃η > 0 | (x, y) ∈ I 2 , x − y ≤ η ⇒ f (x) − f (y) ≤ ε
ce qui équivaut à dire que pour toutes suites (xn )n∈N et (yn )n∈N d’éléments
de I telles que lim xn − yn = 0, on a lim f (xn ) − f (yn ) = 0.
n→+∞ n→+∞
— Dans le cas où I est compact, toute fonction continue sur I est uniformément
continue (théorème 1.19), f (I) est un compact de F, · (théorème 1.20)
et f, à valeurs réelles, est bornée et atteint ses bornes (théorème 1.21).
La notion de convergence d’une suite dépend a priori de la norme choisie sur
E. Considérons par exemple, dans C 0 ([0, 1] , R) muni des normes ·∞ et ·1 , la
suite de fonctions (fn )n∈N∗ définie sur [0, 1] par :
⎧
⎪
⎪ 2 1
⎨ n 1 − n x si x ∈ 0, n2
⎪
fn (x) =
⎪
⎪ 1
⎪
⎩ 0 si x ∈ , 1
n2
1
n2 1
Pour tout n ∈ N∗ , on a fn 1 = n 1 − n2 t dt = et fn ∞ = n, donc
0 2n
lim fn 1 = 0 et lim fn ∞ = +∞, c’est-à-dire que cette suite converge vers
n→+∞ n→+∞
la fonction nulle pour la norme ·1 et diverge pour la norme ·∞ .
La notion de continuité dépend aussi du choix des normes sur E et F. Par
exemple, la fonction f → f (0) est continue de C 0 ([0, 1] , R) muni de ·∞ dans
(R, |·|) , mais non continue sur C 0 ([0, 1] , R) muni de ·1 . La continuité de cette
application linéaire, pour la norme ·∞ , résulte de l’inégalité |f (0)| ≤ f ∞
vérifiée par toute fonction f dans C 0 ([0, 1] , R) . En considérant la suite de fonctions
(fn )n≥1 définie sur [0, 1] par :
⎧ 1
⎪
⎨ −nx + 1 si 0 ≤ x ≤
n
fn (x) =
⎪
⎩ 0 si 1 ≤ x ≤ 1
n
on vérifie que lim fn 1 = 0 et lim fn (0) = 1. L’application f → f (0) n’est
n→+∞ n→+∞
pas continue pour ·1 .
Semi-normes et normes 29
Définition 2.3. On dit qu’un espace vectoriel normé (E, ·) est complet,
ou que c’est un espace de Banach, si toute suite de Cauchy dans E est
convergente.
De ce résultat on déduit que tout espace vectoriel normé de dimension finie est
complet (corollaire 2.5).
On rappelle qu’une partie A d’un espace vectoriel réel E est convexe, si pour
tout couple (a, b) d’éléments de A, le segment [a, b] = {(1 − λ) a + λb | 0 ≤ λ ≤ 1}
est contenu dans A.
Théorème 2.2.
Un convexe dans un espace vectoriel normé est connexe.
Preuve. Si A est convexe dans E, pour a fixé dans A, il s’écrit A = [a, b] , avec
b∈A
[a, b] connexe, pour tout b ∈ A, comme image du connexe [0, 1] par l’application
continue t → (1 − t) a + tb (lemme 1.1 et théorème 1.22). L’ensemble A est donc
connexe comme réunion de connexes d’intersection non vide.
On peut aussi utiliser le corollaire 1.1. Si f : A → {0, 1} est continue, pour tous
x = y dans A la fonction ϕ : t → f ((1 − t) x + ty) est continue du connexe [0, 1]
dans {0, 1} , donc constante et f (x) = ϕ (0) = ϕ (1) = f (y) , donc f est constante
et A est connexe.
Définition 2.4. On dit qu’une partie A de E est connexe par arcs, si pour
tout couple (a, b) d’éléments de A il existe une application continue γ de
[0, 1] dans A telle que γ (0) = a et γ (1) = b (deux points quelconques de A
peuvent être joints par un arc continu dans A).
30 Espaces normés
Théorème 2.3.
Un ensemble connexe par arcs dans E est connexe.
Preuve. Si A est connexe par arcs dans E, pour a fixé dans A en désignant
tout x ∈ A par γx un arc continu joignant a et x dans A, on a alors A =
pour
γx ([0, 1]) , avec γx ([0, 1]) connexe pour tout x ∈ A, comme image du connexe
x∈A
[0, 1] par l’application continue γx . L’ensemble A est donc connexe comme réunion
de connexes ayant tous en commun le point a = γx (0) (théorème 1.23).
Preuve. (1) ⇒ (2) Si u est continue en 0, il existe alors, pour tout ε > 0, un réel
η > 0 tel que :
(x ∈ E, x ≤ η) ⇒ u (x) ≤ ε
Utilisant la linéarité de u on déduit que pour x, y dans E tels que x − y ≤ η on
a u (x) − u (y) ≤ ε, ce qui prouve l’uniforme continuité de f sur E.
(2) ⇒ (3) est évidente.
(3) ⇒ (4) Si u est continue sur E elle est en particulier continue en 0 et il existe
un réel η > 0 tel que :
(x ∈ E, x ≤ η) ⇒ u (x) ≤ 1
Pour tout x ∈ S (0, 1) [resp. tout x ∈ B (0, 1)], on a ηx = η [resp. ηx ≤ η] et
1
avec la linéarité de u on déduit que u (x) ≤ , ce qui signifie que u est bornée
η
sur S (0, 1) [resp. sur B (0, 1)].
(4) ⇒ (5) Si u est bornée sur S (0, 1) [resp. sur B (0, 1)], il existe alors un réel
λ > 0 tel que u (x) ≤ λ pour tout x ∈ E tel que x = 1 [resp. x ≤ 1]. En
Applications linéaires continues 31
1
remarquant que pour tout vecteur x non nul dans E le vecteur x est dans la
x
sphère (et la boule) unité de (E, ·) et en utilisant la linéarité de u on déduit que
u (x) ≤ λ x , cette inégalité étant aussi vérifiée pour x = 0.
(5) ⇒ (1) est évidente.
Une application linéaire continue est donc caractérisée par le fait d’être bornée
sur la sphère unité. Pour cette raison une telle application est également appelée
opérateur borné et la norme d’un tel opérateur borné est définie par N (u) =
sup u (x) .
x∈S(0,1)
Comme tout vecteur x de E s’écrit de manière unique x = u−1 (y) avec y dans F,
on déduit des inégalités précédentes que :
1
∀x ∈ E, x ≤ u (x) ≤ β x
γ
(2) ⇒ (3) Cette implication est évidente.
(3) ⇒ (1) Les inégalités u (x) ≤ β pour tout x ∈ S (0, 1) signifient que
l’application linéaire u est continue. En remarquant que pour tout vecteur x non
1
nul dans E le vecteur x est dans la sphère unité S (0, 1) et en utilisant la
x
linéarité de u on déduit de l’assertion 3. que :
∀x ∈ E \ {0} , α x ≤ u (x) ≤ β x
ces encadrements étant encore valables pour x = 0. Si u (x) = 0 on a alors né-
cessairement x = 0, (α > 0), c’est-à-dire que l’application linéaire u est injective.
Cette application étant supposée surjective, on déduit que c’est un isomorphisme
de E sur F. Tout vecteur x de E s’écrivant de manière unique x = u−1 (y) avec
y dans F, les inégalités α x ≤ u (x) pour tout x dans E sont équivalentes à
−1 1
u (y) ≤ y pour tout y dans F, ce qui équivaut à la continuité de u−1 .
α
Le lemme qui suit nous est utile pour donner une caractérisation des formes
linéaires continues sur (E, ·) .
32 Espaces normés
Lemme 2.2 Si ϕ est une forme linéaire non nulle sur E, il existe alors un vecteur
non nul a dans E tel que E = ker (ϕ) ⊕ Ka.
Preuve. La forme linéaire ϕ étant non nulle, il existe a ∈ E \{0} tel que ϕ (a) = 0.
ϕ (x)
Pour tout vecteur x ∈ E, le vecteur h = x − a, est dans le noyau de ϕ et
ϕ (a)
ϕ (x)
en écrivant que x = h + a on déduit que E = ker (ϕ) + Ka. Si x est dans
ϕ (a)
ker (ϕ) ∩ Ka, on a alors x = λa et λϕ (a) = ϕ (x) = 0 avec ϕ (a) = 0, ce qui
entraîne λ = 0 et x = 0. On a donc ker (ϕ) ∩ Ka = {0} et E = ker (ϕ) ⊕ Ka.
Théorème 2.5.
Une forme linéaire ϕ sur E est continue si, et seulement si, son noyau
ker (ϕ) est fermé dans (E, ·) .
Preuve. Le résultat étant évident pour ϕ = 0, on suppose que ϕ est non nulle.
Si ϕ est une forme linéaire continue sur E, son noyau ker (ϕ) est alors fermé
comme image réciproque du fermé {0} par l’application continue ϕ. Supposons
réciproquement que ker (ϕ) soit fermé dans (E, ·) . Dire que ϕ est non continue
équivaut à dire qu’elle n’est pas bornée sur la sphère unité S (0, 1) de (E, ·)
(théorème 2.4). Dans ce cas on peut trouver une suite (xn )n∈N d’éléments de
S (0, 1) telle que |ϕ (xn )| ≥ n pour tout n ∈ N. En utilisant une décomposition
E = ker (ϕ) ⊕ Ka où ϕ (a) = 0, on écrit pour tout entier n, xn = yn + λn a
ϕ (xn )
avec yn ∈ ker (ϕ) et λn = ∈ K. Pour n ≥ 1 on a |ϕ (xn )| ≥ n > 0 et
ϕ (a)
1 1
a = xn + zn avec zn = − yn ∈ ker (ϕ) . Mais on a alors pour tout entier
λn λn
xn 1 |ϕ (a)| |ϕ (a)|
n ≥ 1, a − zn = = = ≤ , ce qui implique que, a qui
|λn | |λn | |ϕ (xn )| n
n’appartient pas à ker (ϕ) , est limite d’une suite de points de ker (ϕ) , soit une
contradiction avec ker (ϕ) fermé. On a donc ainsi montré que si ker (ϕ) est fermé
dans (E, ·) , ϕ est alors continue.
Le lemme qui suit nous est utile pour donner une caractérisation des application
linéaires de rang fini de E dans F qui sont continues.
Preuve. Si u est de rang r, son image Im (u) est alors un sous-espace vectoriel de
F de dimension r et, désignant par (ai )1≤i≤n une base de Im (u) , on peut trouver
pour tout x dans E, des scalaires uniquement déterminés ϕ1 (x) , · · · , ϕr (x) tels
r
que u (x) = ϕi (x) ai . De la linéarité de u et de l’unicité de l’écriture d’un vecteur
i=1
dans une base on déduit que les applications ϕi sont linéaires. Supposons la famille
Applications linéaires continues 33
r
(ϕi )1≤i≤r liée dans le dual algébrique E ∗ de E avec, par exemple, ϕ1 = λ i ϕi .
i=2
On a alors, pour tout x dans E :
r
r
r
u (x) = λi ϕi (x) a1 + ϕi (x) ai = ϕi (x) (λi a1 + ai )
i=2 i=2 i=2
Lemme 2.4 Soit H un sous-espace vectoriel fermé de (E, ·) . Pour tout a ∈ E,
l’espace K = H + Ka est fermé dans (E, ·) .
Théorème 2.7.
Une application linéaire de rang fini u : E → F est continue si, et seule-
ment si, son noyau est fermé dans (E, ·) .
Preuve. Si u est continue, ker (u) est alors fermé dans (E, ·) comme image
réciproque du fermé {0} de F, · par l’application continue u. Réciproquement
supposons que ker (u) soit fermé dans (E, ·) . L’application linéaire u étant de
rang fini, il existe des formes linéaires ϕ1 , · · · , ϕr , linéairement indépendantes dans
r
∗
E et une famille libre (ai )1≤i≤r dans F tels que u = ϕi ai (lemme 2.3). On
i=1
r
a alors ker (u) = ker (ϕj ) ⊂ ker (ϕj ) pour tout j compris entre 1 et r. On
j=1
peut écrire que ker (ϕj ) = ker (u) ⊕ Hj et la restriction de u à Hj est injective
(u (x) = 0 et x ∈ Hj équivaut à x ∈ ker (u) ∩ Hj ) de Hj dans Im (u) qui est
de dimension finie. En définitive, pour tout j compris entre 1 et r le sous-espace
vectoriel Hj est de dimension finie dans E et avec le théorème 2.6 on déduit que
ker (ϕj ) = ker (u) ⊕ Hj est fermé et donc que la forme linéaire ϕj est continue. La
r
continuité de u = ϕi ai en résulte alors immédiatement.
i=1
Définition 2.5. On dit que deux normes · et · sur E sont équivalentes
si l’application identité est un homéomorphisme de (E, ·) sur E, · .
Exemples 2.2
1. Les normes ·∞ , ·1 et ·2 sur Rn sont équivalentes.
2. Les normes ·1 et ·∞ sur C 0 ([0, 1] , R) ne sont pas équivalentes car nous
avons trouvé un peu plus haut une suite de fonctions qui converge vers la fonc-
tion nulle pour la norme ·1 et diverge pour la norme ·∞ .
Lemme 2.5 Soient E est un espace vectoriel de dimension n ≥ 1, (ei )1≤i≤n une
base de E et ·∞ la norme définie sur E par :
n
∀x = xi ei ∈ E, x∞ = max |xi |
1≤i≤n
i=1
Preuve. Soit x(k) k∈N une suite dans B∞ [resp. S∞ ] avec, pour tout k ∈ N,
# $
. Pour tout j compris entre 1 et n on a xj ≤ x(k) ∞ ≤ 1.
(k) (k)
x(k) = xj
1≤j≤n # $ # $
(k) (ϕ (k))
De la suite réelle bornée x1 on peut extraire une sous-suite x1 1
k∈N k∈N
qui converge vers un scalaire
# x$1 vérifiant |x1 | ≤ 1 (Bolzano-Weierstrass).
# Puis$ de
(ϕ1 (k)) (ϕ2 (k))
la suite réelle bornée x2 on peut extraire une sous-suite x2
k∈N k∈N
qui converge vers un scalaire x2 vérifiant |x2 | ≤ 1. En continuant ainsi on extrait
une suite x(ϕ(k)) k∈N telle que :
(ϕ(k))
∀j ∈ {1, 2, · · · , n} , lim xj = xj
k→+∞
avec |xj | ≤ 1. On a alors lim x(ϕ(k)) − x∞ = 0 où x = (xj )1≤j≤n est dans B∞
k→+∞
[resp. S∞ ], c’est-à-dire que la suite x(ϕ(k)) k∈N converge vers x dans B∞ [resp.
S∞ ]. On a donc ainsi montré que B∞ [resp. S∞ ] est compacte dans (E, ·∞ ) .
Lemme 2.6 Soient (E, ·) un espace vectoriel normé et H un sous-espace vec-
toriel fermé de E distinct de E. Pour tout réel ε > 0 il existe un vecteur x dans
la sphère unité S (0, 1) de (E, ·) tel que d (x, H) ≥ 1 − ε.
1 d (y, H)
dans H, de sorte que x − t = y − u ≥ > 1 − ε. On a donc
y − z y − z
d (x, H) = inf x − t ≥ 1 − ε.
t∈H
Le théorème qui suit donne plusieurs caractérisations des K-espaces vectoriels
de dimension finie.
Théorème 2.9.
Soit E un K-espace vectoriel. Les assertions suivantes sont équivalentes :
1. E est de dimension finie ;
2. toutes les normes sur E sont équivalentes ;
3. quelle que soit la norme choisie sur E toute forme linéaire définie sur
(E, ·) est continue ;
4. quelle que soit la norme choisie sur E, la sphère [resp. boule] unité de
(E, ·) pour cette norme est compacte ;
5. quelle que soit la norme choisie sur E, les compacts de (E, ·) sont les
fermés bornés.
Preuve. (1) ⇒ (2) On suppose que E est de dimension finie et on se donne deux
normes · et · sur E. L’application linéaire Id : (E, ·) → E, · [resp.
Id : E, · → (E, ·)] est de rang fini à noyau fermé, elle est donc continue
(théorème 2.7). L’application Id : (E, ·) → E, · est donc un homéomor-
phisme, c’est-à-dire que les normes · et · sont équivalentes sur E.
(2) ⇒ (3) On suppose que toutes les normes sur E sont équivalentes. Si · est
une norme sur E et ϕ une forme linéaire sur E, l’application N : x → x + |ϕ (x)|
définit alors une norme sur E, donc équivalente à · et il existe une constante
α > 0 telle que N (x) ≤ α x pour tout x ∈ E. On a donc |ϕ (x)| ≤ (α − 1) x
pour tout x ∈ E, ce qui équivaut à la continuité de la forme linéaire ϕ.
(3) ⇒ (1) On suppose que quelle que soit la norme choisie sur E toute forme
linéaire sur E est continue. Si (E, ·) est de dimension infinie on peut trouver un
système libre infini dénombrable (en )n∈N tel que en = 1 pour tout n ∈ N. En
désignant par G un supplémentaire dans E de H = Vect {en | n ∈ N} on définit
la forme linéaire ϕ sur E par ϕ (x) = 0 pour tout x ∈ G et ϕ (en ) = n pour
tout n ∈ N. L’application linéaire ainsi définie n’est pas bornée sur la sphère unité
de (E, ·) et en conséquence n’est pas continue, ce qui est en contradiction avec
l’hypothèse de départ. L’espace vectoriel E est donc de dimension finie.
On a donc ainsi montré que les assertions (1) , (2) et (3) sont équivalentes. En
particulier si (3) est vérifiée alors toutes les normes sur E sont équivalentes et la
compacité de la sphère [resp. boule] unité de (E, ·) résulte de la compacité de la
sphère [resp. boule] unité de (E, ·∞ ) (lemme 2.5).
(4) ⇒ (5) On suppose que quelle que soit la norme choisie sur E, la sphère [resp.
boule] unité de E pour cette norme est compacte. On sait déjà que toute partie
compacte d’un espace vectoriel normé (E, ·) est fermée et bornée (théorème
1.10). Réciproquement soit C une partie non vide fermée et bornée dans (E, ·) .
Il existe une constante λ > 0 telle que x ≤ λ pour tout x dans C et pour
Exercices 37
1
toute suite (xn )n∈N de points de C, la suite xn est dans la boule unité de
λ n∈N
1
(E, ·) , cette boule étant compacte, on peut extraire une sous-suite xϕ(n)
λ n∈N
qui converge vers y ∈ E. La suite xϕ(n) n∈N converge alors vers x = λy et x ∈ C
puisque C est fermé. On a donc ainsi montré que C est compact dans (E, ·) .
(5) ⇒ (1) On suppose que quelle que soit la norme choisie sur E, les compacts
de (E, ·) sont les fermés bornés. Si E est de dimension infinie on peut trouver
un système libre infini dénombrable (en )n∈N . Pour tout entier n, on désigne par
En le sous-espace vectoriel de E engendré par (ek )1≤k≤n . On a alors Ep Eq
pour q > p. De plus chaque En est de dimension finie dans E, donc fermé dans
E et aussi dans En+1 . En utilisant le lemme 2.6, on peut construire une suite
1
(xn )n≥1 dans la sphère unité de (E, ·) telle que xn ∈ En et d (xn , En−1 ) ≥
2
1
pour tout n ≥ 1. Mais alors, on a xq − xp ≥ d (xq , Eq−1 ) ≥ pour q > p et il
2
est impossible d’extraire de la suite (xn )n≥1 une sous-suite convergente, ce qui est
en contradiction avec la compacité de la sphère unité (c’est un fermé borné) de
(E, ·) . L’espace vectoriel E est donc nécessairement de dimension finie.
L’équivalence (1) ⇔ (5) est le théorème de Riesz. De ce résultat et du théorème
1.11, on déduit que dans un espace vectoriel normé de dimension finie, une suite est
convergente si, et seulement si, elle est bornée et a une unique valeur d’adhérence
(une suite bornée est à valeur dans une boule fermée B (0, R) qui est compacte).
On peut donc conclure que sur un espace vectoriel de dimension finie on a une
seule topologie compatible avec la structure d’espace vectoriel.
Preuve. En reprenant les notations précédentes il suffit de montrer que (E, ·∞ )
est complet, ce qui se déduit immédiatement du fait que K est complet.
2.4 Exercices
1 1
Exercice 2.1. Soient p, q deux réels dans R+,∗ tels que + = 1.
p q
1. En utilisant la concavité de la fonction ln, montrer que :
p
1 |xi |
2. Soient x et y dans Rn . En utilisant (2.1) avec λ = , ui = %
n et
p p
|xj |
j=1
q
|yi |
vi = %
n pour x et y non nuls montrer l’inégalité de Hölder :
q
|yj |
j=1
p1 q1
n
n
p
n
q
x i yi ≤ |xi | |yi |
i=1 i=1 i=1
p1
n
p
4. Montrer que, pour p ≥ 1, l’application x → xp = |xi | définit
i=1
une norme sur Rn .
5. L’application x → xp définit-elle une norme sur Rn pour p ∈ ]0, 1[ ?
Solution.
1. Voir le lemme 8.1.
p1 q1
n
p
n
q
2. Pour x, y dans Rn on note xp = |xi | et yq = |yi | .
i=1 i=1
1 1 1 1 1 1
Prenant λ = dans (2.1) , on a 1 − λ = et u p v q ≤ u + v pour u, v positifs
p q p q
ou nuls. Si x et y sont deux vecteurs non nuls dans Rn , prenant pour i compris
p p q q
|xi | |xi | |yi | |yi |
entre 1 et n, ui = % = p et v i = % = q dans l’inégalité
n
p xp n
q yq
|xj | |yj |
j=1 j=1
p q
|xi | |yi | 1 |xi | 1 |yi |
précédente on obtient, ≤ p+ . Faisant la somme de toutes
xp yq p xp q yqq
1 n
1 |xi |
n p
1 |yi |
n q
ces inégalités on obtient, |xi | |yi | ≤ + . Puis
xp yq i=1 p i=1 xpp q i=1 yqq
n
|xi |
p n
|yi |
q
1 1
avec p = q = 1 et + = 1 on déduit que :
i=1
x p i=1
y q p q
n
n
x i yi ≤ |xi | |yi | ≤ xp yq
i=1 i=1
Exercices 39
p1 q1
n
p−1
n
p
n
p
soit avec (p − 1) q = p, |xi | |xi + yi | ≤ |xi | |xi + yi | .
i=1 i=1 i=1
4. On vérifie facilement que x → x1 définit une norme sur Rn . On suppose donc
1 1
que p > 1 et on note q le réel défini par + = 1. Pour x, y dans Rn on a :
p q
n
p
n
p−1
n
p−1
|xi + yi | ≤ |xi + yi | |xi | + |xi + yi | |yi |
i=1 i=1 i=1
p
soit avec p − = 1, x + yp ≤ xp + yp . On a donc l’inégalité triangulaire
q
pour ·p . Les autres propriétés d’une norme se vérifient facilement.
5. Pour 0 < p < 1, l’inégalité triangulaire n’est pas vérifiée. Notant (ei )1≤i≤n la
1
base canonique de Rn , on a e1 + e2 p = 2 p > e1 p + e2 p = 2.
Solution.
1. Pour p = 1, on sait déjà que f → f 1 définit une norme sur E. On suppose
donc que p > 1 et on se donne deux fonctions f, g non identiquement nulles
1 1 1 1
dans E. On applique l’inégalité de convexité u p v q ≤ u + v où q est tel que
p q
p q
1 1 |f (t)| |g (t)|
+ = 1, à u = p , v = q pour tout t dans [a, b] , ce qui donne,
p q f p gq
40 Espaces normés
p q
|f (t)| |g (t)| 1 |f (t)| 1 |g (t)|
≤ p + . En intégrant sur [a, b] on obtient :
f p gq p f p q gqq
b
1 1 1
|f (t)| |g (t)| dt ≤ + = 1
f p gq a p q
b b
D’où l’inégalité de Hölder, f (t) g (t) dt ≤ |f (t)| |g (t)| dt ≤ f p gq ,
a a
cette inégalité étant encore réalisée pour f = 0 ou g = 0. Pour f, g dans E on
a, en utilisant l’inégalité de Hölder :
b
p−1 p−1
|f (t)| |f (t) + g (t)| dt ≤ f p (f + g)
a q
b p
p−1
soit avec (p − 1) q = p, |f (t)| |f (t) + g (t)| dt ≤ f p f + gpq , cette
a
inégalité étant encore valable en permutant les rôles de f et g. On en déduit
b # $ p
p p
que f + gp = |f (t) + g (t)| dt ≤ f p + gp f + gpq , soit compte
a
p
tenu de p − = 1, f + gp ≤ f p + gp . On a donc l’inégalité triangulaire
q
pour ·p . Les autres propriétés d’une norme se vérifient facilement.
2. On suppose f non identiquement nulle. On a
1
0 ≤ |f (x)| ≤ f ∞ ⇒ 0 ≤ f p ≤ f ∞ (b − a) p
Soit x0 ∈ [a, b] tel que |f (x0 )| = f ∞ et, pour ε > 0 donné, il existe η > 0 tel
que 0 ≤ |f (x0 )| − |f (x)| < ε pour x ∈ [0, 1] ∩ [x0 − η, x0 + η]. On a alors, en
notant α la longueur de l’intervalle [0, 1] ∩ [x0 − η, x0 + η] :
b
p p
|f (x)| dx ≥ |f (x)| dx
a [a,b]∩[x0 −η,x0 +η]
p p
≥ (|f (x0 )| − ε) dx ≥ α (f ∞ − ε)
[a,b]∩[x0 −η,x0 +η]
Solution.
1. La forme linéaire ϕ : f ∈ E → f (t0 ) est telle que |ϕ (f )| = |f (t0 )| ≤ f ∞ ,
donc continue. Il en résulte que A = ϕ−1 {0} est fermé dans (E, ·∞ ) comme
image réciproque du fermé {0} de (R, |·|) . Cet ensemble n’est pas ouvert car la
1
suite de fonctions (fn )n∈N définie par fn (t) = est une suite d’éléments
n+1
de E \ A qui converge vers f = 0 ∈/ E \ A.
2. Si (fn )n∈N est une suite de fonctions dans E toutes croissantes qui converge
vers f ∈ E pour ·∞ , on a alors pour tous x ≤ y dans [0, 1] :
donc f ∈ B. L’ensemble B est donc fermé. Cet ensemble n’est pas ouvert car la
sin (6t)
suite de fonctions (fn )n∈N définie par fn (t) = est une suite d’éléments
n+1
de E \ B qui converge vers f = 0 ∈ / E \ B. De manière analogue, on vérifie que
l’ensemble B des fonctions décroissantes est fermé non ouvert dans (E, ·∞ ) .
3. Soit (fn )n∈N est une suite de fonctions dans E toutes monotones qui converge
vers f ∈ E pour ·∞ . S’il n’y a qu’un nombre fini d’indices n pour lesquels
fn est croissante [resp. décroissante], il existe alors un entier n0 tel que la
suite (fn )n≥n0 soit à valeurs dans B [resp. dans B] et f = lim fn ∈ B [resp.
n→+∞
n≥n0
f = lim fn ∈ B], donc f est monotone. Dans le cas contraire, on peut extraire
n→+∞
n≥n0
une suite fϕ(n) n∈N à valeurs dans B et une suite fψ(n) n∈N à valeurs dans B
et f = lim fϕ(n) = lim fψ(n) est à la fois croissante et décroissante, donc
n→+∞ n→+∞
constante et en particulier monotone. L’ensemble C est donc fermé. L’exemple
sin (6t)
de fn (t) = nous montre que cet ensemble n’est pas ouvert.
n+1
2
1 1
4. La suite (fn )n∈N∗ de fonctions dérivables définies par fn (t) = t− +
2 n
1
sur [0, 1] converge vers f : t → t − dans E, cette fonction n’étant pas
2
1 1 1 1
dérivable en (|fn (t) − f (t)| = & ≤ √ ). Donc D
2 n 1 2 1 1 n
t− 2 + n + t− 2
n’est pas fermé. Cet ensemble n’est pas ouvert car la suite de fonctions (fn )n∈N
42 Espaces normés
t − 12
définie par fn (t) = est une suite d’éléments de E \ D qui converge vers
n+1
f =0∈
/ E \ D.
Solution.
1. On a f ≥ 0, λf = |λ| f et f + g ≤ f + g pour tout λ ∈ R et
tous f, g dans E. L’égalité f = 0 équivaut à f = 0 et f (0) = 0, donc à
f = f (0) = 0.
2. Pour toute fonction f ∈ E, on a :
x
|f (x)| = f (0) + f (t) dt ≤ |f (0)| + f ∞
0
Solution.
1. Pour λ ∈ R et f, g dans E1 , on a clairement Nk (λf ) = |λ| Nk (f ) et Nk (f + g) ≤
Nk (f ) + Nk (g) pour k = 1 et k = 2 (linéarité de f → f et f → af ajoutée
au fait que ·∞ est une norme). L’égalité N1 (f ) = 0 entraîne f = 0, donc
f = f (0) = 0. L’égalité N2 (f ) = 0 équivaut à f +af = 0, soit à f (t) = λe−A(t) ,
où A est la primitive nulle en 0 de a et λ = f (0) = 0, donc f = 0.
2. Il existe α ∈ [0, 1] et c ∈ [0, α] tels f ∞ = |f (α)| = |f (α) − f (0)| =
α |f (c)| ≤ f ∞ ≤ N1 (f ) (théorème des accroissements finis).
3. En considérant la suite de fonctions (fn )n∈N∗ définie par fn (t) = tn , on a
fn ∞ = 1 et N1 (fn ) ≥ fn ∞ = n, il ne peut donc exister de constante β > 0
telle que N1 ≤ β ·∞ . Les normes ·∞ et N1 ne sont donc pas équivalentes.
4. La fonction g est dans E1 avec g (t) = e
A(t)
(f (t)+ a (t) f (t)) pour tout
t ∈ [0, 1] , donc |g (t)| ≤ eA ∞ f + af ∞ = eA ∞ N2 (f ) . En utilisant
le théorème des accroissements finis, on en déduit que pour tout x ∈ [0, 1] , il
existe cx ∈ [0, x] tel que |g (x)| = |g (x) − g (0)| = |g (cx )| ≤ eA ∞ N2 (f ) et
en conséquence, on a :
|f (x)| = g (x) e−A(x) ≤ e−A ∞ |g (x)| ≤ e−A ∞ eA ∞ N2 (f )
donc f ∞ ≤ e−A ∞ eA ∞ N2 (f ) .
5. Pour tout f ∈ E1 , on a N2 (f ) = f + af ∞ ≤ f ∞ + af ∞ = N1 (f ) et :
N1 (f ) = f ∞ + af ∞ = f + af − af ∞ + af ∞
A
≤ f + af + 2 a f ≤ 1 + 2 a e−A
∞ ∞ ∞ ∞ ∞
e
∞
N2 (f )
1. Montrer que les normes · et ·∞ sont équivalentes, puis que (E, ·)
est un espace de Banach.
2. Montrer que l’ensemble F = {f ∈ E | f (0) = 0} est un sous-espace vec-
toriel fermé de (E, ·) .
3. On désigne par f1 la fonction constante égale à 1 sur [0, 1] . Montrer que
f1 − f > 1 pour tout f ∈ F, que d (f1 , F ) = inf f1 − f = 1 et que
f ∈F
cette distance n’est pas atteinte.
Solution.
1. Avec f ∞ ≤ f ≤ 2 f ∞ pour tout f ∈ E, on déduit que les normes · et
·∞ sont équivalentes. Sachant que (E, ·∞ ) est complet, on en déduit que
(E, ·) est un espace de Banach.
2. Pour f ∈ E, on a |f (0)| ≤ f ∞ ≤ f , donc la forme linéaire ϕ : f → f (0)
est continue et F = ker (ϕ) = ϕ−1 {0} est un sous-espace vectoriel fermé de
(E, ·) .
3.
(a) Pour toute fonction f ∈ F, on a |f1 − f | = |1 − f | = 0 (puisque f (0) = 0)
1
la fonction |1 − f | étant continue, donc f1 − f 1 = |1 − f (t)| dt > 0
0
et :
(b) Pour tout réel ε ∈ ]0, 1[ , on désigne par fε la fonction affine par morceaux
et continue définie par :
3.
(a) Montrer que pour tout réel α > 0 et tout x ∈ [0, 1] , on a :
n
1
Bn,k (x) ≤
4α2 n
k=0
| nk −x|≥α
(la somme étant nulle quand l’ensemble des entiers k compris entre
k
0 et n tels que − x ≥ α est vide).
n
(b) Montrer que, pour toute fonction f ∈ E, la suite (Bn (f ))n∈N∗
converge uniformément vers f sur [0, 1] .
4. Montrer que toute fonction continue, f : [a, b] → R, est limite uniforme
sur [a, b] d’une suite de polynômes (théorème de Weierstrass).
5. Montrer que si une fonction f est limite uniforme sur R d’une suite de
fonctions polynomiales, c’est alors une fonction polynomiale (le théorème
de Weierstrass n’est pas valable sur R).
6.
(a) Montrer qu’une fonction f ∈ E est limite uniforme sur [0, 1] d’une
suite de polynômes à coefficients entiers relatifs si, et seulement si,
f (0) et f (1) sont entiers relatifs.
46 Espaces normés
1
(b) En déduire que, pour tout réel δ ∈ , l’anneau Z [x] des
0,
2
fonctions polynomiales à coefficients entiers relatifs est dense dans
C 0 ([δ, 1 − δ]) , ·∞ .
Solution.
1. Pour n ∈ N∗ et 0 ≤ k ≤ n, on a :
⎧ n−1
⎪
⎪ −n (1 − x) si k = 0
⎨
n k−1 n−k−1
Bn,k (x) = x (1 − x) (k − nx) si 1 ≤ k ≤ n − 1
⎪
⎪ k
⎩
nxn−1 si k = n
donc x (1 − x) Bn,k (x) = (k − nx) Bn,k (x) . Il en résulte que pour f ∈ E, on
a:
n n
x (1 − x) k k k
(Bn (f )) = f Bn,k (x) − x f Bn,k (x)
n n n n
k=0 k=0
= Bn (xf ) − xBn (f )
2.
(a) Pour tout réel x, on a :
n
n n−k n
Bn (e0 ) (x) = xk (1 − x) = (x + 1 − x) = 1
k
k=0
3.
2
k 1 k
(a) Pour x ∈ [0, 1] et 0 ≤ k ≤ n tel que x − ≥ α, on a 1 ≤ 2 −x ,
n α n
donc :
n n 2
1 k
Bn,k (x) ≤ 2 − x Bn,k (x)
α n
k=0 k=0
|n |
k
−x ≥α |n |
k
−x ≥α
n 2
1 k 1 x (1 − x) 1
≤ 2 − x Bn,k (x) = 2 ≤
α n α n 4α2 n
k=0
1
(la fonction x → x (1 − x) atteint son maximum en ).
2
(b) En utilisant l’égalité Bn (e0 ) = 1, on a pour tout x ∈ [0, 1] :
n
k
Bn (f ) (x) − f (x) = f − f (x) Bn,k (x)
n
k=0
2 f ∞ n
f ∞
≤ +ε Bn,k (x) = +ε
4α2 n 2α2 n
k=0
f ∞
soit Bn (f ) − f ∞ ≤ + ε. Désignant par n0 un entier non nul tel
2α2 n
f ∞
que < ε pour tout n ≥ n0 , on déduit que Bn (f ) − f ∞ < 2ε pour
2α2 n
tout n ≥ n0 , donc (Bn (f ))n∈N∗ converge uniformément vers f sur [0, 1] .
4. Si f est une fonction continue sur [a, b] , la fonction g définie sur [0, 1] par
g (t) = f (a + t (b − a)) est continue, donc la suite de fonctions polynomiales
(Bn (g))n∈N∗ converge uniformément vers g sur [0, 1] et la suite de fonctions
x−a
polynomiales (Pn )n∈N∗ définie par Pn (x) = Bn (g) converge unifor-
b−a
x−a
mément vers la fonction x → g = f (x) sur [a, b] .
b−a
48 Espaces normés
Puis avec :
f − Pn (f )∞ ≤ f − Bn (f )∞ + Bn (f ) − Pn (f )∞
1
≤ f − Bn (f )∞ +
n
et la convergence uniforme de (Bn (f ))n∈N∗ vers f, on déduit que la suite
(Pn (f ))n∈N∗ converge uniformément vers f sur [0, 1] .
(b) Une fonction f ∈ C 0 ([δ, 1 − δ]) se prolongeant en une fonction f ∈ E nulle
en 0 et en 1, on en déduit que Z [x] est dense dans C 0 ([δ, 1 − δ]) , ·∞ .
Chapitre 3
Espaces préhilbertiens
On s’intéresse ici aux espaces vectoriels normés particuliers que sont les espaces
préhilbertiens. Cette étude nous sera utile pour celle des polynômes orthogonaux
(chapitre 15).
Pour ce chapitre, E est un espace vectoriel réel.
On rappelle qu’une forme bilinéaire sur E est une application :
ϕ: E×E → R
(x, y) → ϕ (x, y)
telle que pour tout x ∈ E l’application y → ϕ (x, y) est linéaire et pour tout y ∈ E
l’application x → ϕ (x, y) est linéaire. On dit que ϕ est :
— symétrique si ϕ (x, y) = ϕ (y, x) pour tous x, y dans E ;
— positive si ϕ (x, x) ≥ 0 pour tout x dans E ;
— définie si pour x dans E l’égalité ϕ (x, x) = 0 équivaut à x = 0.
Définition 3.1. Un produit scalaire sur E est une forme bilinéaire symé-
trique définie positive.
Exemples 3.1
1. Soient E de dimension n ≥ 1, (ei )1≤i≤n une base de E et ω = (ωk )1≤k≤n ∈ Rn .
n
L’application x | y = ωk xk yk est un produit scalaire si, et seulement si,
k=1
toutes les composantes de ω sont strictement positives. Pour E = Rn et ωk = 1
pour tout k compris entre 1 et n, le produit scalaire obtenu est le produit scalaire
canonique de Rn .
50 Espaces préhilbertiens
π
2. L’application (f, g) → f (t) g (t) dt définit un produit scalaire sur l’espace
−π
vectoriel F des fonctions définies sur R à valeurs réelles, continues et pério-
diques de période 2π.
3. On se donne une fonction α définie sur un intervalle réel ouvert I = ]a, b[ ,
avec −∞ ≤ a < b ≤ +∞, continue à valeurs réelles ) strictement positives, et
b
on note E = f ∈ C 0 (I) | f 2 (x) α (x) dx < +∞ . En utilisant l’inégalité
a
1 2
|f g| ≤ f + g 2 , on vérifie que E est un espace vectoriel et que l’application
2
b
(f, g) → f (x) g (x) α (x) dx définit un produit scalaire sur E.
a
Si ϕ est une forme bilinéaire positive sur E, on a alors pour tous x, y dans
E, |ϕ (x, y)| ≤ ϕ (x, x) ϕ (y, y). Dans le cas où ϕ est définie positive,
l’égalité est réalisée si, et seulement si, x et y sont liés.
est à valeurs positives, donc dans le cas où ϕ (x, x) est non nul, son discriminant
2
est négatif ou nul, ce qui se traduit par ϕ (x, y) ≤ ϕ (x, x) ϕ (y, y) . Dans le cas
où ϕ (x, x) est nul, on a 2ϕ (x, y) t + ϕ (y, y) ≥ 0 pour tout réel t, ce qui impose
ϕ (x, y) = 0 = ϕ (x, x) ϕ (y, y).
Dans le cas où ϕ est définie positive et x non nul, on a ϕ (x, x) = 0 et l’égalité
2
ϕ (x, y) = ϕ (x, x) ϕ (y, y) nous dit que le trinôme P a une racine double t0 , donc
ϕ (y + t0 x, y + t0 x) = 0, ce qui équivaut à y + t0 x = 0. Si x = 0 ou x = 0 et y = λx
avec λ ∈ R, on a alors l’égalité pour tout y ∈ E.
Avec l’exercice 3.3, on propose une autre démonstration de l’inégalité de Cauchy-
Schwarz pour un produit scalaire.
Sur Rn muni du produit scalaire canonique, l’inégalité de Cauchy-Schwarz prend
la forme suivante :
2 n n
n
2 2
∀ (x, y) ∈ R × R ,
n n
x k yk ≤ xk yk
k=1 k=1 k=1
b
Sur C 0 ([a, b] , R) muni du produit scalaire (f, g) → f (t) g (t) dt, elle s’écrit :
a
2
b b b
2 2
∀ (f, g) ∈ E , f (t) g (t) dt ≤ f (t) dt g 2 (t) dt
a a a
Inégalités de Cauchy-Schwarz et Minkowski 51
On peut déduire de ces inégalités quelques inégalités intéressantes sur les réels
ou sur les fonctions continues (exercices 3.4 et 3.5).
Pour la suite de ce chapitre, (E, · | ·) désigne un espace préhilbertien et on
note pour tout x dans E, x = x|x.
Une conséquence importante de l’inégalité de Cauchy-Schwarz est l’inégalité
triangulaire de Minkowski.
Théorème 3.2. Inégalité de Minkowski
b
Sur C 0 ([a, b] , R) muni du produit scalaire (f, g) → f (t) g (t) dt, elle s’écrit :
a
b b b
2
∀ (f, g) ∈ E 2 , (f (t) + g (t)) dt ≤ f 2 (t) dt + g 2 (t) dt
a a a
x + z | y + x − z | y
2 2 2 2
x + z + y − x + z − y + x − z + y − x − z − y
=
4
2 2 2 2
x + y + z − x − y − z
= = 2 x | y
2
1 1
ce qui donne pour z = x, 2x | y = 2 x | y . Notant u = (x + y) , v = (x − y) ,
2 2
on a :
x + y | z = 2u | z = 2 u | z = u + v | z + u − v | z = x | z + y | z
1# 2 2
$
continuité de l’application (x, y) → x | y = x + y − x − y , on déduit
4
que (3.1) est valable pour tout r ∈ R. Ce qui achève de prouver que l’application
· | · est bilinéaire.
(2) ⇒ (3) Si la norme dérive d’un produit scalaire, on vérifie alors facilement
qu’on a l’identité du parallélogramme et l’égalité μ (E) = 1.
(3) ⇒ (1) Si μ (E) = 1, on a alors :
# $
2 2 2 2
∀ (x, y) ∈ E 2 , x + y + x − y ≤ 2 x + y
En posant u = x + y, v = x − y, on a :
2 2 2 2
2x + 2y = u + v + u − v
# $ # $
2 2 2 2
≤ 2 u + v = 2 x + y + x − y
# $
2 2 2 2
soit 2 x + y ≤ x + y + x − y et l’égalité.
On a donc les équivalences (1) ⇔ (2) ⇔ (3) .
(2) ⇒ (4) Cette implication est évidente.
(4) ⇒ (1) Pour x, y fixés dans E on peut écrire, pour tout réel t, P (t) =
2 2
x + ty = at2 + 2bt + c. Le coefficient c est donné en faisant t = 0, soit c = x
2
P (t) 1
= lim x + y
2
et le coefficient a est donné par a = lim
t→+∞ t 2 t→+∞ t = y . On
déduit alors que :
# $
2 2 2 2
x + y + x − y = P (1) + P (−1) = 2 (a + c) = 2 x + y
3.2 Orthogonalité
L’inégalité de Cauchy-Schwarz nous dit que pour tous vecteurs x et y non nuls
x | y
dans E, on a −1 ≤ ≤ 1, ce qui implique qu’il existe un unique réel θ
x y
dans [0, π] tel que x | y = cos (θ) x y . Le réel θ est la mesure dans [0, π] de
l’angle géométrique que font les vecteurs x et y dans E \ {0} . Pour θ ∈ {0, π} , on
a |x | y| = x y , ce qui équivaut à dire que les vecteurs x et y sont liés. Pour
π
θ = , on a x | y = 0.
2
Les vecteurs x et y sont orthogonaux dans (E, · | ·) si, et seulement si,
2 2 2
on a x + y = x + y .
54 Espaces préhilbertiens
Définition 3.4. L’orthogonal d’une partie non vide X de (E, · | ·) est
l’ensemble X ⊥ = {y ∈ E | ∀x ∈ X, x | y = 0} .
⊥
de vérifier que X est un sous espace vectoriel de E. En écrivant
Il est facile
que X ⊥ = ϕ−1 ⊥
x {0} , où ϕx : x → x | y est continue, on voit que X est fermé
x∈X
comme intersection de fermés.
Définition 3.5. On appelle famille orthogonale dans (E, · | ·) toute fa-
mille (ei )i∈I de vecteurs de E telle que ei | ej = 0 pour tous i = j dans
I. Si de plus ei = 1 pour tout i ∈ I, on dit alors que cette famille est
orthonormée ou orthonormale.
Théorème 3.6.
Une famille orthogonale de vecteurs non nuls de (E, · | ·) est libre.
Preuve. Si (ei )i∈I est une telle famille et si λj ej = 0 où J est une partie finie
, j∈J
-
2
de I, on a alors pour tout k ∈ J, 0 = λj e j | ek = λk ek avec ek = 0 et
j∈J
nécessairement λk = 0.
Exemples 3.2
n
1. Sur Rn [X] muni du produit scalaire (P, Q) → P (xk ) Q (xk ) , où (xk )0≤k≤n
k=0
est une suite de réels deux à deux distincts, la base de Lagrange correspondante
est orthonormée (l’exercice 3.1).
2. Sur l’espace F des fonctions continues et 2π-périodiques sur R muni du produit
π . /
scalaire (f, g) → f (t) g (t) dt, la famille cos(nt)
√
π
, sin(mt)
√
π
| (n, m) ∈ N × N ∗
−π
est orthonormée (l’exercice 3.2).
∀j ∈ {1, · · · , p − 1} , ep | ej = 0
Du fait que xp ∈/ Vect {x1 , · · · , xp−1 } = Vect {e1 , · · · , ep−1 } on déduit que fp = 0
1
et la condition ep = 1 donne |λp | = . La condition supplémentaire :
fp
, ⎛ ⎞ -
1 ⎝
p−1
1
0 < xp | ep = ep − λj e j ⎠ | e p =
λp j=1
λ p
⎪
⎪ %
k−1 1
⎪
⎩ f k = xk − xk | ej ej , ek = fk , (k = 2, · · · , p)
j=1 fk
56 Espaces préhilbertiens
2
k−1
2
= xk − xk | ej
j=1
(fk est orthogonal à ej pour 1 ≤ j ≤ k − 1). Les xk | ej étant déjà calculés
2
(pour obtenir fk ), il suffit donc de calculer xk . En fait le calcul de fk | xk est
souvent plus rapide.
k
1
Dans la base (xi )1≤i≤p , on a ek = μj xj avec μk = > 0.
j=1
f k
2
n
2
n
et x = x | ek = x2k . Ces égalités sont des cas particuliers des égalités
k=1 k=1
de Parseval valables de manière plus générale dans les espaces de Hilbert (voir le
paragraphe 3.5).
n
est donnée par y = x | ek ek et on a :
k=1
2 2 2 2
n
2
x − y = x − y = x − x | ek (3.2)
k=1
Preuve. Soit (ei )1≤i≤n une base orthonormée de F (le théorème de Gram–
Schmidt nous assure l’existence d’une telle base). Pour x dans E, on définit le
n
vecteur y ∈ F par y = x | ek ek et on a x − y | ej = 0 pour tout j compris
k=1
entre 1 et n, c’est-à-dire que x − y ∈ F ⊥ . Le théorème de Pythagore donne alors,
pour tout z ∈ F :
2 2 2 2 2
x − z = (x − y) + (y − z) = x − y + y − z ≥ x − y
et on a bien x − y = d (x, F ) .
S’il existe un autre vecteur u ∈ F tel que x − u = d (x, F ) = δ, de :
2 2 2 2
δ 2 = x − u = x − y + y − u = δ 2 + y − u
(y = pF (x)) ⇔ y ∈ F et x − y ∈ F ⊥ ⇔ (y ∈ F et x − y = d (x, F ))
2
n
2 2
pF (x) = x | ek ≤ x
k=1
Exemples 3.3
1
1. Si D = Ra est une droite vectorielle, une base orthonormée de D est a
a
x | a
et pour tout x ∈ E, on a pD (x) = 2 a.
a
2. Sur l’espace vectoriel F des fonctions
continues et 2π-périodiques muni du pro-
π
duit scalaire (f, g) → f | g = f (x) g (x) dx, la meilleure approximation,
−π
pour la norme déduite de ce produit scalaire, d’une fonction f ∈ F par un
polynôme trigonométrique de degré inférieur ou égal à n est donnée par :
* + n * + n * +
c0 c0 ck ck sk s
Sn (f ) = f|√ √ + f|√ √ + f|√ √k
2π 2π k=1 π π π π
k=1
1 1
n n
1
= f | c0 c0 + f | ck ck + f | sk sk
2π π π
k=1 k=1
a0 (f )
n n
Sn (f ) (x) = + ak (f ) cos (kx) + bk (f ) sin (kx)
2
k=1 k=1
L’opérateur de projection
orthogonale de F sur Pn est l’opérateur de Fourier
et la série a0 (f ) + (an (f ) cos (nx) + bn (f ) sin (nx)) est la série de Fourier
de f.
2
Preuve. Pour tout x ∈ F ∩ F ⊥ , on a x = x | x = 0 et x = 0. Donc
F ∩ F ⊥ = {0} .
Soit x ∈ E et y ∈ F sa projection orthogonale dans F. On a x − y ∈ F ⊥ et
x = y + (x − y) ∈ F + F ⊥ . D’où l’égalité E = F ⊕ F ⊥ .
E est de dimension finie, on a dim F ⊥ = dim (E) − dim (F ) ,
Dans le# cas où $
⊥ ⊥
donc dim F⊥ = dim (F ) et avec l’inclusion F ⊂ F ⊥ , on déduit qu’on a
⊥ ⊥
l’égalité F = F.
Pour F de dimension infinie, on a toujours F ∩ F ⊥ = {0} mais pas nécessaire-
ment E = F ⊕ F ⊥ (exercice 3.9).
Théorème 3.9.
Si F est un sous espace vectoriel de dimension finie de (E, · | ·) , la
projection orthogonale pF de E sur F est alors linéaire et continue avec
pF = 1.
n
∀x ∈ E, pF (x) = x | ek ek
k=1
y ∈ F et ∀h ∈ F, J (y) (h) = 0
si, et seulement si :
Définition 3.6. Pour tout x ∈ E la suite (x | en )n∈N est appelée suite
des coefficients de Fourier de x relativement à B et la série de terme général
x | en en série de Fourier de x relativement à B.
n
Pour tout x ∈ E et pour tout n ∈ N, on note Sn (x) = x | ek ek la nème
k=0
somme partielle de la série de Fourier de x relativement à B.
Ces définitions sont données par analogie aux coefficients et séries de Fourier
trigonométriques d’une fonction continue et 2π-périodique sur R (exemples 3.3).
Théorème 3.11. Inégalité de Bessel
2
Pour tout x ∈ E, la série de terme général x | en est convergente et :
+∞
2 2
x | en ≤ x
n=0
Inégalité de Bessel et égalité de Parseval 61
Preuve. Pour tout entier naturel n, Sn (x) est la projection orthogonale de x sur
n
2 2 2 2
Fn = Vect {ek | 0 ≤ k ≤ n} , donc x | ek = x − x − sn (x) ≤ x , ce
k=0 2
qui entraîne la convergence de la série à termes positifs x | en avec l’inégalité
n∈N
+∞
2 2
x | en ≤ x .
n=0
En utilisant le fait que le terme général d’une série convergente tend vers 0, on
déduit le résultat suivant.
Théorème 3.12. Riemann-Lebesgue
Définition 3.7. On dit qu’une famille orthonormée B = (en )n∈N est totale
dans E si le sous espace vectoriel de E engendré par B est dense dans
(E, ·) .
Dire que la famille orthonormée B est totale dans E équivaut à dire que pour
tout x dans E et pour tout réel ε > 0 il existeun entier n ∈ N et un (n + 1)-uplet
n
(c0 , c1 , · · · , cn ) ∈ Rn+1 tels que x − ck ek < ε, ce qui équivaut encore à dire
k=0
que tout x ∈ E est limite d’une suite d’éléments de Vect (B) .
Théorème 3.13.
Avec les notations qui précédent, les propriétés suivantes sont équiva-
lentes :
1. la famille orthonormée B = (en )n∈N est totale ;
+∞
2. pour tout x ∈ E, on a x = x | en en (série convergente dans
n=0
(E, ·)) ;
3. pour tous x, y dans E, on a x | en y | en = x | y (égalité de
n∈N
Parseval) ;
62 Espaces préhilbertiens
2 2
4. pour tout x ∈ E, on a x | en = x (égalité de Parseval).
n∈N
n +∞
donc lim x | y − x | ek y | ek = 0, soit x | y = x | en y | en .
n→+∞
k=0 n=0
(3) ⇒ (4) Il suffit de faire y = x dans ce qui précède.
+∞
2 2
(4) ⇒ (1) Si x = x | en , pour tout x ∈ E, en écrivant que :
n=0
2
n
n
2 2
0 ≤ x − x | ek ek = x − x | ek
k=0 k=0
n
on déduit que x = lim x | ek ek et la densité de Vect (B) dans E.
n→+∞
k=0
+∞
a0 (f )
L’égalité f = + (an (f ) cn + bn (f ) sn ) (cn = cos (nx) , sn = sin (nx))
2 n=1
dans (F, ·) s’exprime en disant que la série de Fourier de la fonction f ∈ F
converge en moyenne quadratique.
Théorème 3.14.
Si B = (en )n∈N est une famille orthonormée maximale dans E, pour tout
x ∈ E la condition x | en = 0 pour tout n ∈ N équivaut alors à x = 0.
Preuve.
x = 0 dans E est tel que x | en = 0 pour tout n ∈ N, le système
Si
1
B∪ x est alors orthonormé, ce qui contredit le caractère maximal de B. On
x
a donc nécessairement x = 0.
Ce théorème peut s’exprimer en disant que si B est une famille orthonormée
maximale dans E, tout x ∈ E est alors uniquement déterminé par ses coefficients
de Fourier relativement à B.
Théorème 3.15.
Une famille orthonormée totale dans E est maximale.
Théorème 3.16.
Si l’espace préhilbertien (E, · | ·) est de dimension infinie et complet,
alors une famille orthonormée est totale si, et seulement si, elle est maxi-
male.
Preuve. On sait déjà qu’une famille orthonormée totale est maximale. Supposons
que la famille orthonormée B soit maximale. Pour x ∈ E on note toujours Sn (x)
sa n-ème somme partielle de Fourier. Pour m > n on a :
m +∞
2 2 2
Sn (x) − Sm (x) = x | ek ≤ x | ek
k=n+1 k=n+1
et ce reste tend vers 0 quand n tend vers l’infini (inégalité de Bessel). La suite
(Sn (x))n∈N est donc de Cauchy dans E et elle converge si E est complet. On note
y sa limite. Pour m > n on a y − sm (x) | en = y | en −x | en et avec l’inégalité
de Cauchy-Schwarz, on a |y | en − x | en | ≤ y − sm (x) en = y − sm (x) ,
puis en faisant tendre m vers l’infini on déduit que y | en = x | en . Les vecteurs
x et y ont donc mêmes coefficients de Fourier relativement à B, ils sont donc égaux
puisque B est maximale.
x − y | xi = 0 (1 ≤ i ≤ n)
soit :
n
xi | xj yj = x | xei (1 ≤ i ≤ n)
j=1
Théorème 3.17.
Si n est un entier naturel non nul, alors pour toute famille (xi )1≤i≤n de
vecteurs de (E, · | ·) , on a rg (G (x1 , · · · , xn )) = rg (x1 , · · · , xn ) .
p
xi = aki ek (1 ≤ i ≤ n)
k=1
2
positive ( t AAX | XRn = AXRn ≥ 0 pour tout X ∈ Rn ), on déduit que ce
déterminant est strictement positif.
Dans le cas de deux vecteurs x, y non nuls dans E, on a :
x | x x | y 2 2 2
g (x, y) = = x y − x | y
x | y y | y
et la condition g (x, y) ≥ 0 avec égalité si, et seulement si, les vecteurs x et y sont
liés est tout simplement le théorème de Cauchy-Schwarz.
Si x et y sont non nul, en notant θ la mesure dans [0, π] de l’angle que font
2 2 2 2
ces vecteurs, on a g (x, y) = x y 1 − cos2 (θ) = x y sin2 (θ) et il en
2 2
résulte que g (x, y) ≤ x y , l’égalité étant réalisée si, et seulement si, ces deux
vecteurs sont orthogonaux.
Le théorème qui suit généralise cette remarque en donnant une interprétation
géométrique du déterminant de Gram.
Si x, y sont deux vecteurs non nuls dans E, on note (x, y) la mesure dans [0, π]
de l’angle que font ces vecteurs.
Théorème 3.18.
Soient n un entier naturel supérieur ou égal à 2, (xi )1≤i≤n une famille
libre de vecteurs dans (E, · | ·) , F = Vect {x1 , · · · , xn } et (ei )1≤i≤n la
base orthonormée de F déduite par le procédé de Gram-Schmidt avec la
condition xk | ek > 0 pour tout k compris entre 1 et n. On a alors :
(
n (
n
2
g (x1 , · · · , xn ) = cos2 (xk , ek ) xk
k=2 k=1
(
n (
n
2
= sin2 (x1 , x2 ) cos2 (xk , ek ) xk si n ≥ 3
k=3 k=1
1
Preuve. On a vu (démonstration du théorème 3.7) que ek = yk pour tout k
yk
k−1
compris entre 1 et n, où y1 = x1 et yk = xk − xk | ej ej pour k compris entre
j=1
2 et n. La matrice de passage de (ei )1≤i≤n à (xi )1≤i≤n est alors donnée par :
⎛ ⎞
y1 0 ··· 0
⎜ .. .. ⎟
⎜ a21 y2 . . ⎟
A=⎜ ⎜ .
⎟
⎟
⎝ .. .. ..
. . 0 ⎠
an1 · · · an,n−1 yn
2 2
n
2
k−1
et g (x1 , · · · , xn ) = det (A) = yk . De xk = yk ek + xk | ej ej , pour
k=1 j=1
k compris entre 2 et n, et de l’orthogonalité des ej , on déduit que :
yk = xk | ek = xk cos (xk , ek )
Déterminants de Gram 67
(
n (
n
2
2 2
et g (x1 , · · · , xn ) = sin (x1 , x2 ) cos (xk , ek ) xk .
k=3 k=1
La borne inférieure est atteinte si, et seulement si, la famille (xi )1≤i≤n est
liée et la borne supérieure est atteinte si, et seulement si, la famille (xi )1≤i≤n
est orthogonale.
n
gj,x (x1 , · · · , xn )
de F est le vecteur y = xj , où gj,x (x1 , · · · , xn ) est le
j=1
g (x1 , · · · , xn )
la matrice de⎞Gram G (x1 , · · · , xn ) en
déterminant de la matrice déduite de ⎛
x1 | x
⎜ .. ⎟
remplaçant sa colonne numéro j par ⎝ . ⎠.
xn | x
avec :
1 1
1 2 ··· n 2 2
1 1 1 (j − i)
2 3 ··· n+1 0≤i<j≤n−1
g 1, x, · · · , xn−1 = .. .. .. .. = 2
. . . . (i + j + 1)
1 1 1 0≤i,j≤n−1
n n+1 ··· 2n−1
2
(n!)
On en déduit alors que d (X n , Rn−1 [X]) = √ , ce qui signifie que pour
(2n)! 2n + 1
tout P ∈ Rn−1 [X] , on a :
1 4
2 2 (n!)
X n − P = (xn − P (x)) dx ≥ 2
0 ((2n)!) (2n + 1)
Théorème 3.20.
Soit {θn | n ∈ N} un système libre dans (E, · | ·) . L’espace vectoriel
F = Vect {θn | n ∈ N} est dense dans (E, ·) si, et seulement si, pour
g (θ0 , · · · , θn , ep )
tout entier naturel p, on a lim = 0.
n→+∞ g (θ0 , · · · , θn )
∀n ≥ n0 , d (ep , Fn ) < ε
On a ainsi montré que pour tout entier naturel p, on a lim d (ep , Fn ) = 0. Ré-
n→+∞
ciproquement si cette condition est vérifiée, avec la bilinéarité du produit scalaire
et la linéarité du déterminant par rapport à la dernière colonne, on déduit que :
Avec la densité de R [X] dans (E, ·) , on déduit que pour toute fonction f ∈ E
et pour tout réel ε strictement positif il existe une fonction polynomiale P telle
que f − P < ε. En désignant par n0 un entier naturel tel que d (P, Fn0 ) < ε et
en notant P0 ∈ Fn0 la projection orthogonale de P sur Fn0 , on a :
(déterminant de Cauchy).
xi , ainsi que les λi sont deux à deux distincts et on désigne par Fp la fonction
2
p−1
(x − xj )
j=0
rationnelle définie sur R \ {−λ0 , · · · , −λp } par Fp (x) = . Le numé-
2
p
(x + λi )
i=0
rateur de Fp est de degré p et son dénominateur de degré p + 1, on a donc une
p
αi
décomposition en éléments simples de la forme Fp (x) = , les coefficients
i=0
x + λi
αi étant donnés par :
2
p−1
(λi + xj )
j=0
αi = lim (x + λi ) Fp (x) =
x→−λi 2
p
(λi − λj )
j=0
j =i
En développant le déterminant :
1 1 1
x0 +λ0 ··· xp−1 +λ0 xp +λ0
.. .. .. ..
Dp = . . . .
1 1 1
x0 +λp−1 ... xp−1 +λp−1 xp +λp−1
Fp (x0 ) ··· Fp (xp−1 ) Fp (xp )
2
p−1
(xp − xj ) (λp − λj )
Fp (xp ) j=0
det (Ap ) = det (Ap−1 ) = p det (Ap−1 )
αp 2 2
p−1
(xp + λi ) (xj + λp )
i=0 j=0
Dans ce qui suit, on se donne une suite strictement croissante de réels positif :
0 ≤ λ0 < λ1 < · · · < λn < λn+1 < · · ·
et pour tout entier naturel n, on note θn la fonction définie par :
∀x ∈ [0, 1] , θn (x) = xλn
Lemme 3.2 Pour tout entier naturel non nul n, on a :
j−1
2
n 2 2
(λj − λi )
j=0 i=0
g (θ0 , · · · , θn ) = n n
2 2
(λj + λi + 1)
j=0 i=0
1 (n
λi − p
d (ep , Vect {θk | 0 ≤ k ≤ n}) = √
2p + 1 i=0 λi + p + 1
On a aussi :
j−1
2
n 2 2 2
n
2
(λj − λi ) (λi − p)
j=0 i=0 i=0
g (θ0 , · · · , θn , ep ) = n
2
n 2
n 2
(λj + λi + 1) (λj + p + 1) (λi + p + 1) (2p + 1)
j=0 i=0 i=0
soit :
j−1
2
n 2 2
n
22
(λj − λi ) (λi − p)
j=0 i=0 i=0
g (θ0 , · · · , θn , ep ) = n n n
2 2 2 2
(λj + λi + 1) (λi + p + 1) (2p + 1)
j=0 i=0 i=0
1 ( n−i
n−1
(n!)
2
d (X n , Rn−1 [X]) = √ = √
2n + 1 i=0 n + i + 1 (2n)! 2n + 1
(exemple 3.3).
De ces calculs on déduit, avec les notations qui précèdent, le premier résultat
de densité suivant.
Théorème 3.21.
L’espace vectoriel F = Vect {θn | n ∈ N} est dense dans (E, ·2 ) si, et
seulement si :
(n
λi − p
∀p ∈ N, lim =0
n→+∞
i=0
λ i +p+1
1
Preuve. On a λn > λ0 ≥ 0 pour tout entier naturel non nul, donc est bien
λn
défini pour n ≥ 1. Supposons F dense dans (E, ·) , on a alors :
(
n
λi − p
∀p ∈ N, lim =0
n→+∞ λ
i=0 i
+p+1
74 Espaces préhilbertiens
Si la suite (λn )n∈N est bornée, étant croissante positive, elle converge alors vers
+∞
1
un réel λ > 0 et la série est divergente. Si cette suite n’est pas bornée,
λ
n=1 n
étant croissante, elle diverge alors vers l’infini. Si N ⊂ {λk | k ∈ N} , on a alors
+∞
+∞
1 1
≥ = +∞. Dans le cas contraire il existe un entier naturel p tel que
λ
n=1 n n=1
n
p = λk pour tout k ∈ N et avec lim λn = +∞ on déduit qu’il existe un entier
n→+∞
i0 tel que λi > p pour tout i > i0 . De :
(
n
λi − p (i0
λi + p + 1 (n
λi − p
lim = lim =0
n→+∞
i=i0
λ
+1 i
+ p + 1 i=0
λ i − p n→+∞ λ
i=0 i
+p+1
+∞
λi − p
on déduit que ln = −∞ et du fait que :
i=i0 +1
λi + p + 1
λi − p 2p + 1 2p + 1 2p + 1
ln = ln 1 − − −
λi + p + 1 λi + p + 1 i→+∞ λi + p + 1 i→+∞ λi
+∞
+∞
1 1
cela équivaut à = ∞. Réciproquement supposons que = +∞.
λ
i=i0 +1 i
λ
n=1 n
(n
λi − p
Pour p, n dans N, on note un,p = . Si p ∈ {λk | k ∈ N} , on a alors
λ
i=0 i
+p+1
un,p = 0 à partir d’un certain rang. Si p ∈/ {λk | k ∈ N} , on distingue deux cas. Si
la suite (λn )n∈N est bornée, elle converge alors vers un réel λ > 0 et :
λi − p λ−p
lim = =μ<1
i→+∞ λi + p + 1 λ+p+1
λi − p
on peut donc trouver un entier i0 tel que ≤ μ + ε < 1 pour tout
λi + p + 1
i ≥ i0 et :
n−i0
∀n > i0 , |un,p | ≤ |ui0 ,p | (μ + ε)
ce qui entraîne lim un,p = 0. Si la suite (λn )n∈N n’est pas bornée, elle diverge
n→+∞
alors vers l’infini et λi − p est strictement positif à partir d’un rang i0 avec :
λi − p 2p + 1 2p + 1
ln = ln 1 − −
λi + p + 1 λi + p + 1 i→+∞ λi
+∞
λi − p
ce qui entraîne ln = −∞, équivalent à lim un,p = 0. Dans
i=i0 +1
λi + p + 1 n→+∞
tous les cas, on a lim un,p = 0 pour tout p ∈ N, ce qui équivaut à la densité de
n→+∞
F dans (E, ·) .
De ce théorème on déduit le résultat de densité suivant dans (E, ·∞ ) .
Exercices 75
Preuve. Si F est dense dans (E, ·∞ ) , il est alors dense dans (E, ·2 ) et le
% 1
+∞
théorème précédent nous dit que = +∞. Réciproquement, on suppose que
n=1 λn
+∞
+∞
1 1
= +∞. Pour tout entier n ≥ 2 on a λn − 1 > 0 et donc = +∞,
λ
n=1 n
λ n−1
n=2
ce qui équivaut à la densité de G = Vect xλn −1 | n ≥ 1 dans (E, ·) (on note xλ
la fonction x → xλ ). Pour toute fonction polynomiale P et pour tout réel ε > 0,
n
on peut trouver une fonction ϕ = ak xλk −1 dans G telle que P − ϕ < ε,
k=1
où P désigne le polynôme dérivé de P. On désigne alors par θ la primitive sur
n
a k λk
[0, 1] de la fonction ϕ telle que ϕ (0) = P (0) , soit θ = P (0) + x ∈ F
λk
k=1
(l’hypothèse λ0 = 0 nous dit que 1 ∈ F ) et pour tout réel x ∈ [0, 1] avec l’inégalité
de Cauchy-Schwarz, on a :
x
√
|P (x) − θ (x)| = (P (t) − ϕ (t)) dt ≤ P − ϕ x ≤ P − ϕ < ε
0
soit P − θ∞ < ε. On a donc ainsi montré que toute fonction polynomiale peut
être uniformément approchée sur [0, 1] par des éléments de F. Avec le théorème de
Weierstrass (exercice 2.8), on en déduit alors que F est dense dans (E, ·∞ ) .
Exemple 3.5 Si (pn )n≥1 est la suite des nombres premiers positifs rangés dans
+∞
1
l’ordre croissant, on sait que = +∞ et on en déduit que l’espace vectoriel
p
n=1 n
Vect {1, xpn | n ≥ 1} est dense dans (E, ·∞ ) .
3.8 Exercices
Solution. L’application ϕ définit une forme bilinéaire symétrique sur Rn [X] pour
tout ω ∈ Rn . Si ϕ est un produit scalaire, en désignant par (Li )0≤i≤n la base de
(n
X − xk
Lagrange de Rn [X] définie par Li (X) = pour i compris entre 0 et n,
xi − xk
k=0
k=i
on a alors ωj = ϕ (Lj , Lj ) > 0 pour tout j compris entre 1 et n. Réciproquement
n
si tous les ωj sont strictement positifs, on a ϕ (P, P ) = ωi P 2 (xi ) ≥ 0 pour tout
i=1
x ∈ Rn et ϕ (P, P ) = 0 équivaut à ωi P 2 (xi ) = 0 pour tout i, ce qui équivaut à
P (xi ) = 0 pour tout i compris entre 0 et n soit à P = 0 (P est un polynôme dans
Rn [X] qui a n + 1 racines distinctes, c’est donc le polynôme nul). En conclusion, ϕ
définit un produit scalaire sur Rn [X] si, et seulement si, tous les ωi sont strictement
positifs.
Solution.
1. Pour n = m dans N, on a :
π
cos ((n + m) t) + cos ((n − m) t)
cn | cm = dt = 0
−π 2
pour n = m dans N∗ , on a :
π
cos ((n − m) t) − cos ((n + m) t)
sn | sm = dt = 0
−π 2
Exercices 77
et pour (n, m) ∈ N × N∗ , on a :
π
sin ((n + m) t) − sin ((n − m) t)
cn | sm = dt = 0
−π 2
π
c0
Pour n = 0, on a dt = 2π, donc √
2π = 1 et pour n ≥ 1 :
−π
π π π
1 − cos (2nt)
cos2 (nt) dt = sin2 (nt) dt = dt = π
−π −π −π 2
c n sn
donc √ = √
= 1. La famille B est donc orthonormée et en conséquence
π π
libre.
2. Pn est un sous-espace vectoriel de F de dimension 2n + 1 car engendré par la
famille libre Bn = {ck | 0 ≤ k ≤ n} ∪ {sk | 1 ≤ k ≤ n} .
3. Notant z = eix pour tout réel x, on a :
n
zk + zk zk − zk
P (x) = a0 + ak + bk
2 2i
k=1
1
n
1 1
= a0 + ak z + k − ibk z − k
k k
2 z z
k=1
n
1 1
= a0 + (ak − ibk ) z k + (ak + ibk ) k
2 z
k=1
1
n
ou encore z n P (x) = a0 z 2n + (ak − ibk ) z n+k + (ak + ibk ) z n−k = Q (z) .
2
k=1
Il en résulte que si P s’annule en 2n+1 points deux à deux distincts, x0 , · · · , x2n ,
dans [−π, π[ , le polynôme complexe Q ∈ C2n [z] s’annule alors en 2n + 1 points
distincts du cercle unité, eix0 , · · · , eix2n , ce qui revient à dire que c’est le poly-
nôme nul et P = 0.
4. On vérifie facilement que ϕ est une forme bilinéaire symétrique et positive.
L’égalité ϕ (P, P ) = 0 entraîne que P ∈ Pn s’annule en 2n + 1 points deux à
deux distincts dans [−π, π[ et en conséquence P = 0.
donc |u | v| ≤ 1, l’égalité étant réalisée si, et seulement si, u = εv, ce qui revient
1 1
à dire que u et v sont liés. Pour x, y non nuls dans E et (u, v) = x, y ,
x y
cela donne |x | y| ≤ x y , l’égalité étant réalisée si, et seulement si, x et y sont
liés. Pour x ou y nul, ces vecteurs sont liés et on a l’égalité |x | y| ≤ x y = 0.
Exercice 3.4.
n
√ n (n + 1) √
∗ √
1. Montrer que pour tout n ∈ N , on a k k≤ 2n + 1.
k=1
2 3
2. On se donne un entier n ∈ N∗ et des réels x1 , · · · , xn .
n 2
n
(a) Montrer que xk ≤ n x2k . Dans quel cas a-t’on égalité ?
k=1 k=1
(b) En déduire une condition nécessaire et suffisante, sur les réels a
n
et b, pour que l’application ϕ : (x, y) → a xi yi + b x i yj
i=1 1≤i=j≤n
définissent un produit scalaire sur Rn pour n ≥ 2.
3. On se donne un entier n ∈ N∗ et des réels x1 , · · · , xn strictement positifs.
n n
1
(a) Montrer que xk ≥ n2 . Dans quel cas a-t’on éga-
xk
k=1 k=1
lité ?
n
1 6n
(b) Montrer que ≥ .
k2 (n + 1) (2n + 1)
k=1
Solution.
n
n
√ n
1. L’inégalité de Cauchy-Schwarz nous donne k k ≤ k k avec
2
2.
(a) L’inégalité de Cauchy-Schwarz nous donne :
2
n
n
n
n
2
xk · 1 ≤ 1 x2k =n x2k
k=1 k=1 k=1 k=1
l’égalité étant réalisée si, et seulement si, tous les xk sont égaux.
Exercices 79
Solution.
1. L’inégalité de Cauchy-Schwarz nous donne :
2
b b b b
2
f (t) · 1dt ≤ f (t) dt 1dt = (b − a) f 2 (t) dt
a a a a
√ 1
l’égalité étant réalisée si, et seulement si, il existe un réel λ tel que f = λ√ ,
f
ce qui équivaut à dire que f est constante.
3. Pour tout t ∈ ]a, b] , on a :
t 2 t t b
2 2 2
|f (t)| = f (x) dx ≤ 1dx |f (x)| dx ≤ (t − a) |f (t)| dt
a a a a
et en intégrant :
2
b
2
b
2
b
(b − a) b
2
|f (t)| dt ≤ |f (t)| dt (t − a) dt = |f (t)| dt
a a a 2 a
+∞
Exercice 3.6. Soit f (z) = αn z n une fonction développable en sé-
n=0
rie entière sur D (0, R) avec 0 < R ≤ +∞. Montrer que si |f | admet un
maximum local en 0, elle est alors constante (principe du maximum).
Exercices 81
2π 12
1 2
donc |α0 | = |f (0)| = √ f r0 e it
dt , soit αn = 0 pour tout n ≥ 1 et
2π 0
+∞
2 1 2π 2 2
|α0 | = f r0 eit dt = |αn | r02n , ce qui signifie que f est constante.
2π 0 n=0
donc :
n+1 2 n+1 2
εk x k = εk x k
ε∈{−1,1}n+1 k=1 (ε,εn+1 )∈{−1,1}n ×{−1,1} k=1
⎛ 2 2 ⎞
n n
= ⎝
εk xk + xn+1 +
εk xk − xn+1 ⎠
n
ε∈{−1,1} k=1 k=1
⎛ 2 ⎞
n
⎝ 2
=2 εk xk + xn+1 ⎠
n
ε∈{−1,1} k=1
n 2
2
n+1
2
=2 εk xk + 2 · 2n xn+1 = 2n+1 xk
n
ε∈{−1,1} k=1 k=1
82 Espaces préhilbertiens
Exercice 3.8.
2
1. Montrer que l’application (P, Q) → P | Q = (2 − t) P (t) Q (t) dt
0
définit un produit scalaire sur R [X] . Donner une base orthonormée de
R2 [X] .
+1
P (t) Q (t)
2. Montrer que l’application (P, Q) → P | Q = √ dt définit
−1 1 − t2
un produit scalaire sur R [X] . Donner une base orthonormée de R2 [X] .
Solution.
1. La fonction t → 2 − t étant à valeurs strictement positives sur ]0, 2[ , il est facile
de vérifier que · | · est un produit scalaire sur R [X] . En utilisant l’algorithme
de Gram-Schmidt, on définit la base orthonormée (Pi )0≤i≤2 par :
⎧ 2
⎪
⎪ 2 1
⎪
⎪ Q 0 = 1, Q0 = (2 − t) dt = 2, P0 = √
⎪
⎪ 2
⎪
⎪
0
⎪
⎪ 2
⎪
⎪ Q1 = X − X | P0 P0 = X −
⎨ 3
2 4 3
⎪ Q1 = Q1 | X = , P1 = X − 1
⎪
⎪ 3 4
9
3
2
4
⎪
⎪ 8 2
⎪
⎪ Q2 = X 2 − X 2 | P0 P0 − X 2 | P1 P1 = X 2 − X +
⎪
⎪ √ 5 5
⎪
⎪ 3 4
⎪ 2
⎩ Q2 = Q2 | X = 2 8 6 2
, P2 = 5X − 8X + 2
75 4
# √ $
Une base orthonormée de R2 [X] est donc √12 , 32 X − 1, 46 5X 2 − 8X + 2 .
2. Il est facile de vérifier que · | · est un produit scalaire sur R [X] . Pour tout
1
t2n
entier naturel n, on note Tn = √ dt. La fonction à intégrer est positive
0 1 − t2
1
et équivalente au voisinage de 1 à la fonction √ √ , elle est donc intégrable
1 2 1−t
1 π
sur [0, 1] . On a T0 = √ dt = arcsin (1) = et pour n ≥ 1, une
1 − t 2 2
0
intégration par parties donne :
1 1
2n−1 t
Tn = t √ dt = (2n − 1) x2n−2 1 − t2 dt
0 1 − t2 0
1 2(n−1)
t
= (2n − 1) √ 1 − t2 dx = (2n − 1) (Tn−1 − Tn )
0 1 − t2
2n − 1
On a donc la relation de récurrence Tn = Tn−1 pour tout n ≥ 1 et avec
2n
la valeurs initiale T0 , on déduit que :
2n − 1 2n − 3 31π (2n)! π
Tn = ··· = 2
2n 2 (n − 1) 422 2n
2 (n!) 2
Exercices 83
1 1
2 1 1
On pose Q0 = 1 et on a Q0 = √ dt = 2 √ dt = π. Donc
−1 1 − t2 0 1 − t2
1 1
P0 = Q0 = √ . Puis Q1 (X) = X − λP0 où λ est tel que P0 | Q0 = 0,
Q0 π
1
t
ce qui donne λ = P0 | X = √ dt = 0 par parité. On a Q1 (X) = X
2
−1 1 − t
et : 1 1
2 t2 t2 2 π
Q1 = √ dt = 2 √ dt = 2 π =
2 2
−1 1 − t 0 1−t 2 2
5
1 2
Donc P1 = Q1 = X. Puis Q2 (X) = X 2 − λP0 − μP1 où λ, μ sont tels
Q1 π
que P0 | Q2 = P1 | Q2 = 0, ce qui donne :
1 √
3 4 1 t2 1 π π
λ = P0 | X 2 = √ √ dt = √ =
π −1 1 − t 2 π2 2
5 1
3 4 2 t3
et μ = P1 | X 2 = √ dt = 0 par parité. On a Q2 (X) = X 2 −
π 1 − t 2
√ −1
π 1 1
λP0 = X 2 − √ = X 2 − et :
2 π 2
2 3 4 3 4
Q2 = Q2 | X 2 − λP0 = Q2 | X 2
1
t4 1 1 t2 4! 1π π
= √ dt − √ dt = 4 2 π − =
2 2
−1 1 − t 2 −1 1 − t 2 2 22 8
5
1 2
donc P2 = Q2 = 2X 2 − 1 . En conclusion, une base orthonormée
Q2 π
5 5
1 2 2
de R2 [X] est donnée par (P0 , P1 , P2 ) = √ , X, 2X 2 − 1 .
π π π
Solution.
1
1. Une fonction f ∈ F ⊥ est telle que pour tout P ∈ F on a f (x) P (x) dx = 0.
0
En écrivant que la fonction f est limite uniforme sur le compact [0, 1] d’une
suite (Pn )n∈N de polynômes (théorème de Weierstrass), on peut écrire que :
1 1
2
f (x) dx = lim f (x) Pn (x) dx = 0
0 n→+∞ 0
84 Espaces préhilbertiens
Solution.
+∞
1. On vérifie par récurrence que tk e−t dt = k! pour tout k ∈ N et de ce
0
résultat on déduit que l’application · | · est bien définie sur R [X] . On vérifie
ensuite facilement que c’est un produit scalaire.
Exercices 85
Q = P − P | P3 P3 = 9x2 − 17x + 7
Solution.
1
1. En munissant l’espace C 0 ([−1, 1]) du produit scalaire f, g = f (x) g (x) dx,
−1
1
2 2
on a M = inf 2 x2 − ax − b dx = inf f − Q , où f (x) = x2 . Le
(a,b)∈R −1 Q∈R1 [x]
2 2 2
théorème de projection orthogonale donne M = f − P = f − P , où
P est la projection orthogonale de f sur R1 [x] , soit P = f, P0 P0 + f, P1 P1
√ de R1 [x] . Le procédé de Gram-Schmidt
où (P0 , P1 ) est une base orthonormée
1 3 2 1
donne P0 (X) = √ , P1 (X) = √ X et on a f, P0 = √ , f, P1 = 0,
2 2 3 2
86 Espaces préhilbertiens
1 2 2 8
donc P (X) = et M = − = . En utilisant la base canonique (1, X) de
3 5 9 45
R1 [X] , le système d’équations normales est :
3 4
1 | 1 y1 + 1 | X y2 = X3 2 | 1 4
X | 1 y1 + X | X y2 = X 2 | X
2 2 1 1
soit 2y1 = et y2 = 0, ce qui donne y1 = et y2 = 0, soit P = et
3 3 3 3
2 2 8
M = f − P = .
45
1
0
2. L’espace C ([0, 1]) est muni du produit scalaire f | g = f (x) g (x) dx et on
0
note f la fonction définie sur [0, 1] par :
x ln (x) si x ∈ ]0, 1]
f (x) =
0 si x = 0.
Avec lim x ln (x) = 0, on déduit que f ∈ E. Avec ces notations il s’agit donc de
x→0
2
calculer δ 2 = d (f, F ) = inf 2 f − aX 2 − bX , où F = Vect X, X 2 . On
2
(a,b)∈R
sait que si (P1 , P2 ) est une base orthonormée de F, on a alors :
2 2 2 2
δ 2 = f − f | P1 P1 − f | P2 P2 = f − f | P1 − f | P2
Suites numériques
On reprend avec ce chapitre l’étude des suites amorcée dans le cadre des espaces
métriques (paragraphe 1.2) en se plaçant dans le cas particulier des suites de
nombres complexes ou réels.
Les résultats classiques sur les fonctions continues ou dérivables d’une variable
réelle sont supposés acquis de même que les fonctions usuelles exp, ln, sin, · · ·
Nous utiliserons l’expression « suite numérique » pour les notions valables sur
R ou C et préciserons « suite réelle » quand cela est nécessaire.
Preuve.
1. Il existe n0 ∈ N tel que − + < un < + , pour tout n ≥ n0 , ce qui nous
2 2
donne un > > 0 pour tout n ≥ n0 . Pour < 0, on travaille avec la suite
2
(−un )n∈N .
2. Se déduit facilement du premier point.
88 Suites numériques
Théorème 4.2.
Soient (un )n∈N et (vn )n∈N deux suites réelles telles que lim (un ) =
n→+∞
et lim (vn ) = .
n→+∞
∀n ≥ n0 , − ε ≤ vn ≤ un ≤ wn ≤ + ε
donc |un − | ≤ ε pour tout n ≥ n0 , ce qui signifie que la suite (un )n∈N est
convergente vers .
Théorème 4.4.
Soient (un )n∈N , (vn )n∈N deux suites numériques convergentes vers et
respectivement.
1. Les suites (un + vn )n∈N et (un vn )n∈N convergent vers + et ·
respectivement.
2. Si = 0,
il existe
alors un entier n0 tel que vn = 0 pour tout n ≥ n0 et
un
la suite converge vers .
vn n≥n0
3. Dans le cas réel, les suites (min (un , vn ))n∈N et (max (un , vn ))n∈N
convergent vers min (, ) et max (, ) respectivement.
4. Dans le cas réel, si > 0, il existe un entier n
√0 tel que un > 0 pour tout
√
n ≥ n0 et la suite un n≥n converge vers .
0
Preuve.
1. Pour tout réel ε > 0, il existe n0 ∈ N tel que |un − | < ε et |vn − | < ε pour
tout n ≥ n0 , ce qui entraîne que |(un + vn ) − ( + )| ≤ |un − |+|vn − | < 2ε
et signifie que la suite (un + vn )n∈N converge vers + . Par ailleurs, comme la
suite convergente (vn )n∈N est bornée, il existe un réel M > 0 tel que |vn | ≤ M
Suites numériques convergentes 89
Parmi les suites réelles divergentes, on traite à part celles qui tendent vers
l’infini.
Définition 4.1. Soit (un )n∈N une suite réelle. On dit que :
— (un )n∈N tend vers +∞ si :
∀M ∈ R, ∃n0 ∈ N | ∀n ≥ n0 , un > M
∀m ∈ R, ∃n0 ∈ N | ∀n ≥ n0 , un < m
Une suite qui tend vers l’infini (i. e. vers +∞ ou −∞) est non bornée, donc
divergente.
Théorème 4.5.
Si (un )n∈N est une suite numérique pour laquelle on peut trouver une
suite (vn )n∈N de réels positifs telle que lim vn = +∞ et |un | ≥ vn à
n→+∞
partir d’un certain rang, la suite (un )n∈N est alors divergente.
Preuve. On a :
Preuve.
1. Si λ = 0, la suite (un )n∈N est alors stationnaire sur 0 à partir du rang n0 + 1.
On suppose donc que λ ∈ ]0, 1[ . Montrons par récurrence sur n ≥ n0 que
|un | ≤ un0 λn−n0 . C’est vrai pour n = n0 . Supposons que pour une valeur n ≥ n0
on ait |un | ≤ un0 λn−n0 , comme |un+1 | ≤ λ |un | , on a |un+1 | ≤ un0 λn+1−n0 .
un
Pour λ ∈ ]0, 1[ la suite géométrique de terme général n00 λn converge vers 0, et
λ
comme cette suite majore la suite positive (|un |)n∈N on peut affirmer que cette
dernière converge aussi vers 0 et il en est de même de (un )n∈N .
2. Si un0 = 0, on vérifie alors par récurrence que un =0 pour tout n ≥ n0 .
1
En appliquant le résultat précédent à la suite , on déduit que
|un | n≥n0
1
lim = 0, ce qui équivaut à lim (|un |) = +∞ et (un )n∈N diverge.
n→+∞ |un | n→+∞
Suites numériques convergentes 91
un+1
3. Si lim = λ, on a alors :
n→+∞ un
un+1
∀ε > 0, ∃n0 ∈ N | ∀n ∈ N, n > n0 ⇒ <λ+ε
un
Dans le cas où λ ∈ [0, 1[ , on peut choisir ε assez petit pour que ρ = λ + ε soit
strictement inférieur à 1 et on a alors |un+1 | ≤ ρ |un | pour tout n ≥ n0 avec
ρ ∈ ]0, 1[ , ce qui implique lim (un ) = 0.
n→+∞
1
4. Le résultat précédent appliqué à la suite (vn )n∈N définie par vn = pour n
|un |
assez grand, nous dit que lim (vn ) = 0, donc lim (|un |) = +∞ et (un )n∈N
n→+∞ n→+∞
diverge.
Théorème 4.7.
Soit (un )n∈N une suite numérique.
1. S’il existe un réel λ ∈ [0, 1[ tel que n
|un | ≤ λ à partir d’un certain rang
n0 , on a alors lim (un ) = 0.
n→+∞
2. S’il existe un réel λ > 1 tel que n |un | ≥ λ à partir d’un certain rang
n0 , alors (un )n∈N diverge.
# $
3. Si lim n
|un | = λ ∈ [0, 1[ , on a alors lim (un ) = 0.
n→+∞ n→+∞
# $
4. Si lim n
|un | = λ > 1, alors (un )n∈N diverge.
n→+∞
Preuve.
1. Résulte de 0 ≤ |un | ≤ λn pour n ≥ n0 avec lim (λn ) = 0 (λ ∈ [0, 1[).
n→+∞
2. Résulte de |un | ≥ λn pour n ≥ n0 avec lim (λn ) = +∞ (λ > 1).
n→+∞
# $
3. Si lim n
|un | = λ, on a alors :
n→+∞
# $
un+1
On peut vérifier que si lim = λ, on a alors lim n
|un | = λ
n→+∞ un n→+∞
(exercice 4.21).
Définition 4.2. Soient (un )n∈N et (vn )n∈N deux suites numériques. On dit
que :
— (un )n∈N est dominée par (vn )n∈N s’il existe un entier n0 ≥ 0 et une
suite bornée (ϕn )n≥n0 tels que un = ϕn vn pour tout n ≥ n0 ;
— (un )n∈N est négligeable devant (vn )n∈N , s’il existe un entier n0 ≥ 0 et
une suite (εn )n≥n0 convergente vers 0 tels que un = εn vn pour tout
n ≥ n0 ;
— (un )n∈N est équivalente à (vn )n∈N , s’il existe un entier n0 ≥ 0 et
une suite (ϕn )n≥n0 convergente vers 1 tels que un = ϕn vn pour tout
n ≥ n0 .
On notera un = O (vn ) pour signifier que (un )n∈N est dominée par (vn )n∈N ,
n→+∞
un = o (vn ) pour signifier que (un )n∈N est négligeable devant (vn )n∈N et
n→+∞
un vn pour signifier que (un )n∈N est équivalente à (vn )n∈N .
n→+∞
On vérifie facilement que la relation ∼ définit une relation d’équivalence
n→+∞
sur l’ensemble des suites réelles.
Dire que un vn revient aussi à dire que un − vn = o (vn ) .
n→+∞ n→+∞
Si la suite (un )n∈N converge vers un scalaire = 0, on a alors un (il
n→+∞
un
suffit d’écrire un = ). Mais ce résultat est faux pour = 0. Dire que (un )n∈N
est équivalente à 0 signifie que les un sont tous nuls à partir d’un certain rang et
∗
une limite nulle en étant à valeurs dans K comme le montre
une suite peut avoir
1
l’exemple de .
n n∈N∗
Ces relations peuvent aussi se définir dans le cadre des suites à valeurs dans un
espace normé (E, ·) .
Définition 4.3. Soient (un )n∈N une suite d’éléments d’un espace normé
(E, ·) et (vn )n∈N une suite réelle. On dit que :
— (un )n∈N est dominée par (vn )n∈N , si un = O (|vn |) , ce qui si-
n→+∞
gnifie qu’il existe un réel M > 0 et un entier n0 tels que :
∀n ≥ n0 , un ≤ M |vn |
on note alors un = O (vn ) ;
n→+∞
— (un )n∈N est négligeable devant (vn )n∈N si un = o (|vn |) , ce qui
n→+∞
signifie que pour tout ε > 0, il existe un entier n0 tels que :
∀n ≥ n0 , un ≤ ε |vn |
Suites réelles monotones, adjacentes 93
Définition 4.4. Soient (un )n∈N et (vn )n∈N deux suites d’éléments d’un
espace normé (E, ·) . On dit que (un )n∈N est équivalente à (vn )n∈N si
un − v n = o (vn ) , ce qui signifie que pour tout ε > 0, il existe un
n→+∞
entier n0 tels que :
∀n ≥ n0 , un − vn ≤ ε vn
En remplaçant les inégalités larges par des inégalités strictes on parle de suites
strictement monotones.
Pour étudier la monotonie d’une suite, on peut étudier le signe de un+1 − un
un+1
ou, si un > 0 à partir d’un certain rang n0 , le signe de − 1 pour n ≥ n0 .
un
Une suite réelle (un )n∈N est décroissante si, et seulement si, (−un )n∈N est crois-
sante. Il suffit donc de s’intéresser aux suites croissantes.
Du théorème de la borne supérieure sur R, on déduit le résultat suivant.
Théorème 4.9.
Une suite réelle croissante [resp. décroissante] (un )n∈N est convergente
si, et seulement si, elle est majorée [resp. minorée] et dans ce cas on a
lim un = sup un [resp. lim un = inf un ]. Sinon on a lim un = +∞
n→+∞ n∈N n→+∞ n∈N n→+∞
[resp. lim un = −∞].
n→+∞
Preuve. Considérons une suite (un )n∈N croissante. Si elle est majorée, l’ensemble
non vide majoré {un | n ∈ N} admet alors une borne supérieure . Soit ε un réel
strictement positif. Il existe un entier n0 tel que − ε ≤ un0 ≤ . La suite étant
croissante et étant un majorant de la suite, on a − ε ≤ un ≤ , soit |un − | ≤ ε
pour tout n ≥ n0 . La suite (un )n∈N est donc convergente vers . Si elle n’est pas
majorée, pour tout réel M > 0, il existe alors un entier n0 tel que un0 ≥ M
et avec la croissance, on déduit que un ≥ M pour tout n ≥ n0 . Cette suite est
donc divergente vers +∞. On procède de même pour les suites décroissantes et
minorées.
Le théorème précédent associé au résultat qui suit nous donne une démonstra-
tion du théorème de Bolzano-Weierstrass.
Théorème 4.10.
De toute suite réelle on peut extraire une suite monotone.
Preuve. On sait déjà qu’une suite convergente est bornée et qu’elle n’a qu’une
seule valeur d’adhérence (théorème 1.8). Réciproquement, supposons que la suite
bornée (un )n∈N admette pour seule valeur d’adhérence. Si cette suite ne converge
pas vers , on peut alors trouver un réel ε > 0 tel que pour tout entier n, il
existe p > n avec |up − | ≥ ε. Par récurrence on peut alors construire une suite
strictement croissante d’entiers (ϕ (n))n∈N telle que uϕ(n) − ≥ ε pour tout n. De
la suite bornée uϕ(n) n∈N on peut extraire une sous suite uψ(n) n∈N qui converge
vers et par passage à la limite dans l’inégalité uψ(n) − ≥ ε on déduit que
| − | ≥ ε > 0, c’est-à-dire que est une valeur d’adhérence de (un )n∈N distincte
de , ce qui contredit l’hypothèse de départ.
Définition 4.6. Deux suites réelles (un )n∈N et (vn )n∈N sont dites adja-
centes si la suite (un )n∈N est croissante, la suite (vn )n∈N est décroissante
et la suite (vn − un )n∈N est convergente vers 0.
Lemme 4.1 Si (un )n∈N et (vn )n∈N sont deux suites réelles adjacentes, on a alors
un ≤ vm pour tout (n, m) ∈ N2 .
Preuve. Supposons qu’il existe n, m tels que un > vm . Comme (un )n∈N est
croissante, et (vn )n∈N décroissante, on a alors pour tout k ≥ max (n, m) , uk ≥ un
et vk ≤ vm , donc uk − vk ≥ un − vm > 0 et 0 = lim (uk − vk ) ≥ un − vm > 0,
k→+∞
ce qui est impossible.
Théorème 4.13.
Deux suites réelles adjacentes (un )n∈N et (vn )n∈N convergent vers la
même limite et on a un ≤ ≤ vm pour tout (n, m) ∈ N2 .
Preuve. Il est facile de vérifier que les suites (an )n∈N et (bn )n∈N sont adjacentes
et = sup (an ) = lim (an ) = lim (bn ) = inf (bn ) .
n∈N n∈N n∈N n∈N
Le théorème précédent est un cas particulier du théorème des boules emboîtées
sur un espace métrique complet (exercice 1.9).
Le théorème des suites adjacentes nous permet de retrouver le théorème de
Bolzano-Weierstrass (théorème 4.11) en utilisant une méthode de dichotomie.
Théorème 4.15. Bolzano-Weierstrass
De toute suite bornée de nombres réels on peut extraire une sous-suite
convergente.
Preuve. Si [a0 , b0 ] est un intervalle réel qui contient tous les éléments de la suite
(un )n∈N on le coupe en deux parties égales et on garde une de ces parties qui
contient des un pour une infinité d’indices n. En réitérant ce procédé on construit
deux suites adjacentes (an )n∈N et (bn )n∈N et une application ϕ strictement crois-
sante de N dans N telles que chaque intervalle [an , bn ] contient un terme uϕ(n) . La
suite uϕ(n) n∈N est alors convergente.
Le théorème des suites adjacentes permet également de montrer que R n’est
pas dénombrable en utilisant une méthode de trichotomie.
Théorème 4.16.
R n’est pas dénombrable.
Preuve. Il suffit de montrer que [0, 1] n’est pas dénombrable. Supposons qu’il
existe une application bijective ϕ : N → [0, 1] . En coupant I = [0, 1] en trois
segments de même longueur, il en existe un que l’on note I0 qui ne contient pas
ϕ (0) . On coupe ensuite I0 en trois segments de même longueur en notant I1 l’un
de ces segments qui ne contient par ϕ (1) . Par récurrence, on construit ainsi une
suite de segments emboîtés (In )n∈N telle que, pour tout n ∈ N, In ne contient pas
1
ϕ (n) et In est de longueur n , on déduit alors du théorème des segments emboîtés
3
que In = {x} avec x ∈ [0, 1] et x = ϕ (n) pour tout n ∈ N, ce qui contredit la
n∈N
définition de ϕ.
Suites réelles monotones, adjacentes 97
Une autre application importante du théorème des segments emboîtés (ou des
suites adjacentes) est le théorème des valeurs intermédiaires qui fournit de plus une
méthode dichotomique d’approximation d’une solution d’une équation f (x) = 0
(voir aussi le paragraphe 6.5).
Théorème 4.17.
Si I = [a, b] est un intervalle réel fermé borné et f une fonction continue
de I dans R telle que f (a) f (b) < 0, alors l’équation f (x) = 0 admet au
moins une solution α ∈ ]a, b[ .
Preuve. Supposons que f (a) < 0 < f (b) (en remplaçant au besoin f par −f on
se ramène toujours à ce cas). On construit, par récurrence, une suite ([an , bn ])n∈N
d’intervalles emboîtés dans [a, b] de la manière suivante :
— [a0 , b0 ] = [a, b] ;
— en⎧ supposant
construit
[an , bn ] ⊂ [a, b] pour n ≥ 0, on pose :[an+1 , bn+1 ] =
⎪
⎪ a n + b n a n + b n
⎪
⎨ an , si f >0
2 2
⎪
⎪ an + bn
⎪
⎩ , bn sinon
2
bn − an
On a alors [an+1 , bn+1 ] ⊂ [an , bn ] avec bn+1 − an+1 = pour tout n ≥ 0,
2
b−a
ce qui entraîne bn − an = n pour tout n ≥ 0.
2
([an , bn ])n∈N est alors une suite de segments emboîtés et on a [an , bn ] = {α}
n∈N
avec α ∈ [a, b] . De plus, par construction, on a f (an ) ≤ 0 ≤ f (bn ) pour tout
n ≥ 0. En effet, c’est vrai pour n = 0 et en supposantcet encadrement vérifié au
a n + bn a n + bn
rang n ≥ 0, on a f (an+1 ) = f (an ) ≤ 0 si f > 0 avec bn+1 =
2 2
a n + bn a n + bn
et f (bn+1 ) = f (bn ) ≥ 0 si f ≤ 0 avec an+1 = . Puis avec
2 2
α = lim (an ) = lim (bn ) et la continuité de f, on déduit que :
n→+∞ n→+∞
ce qui équivaut à f (α) = 0. Comme de plus on a supposé que f (a) f (b) < 0, α
b.
est différentde a et de
an + bn
La suite converge également vers α.
2 n∈N
Pour chacune des trois suites, on la majoration de l’erreur d’approximation :
b−a
∀n ∈ N, |α − xn | ≤
2n
ce qui permet de déterminer un nombre suffisant d’itérations
pour atteindre une
b−a
précision ε > 0 donnée. On peut prendre n0 = log2 . En pratique on
ε
préfère utiliser le test d’arrêt |bn − an | < ε.
98 Suites numériques
La méthode converge toujours, mais cette convergence peut être lente. De plus
elle ne se généralise pas au cas des systèmes non linéaires d’équations.
√
Exemple 4.1 Pour obtenir des approximations numériques de 2, on utilise la
fonction f définie par f (x) = x2 − 2 sur [0, 2] (on a f (0) = −2 < 0 < f (2) = 2),
ce qui conduit aux suites (an )n∈N et (bn )n∈N définies par [a0 , b0 ] = [1, 2] et :
⎧ 2
⎪
⎪ a n + bn a n + bn
⎪
⎨ an , si >2
2 2
[an+1 , bn+1 ] =
⎪
⎪
⎪ an + b n
⎩ , bn sinon
2
a n + bn √
La suite (un )n∈N = permet d’approximer 2 avec pour majoration
2 n∈N
√ 1
de l’erreur, un − 2 ≤ bn − an = n .
2
et en conséquence, l’ensemble des entiers m > 0 vérifiant m > x est non vide. Il
admet donc un plus petit élément p qui vérifie p > x et p − 1 ≤ x. Il suffit alors de
poser n = p − 1. Pour x < 0 en raisonnant avec −x on aboutit à l’existence d’un
entier p vérifiant p ≤ −x < p + 1. On a alors − (p + 1) < x < p (x n’est pas entier)
et n = − (p + 1) convient.
Si pour x réel il existe deux entiers n, p tels que n ≤ x < n + 1 et p ≤ x < p + 1,
on a alors n − p < 1, soit n − p ≤ 0 et n − p > −1, donc n = p.
À tout réel x, on associe les suites (rn )n∈N et (sn )n∈N définies par :
[10n x] 1
∀n ∈ N, rn = , sn = rn + n
10n 10
Théorème 4.20.
Les suites (rn )n∈N et (sn )n∈N sont des suites adjacentes de nombres dé-
cimaux qui convergent vers x avec rn ≤ x < sn pour tout n ∈ N.
Preuve. Il est clair que pour tout n ∈ 6N, rn et7sn sont des nombres décimaux. 6 7
Pour n ∈ N on a 10 [10n x] ≤ 10n+1 x < 10n+1 x + 1, soit 10 [10n x] ≤ 10n+1 x
et divisant
6 n+1par7 10
n+1
, on obtient rn ≤ rn+1 . La suite (rn )n∈N
6 n+1 7 est donc croissante.
Avec 10 x ≤ 10 · 10n6x < 10 ([10
7
n
x] + 1) , soit 10 x ≤ 10 ([10 n
x] + 1) − 1,
10n+1 x + 1 n
10 ([10 x] + 1)
on déduit que sn+1 = ≤ = sn . La suite (sn )n∈N
10n+1 10nn+1
est donc décroissante. Enfin avec [10 x] ≤ 10 x < [10n x] + 1, on déduit que
n
1
rn ≤ x < sn , soit 0 ≤ x − rn < , ce qui entraîne la convergence des suites
10n
(rn )n∈N et (sn )n∈N vers x.
La démonstration précédente montre que pour tout n ∈ N on a :
1 1
x− < rn ≤ x et x < sn ≤ x + n
10n 10
100 Suites numériques
Pour ces raisons rn est appelée l’approximation décimale par défaut à 10−n près
de x et sn l’approximation décimale par excès à 10−n près.
Ce théorème peut aussi s’exprimer comme suit.
Théorème 4.21.
L’ensemble D des nombres décimaux est dense dans R.
Preuve. Si x < y on peut alors trouver un entier naturel n tel que 10n (y − x) > 1,
soit 10n y > 10n x + 1 et on a :
10n rn + 1 = [10n x] + 1 ≤ 10n x + 1 < 10n y < [10n y] + 1 = 10n rn + 1
donc rn < rn . Réciproquement s’il existe n ∈ N tel que rn < rn , on a alors
[10n x] < [10n y] , donc [10n x] ≤ [10n y] − 1 et 10n x < [10n x] + 1 ≤ [10n y] ≤ 10n y,
soit x < y.
À tout réel x, on associe la suites (rn )n∈N de ses approximations décimales par
défaut et la suite (an )n∈N définie par :
a0 = [x] 6 7 (4.1)
∀n ∈ N∗ , an = [10n x] − 10 10n−1 x
Développement décimal d’un réel 101
Lemme 4.2 Pour tout entier naturel non nul n, on a an = 10n (rn − rn−1 ) et an
est un entier compris entre 0 et 9.
soit an ≤ 9.
n
ak
Lemme 4.3 Pour tout entier naturel n, on a = rn .
10k
k=0
n
ak
n
= r0 + (rk − rk−1 ) = rn
10k
k=0 k=1
Du théorème 4.20 on déduit le résultat suivant.
Théorème 4.23.
+∞
ak
Pour tout réel x on a x = .
10k
k=0
On dit alors que cette écriture est un développement décimal illimité du réel x.
Par exemple pour x = 32, 456, on vérifie que :
⎧
⎨ a0 = [x] = 32, a1 = [10x] − 10 [x] = 4
a2 = [100x] − 10 [10x] = 5, a4 = [1000x] − 10 [100x] = 6
⎩
ak = 0, pour k ≥ 5,
Lemme 4.4 Pour tout réel x la suite (an )n∈N définie par (4.1) ne peut pas être
stationnaire sur 9 à partir d’un certain rang.
n
n−n 0 −1
ak 9 1
rn − rn0 = = n0 +1
10k 10 10k
k=n0 +1 k=0
1
9 1−
= 10n−n0 = 1 − 1
10n0 +1 1 10n0 10n
1−
10
1 1
soit sn = rn + = rn0 + n0 = sn0 et x = lim (sn ) = sn0 , ce qui contredit
10n 10 n→+∞
x < s n0 .
On déduit donc, par exemple, que la suite (0, 9, 9, · · · , 9, · · · ) comportant une
infinité de 9 consécutifs n’a pas d’antécédents par l’application δ.
Si D désigne le sous-ensemble de D formé des suites qui ne sont pas station-
naires sur 9 à partir d’un certain rang, l’application δ réalise alors une bijection
de R+ sur D .
La suite (an )n∈N définie par (4.1) , fournit un développement décimal illimité
propre de x.
Le réel x = 1 a pour développement propre 1 = 1, 00 · · · 0 · · · , mais on peut
+∞
9
aussi écrire que 1 = 0, 99 · · · 9 · · · = . Ce deuxième développement est un
10k
k=1
développement impropre de 1.
Développement décimal d’un réel 103
Théorème 4.24.
Le développement décimal illimité propre d’un réel positif est unique et
l’application δ réalise une bijection de R+ sur D .
soit b0 ≤ x < b0
+ 1, ce qui signifie que b0 = [x] = a0 . Plus généralement, pour
bn−1 bn+1
n ≥ 1 on a 10 x − b0 − · · · − n−1 = bn +
n
+ · · · et le raisonnement
10 10
précédent nous dit que :
bn−1
bn = 10 x − b0 − · · · − n−1
n
= [10n x] − 10 b0 10n−1 + · · · + bn−1
10
bn 6 7
avec 10n−1 x = b0 10n−1 + · · · + bn−1 + + · · · et b0 10n−1 + · · · + bn−1 = 10n−1 x .
6 7
10
On a donc bn = [10n x] − 10 10n−1 x = an . Le développement décimal illimité
propre d’un réel positif x est donc bien unique.
Le lemme 4.4 nous dit que δ est bien une application de R+ dans D . L’injectivité
se déduit immédiatement du théorème 4.23.
+∞
ak
Si (an )n∈N ∈ D , on peut poser x = (avec ak ≥ 0 pour tout k ≥ 1
10k
k=0 n
n
ak
n
9 ak
et ≤ < 1, on déduit que la suite est croissante
10k 10k 10k
k=1 k=1 k=1 n≥1
majorée, donc convergente) et l’unicité du développement propre nous dit que
δ (x) = (an )n∈N . L’application δ est donc surjective.
Ce résultat permet de donner une démonstration relativement simple du fait
que R n’est pas dénombrable.
Preuve. En écrivant que Z [X] = Zn [X] , on déduit que Z [X] est dénom-
n∈N
brable, soit Z [X] = {Pk | k ∈ N} , les Pk étant des polynômes à coefficients
entiers.
Il en résulte que l’ensemble des nombres réels algébriques A = Pk−1 {0} est dé-
k∈N
nombrable et l’ensemble des réels transcendants R \ A est infini non dénombrable
comme R.
Le théorème de Liouville (théorème 9.34) permet de construire une infinité de
nombres transcendants.
Les développement décimaux illimités propres permettent de caractériser les
nombres décimaux et les nombres rationnels.
Comme x est décimal [resp. rationnel] si, et seulement si, −x l’est, il nous suffit
de considérer les réels positifs et même strictement positifs.
Théorème 4.26.
Un réel strictement positif est décimal si, et seulement si, son développe-
ment décimal illimité propre est fini, c’est-à-dire que la suite des décimales
après la virgule est nulle à partir d’un certain rang.
a
Preuve. Si x = est décimal, on a alors a = q10m + r avec 0 ≤ r < 10m
10m
r
(division euclidienne) et x = q + m . L’écriture en base 10 de r est de la forme
10
n n
rk
r = k
rk 10 avec n < m, ce qui donne x = q + = q, a1 · · · am avec
10m−k
k=0 k=0
am = r0 . La réciproque est évidente.
Théorème 4.27.
Un réel positif x est rationnel si et seulement son développement décimal
illimité propre est périodique à partir d’un certain rang.
Preuve. Le réel x > 0 est rationnel si, et seulement si, x − [x] est rationnel. On
peut donc se limiter à x ∈ ]0, 1[ . Si le développement décimal illimité propre de
x ∈ ]0, 1[ est périodique à partir d’un certain rang, on a alors :
a1 ap b1 bq b1 bq
x= + · · · + p + p+1 + · · · + p+q + p+q+1 + · · · + p+2q + · · ·
10 10 10 10 10 10
a1 ap
soit en notant r = + ··· + p ∈ Q :
10 10
1 b1 bq 1 b1 bq
x=r+ p + · · · + q + p+q + ··· + q + ···
10 10 10 10 10 10
b1 bq
et en notant s = + · · · + q ∈ Q, on a :
10 10
s 1 1 10q s
x = r + p 1 + q + 2q + · · · = r + p ∈Q
10 10 10 10 (10q − 1)
a
Réciproquement supposons que x = avec 0 < a < b dans N. Pour tout entier
b
k compris entre 0 et b, on a la division euclidienne 10k a = bqk + rk , les restes rk
étant compris entre 0 et b−1, ces restes forment une famille de b+1 entiers à valeurs
dans un ensemble à b éléments, il y en a donc forcément deux qui sont égaux, c’est-
à-dire qu’il existe deux entiers p < q compris entre 0 et b tels que 10p a = bqp + r
10q a 10p a
et 10q a = bqq + r et b divise la différence 10q a − 10p a. On a donc − ∈N
b b
10q a 10p a
et les rationnels et ont les mêmes décimales après la virgule (unicité
b b
a
du développement décimal illimité propre). Si = 0, a1 a2 · · · an · · · on a alors :
b
⎧
⎪ 10p a
⎨ = m0 + 0, ap+1 ap+2 · · · ap+n · · ·
b
q
⎪
⎩ 10 a = m1 + 0, aq+1 aq+2 · · · aq+n · · ·
b
et il en résulte que ap+n = aq+n pour tout n ≥ 1, soit :
a
= 0, a1 · · · ap ap+1 · · · aq ap+1 · · · aq · · · ap+1 · · · aq · · ·
b
c’est-à-dire que le développement est périodique à partir du rang p + 1.
p − q [x] r1
Preuve. On a x − [x] = = ∈ ]0, 1[ ∩ Q du fait que x n’est pas entier
q r0
et nécessairement 0 < r1 < r0 = q dans N. De même :
1 r0 r0 − r1 [y] r2
y − [y] = − [y] = − [y] = = ∈ [0, 1[ ∩ Q
x − [x] r1 r1 r1
et 0 ≤ r2 < r1 .
Théorème 4.28.
Si x est un nombre rationnel non entier, il existe alors un entier naturel
non nul n tel que la suite (xk )0≤k≤n soit définie par x0 = x et xk = ϕ (xk−1 )
pour tous k compris entre 1 et n−1, les xk étant rationnels non entiers pour
k compris entre 0 et n − 1, et xn étant entier. De plus en posant ak = [xk ]
pour tout k compris entre 0 et n, on a :
1
x = a0 +
1
a1 +
1
a2 +
1
a3 +
· · · .. 1
. an−1 +
an
Fractions continues 107
p
Preuve. On note x = avec p entier relatif non nul, q entier naturel différent
q
de 0 et 1 et premier avec q. En utilisant le lemme précédent, on a :
⎧ r1 r1
⎪
⎨ x0 = [x] + r = a0 + r
0 0
⎪
⎩ x1 = ϕ (x0 ) = [x1 ] + r2 = a1 + r2
r1 r1
avec 0 ≤ r2 < r1 < r0 = q dans N. Si x1 ∈ Z, il est alors nécessairement dans N
(x1 = ϕ (x0 ) > 1), r2 = 0 et le processus s’arrête à n = 1. Sinon en supposant
construit xj = ϕ (xj−1 ) , pour j compris entre 1 et k, n’appartenant pas à Z, avec
rj+1
k ≥ 1 et xj = aj + , 0 < rj+1 < rj dans N, on peut définir xk+1 = ϕ (xk ) et le
rj
rk+2
lemme précédent nous dit que xk+1 = ak+1 + avec 0 ≤ rk+2 < rk+1 dans N.
rk+1
La suite des rk étant strictement décroissante dans N, il existe nécessairement un
entier n ≥ 1 tel que rn > 0 et rn+1 = 0, ce qui signifie que les xj sont rationnels
non entiers pour j compris entre 0 et n − 1 et que xn est entier. On a donc :
⎧ r1
⎪
⎪ x = x0 = a0 +
⎪
⎪ r
⎪
⎪
0
⎪
⎪ 1 r0 r2
⎪
⎪
⎪
⎪ x1 = = = a1 +
⎪
⎨ . x 0 − a 0 r 1 r 1
..
⎪
⎪
⎪
⎪ 1 rn−2 rn
⎪
⎪ xn−1 = = = an−1 +
⎪
⎪ x − a r r
⎪
⎪
n−2 n−2 n−1 n−1
⎪
⎪ 1 rn−1
⎪
⎩ xn = = = an
xn−1 − an−1 rn
ce qui donne :
r1 1 1
x = a0 + = a0 + r2 = a 0 +
r0 a1 + 1
r1 a1 +
1
a2 +
1
a3 +
· · · .. 1
. an−1 +
an
rk−1 rk+1
À chaque étape, on a xk = = ak + , la partie entière ak = [xk ] étant
rk rk
obtenue en effectuant la division euclidienne de rk−1 par rk . Par exemple, pour
19
x= , on a :
7
⎧
⎪
⎪ 19 = 2 × 7 + 5, donc a0 = 2, r0 = 7, r1 = 5
⎨
7 = 1 × 5 + 2, donc a1 = 1, r2 = 2
⎪
⎪ 5 = 2 × 2 + 1, donc a2 = 2, r3 = 1
⎩
2 = 2 × 1 + 0, donc a3 = 2, r4 = 0
108 Suites numériques
19 1
ce qui donne =2+ .
7 1
1+
1
2+
2
où n est un entier naturel non nul, a0 un réel et, pour k compris entre 1 et
n, ak un réel non nul. On note Rn = [a0 , a1 , · · · , an ] .
Le théorème précédent s’exprime en disant que tout nombre rationnel non entier
peut s’écrire sous forme d’une fraction continue limitée à coefficients entiers. Un
tel développement n’est pas unique. En effet, si an ≥ 2, on a :
Théorème 4.29.
Pour tout entier naturel non nul n et pour tout (n + 1)-uplet
Pn (a0 , · · · , an )
(a0 , a1 , · · · , an ) dans R × (R∗ ) , on a [a0 , a1 , · · · , an ] =
n
,
Qn (a0 , · · · , an )
ou Pn et Qn sont des fonctions polynomiales de a0 , · · · , an définies par les
relations de récurrence P0 = a0 , Q0 = 1, P1 = a0 a1 + 1, Q1 = a1 et pour
n≥2:
Pn = an Pn−1 + Pn−2
(4.2)
Qn = an Qn−1 + Qn−2
1 a 0 a1 + 1 P1
Preuve. Pour n = 1, on a [a0 , a1 ] = a0 + = = . En supposant le
a1 a1 Q1
résultat acquis au rang n, pour tout (n + 1)-uplet (a0 , a1 , · · · , an ) dans R × (R∗ ) ,
n
Fractions continues 109
on a :
1
Rn+1 = [a0 , · · · , an+1 ] = a0 , · · · , an−1 , an +
an+1
1
Pn a0 , · · · , an−1 , an +
an+1
=
1
Qn a0 , · · · , an−1 , an +
an+1
et avec l’hypothèse de récurrence, on a :
# $
1
an + an+1 Pn−1 (a0 , · · · , an−1 ) + Pn−2 (a0 , · · · , an−2 )
Rn+1 = # $
1
an + an+1 Pn−1 (a0 , · · · , an−1 ) + Pn−2 (a0 , · · · , an−2 )
n−1
Dans le cas où les ak sont entiers, la relation Pn Qn−1 − Pn−1 Qn = (−1)
traduit le fait que les entiers Pn et Qn sont premiers entre eux (théorème de
Bézout).
La notion de fraction continue illimitée va nous donner un autre procédé effectif
d’approximation rationnelle des réels.
Théorème 4.31.
Si a0 est un entier relatif et (an )n≥1 une suite d’entiers naturels non
nuls, alors la suite de fractions continues limitées ([a0 , a1 , · · · , an ])n≥1 est
convergente.
pn
Preuve. On note r0 = a0 et rn = [a0 , a1 , · · · , an ] pour tout n ≥ 1 et on a rn =
qn
où (pn )n≥1 et (qn )n≥1 sont les suites d’entiers définies avec le théorème 4.29. Le
théorème 4.30 nous dit que les qn sont tous strictement positifs et :
⎧ n−1
⎪
⎪ (−1)
⎪ rn − rn−1 =
⎨ (n ≥ 1)
qn qn−1
⎪
⎪
n
(−1) an
⎪
⎩ rn − rn−2 = (n ≥ 2)
qn qn−2
Il en résulte que r2p − r2p−1 < 0, r2p − r2p−2 > 0 et r2p+1 − r2p−1 < 0 pour p ≥ 1,
ce qui signifie que la suite (r2p )p≥1 est strictement croissante, la suite (r2p+1 )p≥0
est strictement décroissante avec r2p < r2p−1 pour tout p ≥ 1. D’autre part avec
an ≥ 1 pour tout n ≥ 1, qn ≥ 1 pour tout n ≥ 0 (les an et qn sont entiers naturels
non nuls) et qn = an qn−1 + qn−2 pour n ≥ 2, on déduit que qn ≥ qn−1 + 1 et par
récurrence que qn ≥ n pour tout n ≥ 1. En conséquence on a lim qn = +∞ et
n→+∞
−1
avec r2p − r2p−1 = , on déduit que lim (r2p − r2p−1 ) = 0. En définitive,
q2 q2p−1 n→+∞
les suites (r2p )p≥1 et (r2p+1 )p≥0 sont adjacentes. Elles convergent donc vers une
même limite, ce qui signifie que la suite (rn )n≥1 est convergente.
La limite de la suite ([a0 , a1 , · · · , an ])n≥1 est notée [a0 , a1 , · · · , an , · · · ] et on dit
que c’est une fraction continue régulière illimitée.
La démonstration précédente est en fait valable pour a0 réel et (an )n≥1 suite
de réels tous supérieurs ou égaux à 1.
On a déjà vu que tout nombre rationnel peut s’écrire comme une fraction conti-
nue limitée à coefficients entiers. Dans ce qui suit on montre que tout nombre ir-
rationnel peut s’écrire comme une fraction continue illimitée à coefficients entiers,
ce qui donnera une preuve constructive de la densité de Q dans R.
En reprenant les notations du début de ce paragraphe, on a le résultat suivant.
Lemme 4.6 Si x est un nombre irrationnel, on peut alors définir la suite (xn )n∈N
1
par x0 = x et xn = ϕ (xn−1 ) = pour tout n ≥ 1, chaque xn , pour
xn−1 − [xn−1 ]
n ≥ 1, étant irrationnel.
1
compris entre 1 et n ≥ 1, on peut définir xn+1 = et ce réel est irrationnel
xn − [xn ]
comme xn .
Dans ce qui suit on se donne un nombre irrationnel x et on définit les suites
(xn )n∈N et (an )n∈N par x0 = x, a0 = [x0 ] , xn = ϕ (xn−1 ) et an = [xn ] pour n ≥ 1.
Les xn sont irrationnels avec xn > 1 pour tout n ≥ 1, les an sont entiers avec
pn
an ≥ 1 pour tout n ≥ 1 et rn = [a0 , a1 , · · · , an ] = , où (pn )n∈N et (qn )n∈N
qn
sont des suites d’entiers définies par les relations de récurrence p0 = a0 , q0 = 1,
p1 = a0 a1 + 1, q1 = a1 et :
pn = an pn−1 + pn−2 , qn = an qn−1 + qn−2 (n ≥ 2)
De qn = an qn−1 + qn−2 avec an positif pour n ≥ 1 et q0 , q1 positifs, on déduit
que les entiers qn sont tous positifs non nuls. On a également qn ≥ qn−1 +1, la suite
(qn )n≥1 est donc strictement croissante et par récurrence on vérifie facilement que
qn ≥ n pour tout n ≥ 1.
n−1
Des relations pn qn−1 − pn−1 qn = (−1) pour n ≥ 1 (théorème 4.30), on
déduit que les entiers pn et qn sont premiers entre eux.
1 qn−1
De ces relations on déduit que |rn+1 − rn | = = |rn − rn−1 | et avec
qn qn+1 qn+1
qn+1 = an+1 qn + qn−1 ≥ qn + qn−1 > 2qn−1 on obtient :
|rn − rn−1 |
|rn+1 − rn | < (n ≥ 1)
2
pn−1 xn + pn−2
Lemme 4.7 Pour tout entier n supérieur ou égal à 2, on a x = .
qn−1 xn + qn−2
Preuve. On procède par récurrence sur n ≥ 2. Pour n = 2, on a :
p 1 x 2 + p0 P1 (a0 , a1 ) x2 + P0 (a0 ) P1 (a0 , a1 , x2 )
= =
q1 x2 + q0 Q1 (a0 , a1 ) x2 + Q0 (a0 ) Q1 (a0 , a1 , x2 )
1
= [a0 , a1 , x2 ] = a0 +
1
a1 +
x2
1 1 1
avec x2 = ϕ (x1 ) = , ou encore a1 + = x1 = , ce qui donne
x1 − a1 x2 x − a0
p1 x2 + p0 1
= a0 + = x. En supposant le résultat acquis au rang n ≥ 2, on a :
q1 x 2 + q0 x1
pn xn+1 + pn−1 Pn (a0 , · · · , an ) xn+1 + Pn−1 (a0 , · · · , an−1 )
=
qn xn+1 + qn−1 Qn (a0 , · · · , an ) xn+1 + Qn−1 (a0 , · · · , an−1 )
Pn (a0 , · · · , an , xn+1 )
= = [a0 , · · · , an , xn+1 ]
Qn (a0 , · · · , an , xn+1 )
1
= a0 , · · · , an−1 , an +
xn+1
1
avec an + = xn , ce qui donne :
xn+1
pn xn+1 + pn−1 pn−1 xn + pn−2
= [a0 , · · · , an−1 , xn ] = =x
qn xn+1 + qn−1 qn−1 xn + qn−2
112 Suites numériques
Théorème 4.32.
1 1
Pour x irrationnel, on a |rn − x| < 2
≤ 2 pour tout n ≥ 1 et :
qn n
pn−1 an + pn−2
Preuve. Pour n ≥ 2, on a rn = et, avec le lemme 4.7 et le
qn−1 an + qn−2
théorème 4.30, on déduit que :
pn−1 an + pn−2 pn−1 xn + pn−2 (pn−1 qn−2 − pn−2 qn−1 ) (an − xn )
rn − x = − =
qn−1 an + qn−2 qn−1 xn + qn−2 (qn−1 an + qn−2 ) (qn−1 xn + qn−2 )
n
(−1) (an − xn )
=
(qn−1 an + qn−2 ) (qn−1 xn + qn−2 )
Puis avec 0 ≤ xn − an < 1 (an = [xn ]), qn−1 an + qn−2 = qn ≥ n (récurrence) et
1 1
qn−1 xn + qn−2 ≥ qn−1 an + qn−2 = qn , on déduit que |rn − x| ≤ 2 ≤ 2 et que
qn n
lim rn = x.
n→+∞
Dans la démonstration du théorème 4.31, on a vu que la suite (r2p )p≥1 est
strictement croissante et la suite (r2p+1 )p≥0 est strictement décroissante, ce qui
implique que r2p < x < r2p+1 pour tout p ≥ 1.
Exemples 4.2
√
1. Pour x = 2, on a :
⎧ √ 6√ 7
⎪
⎪ x0 = 2, a0 = 2 =1
⎪
⎪
⎪
⎨ x =√ 1 √ 6√ 7
1 = 2 + 1, a1 = 2+1 =2
2−1
⎪
⎪ √ 6√ 7
⎪
⎪ 1
⎪
⎩ x2 = √ = 2 + 1, a2 = 2+1 =2
2+1 −2
√
et par récurrence, xn = 2 + 1, an = 2 pour tout n√≥ 1. Ce qui donne le
développement en fraction continue régulière illimitée 2 = [1, 2, 2, · · · , 2, · · · ]
√ pn
et les approximations rationnelles de 2, [1, 2, 2, · · · , 2] = où les suites
qn
(pn )n∈N et (qn )n∈N sont définies par les relations de récurrence :
p0
Preuve. Pour n = 0, on a r0 = = [x] et avec :
q0
x − r ≤ |x − r| ≤ |x − r0 | = x − [x]
(pour x > 0, les an sont entiers naturels non nuls, donc les suites (pn )n∈N et
(qn )n∈N sont croissantes). Si r est dans l’intervalle ouvert d’extrémités rn et rn+1 ,
1 q
on a alors 0 < |r − rn | < |rn+1 − rn | = , soit 1 ≤ |pqn − pn q| < et
qn qn+1 qn+1
q ≥ qn+1 ≥ qn . D’autre part, pour n pair [resp. n impair] on a rn < r < rn+1
[resp. rn+1 < r < rn ] ce qui entraîne pqn ≥ pn q + 1 ≥ pn qn+1 + 1 = pn+1 qn
n
(pn+1 qn −pn qn+1 = (−1) = 1) et p ≥ pn+1 ≥ pn [resp. pqn+1 > pn+1 q ≥ pn+1 qn+1
et p ≥ pn+1 ≥ pn ]. Il reste à considérer le cas où r est en dehors de l’intervalle
fermé d’extrémités rn et rn+1 . Si n est pair alors rn < r < rn+1 et les conditions
r∈/ [rn , rn+1 ] , |x − r| ≤ |x − rn | entraînent r > rn+1 ≥ rn et avec r − x ≤ x − rn
114 Suites numériques
rn−1 − rn
on a r ≤ 2x − rn < 2rn+1 − rn puis tenant compte de rn+1 − rn < ,
2
on déduit que r < rn−1 . En définitive, r est dans l’intervalle ]rn , rn−1 [ et ce qui
précède nous dit que p ≥ pn , q ≥ qn . Le cas où n est impair se traite de manière
analogue.
Théorème 4.34.
Les sous-groupes additifs de R discrets sont les sous-groupes monogènes,
à savoir de la forme Zα = {pα | p ∈ Z} où α est un réel. Un tel sous-groupe
est fermé dans R.
que H ⊂ Zα. Si α = 0, alors H est dense dans R. En effet pour x < y dans R,
y x
il existe z dans H ∩ R+,∗ tel que 0 < z < y − x soit 1 < − , donc l’intervalle
8x y 9 8x y 9 z z
, contient au moins un entier et pour n ∈ , ∩ Z, on a x < nz < y avec
z z z z
nz ∈ H.
La démonstration précédente montre en fait le résultat suivant : si G est un
sous-ensemble de R stable par addition contenant au moins un élément strictement
positif et au moins un élément strictement négatif, il est alors dense ou discret.
Le.théorème précédent peut / être utilisé pour prouver la densité de l’ensemble
a
D = | (a, m) ∈ Z × N des nombres décimaux et de l’ensemble Q des ra-
10m
tionnels dans R. Ces deux ensembles sont des sous-groupes additifs de R. Si D
[resp. Q] est discret il existe alors un réel strictement positif α ∈ D [resp. α ∈ Q]
α 5α α
tel que D = Zα [resp. Q = Zα] et avec = ∈ D [resp. ∈ Q] on déduit
2 10 2
α
qu’il existe un entier relatif k tel que = kα, ce qui est impossible (2k = 1 dans
2
Z). Il en résulte que D [resp. Q] est dense dans R. On peut aussi remarquer que
1
inf (D ∩ R+,∗ ) = 0 (pour tout ε > 0, il existe un entier n ≥ 0 tel que 0 < n < ε).
10
Le théorème précédent peut aussi être utilisé pour obtenir des critères d’irra-
tionalité.
2
Corollaire 4.4. Soit (a, b) ∈ (R∗ ) et H = Za + Zb =
2
pa + qb | (p, q) ∈ Z le sous-groupe additif de R engendré par a et b. H est
a
discret [resp. dense] si, et seulement si, est rationnel [resp. irrationnel].
b
Preuve. Si H est discret, il existe alors α ∈ R+,∗ tel que H = Zα, donc a = pα,
a p
b = qα avec p et q non nuls dans Z et en conséquence = ∈ Q. Réciproquement,
b q
a p
en supposant = rationnel avec p et q entiers premiers entre eux dans Z∗ ,
b q
p b
on a H = Z + Z b = (Zp + Zq) et le théorème de Bézout nous dit que
q q
a
Zp + Zq = Z, donc H = Z est discret.
p
Dans le cas particulier où a et b sont des entiers relatifs, on a H = Z (a ∧ b) par
définition du pgcd .
1
n−1
∗
Preuve. Notons pour tout entier n ∈ N , vn = αk uk (suite des moyennes
An
k=0
pondérées de Cesàro).
Dans le cas où (un )n∈N est une suite d’éléments de (E, ·) convergente vers
∈ E, on a :
∀ε > 0, ∃n0 ∈ N | ∀n ≥ n0 , un − < ε
donc pour tout n > n0 :
n−1
1
vn − = αk (uk − )
An
k=0
n
1
0 n−1
1
≤ αk (uk − ) + αk uk −
An An
k=0 k=n0 +1
C0 1
n−1
C0
≤ + αk ε ≤ +ε
An An An
k=n0 +1
C0
Si de plus lim (An ) = +∞, on a alors lim = 0 et on peut trouver un
n→+∞ n→+∞ An
entier n1 > n0 tel que vn − ≤ 2ε pour tout n ≥ n1 . D’où le résultat annoncé.
Dans le cas où (un )n∈N est une suite réelle divergente vers −∞ ou +∞, quitte
à remplacer (un )n∈N par (−un )n∈N , on peut supposer que lim (un ) = +∞. On
n→+∞
a alors :
∀M > 0, ∃n0 ∈ N | ∀n ≥ n0 , un > M
donc pour tout n > n0 :
1 1
n−1 n0 n−1
1
vn = α k uk = α k uk + α k uk
An An An
k=0 k=0 k=n0 +1
C0 An − An0 C0 − An0 M
> + M =M+
An An An
118 Suites numériques
C0 − An0 M
avec lim = 0 et on peut alors trouver un entier n1 > n0 tel
n→+∞ An
C 0 − An0 M M M
que >− pour tout n ≥ n1 , ce qui nous donne vn > pour tout
An 2 2
n ≥ n1 , et le résultat annoncé.
Ce théorème est souvent utilisé en considérant les moyennes arithmétiques,
c’est-à-dire avec la suite (αn )n∈N stationnaire sur 1. Précisément, on a :
1
n−1
lim (un ) = ⇒ lim uk =
n→+∞ n→+∞ n
k=0
Définition 4.12.On dit qu’une suite (un )n∈N d’éléments de (E, ·)
n−1
1
converge au sens de Cesàro vers ∈ E, si la suite uk est
n ∗ k=0 n∈N
convergente vers .
n
En considérant les suites réelles définies par αn = 1 et un = (−1) , on voit que
la réciproque du théorème de Cesàro est fausse. Toutefois, on a le résultat suivant.
Théorème 4.37.
1
Une suite (un )n∈N dans (E, ·) telle que un − un−1 = est o
n→+∞ n
convergente si, et seulement si, elle est convergente au sens de Cesàro.
Preuve. La condition nécessaire est déjà prouvé (que la suite (n (un − un−1 ))n∈N
converge vers 0 ou non). Pour tout entier n ∈ N∗ , on a :
n
n
n
n
n−1
k (uk − uk−1 ) = kuk − kuk−1 = kuk − (k + 1) uk
k=1 k=1 k=1 k=1 k=0
n−1
= nun − uk
k=0
1 1
n−1 n
(transformation d’Abel), soit un − uk = k (uk − uk−1 ) , ce qui donne
n n
k=0 k=1
en appliquant le théorème de Cesàro à la suite (n (un − un−1 ))n∈N∗ (qui converge
1
n−1
vers 0), lim un − uk = 0 et dans le cas où (un )n∈N converge au sens de
n→+∞ n
k=0
Cesàro vers , on en déduit que lim un = .
n→+∞
Le théorème précédent est encore valable pour une suite réelle divergente vers
−∞ ou +∞.
Ce théorème est un cas particulier du théorème suivant.
Moyennes de Cesàro 119
Preuve. On a déjà la condition nécessaire (que (n (un − un−1 ))n∈N soit bornée
1
n−1
ou non). En notant vn = uk pour tout entier n ∈ N∗ , on a pour m > n :
n
k=0
1 1 1
n−1 m−1 m−1
n
vm = uk + uk = v n + uk
m m m m
k=0 k=n k=n
et :
1
m−1
n
u m − v m = um − vn − uk
m m
k=n
n 1
m−1
m−n
= um − vn − (uk − um ) − um
m m m
k=n
1
m−1
n
= (um − vn ) + (um − uk )
m m
k=n
1
m−1
n n
soit um − vm = (um − vm ) + (vm − vn ) + (um − uk ) , ou encore :
m m m
k=n
1
m−1
m−n n
(um − vm ) = (vm − vn ) + (um − uk )
m m m
k=n
1
m−1
n
donc um − vm = (vm − vn ) + (um − uk ) . Dans le cas où la suite
m−n m−n
k=n
(n (un − un−1 ))n∈N est bornée, en désignant par M un majorant de cette suite, on
a pour m > n et k compris entre n et m − 1 :
m
m
1 m−k m−n
um − uk ≤ uj − uj−1 ≤ M ≤M ≤M
j k+1 n+1
j=k+1 j=k+1
M m−n
m−1
n
um − vm ≤ vm − vn +
m−n m−n n+1
k=n
n m−n
≤ vm − vn + M
m−n n+1
120 Suites numériques
Dans le cas où la suite (vn )n∈N est convergente, elle est en particulier de Cauchy,
1
donc pour tout réel ε > 0, on peut trouver un entier n0 > (ce choix sera justifié
ε
plus loin) tel que :
∀m > n ≥ n0 , vm − vn < ε2
ce qui donne :
n m−n
∀m > n ≥ n0 , um − vm ≤ ε2 + M
m−n n+1
Pour m > n0 assez grand, on cherche un entier n compris entre n0 et m tel que
n 1 m−n m−ε m
< et < ε, ou encore <n< . Pour ce faire, il suffit de
m−n ε n+1 ε + 1 ε +1
m−ε
prendre n tel que n = E + 1 où m est choisi tel que m > n0 + ε (n0 + 1) .
ε+1
m−ε m−ε m+1
En effet, on a n − 1 ≤ < n, donc n ≤ +1 = < m puisque
ε+1 ε+1 ε+1
1 m−ε
m > n0 > et n > ≥ n0 si m > ε (n0 + 1) + n0 . On a donc pour ε > 0
ε ε+1
m−ε
donné et m > n0 + ε (n0 + 1) , en prenant n = E +1 :
ε+1
n m−n
um − vm ≤ ε2 + M < (M + 1) ε
m−n n+1
On a ainsi prouvé que lim (um − vm ) = 0 et lim um = lim vm = .
m→+∞ m→+∞ m→+∞
Le théorème précédent est encore valable pour une suite réelle divergente vers
−∞ ou +∞.
Lemme 4.8 La suite (vn )n∈N est décroissante minorée et la suite (wn )n∈N crois-
sante majorée.
Les suites (vn )n∈N et (wn )n∈N sont donc bornées. En écrivant, pour tout n ∈ N,
que En+1 ⊂ En = {un } ∪ En+1 , on déduit que :
wn = inf (En ) ≤ wn+1 = inf (En+1 )
vn+1 = sup (En+1 ) ≤ vn = sup (En )
Lemme 4.9 Avec les notations qui précèdent, 1 et 2 sont des valeurs d’adhérence
de la suite (un )n∈N .
Preuve. De 1 = sup (wn ) avec (wn )n∈N croissante, on déduit que pour tout réel
n∈N
ε > 0 il existe un entier nε tel que :
∀n ≥ nε , 1 − ε < wn = inf up ≤ 1
p≥n
Preuve. Soit = lim uϕ(n) une valeur d’adhérence de la suite (un )n∈N où
n→+∞
(ϕ (n))n∈N est une suite strictement croissante d’entiers naturels (l’existence de
valeurs d’adhérence d’une suite bornée est assurée par le théorème de Bolzano-
Weierstrass). En passant à la limite dans l’encadrement :
on obtient l’encadrement 1 ≤ ≤ 2 .
Dans le cas où la suite (un )n∈N n’est pas bornée, soit elle n’est pas majorée et
+∞ est valeur d’adhérence, soit elle n’est pas minorée et −∞ est valeur d’adhé-
rence. Donc une suite réelle a toujours des valeurs d’adhérence dans R et on peut
définir sa limite supérieure [resp. inférieure] dans R comme la plus grand [resp.
petite] de ses valeurs d’adhérence.
Théorème 4.39.
La suite (un )n∈N converge si, et seulement si, lim inf un = lim sup un .
n→+∞ n→+∞
Preuve. Si la suite (un )n∈N est convergente, sa limite est l’unique valeur d’adhé-
rence et 1 = 2 . Réciproquement, si 1 = 2 , toute valeur d’adhérence de (un )n∈N
étant comprise entre 1 et 2 , il ne peut y en avoir qu’une et comme (un )n∈N est
bornée, elle est nécessairement convergente (théorème 4.12).
4.8 Exercices
n
n
n (n + 1)
n
0≤ kx − [kx] = x− [kx] < n
2
k=1 k=1 k=1
n+1 2
ce qui nous donne 0 ≤ x − un < et en conséquence, lim un = x. Les un
n n n→+∞
étant des nombres rationnels, la densité de Q dans R s’en suit.
Solution. Soit (un )n∈N une suite à valeurs dans Z convergente vers ∈ R. Il
existe un entier n0 tel que :
1
∀n ≥ n0 , |un − un0 | ≤ |un − | + | − un0 | <
2
ce qui implique que un = un0 pour tout n ≥ n0 , puisque les un sont entiers. La
suite (un )n∈N est donc stationnaire et ∈ Z. La réciproque est évidente.
Solution.
1 1 1 1
1. Pour tout n ∈ N∗ , on a un+1 ≤ un + 2 ≤ un + = un + − , donc
n n (n − 1) n − 1 n
1
la suite un + est décroissante minorée par 0 et en conséquence
n − 1 n≥2
convergente, ce qui entraîne la convergence de (un )n∈N .
2. Par récurrence, on a pour tout entier n0 ∈ N :
Exercice 4.4. Étudier les suites (sin (nθ))n∈N , (cos (nθ))n∈N , einθ n∈N
et (tan (n))n∈N , où θ est un réel fixé.
1. Si lim (sin (nθ)) = , avec sin ((n + 1) θ) + sin ((n − 1) θ) = 2 sin (nθ) cos (θ) ,
n→+∞
on déduit alors que 2 = 2 cos (θ) et = 0 puisque cos (θ) = 1 pour θ ∈ /
πZ. Puis avec sin ((n + 1) θ) = cos (nθ) sin (θ) + sin (nθ) cos (θ) , on déduit que
lim (cos (nθ) sin (θ)) = 0, qui entraîne lim (cos (nθ)) = 0 puisque sin (θ) =
n→+∞ n→+∞
0 pour θ ∈ / πZ, ce qui est incompatible avec cos2 (nθ) + sin2 (nθ) = 1. Donc
(sin (nθ))n∈N diverge.
2. Si lim (cos (nθ)) = , avec cos ((n + 1) θ) = cos (nθ) cos (θ) − sin (nθ) sin (θ) ,
n→+∞
(cos (θ) − 1)
on déduit que lim sin (nθ) = , ce qui contredit la divergence de
n→+∞ sin (θ)
(sin (nθ))n∈N . Donc (cos (nθ))n∈N diverge.
3. Si einθ converge, il en est alors de même de e−inθ n∈N , ce qui entraîne
n∈N inθ
e + e−inθ
la convergence de (cos (nθ))n∈N = , soit une impossibilité.
2 n∈N
Donc einθ n∈N diverge.
2 tan (n)
4. Avec sin (2n) = , on déduit que si lim (tan (n)) = , on a alors
1 + tan2 (n) n→+∞
2
lim sin (2n) = , ce qui n’est pas possible d’après ce qui précède. Donc
n→+∞ 1 + 2
(tan (n))n∈N diverge.
Solution. Pour a = 0, la suite est stationnaire sur 0. Pour |a| > 1, la formule
n
du binôme de Newton nous dit que |an | ≥ 1 + n (|a| − 1) , donc lim |a| = +∞
n→+∞
n 1
et la suite (a )n∈N diverge. Pour 0 < |a| < 1, en écrivant que |a| = #
n $n avec
1
|a|
1
> 1, on déduit que lim an = 0. Pour |a| = 1, on a a = eiθ avec θ ∈ [0, 2π[ .
|a| n→+∞
Pour θ = 0, on a a = 1, donc (an )n∈N est stationnaire 1, pour θ = π, on a a = −1 et
(an )n∈N est divergente (deux valeurs d’adhérence distinctes), pour θ ∈ ]0, 2π[\{π} ,
(an )n∈N diverge d’après l’exercice précédent.
n
Exercice 4.6. Montrer que la suite (un )n∈N = n(−1) n∈N
admet 0
comme unique valeur d’adhérence et est divergente.
1
Solution. De lim u2n+1 = lim = 0, on déduit que 0 est une valeur
n→+∞ 2n + 1
n→+∞
d’adhérence de (un )n∈N . Si = lim uϕ(n) est une valeur d’adhérence non nulle
n→+∞
de (un )n∈N , où ϕ : N → N est strictement croissante, on a alors > 0 et :
ϕ(n)
|ln ()| = lim ln uϕ(n) = lim (−1) ϕ (n) = lim ϕ (n) = +∞
n→+∞ n→+∞ n→+∞
Exercices 125
ce qui est impossible. Donc 0 est l’unique valeur d’adhérence de (un )n∈N . Cette
suite est divergente puisque non majorée (u2n = 2n).
pn
Exercice 4.7. Soit x un nombre irrationnel. Montrer que si
qn n∈N
est une suite de nombres rationnels convergente vers x, où pour tout n ∈ N,
pn est un entier relatif et qn un entier naturel non nul, on a lim qn = +∞
n→+∞
et lim pn = +∞ pour x > 0, lim pn = −∞ pour x < 0.
n→+∞ n→+∞
Solution. Dire que la suite (qn )n∈N ne converge pas vers l’infini signifie qu’il existe
une réel α > 0 tel que pour tout entier n ∈ N, il existe un entier kn > n tel que
0 < qkn ≤ α. On peut alors extraire de (qn )n∈N une sous-suite qϕ(n) n∈N à valeurs
dans [0, α] comme suit : pour n = 0 il existe ϕ (0) > 0 tel que 0 < qϕ(0) ≤ α et en
supposant construits les entiers ϕ (0) < ϕ (1) < · · · < ϕ (n) tels que 0 < qϕ(k) ≤ α
pour tout k compris entre 0 et n, on peut trouver ϕ (n + 1) > ϕ (n) tel que
0 < qϕ(n+1) ≤ α. De cette suite bornée on peut alors extraire une sous-suite
pψ(n)
qψ(n) n∈N qui converge vers un entier q ≥ 1, mais alors avec pψ(n) = qψ(n) ,
qψ(n)
on déduit que la suite pψ(n) n∈N est également convergente et sa limite p = xq est
pn
également un entier, ce qui est en contradiction avec x irrationnel. Avec pn = qn
qn
pn
et lim = x = 0, on déduit que lim pn = ±∞, le signe étant celui de x.
n→+∞ qn n→+∞
Exercice 4.8. Montrer que les suites (un )n∈N et (vn )n∈N définies par
n
1 1
un = et vn = un + pour tout n ∈ N convergent vers la même
k! n!
k=0
limite irrationnelle notée e.
Solution.
1. Il est clair que (un )n∈N est croissante et pour n ≥ 1, on a :
1 1 1 n−1
vn+1 − vn = + − =− ≤0
(n + 1)! (n + 1)! n! (n + 1)!
1
donc (vn )n≥1 est décroissante. Avec lim (vn − un ) = lim = 0, on
n→+∞ n→+∞ n!
déduit que ces suites sont adjacentes. Elles convergent donc vers la même limite
e > 0 (on a e ≥ u0 = 1).
p
2. Supposons que e = où p, q sont deux entiers strictement positifs premiers
q
entre eux. Pour tout n > q, le nombre pn = n! (r − un ) = n! lim (um − un )
m→+∞
126 Suites numériques
1 1 1 1
≤ 1 = ≤
n + 1 1 − n+1 n 2
pour m > n ≥ 2, ce qui implique que 0 < pn < 1, soit une impossibilité sur N.
3. Les encadrements un ≤ e ≤ vm , nous permettent de donner des valeurs appro-
chées de e par défaut et par excès. Par exemple, pour n = m = 10, on obtient
u10 ≈ 2.7183 ≤ e ≤ v10 ≈ 2.7183, avec une majoration de l’erreur d’approxi-
1
mation donnée par 0 ≤ e − u10 ≤ v10 − u10 = ≈ 2.755 · 10−7 . On peut aussi
10!
1
utiliser la suite v = (vn )n≥1 définie par vn = un + (les suites u et v sont
n · n!
encore adjacentes) et on a en fait :
1
0 ≤ e − u10 ≤ v10 − u10 = ≈ 2.755 · 10−8
10 · 10!
Exercice 4.9. Montrer que les suites réelles (un )n∈N et (vn )n∈N définies
n
1 n
1
par un = − ln (n) et vn = − ln (n + 1) convergent vers une même
k k
k=1 k=1
limite γ (la constante d’Euler).
1
Solution. La fonction t → étant décroissante positive sur R+,∗ , on a pour tout
t
entier n ∈ N∗ :
n+1
1 1 1
un+1 − un = − (ln (n + 1) − ln (n)) = − dt < 0
n+1 n n+1 t
donc la suite (un )n∈N∗ est strictement décroissante. De manière analogue, pour
n ≥ 1, on a :
n+2
1 n+2 1 1
vn+1 − vn = − ln = − dt
n+1 n+1 n+1 n+1 t
n+2
t − (n + 1)
= dt > 0
n+1 (n + 1) t
on conclut que ces deux suites sont adjacentes et en conséquence convergentes vers
une même limite γ. Les encadrements vn ≤ γ ≤ um , nous permettent de donner
des valeurs approchées de γ. Par exemple, pour n = m = 10, on obtient :
Exercice 4.10. Soient 0 < a < b deux réels et (un )n∈N , (vn )n∈N les
suites définies par u0 = a, v0 = b et :
⎧
⎪ 2
⎨ un+1 = 1 1 (moyenne harmonique)
∀n ∈ N, un + vn
⎪
⎩ vn+1 = un + vn (moyenne arithmétique)
2
√
Montrer que ces suites convergent vers la même limite ab (moyenne géo-
métrique).√Pour b = 1, ces suites nous donnent des approximations numé-
riques de a.
Solution. On vérifie facilement, par récurrence, que un > 0 et vn > 0 pour tout
un − v n
n ∈ N. Pour n ∈ N, on a vn+1 − vn = avec u0 − v0 = a − b < 0 et pour
2
n≥1:
2
2un−1 vn−1 un−1 + vn−1 (un−1 − vn−1 )
un − v n = − =− ≤0
un−1 + vn−1 2 2 (un−1 + vn−1 )
2un vn un (vn − un )
un+1 − un = − un =
un + vn un + v n
on déduit que (un )n∈N est croissante. Enfin avec un > 0 on obtient :
2
(un − vn ) vn − un
0 ≤ vn+1 − un+1 = ≤
2 (un + vn ) 2
b−a
et par récurrence, 0 ≤ vn − un ≤ , ce qui implique que lim (vn − un ) = 0.
2n n→+∞
Les suites (un )n∈N et (vn )n∈N sont adjacentes et en conséquence convergent vers
une même limite λ ≥ 0. D’autre part avec un+1 vn+1 = un vn , on déduit que
√ un vn =
√
u0 v0 pour tout n et λ2 = u0 v0 . Donc lim un = lim vn = u0 v0 = ab.
n→+∞ n→+∞
Exercice 4.11. Soient 0 < a < b deux réels et (un )n∈N et (vn )n∈N les
suites définies par u0 = a, v0 = b et :
√
un+1 = un vn (moyenne géométrique)
∀n ∈ N, un + vn
vn+1 = (moyenne arithmétique)
2
128 Suites numériques
Montrer que ces suites convergent vers une même limite. Cette limite est
appelée moyenne arithmético-géométrique de a et b.
Solution. On vérifie facilement, par récurrence, que un > 0 et vn > 0 pour tout
√ un + v n
n ∈ N. De l’inégalité un+1 = un vn ≤ = vn+1 , on déduit que un ≤ vn ,
2
√ un + vn
un ≤ un vn = un+1 et vn+1 = ≤ vn pour tout n ∈ N. Donc la suite
2
(un )n∈N est croissante et (vn )n∈N est décroissante. Enfin avec :
vn − u n
0 ≤ vn+1 − un+1 ≤ vn+1 − un =
2
b−a
on déduit par récurrence sur n ≥ 0 que 0 ≤ vn −un ≤ et lim (vn − un ) = 0.
2n n→+∞
Les suites (un )n∈N et (vn )n∈N sont donc adjacentes et en conséquence convergent
π
vers une même limite > 0. On peut montrer que cette limite est = ,
2 · E (a, b)
où E (a, b) est l’intégrale elliptique définie par :
+∞
dt
E (a, b) =
0 (t + a2 ) (t2 + b2 )
2
Exercice 4.12. Soient 0 < a < b deux réels et (un )n∈N et (vn )n∈N les
suites définies par u0 = a, v0 = b et :
⎧
⎨ un+1 = un + vn
∀n ∈ N, 2
⎩ √
vn+1 = un+1 vn
sin (θ)
Montrer que ces suites convergent vers la même limite = b où
θ
a
cos (θ) = .
b
On a donc bien 0 < u0 < u1 < v1 < v0 . En supposant le résultat acquis au rang
n ≥ 0, on a :
un+1 + vn+1
un+2 = > un+1 > 0
2
5 &
un+1 + vn+1 2
vn+2 = vn+1 < vn+1 = vn+1 > 0
2
√
√ √ √ un+2
vn+2 − un+2 = un+2 vn+1 − un+2 = √ √ (vn+1 − un+2 )
vn+1 + un+2
√
un+2 un+1 + vn+1
=√ √ vn+1 −
vn+1 + un+2 2
√
un+2 vn+1 − un+1
=√ √ > 0.
vn+1 + un+2 2
La suite (un )n∈N est donc croissante et la suite (vn )n∈N est décroissante. La der-
nière égalité donne pour n ≥ 0 :
√
un+1 v n − un v n − un
0 < vn+1 − un+1 = √ √ <
vn + un+1 2 2
b−a
et par récurrence 0 < vn − un ≤ , ce qui entraîne lim (vn − un ) = 0. Les
2n n→+∞
suites (un )n∈N et (vn )n∈N sont donc adjacentes et en conséquence convergent
8 π 9vers
a
une même limite > 0. Comme 0 < < 1, il existe un unique réel θ ∈ 0, tel
b 2
que a = b cos (θ) . On a donc u0 = b cos (θ) et v0 = b. Pour n = 1, on a ;
u0 + v 0 b (1 + cos (θ)) 2 θ
u1 = = = b cos
2 2 2
√ θ
et v1 = u1 v0 = b cos . De même pour n = 2, on a :
2
u1 + v 1 θ 1 + cos θ2 θ 2 θ
u2 = = b cos = b cos cos
2 2 2 2 22
√ θ θ
et v2 = u2 v1 = b cos cos . Par récurrence, on vérifie que pour tout
2 22
n ≥ 1, on a :
θ θ θ 2 θ
un = b cos cos · · · cos cos
2 22 2n−1 2n
130 Suites numériques
θ θ θ θ
et vn = b cos cos 2
· · · cos n−1
cos . En effet, c’est vrai pour
2 2 2 2n
n = 1 et le supposant acquis pour n ≥ 1, on a :
un + vn
un+1 =
2
θ θ θ θ 1 + cos 2θn
= b cos cos · · · cos cos
2 22 2n−1 2n 2
θ θ θ θ
= b cos cos · · · cos cos2
2 22 2n 2n+1
√ θ θ θ θ
et vn+1 = un+1 vn = b cos cos · · · cos cos . On a donc
2 22 2n 2n+1
2n θ
pour tout n ≥ 1, vn = b cos k
. En remarquant que :
k=1 2
θ cos θ2 sin (θ)
cos = sin (θ) θ θ
=
2 2 sin 2 cos 2 2 sin θ2
θ θ sin (θ) θ
cos cos 2
= cos
2 2 2 sin 2θ 22
sin (θ) θ cos 2θ2 sin (θ)
= sin =
2 sin θ2 2 2 sin 2θ2 cos θ
22 22 sin 2θ2
b sin (θ)
on vérifie facilement par récurrence que, pour tout n ≥ 1, on a vn = n .
2 sin 2θn
θ θ b sin (θ)
Puis avec sin n
n
, on déduit que lim un = lim vn = .
2 n→+∞ 2 n→+∞ n→+∞ θ
1 π
Pour a = √ , b = 1, on a θ = et ces suites donnent des approximations
2 √ 4
2 2
numériques de .
π
Exercice 4.14.
1. Montrer que le réel x = 0, 0100100010 · · · , où le nombre de 0 qui suivent
le chiffre ak = 1 est augmenté de 1 à chaque étape, est irrationnel.
Exercices 131
Solution.
+∞
1
1. On a x = avec p0 = 2 et pour k ≥ 1, pk = pk−1 + k + 2, soit :
10pk
k=0
k (k + 1) (k + 1) (k + 4)
pk = p0 + 1 + 2 + · · · + k + 2k = + 2 (k + 1) =
2 2
Si x est rationnel, alors son développement décimal est de la forme :
x = a 0 , a 1 · · · a p b1 · · · b q b1 · · · b q · · · b 1 · · · b q · · ·
p
j
p
P (n + jm) = ak (n + jm) = ak nj + mq = m (q + 1)
k=0 k=0
est premier et produit de deux entiers au moins égaux à 2, ce qui est impossible.
3. Si x est rationnel, alors son développement décimal est de la forme :
x = a 0 , a 1 · · · a p b1 · · · b q b1 · · · b q · · · b 1 · · · b q · · ·
2. Soit x0 un réel strictement positif. Montrer que pour tout réel ε > 0 il
existe un réel η > 0 tel que x > 0 et |ln (x) − ln (x0 )| < η entraînent
|x − x0 | < ε.
3. Montrer que D∗ est dense dans R.
Solution.
1. Si H n’est pas dense dans R, il est nécessairement discret, c’est-à-dire qu’il
existe un réel α tel que H = Zα. Il existe alors des entiers relatifs p, q, r tels que
ln (5) ln (5) a
α = p ln (2) + q ln (5) et ln (2) = rα, ce qui entraîne ∈ Q, soit =
ln (2) ln (2) b
avec a, b entiers naturels non nuls et 5b = 2a , ce qui est impossible.
2. Se déduit de la continuité de la fonction exponentielle en ln (x0 ) .
3. Il s’agit de montrer que pour tout réel x0 et tout réel ε > 0 il existe un décimal
inversible d tel |x0 − d| < ε. On rappelle que les décimaux inversibles s’écrivent
d = ±2p 5q avec p, q entiersrelatifs.
Pour x0 = 0, cela se déduit immédiatement
1 1
de lim n = 0, la suite étant à valeurs dans D∗ . Pour x0 > 0, du
n→+∞ 2 2n n≥1
fait de la densité de H dans R, pour tout réel η > 0 on peut trouver deux entiers
relatifs p, q tels que |p ln (2) + q ln (5) − ln (x0 )| < η, soit |ln (2p 5q ) − ln (x0 )| < η
et avec le résultat de la deuxième question on déduit que pour tout réel ε > 0
on peut trouver d = 2p 5q dans D∗ tel que |x0 − d| < ε. Enfin pour x0 < 0 et
ε > 0, si d ∈ D∗ est tel que |−x0 − d| < ε, en posant d = −d ∈ D∗ , on a
|x0 − d | < ε.
Solution.
1. Comme 2π est irrationnel, le groupe H = Z2π + Z est dense dans R. Avec la
2π-périodicité, la continuité et la surjectivité de l’application f : x → eix de R
sur Γ, on déduit alors que l’ensemble :
. /
f (H) = e(2πm+n)i | (m, n) ∈ Z × Z = ein | n ∈ Z
est dense dans Γ, ce qui signifie l’ensemble des valeurs d’adhérence de la suite
ein n∈N est Γ.
2. Avec la continuité et la surjectivité de la projection p : z → (z) de Γ sur
[−1, 1] , on déduit que l’ensemble {cos (n) | n ∈ Z} est dense dans [−1, 1] , puis
par parité que l’ensemble {cos (n) | n ∈ N} est dense dans [−1, 1] , ce qui signifie
l’ensemble des valeurs d’adhérence de la suite (cos (n))n∈N est [−1, 1] .
Exercices 133
Exercice 4.17. Soit (qn )n∈N une suite d’entiers naturels non nuls telle
que :
— pour tous k, n dans N tels que k ≤ n, qk divise qn ;
1
— la série de terme général est convergente et le reste d’ordre n,
qn
+∞
1 1
Rn = , est négligeable devant .
qk qn
k=n+1
+∞
1
1. Montrer que θ = est irrationnel.
qk
k=0
+∞
1
2. Montrer que e = est irrationnel.
k!
k=0
1
3. Montrer que la série de terme général est convergente et que sa
22 k − 1
somme est irrationnelle.
1
4. Montrer que la série de terme général (nombres de Fermat) est
+1 22k
convergente et que sa somme est irrationnelle.
Solution.
n
1
1. Pour tout entier naturel n, on note pn = qn . Pour tout n ∈ N, on a
qk
k=0
pn ∈ N∗ (qn est un entier multiple de qk pour tout k compris entre 0 et n) et :
0 < qn θ − pn = qn Rn
1
avec lim qn Rn = 0 (Rn est négligeable devant ), ce qui implique que θ est
n→+∞ qn
irrationnel (théorème 4.6).
2. Le résultat précédent avec qk = k! nous donne l’irrationalité de e. En effet, il
est clair que qk divise qn pour k compris entre 0 et n, le critère de d’Alembert
+∞
1
nous assure la convergence de la série et enfin :
k!
k=0
+∞
+∞
1 1 1
Rn = = 1+
k! (n + 1)! (n + 2) · · · (n + k)
k=n+1 k=2
1 1
avec ≤ pour tout k ≥ 2 nous donne :
(n + 2) · · · (n + k) k!
1 1
0 < Rn ≤ e= o
(n + 1)! n→+∞ n!
k
3. On prend ici qk = 22 − 1 pour tout k ∈ N. Avec :
k k
qk 22 − 1 22 1
0< = 2k+1 2k+1 = < 1
qk+1 2 −1 2 4
134 Suites numériques
+∞
1
on déduit que la série est convergente (critère de d’Alembert). Avec :
qk
k=0
xkp − 1 = xk − 1 Q (x)
+∞
1
On peut donc conclure à l’irrationalité de θ = 2k − 1
.
k=0
2
+∞
1
4. En utilisant le critère de d’Alembert, on vérifie que la série ϕ = est
k=0
+1 22k
convergente. Puis avec θ−ϕ = 2 (θ − 1) , on déduit que ϕ = 2−θ est irrationnel.
Exercice 4.18. Soient (un )n∈N une suite réelle monotone et (vn )n∈N∗ la
1
n−1
suite de ses moyennes de Cesàro définie par vn = uk pour tout n ∈ N∗ .
n
k=0
1. Montrer que la suite (vn )n∈N est monotone de même sens de variation
que (un )n∈N .
2. Montrer que lim un = dans R = R ∪ {−∞ + ∞} si, et seulement si,
n→+∞
lim vn = .
n→+∞
Solution. Remplaçant éventuellement (un )n∈N par (−un )n∈N , on suppose que
cette suite est croissante.
n un 1
1. On a vn+1 = vn + = vn + (un − vn ) , soit :
n+1 n+1 n+1
1
n−1
1 1
vn+1 − vn = (un − vn ) = un − uk
n+1 n+1 n
k=0
n−1
1
n−1
1
= nun − uk = (un − uk ) ≥ 0
n (n + 1) n (n + 1)
k=0 k=0
2. La condition nécessaire est le théorème de Cesàro. Comme (un )n∈N est crois-
sante elle a une limite dans R donc (vn )n∈N a la même limite (théorème de
Cesàro) et lim vn = entraîne = .
n→+∞
Exercice 4.19. Soit (un )n∈N une suite d’éléments d’un espace normé
(E, ·) .
1. Montrer que si lim (un+1 − un ) = (avec éventuellement infini pour
n→+∞
1
une suite réelle), on a alors lim un = .
n→+∞ n
2. Soit (γn )n∈N une suite réelle strictement
croissante non majorée avec
1
γ0 > 0. Montrer que si lim (un+1 − un ) = ( éven-
n→+∞ γn+1 − γn
1
tuellement infini pour une suite réelle), on a alors lim un = .
n→+∞ γn
Solution.
1
n−1
1 1
1. Il suffit d’écrire que un = (uk+1 − uk ) + u0 et d’utiliser le théorème
n n n
k=0
de Cesàro.
2. Soit (αn )n∈N la suite réelle définie par αn = γn+1 − γn . Comme (γn )n∈N est
strictement croissante avec γ0 > 0, les suites (γn )n∈N et (αn )n∈N sont à va-
leurs strictement positives. Side plus (γn )n∈N est non majorée, elle diverge
n
alors vers +∞ et on a lim αk = lim (γn+1 − γ0 ) = +∞. En écri-
n→+∞ n→+∞
k=0
n−1
αk 1
1
vant que (uk+1 − uk ) = (un − u0 ) , on déduit du
n−1
αk k=0 γ k+1 − γ k γ n − γ0
k=0
1
théorème de Cesàro que si lim (un+1 − un ) = , on a alors
n→+∞ γn+1 − γn
1 1
lim (un − u0 ) = , soit lim un = car lim γn = +∞.
n→+∞ γn − γ0 n→+∞ γn − γ0
n→+∞
1 1 1
Avec un un , on déduit que lim un = .
γn − γ0 n→+∞ γn n→+∞ γn
Exercice 4.20. Soient α > 0 et (un )n∈N la suite de réels définie par
1
u0 > 0 et un+1 = un + α pour tout n ∈ N.
un
1. Montrer que lim un = +∞.
n→+∞
2. Montrer que pour tout β > 0 on a
β 1
uβn+1 = uβn 1 + α+1 + o
un n→+∞ uα+1
n
136 Suites numériques
Solution.
1. La suite (un )n∈N est strictement croissante (par récurrence). Si elle était bornée,
1
elle serait alors convergente de limite vérifiant = + α , ce qui est impossible
pour α > 0. Donc lim un = +∞.
n→+∞
β
1 β 1
2. On a uβn+1 = uβn 1 + α+1 = uβn 1 + α+1 + o puisque
un un n→+∞ uα+1 n
1
lim = 0.
n→+∞ uα+1n
3. Pour β = α + 1, on a lim uα+1 n+1 − un
α+1
= α + 1. Le théorème de Cesàro
n→+∞
uα+1 1
entraîne alors que lim n
= α + 1, soit que un ∼ ((α + 1) n) α+1 .
n→+∞ n n→+∞
Exercice 4.22. Soit (un )n∈N une suite de réels strictement positifs qui
converge vers .
⎛ n1 ⎞
(
n−1
1. Montrer que la suite ⎝ uk ⎠ des moyennes géométriques
k=0
n∈N∗
converge vers .
⎛ ⎞
⎜ n ⎟
2. Montrer que la suite ⎜
⎝ n−1
⎟ des moyennes harmoniques
% 1 ⎠
k=0 uk n∈N∗
converge vers .
Solution.
1. Si lim (un ) = ≥ 0, on a alors lim (ln (un )) = ln () ∈ [−∞, +∞[
n→+∞
n−1
n→+∞
1
et en conséquence lim ln (uk ) = μ avec μ = ln () pour réel
n→+∞ n
k=0 ⎛ ⎛ n1 ⎞⎞
(
n−1
et μ = −∞ pour = 0. On a donc lim ⎝ln ⎝ uk ⎠⎠ = μ et
n→+∞
k=0
⎛ n1 ⎞
(
n−1
lim ⎝ uk ⎠ = eμ = .
n→+∞
k=0
1 1
2. On a lim = ∈ [0, +∞] et le théorème de Cesàro nous assure que
n→+∞un
1
n−1
1 1 n
lim = , ou encore que lim n−1 = . En utilisant l’encadre-
n→+∞ n uk n→+∞ % 1
k=0
k=0 uk
ment Hn ≤ Gn ≤ An , où Hn , Gn et An désigne respectivement les moyennes
harmonique, géométrique et arithmétique de la suite (un )n∈N , la convergence
de (Gn )n∈N∗ vers se déduit de celle des suites (Hn )n∈N∗ et (An )n∈N∗ .
Exercice 4.23. Soient (un )n∈N∗ et (vn )n∈N∗ deux suites numériques
convergentes respectivement vers et . Montrer que la suite (wn )n∈N∗
1
n
définie par wn = uk vn−k pour tout n ∈ N∗ , converge vers .
n
k=1
sup |un |
| |
n n
n∈N∗
et |wn − | ≤ |vn−k − | + |uk − | (la suite (un )n∈N∗ est
n n
k=1 k=1
bornée puisque convergente). On conclut alors avec le théorème de Cesàro.
Exercice 4.24. Soient (un )n∈N et v = (vn )n∈N deux suites réelles bor-
nées.
1. On suppose que un ≤ vn pour tout n ∈ N. Montrer que :
lim inf (un ) ≤ lim inf (vn ) et lim sup un ≤ lim sup vn
n→+∞ n→+∞ n→+∞ n→+∞
2. Comparer lim inf (un + vn ) et lim inf (un ) + lim inf (vn ) . Donner un
n→+∞ n→+∞ n→+∞
exemple de suites (un )n∈N , (vn )n∈N telles que l’égalité n’ait pas lieu.
Solution.
1. Si un ≤ vn pour tout n ∈ N, on a alors inf un ≤ un ≤ vn pour tout m ∈ N
n≥m
et tout n ≥ m, donc inf un ≤ inf vn pour tout m ∈ N et passant à la limite
n≥m n≥m
quand m tend vers l’infini, on en déduit que lim inf (un ) ≤ lim inf (vn ) . De
n→+∞ n→+∞
manière analogue, on vérifie que lim sup un ≤ lim sup vn .
n→+∞ n→+∞
2. Pour tout m ∈ N et tout n ≥ m, on a inf un + inf vn ≤ un + vn , donc
n≥m n≥m
inf un + inf vn ≤ inf (un + vn ) et passant à la limite quand m tend vers
n≥m n≥m n≥m
l’infini, on en déduit que lim inf (un ) + lim inf (vn ) ≤ lim inf (un + vn ) . Pour
n→+∞ n→+∞ n→+∞
n
(un )n∈N = ((−1) )n∈N et (vn )n∈N = −u, on a lim inf (un ) = lim inf (vn ) = −1
n→+∞ n→+∞
et lim inf (un + vn ) = 0, donc l’égalité n’a pas lieu.
n→+∞
Chapitre 5
Vitesse et accélération de la
convergence des suites
réelles
Pour tout ce chapitre, on désigne par (xn )n∈N une suite réelles qui converge
vers un réel et telle que xn = pour tout n ∈ N.
On dit que le réel λ qui intervient dans la définition précédente, quand il existe,
est le coefficient de convergence de la suite (xn )n∈N .
Dans le cas où λ ∈ ]0, 1[ (convergence géométrique), pour tout ε > 0 tel que
0 < λ + ε < 1, on peut trouver un entier naturel nε tel que :
xn+1 −
∀n ≥ nε , 0 < <λ+ε
xn −
ce qui nous donne pour n ≥ nε :
n−nε |xnε − | n
|xn − | < (λ + ε) |xnε − | = n (λ + ε)
(λ + ε) ε
140 Vitesse et accélération de la convergence des suites réelles
n
donc la suite (|xn − |)n≥nε est dominée par la suite géométrique ((λ + ε) )n≥nε .
Exemples 5.1
1. Le nombre e peut être défini comme la limite de la suite (xn )n∈N∗ définie par
n
1
xn = 1 + pour tout n ∈ N∗ . Le développement limité à l’ordre 2 de
n
1 1
ln (1 + x) au voisinage de 0 nous donne xn = e 1 − + o , ou
2n n→+∞ n
e e − xn+1
encore e − xn ∼ et lim = 1, ce qui signifie que la conver-
n→+∞ 2n n→+∞ e − xn
gence est lente.
e
2. En utilisant la suite (yn )n∈N = (x2n )n∈N , on a e − yn ∼ et en consé-
n→+∞ 2n+1
e − yn+1 1
quence, lim = , c’est-à-dire que la convergence est géométrique.
n→+∞ e − yn 2
On a ainsi accéléré la convergence de la suite (xn )n∈N∗ .
3. De manière plus générale, dès que l’on a un développement asymptotique de la
forme xn = +βλn + o (λn ) avec β non nul et λ dans ]−1, 1[ , la convergence
n→+∞
de la suite (xn )n∈N vers est géométrique de rapport |λ| . En considérant les
λn
suites (nλn )n∈N ou , on constate que la réciproque est fausse.
n n∈N∗
n
1
4. La convergence de la suite (xn )n∈N = vers e est rapide. En effet,
k!
k=0 n∈N
la formule de Taylor-Lagrange nous dit que pour tout n ∈ N∗ , il existe un réel
e cn
cn ∈ ]0, 1[ tel que e − xn = , ce qui nous donne :
n!
e − xn+1 1 ecn+1 1
0< = < e → 0
e − xn n+1 e c n n + 1 n→+∞
et la convergence est rapide.
+∞
1
5. Considérons la somme d’une série de Riemann ζ (p) = p
où p est un réel
n=1
n
strictement supérieur à 1. Pour tout n ∈ N∗ , on a :
n +∞
1 1
ζ (p) − xn = ζ (p) − =
kp kp
k=1 k=n+1
k+1
1 dt 1
Des encadrements p ≤ ≤ p , on déduit que :
(k + 1) k tp k
+∞
1 1 1
∀n ≥ 2, ζ (p) − xn ≤ dt = ≤ ζ (p) − xn−1
n t p p−1n p−1
ou encore :
1 1
∀n ∈ N∗ , p−1 ≤ (p − 1) (ζ (p) − xn ) ≤ (5.1)
(n + 1) np−1
Vitesse de convergence 141
1 1 ζ (p) − xn+1
ce qui nous donne ζ (p) − xn ∼ et lim = 1,
n→+∞ p − 1 np−1 n→+∞ ζ (p) − xn
c’est-à-dire que la convergence est lente.
⎧
xn+1 ⎨ 2λ si n = 2p
=
xn ⎩ λ si n = 2p + 1
2
xn+1
on voit que la suite est divergente.
xn n∈N
Dans la pratique, on ne connaît pas la limite de la suite (xn )n∈N , mais dans
certains cas, on peut calculer le coefficient de convergence λ sans connaître expli-
citement cette limite .
xn+1 −
Lemme 5.1 Si lim = λ ∈ ]−1, 1[ \ {0} (convergence géométrique de
n→+∞ xn −
|λ|) et s’il existe un entier n0 ≥ 1 tel que xn = xn−1 pour tout n ≥ n0 , la
rapport
xn+1 − xn
suite converge alors vers λ.
xn − xn−1 n≥n0
142 Vitesse et accélération de la convergence des suites réelles
xn −
(de xn = xn−1 , on déduit que = 1)
xn−1 −
xn+1 −
Le fait que lim = μ n’entraîne pas nécessairement la convergence
n→+∞ xn −
xn+1 − xn
de la suite . Par exemple pour la suite (xn )n∈N définie par
xn − xn−1 n≥n0
x2p = (−1) λ2p et x2p+1 = (−1) λ2p+1 avec 0 < λ < 1, on a = lim |xn | = 0,
p p
n→+∞
xn+1 −
= λ, xn = xn−1 pour tout n ≥ 1 et :
xn −
Une convergence lente ou géométrique est dite d’ordre 1. On dit aussi que la
convergence est super-linéaire si elle est d’ordre r ≥ 2.
Si la convergence de (xn )n∈N vers est d’ordre r ≥ 1, cet entier r est alors
|xn+1 − | |xn+1 − |
uniquement déterminé. En effet si lim r = λ et lim s = μ
n→+∞ |xn − | n→+∞ |xn − |
s−r λ λ
avec s > r ≥ 1, on a alors lim |xn − | = avec = 0, s − r > 0 et
n→+∞ μ μ
lim (xn − ) = 0, ce qui est impossible.
n→+∞
xn+1 −
Si la convergence de (xn )n∈N vers est d’ordre r ≥ 2, est alors
xn −
r−1
équivalent à λ |xn − | qui converge vers 0, c’est-à-dire que la convergence est
rapide. Mais réciproquement une convergence rapide n’est pas obligatoirement
Accélération de la convergence 143
n
1
super-linéaire comme le montre l’exemple de la suite (xn )n∈N = .
k!
k=0 n∈N
1
Cette suite converge rapidement vers e avec e − xn ∼ , de sorte que
n→+∞ (n + 1)!
pour tout entier r ≥ 2, on a :
r r−1
e − xn+1 ((n + 1)!) ((n + 1)!)
r ∼ = → +∞
|e − xn | n→+∞ (n + 2)! (n + 2) n→+∞
Définition 5.3. Si (yn )n∈N est une autre suite convergente vers avec
yn = pour tout n ∈ N, on dit que la convergence de cette suite vers est
yn −
plus rapide que celle de (xn )n∈N si lim = 0.
n→+∞ xn −
Exemples 5.2
1. On reprend l’exemple d’une série de Riemann convergente. De l’encadrement
(5.1) on déduit que :
p−1
1 1 1 (n + 1) − np−1
∀n ≥ 1, 0 ≤ ζ (p) − xn − ≤
p − 1 (n + 1)p−1 p − 1 np−1 (n + 1)p−1
1 1
ce qui entraîne que la suite (yn )n∈N∗ définie par yn = xn +
p − 1 (n + 1)p−1
converge vers ζ (p) plus rapidement que la suite (xn )n∈N∗ . En effet, il est clair
que la suite (yn )n∈N∗ converge vers ζ (p) et pour tout n ≥ 1, on a :
p−1
ζ (p) − yn (n + 1) − np−1 p−1
0≤ ≤ ∼ → 0
ζ (p) − xn np−1 n→+∞ n n→+∞
β 1
2. Un développement asymptotique de la forme xn = + + o avec
np n→+∞
n p
β 1
β non nul et p > 0 donne yn = x2n = + np + o et en consé-
2 n→+∞ 2np
yn − np
quence, lim = lim = 0. Mais une extraction ne permet pas
n→+∞ xn − n→+∞ 2np
1
toujours d’accélérer la convergence d’une suite. Par exemple pour
ln (n) n≥2
1 yn 1
et , on a lim = .
ln (n2 ) n≥2 n→+∞ xn ln (2)
144 Vitesse et accélération de la convergence des suites réelles
L’exercice 5.6 nous donne un procédé élémentaire, mais peu performant, d’ac-
célération de la convergence, l’idée étant de remplacer chaque xn par une moyenne
pondérée de xn et xn+1 . Ce procédé sera affiné par la méthode de Richardson.
Dans le cas où on dispose d’un encadrement de la forme εn ≤ xn − ≤ εn ,
où (εn )n∈N et (εn )n∈N sont des suites convergentes vers 0, la suite (yn )n∈N définie
par yn = xn − εn converge aussi vers avec 0 ≤ yn − ≤ εn − εn , ce qui fournit
parfois une suite accélératrice. Avec l’exercice 5.8, on trouvera des exemples de
telle situation.
En utilisant la définition des λn , on peut écrire chaque terme de la suite accé-
lératrice de Aitken (yn )n≥n0 sous la forme :
2
xn+1 xn−1 − x2n (xn − xn−1 )
yn = = xn−1 −
xn+1 − 2xn + xn−1 xn+1 − 2xn + xn−1
Méthode d’accélération d’Aitken 145
xn+1 − xn
(comme λn = < 1, on a (xn+1 − xn ) − (xn − xn−1 ) = 0 et le dénomi-
xn − xn−1
nateur de yn est bien non nul).
En introduisant les opérateurs de Aitken Δ et Δ2 définis par :
Δxn = xn+1 − xn
Δ2 xn = Δ (Δxn ) = xn+2 − 2xn+1 + xn
2
(Δxn )
on a yn+1 = xn −
Δ2 x n
Pour la programmation de la méthode de Aitken on peut remarquer que les yn
−1
1 1
s’écrivent aussi yn = xn + − . En effet, on a :
xn+1 − xn xn − xn−1
Dans le cas où la suite (xn )n∈N est une suite d’approximations successives définie
1
par xn+1 = f (xn ) , en définissant la fonction g par g (x) = pour tout
f (x) − x
x ∈ I \ {} , les yn peuvent se calculer comme suit :
1
xn = f (xn−1 ) , yn = xn +
g (xn ) − g (xn−1 )
f () = , on a ici :
⎧
⎪ f () f () 2 2 2
⎪
⎨ yn − n→+∞
∼ (x n−1 − ) = (xn−1 − )
2 (1 − f ()) 2 (1 + )
⎪ yn+1 −
⎪
⎩ ∼ (f ()) = 2
2
yn − n→+∞
2
avec 2 0.321651511855947 et 0.102623516887215.
2 (1 + )
Dans le cas d’un point fixe super-attractif (c’est-à-dire que f () = 0), en
supposant de plus que f () = 0, on a, pour f de classe C 4 , le développement
asymptotique suivant de l’erreur d’approximation en = xn − :
−λ22 + o (1)
n→+∞
et yn − = e3n−1 = −λ22 + o (1) e3n−1 , soit
1 − 2λ2 en−1 + o (en−1 ) n→+∞
n→+∞
2
(f ()) 3
yn − ∼ (un − ) . Avec :
n→+∞ 4
⎧
⎪
⎪
⎨ yn − = −λ22 + o (1) e3n−1
n→+∞
⎪
⎪
⎩ yn+1 − = −λ2 + o (1) e3n = −λ52 +
2
o (1) e6n−1
n→+∞ n→+∞
yn+1 − f ()
on déduit que 2 . La convergence vers de (yn )n≥n0 est donc
(yn − ) n→+∞ 2
d’ordre 2 comme celle de (xn )n∈N , mais quand même plus rapide.
ce qui confirme bien que la suite (yn )n∈N converge vers plus vite que la suite
(xn )n∈N .
Si on connaît explicitement le coefficient λ, mais pas le coefficient β, on peut
définir un barycentre de xn+1 et xn où le terme βλn a été éliminé. Pour ce faire,
on écrit que :
⎧
⎪
⎪
⎨ xn+1 = + βλ n+1
+μ n+1
γ + o (1)
n→+∞
⎪
⎪
⎩ xn = + βλ + μ γ + o (1)
n n
n→+∞
et on a xn+1 − λxn = (1 − λ) + μn (μ − λ) γ + o (1) , ce qui nous conduit
n→+∞
xn+1 − λxn
à introduire la suite (yn )n∈N définie par yn = pour tout n ∈ N. On
1−λ
μ−λ μ−λ n
a alors yn − = μn γ + o (1) ∼ γμ , c’est-à-dire que la
1−λ n→+∞ n→+∞ 1 − λ
convergence est géométrique de rapport |μ| et :
yn − μ − λ γ # μ $n
∼ → 0
xn − n→+∞ 1−λ β λ n→+∞
On est donc ainsi passé de la suite (xn )n∈N qui converge vers avec une vitesse
de convergence géométrique de raison |λ| à la suite (yn )n∈N qui converge aussi vers
avec une vitesse de convergence géométrique de raison |μ| < |λ| .
Les exercices 5.6 et 5.7 nous donnent des exemples de cette situation où on
approxime respectivement les nombres e et π.
β γ 1
Si on a un développement asymptotique du type xn = + + 2 + o
n n n→+∞ n2
avec β et γ non nuls, on utilise alors la suite (yn )n∈N = (x2n )n∈N pourlaquelle
β γ 1
on a le développement asymptotique yn = + n + n + o et une
2 4 n→+∞ 4n
β
suite accélératrice est définie par zn = 2yn+1 − yn . On a alors yn − ∼
n→+∞ 2n
1 γ
et zn − ∼ − n , c’est-à-dire qu’on passe d’une convergence géométrique de
n→+∞ 24
1 1
raison à une convergence géométrique de raison (voir l’exercice 5.6).
2 4
La méthode de Richardson consiste à itérer le procédé précédent si on dispose
p+1
d’un développement asymptotique de la forme xn = + βj λnj + o λnp+1 ,
n→+∞
j=1
148 Vitesse et accélération de la convergence des suites réelles
où p est un entier naturel non nul, les coefficients βj sont tous non nuls et les
coefficients λj tels que 0 < |λp+1 | < |λp | < · · · < |λ1 | < 1.
Si tous les coefficients βj et λj sont connus, on peut accélérer la convergence
p+1
de cette suite en introduisant la suite (yn )n∈N définie par yn = xn − βj λnj pour
j=1
tout n ∈ N. Ce cas se présente pour les sommes de séries numériques de la forme
+∞
f (n) , où la fonction f est indéfiniment dérivable sur R+,∗ . Le développement
n=0
asymptotique est obtenu en utilisant la formule d’Euler et Mac-Laurin en suppo-
sant le calcul explicite des dérivées de la fonction f facilement réalisable. C’est le
cas par exemple pour les séries de Riemann convergentes.
Si les coefficients λj sont tous connus, mais pas les coefficients βj , on va les
éliminer progressivement en itérant le procédé barycentrique décrit précédemment,
ce qui nous amène à introduire, pour tout k compris entre 0 et p, les suites (xn,k )n∈N
xn+1,k−1 − λk xn,k−1
définies par xn,0 = xn et les formules de récurrence xn,k = .
1 − λk
Lemme 5.2 Avec les notations et hypothèses qui précèdent, on a pour tout entier
k compris entre 0 et p, le développement asymptotique :
p+1
xn,k = + βk,j λnj + o λnp+1
n→+∞
j=k+1
⎪
⎪ %
p+1
⎪
⎪ βk−1,j λnj + o λnp+1
⎩ xn,k−1 = + n→+∞
j=k
xn+1,k−1 − λk xun,k−1
p+1
=+ βk,j λnj + o λnp+1
1 − λk n→+∞
j=k+1
λj − λk
où βk,j = βk−1,j = 0 pour tout j compris entre k + 1 et p + 1.
1 − λk
Théorème 5.2. Richardson
Avec les notations et hypothèses qui précèdent, pour tout entier k com-
pris entre 1 et p, la suite (xn,k )n∈N converge vers plus rapidement que la
suite (xn,k−1 )n∈N , la convergence de la suite (xn,k )n∈N étant géométrique
Méthode d’accélération de Richardson 149
Preuve. Avec l’hypothèse 0 < |λp+1 | < · · · < |λk+1 | < |λk | et lemme précédent,
on déduit que, pour k compris entre 1 et p, on a :
⎧
⎨ xn,k − n→+∞
⎪ ∼ βk,k+1 λnk+1
n
⎪ x n,k − β k,k+1 λ k+1
⎩ ∼ → 0
xn,k−1 − n→+∞ βk−1,k λk n→+∞
⎪ x − rk x
⎩ xn,k = n+1,k−1 k n,k−1 (1 ≤ k ≤ p)
1−r
Les coefficients βk,k+1 sont alors donnés par :
(k
rk+1 − rj (k k+1−j
−1
jr
βk,k+1 = βk+1 = β k+1 r
j=1
1−r j
j=1
1 − rj
rk − 1 rk−1 − 1 · · · (r − 1) (k
= β k+1 rj
(1 − r) · · · (1 − rk−1 ) (1 − rk ) j=1
k(k+1)
= (−1) r(1+2+···+k) βk+1 = (−1) r
k k 2 βk+1
k (k+1)(2n+k)
On a donc, pour k compris entre 0 et p, xn,k − ∼ (−1) βk+1 r 2 .
n→+∞
150 Vitesse et accélération de la convergence des suites réelles
#π$
n 1
Pour la suite d’Archimède de l’exercice 5.12, on a xn = 2 sin n = f
2 2n
sin (πx)
pour tout n ∈ N∗ , où f (x) = et en écrivant f (x) = g x2 , où :
x
p+1
j π 2j+1 j
g (t) = π + (−1) t + o xp+1
j=1
(2j + 1)! n→+∞
1
on se ramène à la situation précédente avec r = . On a alors, pour tout k compris
4
π 2k+3 1
entre 0 et p, π − xn,k ∼ .
n→+∞ (2k + 3)! 2(2n+k)(k+1)
On a, par exemple, pour les trois premières suites :
#π$ 4xn+1 − xn 16xn+1,1 − xn,1
xn = 2n sin n , xn,1 = , xn,2 =
2 3 15
avec :
π3 1 π5 4 π7 1
π − xn ∼ , π − xn,1 ∼ , π − xn,2 ∼
n→+∞ 6 4n n→+∞ 5! 16n+1 n→+∞ 7! 64n+1
Si on reprend l’exemple du nombre e approché par la suite (xn )n≥0 définie par
2 n
1 1
xn = 1 + n pour tout n ∈ N, on a xn = f , où f est la fonction
2 2n
définie sur ]−1, 1[ par :
1 ln(1+x)
5.5 Exercices
Exercice 5.1. Étudier la vitesse de convergence des suites (xn )n≥2 défi-
1 1 1
nies par xn = p où p > 0, xn = , xn = an où 0 < |a| < 1, xn =
n ln (n) n!
n!
et xn = n .
n
Solution. La suite (xn )n∈N∗ converge vers γ (constante gamma d’Euler). Pour
tout n ≥ 1, on a :
k+1 n k+1 n k+1
n
1 dt 1 1 t−k
xn = − = − dt = dt
k k t k k t k kt
k=1 k=1 k=1
+∞
n+1
t−n
ce qui fait apparaître γ comme somme d’une série, soit γ = dt et :
n=1 n
nt
+∞
k+1
t−k
γ − xn = dt
k kt
k=n+1
1 1 1
on en déduit que < γ − xn < et γ − xn ∼ . La convergence
2 (n + 1) 2n n→+∞ 2n
est donc lente.
Solution.
1. Avec la continuité de f et f (I) ⊂ I, on déduit que f admet au moins un point
fixe. En effet, la fonction g définie sur I par g (x) = f (x) − x étant continue
telle que g (a) = f (a) − a ≥ 0 et g (b) = f (b) − b ≤ 0 (puisque f (a) et f (b)
sont dans I = [a, b]), le théorème des valeurs intermédiaires nous dit qu’elle
s’annule sur I. De plus l’hypothèse −1 < f < 1 entraîne g = f − 1 < 0
sur I, c’est-à-dire que g est strictement décroissante sur I, donc injective, et la
solution de g (x) = 0 sur I est unique. Ce réel est l’unique point fixe de f
sur I.
2. Si x0 = , on a alors xn = pour tout n ∈ N. En effet, le résultat est vrai
pour n = 0 et en le supposant vrai pour n ≥ 0, le théorème des accroissements
finis nous permet d’écrire xn+1 − = f (xn ) − f () = (xn − ) f (cn ) avec cn
Exercices 153
ce qui implique que la suite (xn )n∈N converge vers et que la convergence est
géométrique de rapport |f ()| ( est un point fixe attractif de f ).
Solution.
1. Voir l’exercice 5.3.
2. La formule de Taylor-Lagrange à l’ordre r permet d’écrire que :
r f (r) (cn )
xn+1 − = f (xn ) − f () = (xn − )
r!
avec cn strictement compris entre xn et , ce qui entraîne xn = pour tout
xn+1 − f (r) ()
n ≥ 0 (par récurrence) et lim r = = 0, ce qui implique que
n→+∞ (xn − ) r!
la suite (xn )n∈N converge vers puisque :
(r)
|xn+1 − | r−1 f (cn )
lim = lim |xn − | =0
n→+∞ |xn − | n→+∞ r!
et la convergence est d’ordre r.
g (xn )
définie par x0 ∈ J \ {} et xn+1 = xn − pour tout n ≥ 0 (méthode
g (xn )
de Newton) converge vers et que la convergence est d’ordre 2.
Solution.
1. Le théorème des valeurs intermédiaires nous dit que l’équation g (x) = 0 a au
moins une solution dans I et l’hypothèse g (x) = 0 pour tout x ∈ I avec g
continue nous dit que g > 0 ou g < 0 (théorème des valeurs intermédiaires
pour g ) ce qui implique que g est strictement monotone, donc injective. Cette
solution est donc unique.
g (x)
2. est l’unique point fixe dans I de f définie sur I par f (x) = x − . Cette
g (x)
g (x) g (x)
fonction est de classe C 2 sur I avec f (x) = 2 . De g () = 0 on déduit
(g (x))
f (x) g (x) g (x) g ()
que f () = 0 et f () = lim = lim 2 = = 0.
x→ x − x→ x − (g (x)) g ()
3. Par continuité de f on peut trouver un voisinage J de tel que f (x) = 0
pour tout x ∈ J. La formule de Taylor-Lagrange à l’ordre 2 permet d’écrire que
2 f (cn )
xn+1 − = f (xn ) − f () = (xn − ) , avec cn strictement compris entre
r!
xn et et f (cn ) = 0, ce qui entraîne xn = pour tout n ≥ 0 (par récurrence)
xn+1 − f () g ()
et lim 2 = = = 0, ce qui implique que la suite (xn )n∈N
n→+∞ (x − ) 2 2g ()
n
|xn+1 − | |f (cn )|
converge vers puisque lim = lim |xn − | = 0 et que
n→+∞ |xn − | n→+∞ 2
la convergence est d’ordre 2.
Exercice 5.6. Soit λ un réel différent de 1 et (yn )n∈N la suite définie par
xn+1 − λxn
yn = pour tout n ∈ N (yn est un barycentre de xn+1 et xn ).
1−λ
1. Préciser pour quelles valeurs de λ et à quelles conditions sur (xn )n∈N la
suite (yn )n∈N converge vers plus rapidement que (xn )n∈N .
2 n
1
2. Appliquer ce procédé à la suite 1+ n en précisant la vitesse
2
n∈N
de convergence de la suite accélératrice obtenue.
on déduit que la suite (yn )n∈N converge vers plus rapidement que (xn )n∈N
xn + xn+1
si, et seulement si, λ ∈ [−1, 1[ . Pour λ = −1, on a yn = et cette
2
suite accélère (xn )n∈N si, et seulement si, (xn )n∈N converge lentement avec
xn+1 −
lim = −1. Pour 0 < |λ| < 1, la suite (yn )n∈N accélère (xn )n∈N si,
n→+∞ xn −
et seulement si, la convergence de (xn )n∈N est géométrique de rapport |λ| avec
xn+1 −
lim = λ.
n→+∞ xn −
2. On a vu que la convergence de la suite (xn )n∈N vers e ≈ 2.718281828 est
1
géométrique de rapport λ = , ce qui donne la suite (yn )n∈N définie par
2
ln (1 + x)
yn = 2xn+1 − xn . Le développement limité à l’ordre 2 de exp
x
au voisinage de 0 nous donne le développement asymptotique :
n
1 1 11 1 1
1+ =e 1− + 2
+ o
n 2n 24 n n→+∞ n2
xn 1 11 1 1 yn 11 1 1
et = 1 − n+1 + + o , = 1 − + o .
e 2 24 22n n→+∞ 22n e 48 22n n→+∞ 22n
11 e 1
Donc e − yn ∼ 2n
et la convergence est géométrique de rapport .
n→+∞ 48 2 4
Solution.
5 #π$
#π$
# π $ 1 − cos n 1− 1 − sin2
2 2n
1. Avec sin2 n+1 = = , on déduit que :
2 2 2
5
√ # x $2
∀n ∈ N∗ , xn+1
n
= 22n 1− 1−
2n
156 Vitesse et accélération de la convergence des suites réelles
x3
2. Le développement limité sin (x) = x − + o x3 nous donne le développement
3!
π3 1 1 π3 1
asymptotique, xn = π − + o et π − x n ∼ . Cette
3! 22n n→+∞ 22n n→+∞ 3! 22n
1
suite converge donc vers π et la convergence est géométrique de raison .
4
3. Utilisant le procédé décrit à l’exercice précédent, on accélère la convergence de
4xn+1 − xn
cette suite en posant yn = pour n ∈ N∗ . Poussant le développement
3
x3 x5
limité précédent un peu plus loin, on a sin (x) = x − + + o x5 et le
3! 5!
π3 1 π5 1 1
développement asymptotique xn = π − + + o , qui
3! 22n
5! 24n n→+∞ 24n
π5 3 1 1 π5 3 1
donne yn = π − + o , soit π − yn ∼ . Cette
5! 4 24n n→+∞ 24n n→+∞ 5! 4 24n
1
suite converge donc vers π et la convergence est géométrique de raison .
16
Exercice 5.8.
1. Utilisant l’encadrement obtenu avec les exemples 5.1, montrer que la
n
1 1
suite (yn )n∈N∗ définie par yn = + , accélère la convergence
k! n · n!
k=0
n
1
de la suite (xn )n∈N∗ définie par xn = pour n ∈ N∗ .
k!
k=0
2. Utilisant l’encadrement obtenu avec les exemples 5.1, montrer que la
n
1 1 1
suite (yn )n∈N∗ définie par yn = + , accélère la
kα α − 1 (n + 1)α−1
k=1
n
1
convergence de la suite (xn )n∈N∗ définie par xn = pour n ∈ N∗ .
kα
k=1
3. Utilisant l’encadrement obtenu avec l’exercice 5.2, montrer que la suite
n
1 1
(yn )n∈N∗ définie par yn = − ln (n + 1) + , accélère la
k 2 (n + 1)
k=1
n
1
convergence de la suite (xn )n∈N∗ définie par xn = − ln (n + 1)
k
k=1
pour n ∈ N∗ .
Solution.
1 1
1. On a l’encadrement < e − xn < , qui donne :
(n + 1)! n · n!
1 1 1
0 < yn − e < − =
n · n! (n + 1)! n · (n + 1)!
Exercices 157
15
yn − e 1
et 0 < ≤ → 0. On a par exemple x5 = 2.7167 et
e − xn n n→+∞ k!
k=0
1
y 5 = x5 + 2.7183.
5 ∗ 5!
1 1
2. On a l’encadrement α−1 ≤ (α − 1) ( − xn ) ≤ nα−1 , qui donne :
(n + 1)
α−1
1 (n + 1) − nα−1
0 ≤ − yn ≤
α − 1 nα−1 (n + 1)α−1
α−1
− yn (n + 1) − nα−1 α−1
et 0 ≤ ≤ ∼ → 0.
− xn nα−1 n→+∞ n n→+∞
1 1 1
3. L’encadrement < γ − xn < nous donne 0 < γ − yn <
2 (n + 1) 2n 2n (n + 1)
γ − yn 1
et 0 ≤ ≤ → 0.
γ − xn n n→+∞
Exercice 5.9. Soit (xn )n∈N une suite arithmético-géométrique définie par
x0 ∈ R et xn+1 = axn + b où a, b sont des réels donnés avec 0 < |a| < 1.
b
1. Montrer que (xn )n∈N converge ver = et préciser sa vitesse de
1−a
convergence dans le cas où u0 = .
2. Décrire la suite accélératrice de Aitken correspondante.
Solution.
1. Si cette suite converge, alors sa limite est solution de l’équation x = ax + b
b
qui a pour unique solution = . De xn+1 = axn + b et = a + b,
1−a
on déduit que xn+1 − = a (xn − ) et par récurrence xn − = an (x0 − ) ,
soit xn = + an (x0 − ) et lim xn = avec xn = pour tout n ≥ 0 et
n→+∞
xn+1 −
= a, c’est-à-dire que la convergence est géométrique de rapport |a|
xn −
(ce qui n’est pas étonnant).
2. On a xn+1 − xn = an (x0 − ) (a − 1) et xn+1 − axn = b = (1 − a) , de sorte
xn+1 − xn xn+1 − λn xn
que λn = = a et yn = = . La suite (yn )n∈N est donc
xn − xn−1 1 − λn
stationnaire sur .
f ()
En notant en = xn − , λ = f () et μ = , cela s’écrit :
2
en = λen−1 + μe2n−1 + o e2n−1
n→+∞
et donc :
(λ − 1) en−1 + 2μe2n−1 + o e2n−1
n→+∞
yn − = en−1 −
(λ − 1) + μ (λ + 2) en−1 + o (en−1 )
n→+∞
λμ + o (1)
n→+∞
= e2n−1
(λ − 1) + o (1)
n→+∞
yn − λμ
ou encore lim = . Comme f () = 0, on a μ = 0 et :
n→+∞ e2n−1 λ−1
λμ 2 f () f () 2
yn − ∼ en−1 = e
n→+∞ 1 − λ 2 (1 − f ()) n−1
2
yn+1 − en 2
On a donc ∼ ∼ λ2 = (f ()) . En définitive, on
yn − n→+∞ en−1 n→+∞
est passé d’une convergence géométrique de rapport |f ()| à une convergence
Exercices 159
2
géométrique de rapport (f ()) , ce qui confirme l’accélération de la convergence
puisque |f ()| < 1.
Désignant par Mn le point de R2 de coordonnées (xn , f (xn )) = (xn , xn+1 ) dans la
xn+2 − xn+1 Δn+1
base canonique, la pente de la droite (Mn Mn+1 ) est δn = = et
xn+1 − xn Δn
Δxn+1
l’équation de cette droite est y = xn+1 + (x − xn ) . Le point d’intersection
Δxn
de cette droite avec la première bissectrice est le point Mn de coordonnées (zn , zn )
Δxn+1 Δxn+1
où zn est solution de z = xn+1 + (z − xn ) = Δxn + xn + (z − xn ) ,
Δx n Δxn
Δxn+1
soit de (z − xn ) 1 − = Δxn , ce qui donne :
Δxn
2 2
Δxn (Δxn ) (Δxn )
zn = xn + Δxn+1
= xn − = xn − = yn+1
1− Δxn+1 − Δxn Δ2 xn
Δxn
1 2 1 1
Solution. On a Δxn = α , Δ xn = α − α et :
(n + 1) (n + 2) (n + 1)
2 α
(Δxn ) (n + 2)
yn+1 = xn − = xn + α α α
Δ2 x n (n + 1) ((n + 2) − (n + 1) )
2
(n + 2)
Par exemple, pour α = 2, on a yn+1 = xn + 2 . Reprenant les
(n + 1) (2n + 3)
1 1 1 1
calculs des exemples 5.1, on a ≤ − xn ≤ pour tout
α − 1 (n + 1)α−1 α−1n α−1
n ≥ 1, donc :
α
1 (α − 1) (n + 2)
1− α α ≤ − yn+1
(α − 1) (n + 1)
α−1
(n + 1) ((n + 2) − (n + 1) )
α
1 nα−1 (α − 1) (n + 2)
≤ 1 − α α α
(α − 1) nα−1 (n + 1) ((n + 2) − (n + 1) )
soit :
1 (α−1)
(α−1)(n+1)α−1
1−
n+1 α ≤ − yn+1
(n+1) 1− n+2
1 nα−1 (α−1)
≤ (α−1)nα−1 1− (n+1)α (1−( n+1
α
n+2 ) )
160 Vitesse et accélération de la convergence des suites réelles
avec :
α α
n+1 1 1 1
1− =1− 1− =1− 1−α + o
n+2 n+2 n + 2 n→+∞ n
1 1 α
=α + o ∼
n + 2 n→+∞ n n→+∞ n
Solution.
sin (πx)
p+1
π 2j
x2j + o x2p+2 , on
j
1. Du développement limité = (−1)
πx j=0
(2j + 1)!
déduit le développement asymptotique :
p+1 n n
π 4j+1
j 1 1
xn = π + (−1) + o
j=1
(2j + 1)! 4j n→+∞ 4p+1
Une telle limite étant unique, quand elle existe, on la note = lim f (x) .
x→α
Prenant en considération la structure d’ordre sur R, on peut définir les notions
de limite à gauche ou à droite en un point, ce qui permettra de distinguer deux
types de discontinuités.
On suppose que α est réel dans l’adhérence de l’intervalle I.
162 Limites et continuité des fonctions d’une variable réelle
De manière équivalente on peut dire que f a une limite à gauche [resp. à droite]
en α si la restriction de f à I ∩ ]−∞, α[ [resp. à I ∩ ]α, +∞[] a une limite en α.
Si f admet une limite à gauche [resp. à droite] en α, cette limite est alors unique
et on la note f (α− ) = lim f (x) [resp. f (α+ ) = lim f (x)].
x→α− x→α+
Des définitions précédentes, on déduit facilement le résultat suivant.
Théorème 6.1.
Si α est intérieur à I, la fonction f : I → R a pour limite en α si, et
seulement si, elle a une limite à gauche et à droite en α, ces limites étant
égales à .
Le cas des fonctions monotones définies sur un intervalle ouvert (pour simplifier)
est particulièrement intéressant.
Théorème 6.2.
Si f est une fonction monotone de l’intervalle ouvert I dans R, elle admet
alors une limite à gauche et à droite en tout point. Dans le cas où f est
croissante, on a pour tout x ∈ I :
lim f (x) = f (α) [resp. lim f (x) = f (α) , resp. lim f (x) = f (α)].
x→α x→α− x→α+
On dit que la fonction f : I → R est continue sur I si elle est continue en
tout point de I.
Théorème 6.4.
Si α est un point intérieur à l’intervalle I, la fonction f est alors continue
en α si, et seulement si, elle est continue à gauche et à droite en α.
Théorème 6.6.
Si f est une fonction monotone d’un intervalle ouvert I dans R, l’en-
semble de ses points de discontinuité est alors dénombrable.
Exemples 6.1
1. Une fonction constante est continue sur R.
2. Pour tout entier naturel n, la fonction x → xn est continue sur R et pour tout
nombre rationnel r, la fonction x → xr est continue sur R+,∗ (exercice 6.2).
3. À partir de la continuité de fonction sin en 0 (qui se déduit de |sin (x)| ≤ |x|
pour tout réel x), on déduit que :
— la fonction cos est continue en 0 ; il suffit d’écrire que :
#x$ x2
|cos (x) − 1| = 2 sin2 ≤
2 2
— la fonction sin est continue en tout point α ∈ R ; il suffit d’écrire que :
x+α x−α
|sin (x) − sin (α)| = 2 cos sin ≤ |x − α| → 0
2 2 x→α
Théorème 6.8.
La fonction f : I → R est continue en α ∈ I si, et seulement si, toute
suite (xn )n∈N de points de I qui converge vers α est transformée par f en
une suite convergente vers f (α) .
Dans le théorème précédent, on peut se contenter de dire que la suite (f (xn ))n∈N
est convergente, sans préciser que c’est vers f (α) .
Théorème 6.9.
La fonction f : I → R est continue sur I si, et seulement si, l’image
réciproque par f de tout ouvert [resp. fermé] de R est un ouvert [resp.
fermé] de I.
Exemples 6.2
1
1. La fonction définie sur R par f (0) = 0 et f (x) = cos si x = 0, n’est pas
x
1 1 n
continue en 0 puisque lim = 0 et la suite f = ((−1) )n≥1
n→+∞ nπ nπ ∗
n∈N
est divergente.
2. La fonction caractéristique de Q définie par f (x) = 1 si x ∈ Q et f (x) = 0
sinon est discontinue en tout
point de R. En effet, r ∈ Q est limite de la suite
√
2
d’irrationnels (xn )n∈N∗ = r + avec lim f (xn ) = 0 = f (r) , et un
n ∗
n→+∞
n∈N
irrationnel x ∈
/ Q étant limite d’une suite (rn )n∈N∗ de rationnels, on a encore
lim f (rn ) = f (x) .
n→+∞
3. La fonction définie sur R par f (x) = x si x ∈ Q et f (x) = 0 sinon est
continue en 0 et discontinue en tout point de R∗ . La discontinuité en tout
point de R∗ se montre comme dans l’exemple précédent. Pour la continuité en
0 il suffit de remarquer que pour tout ε > 0 la condition |x| < ε entraîne
|f (x) − f (0)| = |f (x)| < ε puisque f (x) vaut x ou 0.
ce qui équivaut à dire que pour toutes suites (xn )n∈N et (yn )n∈N d’éléments de I
telles que lim |xn − yn | = 0, on a lim |f (xn ) − f (yn )| = 0.
n→+∞ n→+∞
Dans le cas où I est un segment, donc un compact, toute fonction continue sur
I est uniformément continue (théorème 1.19).
Lemme 6.1 Si f : I → R est continue en α ∈ I avec f (α) > 0 [resp. f (α) < 0],
il existe alors un voisinage V de α dans I tel que f (x) > 0 [resp. f (x) < 0] pour
tout x ∈ V.
Preuve. Supposons f (α) > 0. Pour ε ∈ ]0, f (α)[ on peut trouver η > 0 tel que
|x − α| < η dans I entraîne |f (x) − f (α)| < ε, ce qui implique f (x) > f (α)−ε > 0
pour tout x dans ce voisinage.
168 Limites et continuité des fonctions d’une variable réelle
b
De ce résultat on déduit que la forme linéaire positive ϕ → ϕ (t) dt, définie
a
sur l’espace vectoriel E = C 0 ([a, b] , R) des applications continues sur l’intervalle
b
[a, b] (a < b) et à valeurs dans R, est telle que l’égalité ϕ (t) dt = 0 équivaut
a
à ϕ = 0 si ϕ ∈ E est à valeurs positives ou nulles, ce qui permet de montrer
b
que l’application f → f 1 = |f (t)| dt définit une norme sur E (norme de la
a
convergence en moyenne).
Théorème 6.14.
1
Si f : I → R est continue en α ∈ I avec f (α) = 0, la fonction est
f
alors définie dans un voisinage de α et est continue en ce point.
f
De ce résultat on déduit la continuité de en α si f, g sont continues en ce
g
point avec g (α) = 0.
De la continuité des fonctions polynomiales, on déduit la continuité des fonctions
rationnelles en tout point de leur domaine de définition.
De la continuité
8 πdesπ fonctions
9 sin et cos sur R, on déduit la continuité de la
fonction tan sur − , .
2 2
Pour la composition des applications, on a le résultat suivant.
Théorème 6.15.
Si f : I → R est continue en α ∈ I, J est un intervalle réel contenant
f (I) et g : J → R est continue en β = f (α) , g ◦ f est alors continue en α.
Preuve. Pour ε > 0 donné, on peut trouver un réel η > 0 tel que |y − β| < η
dans J entraîne |g (y) − g (β)| < ε et il existe η > 0 tel que |x − α| < η dans
I entraîne |f (x) − f (α)| < η, ce qui implique |(g ◦ f ) (x) − (g ◦ f ) (α)| < ε pour
tout x dans I tel que |x − α| < η .
1
La continuité de peut se retrouver en composant la fonction f dans un voi-
f
1
sinage de α où elle est non nulle avec y → .
y
Fonctions périodiques continues 169
Exemples 6.4
1. Une fonction f : R → R est constante si, et seulement si, P (f ) = R (qui est
dense dans R). En effet, si f est constante égale à λ, on a alors pour tous réels
T et x, f (x + T ) = λ = f (x) et T ∈ P (f ) , donc P (f ) = R. Réciproquement
si P (f ) = R, tout réel x est une période et f (x) = f (0 + x) = f (0) , donc f
est constante.
2. Si f = 1G est la fonction caractéristique d’un sous-groupe additif G de R, on a
alors P (f ) = G. En effet, pour tout T ∈ G et tout x ∈ G, on a x + T ∈ G et
f (x + T ) = 1 = f (x) . Pour tout x ∈ R \ G, on a x + T ∈ R \ G (sinon x =
(x + T ) − T ∈ G) et f (x + T ) = 0 = f (x) . Donc T ∈ P (f ) . Réciproquement
si T ∈ P (f ) , on a alors 1 = f (0) = f (T ) et T ∈ G. D’où l’égalité P (f ) = G.
Théorème 6.16.
Si f : R → R est une fonction continue non constante, son groupe des
périodes P (f ) est alors fermé dans R et f est périodique si, et seulement
si, P (f ) est discret non réduit à {0} .
Preuve. Soit (Tn )n∈N une suite d’éléments de P (f ) convergente vers un réel T.
Par continuité de f on a pour tout réel x, f (x + T ) = lim f (x + Tn ) = f (x) ,
n→+∞
c’est-à-dire que T ∈ P (f ) . L’ensemble P (f ) est donc fermé dans R. On peut aussi
procéder comme suit. En notant fa (t) = f (a + t) − f (t) pour tout réel a, on a
P (f ) = fa−1 {0} et pour f continue, cet ensemble est fermé comme intersection
a∈R
de fermés.
Comme f est continue non constante, P (f ) est un sous-groupe fermé de R
distinct de R et en conséquence, il ne peut être dense dans R, donc il est discret
de la forme P (f ) = ZT. Dans le cas où f est périodique, on a P (f ) = {0} et
T > 0 (T est la plus petite période de f ). La réciproque résulte de la définition
d’une fonction périodique.
Théorème 6.17.
Si K est un compact de R, toute fonction continue de K dans R est alors
uniformément continue sur K.
b−a
xk = a + k (0 ≤ k ≤ n)
n
et à cette subdivision on associe la fonction fn définie par :
x − xk
fn (x) = f (xk ) + (f (xk+1 ) − f (xk ))
xk+1 − xk
(fn coïncide avec f aux xk et est affine sur [xk , xk+1 ]). Cette fonction est affine
par morceaux et continue sur [a, b] .
Lemme 6.2 La suite (fn )n≥1 converge uniformément vers f sur [a, b] .
x − xk
|f (x) − fn (x)| = f (x) − f (xk ) − (f (xk+1 ) − f (xk ))
xk+1 − xk
x − xk
≤ |f (x) − f (xk )| + |f (xk+1 ) − f (xk )|
xk+1 − xk
x − xk
≤ε+ ε ≤ 2ε
xk+1 − xk
Théorème 6.20.
Toute fonction définie sur un intervalle réel fermé borné [a, b] à valeurs
réelles et continue est bornée et atteint ses bornes.
Preuve.
1. La fonction f étant continue sur le compact [a, b] est bornée et atteint ses bornes,
il existe donc deux réels α, β dans [a, b] tels que m = inf f (x) = f (α) ,
x∈[a,b]
M = sup f (x) = f (β) . En supposant g à valeurs positives ou nulles, on a
x∈[a,b]
mg (x) ≤ f (x) g (x) ≤ M g (x) pour tout x ∈ [a, b] et :
b b b
m g (x) dx ≤ f (x) g (x) dx ≤ M g (x) dx
a a a
b b
Dans le cas où γ = g (x) dx = 0, on a
f (x) g (x) dx = 0 et n’importe quel
a a
1 b
point c convient. Pour γ = 0, on a γ > 0, δ = f (x) g (x) dx ∈ [f (α) , f (β)]
γ a
et le théorème des valeurs intermédiaires nous dit qu’il existe un réel c compris
entre α et β tel que δ = f (c) , ce qui donne la première formule de la moyenne.
2. Soit G la primitive de g nulle en a. Une intégration par parties nous donne :
b b
f (x) g (x) dx = f (b) G (b) − f (x) G (x) dx
a a
Le théorème des valeurs intermédiaires 173
La fonction G étant continue sur le compact [a, b] est bornée et on peut noter
m = inf G (x) , M = sup G (x) . Comme f est à valeurs positives, on a :
x∈[a,b] x∈[a,b]
Il en résulte que :
b
mf (b) − m (f (b) − f (a)) ≤ f (x) g (x) dx ≤ M f (b) − M (f (b) − f (a))
a
b
soit mf (a) ≤ f (x) g (x) dx ≤ M f (a) . Dans le cas où f (a) = 0, on a
b a
f (x) g (x) dx = 0 et la formule est vérifiée pour tout c ∈ [a, b] . Dans le cas
a b
1
contraire, on a f (a) > 0 et m ≤ f (x) g (x) dx ≤ M, ce qui entraîne
f (a) a
b
1
l’existence de c ∈ [a, b] tel que f (x) g (x) dx = G (c) (théorème des
f (a) a
valeurs intermédiaires pour la fonction continue G).
La seconde formule de la moyenne est encore valable pour f, g continues par
morceaux sur I, la fonction f étant décroissante à valeurs positives (voir [19]).
Si la fonction f n’est pas continue en tout point de I, alors f (I) n’est pas
nécessairement un intervalle comme le montre l’exemple de la fonction f définie
sur I = [0, 2] par f (x) = 1 si 0 ≤ x ≤ 1 et f (x) = 2 si 1 < x ≤ 2 (cette fonction
est continue sur I \ {1} avec f (I) = {1, 2}).
De ce théorème, on déduit le théorème des valeurs intermédiaires.
174 Limites et continuité des fonctions d’une variable réelle
Preuve. Remplaçant au besoin f par −f, on peut supposer que f (a) < 0 < f (b) .
Première démonstration. L’image f (I) est un intervalle qui contient f (a) et
f (b) , donc [f (a) , f (b)] ⊂ f (I) et de 0 ∈ [f (a) , f (b)] , on déduit qu’il existe
α ∈ I tel que f (α) = 0 avec α est différent de a et b puisque f (a) f (b) = 0.
Deuxième démonstration, directe. L’ensemble A = {x ∈ [a, b] | f (x) ≤ 0} étant
non vide (a ∈ A) et majorée (par b) dans R, il admet une borne supérieure α dans
[a, b] . La fonction f étant continue sur [a, b] , on peut trouver η > 0 tel que :
soit f (α) = 0.
Troisième démonstration. En utilisant le théorème des segments emboîtés (voir
le théorème 4.17).
Si, avec les hypothèses du théorème précédent, la fonction f est de plus stric-
tement monotone, elle est alors injective et la solution α de l’équation f (x) = 0
dans l’intervalle [a, b] est unique.
La réciproque du théorème des valeurs intermédiaires n’est pas vraie, c’est-à-
dire qu’une fonction peut vérifier la propriété des valeurs intermédiaires sans être
continue. Par exemple le théorème de Darboux (théorème 7.18) nous dit qu’une
fonction dérivée vérifie la propriété des valeurs intermédiaires et il existe des fonc-
tions dérivables de dérivée non continue.On peut aussi considérer l’exemple de la
1
fonction f définie sur R par f (x) = sin si x = 0 et f (0) = 0 (exercice 6.16).
x
Précisément, on dira qu’une fonction f définie sur un intervalle réel I et à
valeurs réelles vérifie la propriété des valeurs intermédiaires si pour tout intervalle
J contenu dans I, f (J) est un intervalle.
Ce qu’il manque à une fonction vérifiant la propriété des valeurs intermédiaires
sur un intervalle compact [a, b] pour être continue est donné par le résultat suivant.
Fonctions réciproques 175
Théorème 6.24.
Si f est une fonction à valeurs réelles définie sur un intervalle I véri-
fiant la propriété des valeurs intermédiaires, elle est alors continue si, et
seulement si, pour tout réel y, l’ensemble f −1 {y} est fermé dans I.
Preuve. Si f est continue, on sait qu’elle vérifie la propriété des valeurs inter-
médiaires et l’image réciproque du fermé {y} par f est fermé. Réciproquement
supposons que f : I → R vérifie la propriété des valeurs intermédiaires et que
f −1 {y} est fermé dans I pour tout y ∈ R. On se donne x0 ∈ I et ε > 0.
Les ensembles F1 = f −1 {f (x0 ) − ε} et F2 = f −1 {f (x0 ) + ε} sont des fermés
(éventuellement vides) de I qui ne contiennent pas x0 , donc x0 est dans l’ouvert
O = (I \ F1 ) ∩ (I \ F2 ) et il existe η > 0 tel que J = I ∩ ]x0 − η, x0 + η[ ⊂ O. Pour
tout x ∈ J on a f (x) = f (x0 ) ± ε et f (J) est un intervalle qui contient f (x0 ) ,
nécessairement f (J) ⊂ ]f (x0 ) − ε, f (x0 ) + ε[ , c’est-à-dire que |f (x) − f (x0 )| < ε
pour tout x ∈ I ∩ ]x0 − η, x0 + η[ . On a donc ainsi montré que f est continue en
tout point de I.
On peut affaiblir les hypothèses dans le théorème précédent en remplaçant
l’hypothèse, f −1 {y} est fermé dans I pour tout réel y, par f −1 {y} est fermé dans
I pour tout rationnel y (voir [8], exercice 4.1).
Dans le cas particulier des fonctions monotones, on a le résultat suivant, où
I = ]a, b[ est un intervalle ouvert avec −∞ ≤ a < b ≤ +∞.
Théorème 6.25.
Si f est une fonction monotone de I dans R telle que f (I) soit un in-
tervalle, elle est alors continue sur I.
Preuve. On suppose que f est croissante. Il s’agit de montrer que pour tout
x ∈ I on a lim f (t) = f (x) . On sait déjà que f admet une limite à gauche et à
t→x
droite en x avec f (x− ) ≤ f (x) ≤ f (x+ ) (théorème 6.2). Il s’agit alors de montrer
que f (x− ) = f (x+ ) = f (x) . Si f (x− ) < f (x) , on peut alors trouver, pour ε > 0
donné, x0 ∈ ]a, x[ tel que f (x− ) − ε < f (x0 ) ≤ f (x− ) < f (x) . Mais si de plus
f (I) est un intervalle alors tout λ ∈ ]f (x− ) , f (x)[ étant dans ]f (x0 ) , f (x)[ s’écrit
λ = f (x1 ) avec x1 ∈ ]x0 , x[ et on a alors λ = f (x1 ) ≤ f (x− ) en contradiction
avec λ > f (x− ) . On a donc f (x− ) = f (x) . On montre de manière analogue que
f (x) = f (x+ ) . Les limites à droite et à gauche en x sont donc égales à f (x) , ce
qui prouve la continuité de f en x.
Preuve. Si f est strictement monotone, elle est alors injective. Si de plus elle est
continue, J = f (I) est alors un intervalle (théorème des valeurs intermédiaires).
La fonction réciproque f −1 étant strictement monotone de J sur I = f −1 (J) qui
est un intervalle, elle est continue. Il nous reste à montrer que J = f (I) est de
même nature que I. En notant −∞ ≤ a < b ≤ +∞ les extrémités de I et en
supposant f strictement croissante, J est un intervalle d’extrémités :
lim f (x) , β = sup (f (I)) = lim f (x)
α = inf (f (I)) = x→a
x→b
x>a x<b
(x ∈ R et y = ex ) ⇔ y ∈ R+,∗ et x = ln (y)
Pour tout entier naturel non nul n, avec la continuité et la stricte croissance de
la fonction x → xn de R+ sur R+ , on aboutit à la définition de la fonction racine
n-ème : √
x ∈ R+ et y = n x ⇔ y ∈ R+ et x = y n .
Avec les mêmes arguments, on définit les fonctions trigonométriques inverses :
⎧ # 9 π π8 $
⎪
⎪ (x ∈ [−1, 1] et y = arcsin (x)) ⇔ y ∈ − , et x = sin (y)
⎪
⎪ 2 2
⎨
(x ∈ [−1, 1] et y = arccos (x)) ⇔ (y ∈ [0, π] et x = cos (y))
⎪
⎪ # 8 9 $
⎪
⎪
⎩ (x ∈ R et y = arctan (x)) ⇔ y ∈ − π , π et x = tan (y)
2 2
et les fonctions hyperboliques inverses :
⎧
⎪
⎪ (x ∈ R et y = argsh (x)) ⇔ (y ∈ R et x = sh (y))
⎨
(x ∈ [1, +∞[ et y = argch (x)) ⇔ (y ∈ R+ et x = ch (y))
⎪
⎪
⎩
(x ∈ R et y = argth (x)) ⇔ (y ∈ R et x = th (y))
Preuve. Si f est strictement monotone, il est clair qu’elle est injective (qu’elle
soit continue ou non). Pour la réciproque, on propose trois démonstrations.
Supposons f continue et injective de I dans R.
Première démonstration. S’il existe x < y < z dans I tels que f (x) < f (z) <
f (y) alors tout réel u dans ]f (z) , f (y)[ ⊂ ]f (x) , f (y)[ va s’écrire u = f (c) = f (d)
avec c ∈ ]y, z[ et d ∈ ]x, y[ , donc c = d, ce qui contredit l’injectivité de f. La
fonction f est donc strictement monotone.
Deuxième démonstration. Pour a < b dans I, on a f (a) = f (b) . Supposons que
f (a) < f (b) . Nous allons alors montrer que f est strictement croissante. Pour
x < y dans I, l’application ϕ : t → ϕ (t) = f (ta + (1 − t) x) − f (tb + (1 − t) y) est
178 Limites et continuité des fonctions d’une variable réelle
continue sur [0, 1] et ne s’annule jamais sur cet intervalle (comme f est injective,
ϕ (t) = 0 équivaut à t (b − a) + (1 − t) (y − x) = 0 encore équivalent à t (b − a) =
(1 − t) (y − x) = 0 qui est impossible). Cette fonction garde donc un signe constant
sur [0, 1] et en particulier ϕ (0) = f (x) − f (y) est de même signe que ϕ (1) =
f (a) − f (b) , c’est-à-dire que f (x) < f (y) .
Troisième démonstration. On utilise la fonction g définie par g (x, y) = f (x) −
f (y) sur Δ = (x, y) ∈ I 2 | x < y ⊂ R2 . Cette fonction est continue sur Δ qui
est convexe donc connexe, ce qui implique que g (Δ) est connexe dans R∗ (f
est injective), c’est donc un intervalle de R∗ et on a soit g (Δ) ⊂ R+,∗ et f est
strictement croissante, soit g (Δ) ⊂ R−,∗ et f est strictement décroissante.
Si f est une fonction continue bijective de I (intervalle réel) sur f (I) , elle est
alors strictement monotone et f −1 est continue. Mais de manière plus générale
si f est une application continue bijective d’un espace métrique E sur un espace
métrique F, son application réciproque f −1 n’est pas nécessairement continue. Par
exemple l’application f : x → eix est continue bijective de [0, 2π[ sur le cercle unité
Γ = {z ∈ C | |z| = 1} et f −1 : z → arg (z) n’est pas continue puisque l’image du
compact Γ égale à [0, 2π[ n’est pas compacte. On peut aussi considérer l’application
identité de l’espace E = C 0 ([0, 1] , R) des fonctions continues de [0, 1] dans R muni
de la norme de la convergence uniforme f → f ∞ = sup |f (x)| , dans l’espace
[0,1]
1
F = E muni de la norme de la convergence en moyenne f → f 1 = |f (x)| dx,
0
qui est bijective continue d’inverse non continue (ces deux normes ne sont pas
équivalentes).
Dire que f est négligeable devant g = 0 signifie que f est identiquement nulle
dans un voisinage de a (éventuellement privé de a).
La notation f = o (g) n’est pas réellement une égalité, elle signifie que f
x→a
appartient à l’ensemble des fonctions négligeables devant g au voisinage de a et
on devrait plutôt noter f ∈ o (g) .
x→a
Une définition équivalente est donnée par le résultat suivant.
Prépondérance, domination et équivalents 179
Théorème 6.29.
Avec les notations précédentes, f est négligeable devant g, au voisinage
de a si, et seulement si, il existe une fonction ε : I → R telle que :
∀x ∈ I, f (x) = ε (x) g (x)
lim ε (x) = 0
x→a
Lemme 6.3 Pour tout réel α strictement positif, ln (x) est négligeable devant xα
au voisinage de l’infini.
ln (x)
ce qui entraîne lim = 0, soit ln (x) = o (xα ) .
x→+∞ xα x→+∞
xα
Pour α ≤ 0, on a directement lim = 0 et xα = o (ln (x)) .
x→+∞ ln (x) +∞
Théorème 6.30.
α
Pour tous réels α, β, γ strictement positifs, on a (ln (x)) = o xβ
x→+∞
et xβ = o (eγx ) .
x→+∞
⎛ # β $ ⎞α
(ln (x))
α
α ln xα
Preuve. Pour x > 1, on a lim = lim ⎝ ⎠ = 0 et
xβ
x→+∞ x→+∞ β x αβ
xβ ln (x)
lim γx = lim exp x β −γ = 0.
x→+∞ e x→+∞ x
Des définitions, on déduit facilement les résultats suivants.
Théorème 6.31.
Dire que f est équivalente à g = 0 signifie que f est identiquement nulle dans
un voisinage de a (éventuellement privé de a).
Théorème 6.32.
Avec les notations de la définition précédente, on a f g si, et seule-
x→a
ment si, il existe une fonction ϕ : I → R telle que :
∀x ∈ I, f (x) = ϕ (x) g (x)
lim ϕ (x) = 1
x→a
Théorème 6.33.
La relation f g est une relation d’équivalence.
x→a
Les développements limités (chapitre 11) vont nous permettre d’obtenir des
équivalents, puis de calculer des limites.
Théorème 6.35.
Preuve.
1. Si f = ϕg et h = ψk avec lim ϕ (x) = 1 et lim ψ (x) = 1, on a alors f h = ϕψgk
x→a x→a
avec lim (ϕψ) (x) = 1, c’est-à-dire que f h gk.
x→a x→a
Prépondérance, domination et équivalents 183
h
2. Si h ne s’annule pas au voisinage de a, il en est de même de k = (comme
ψ
f ϕg
lim ψ (x) = 1 la fonction ψ ne s’annule pas au voisinage de a) et = avec
x→a h ψk
ϕ (x) f g
lim = 1, c’est-à-dire que .
x→a ψ (x) h x→a k
3. Si f est à valeurs strictement positives au voisinage de a, il en est de même de
f
g= et f α = ϕα g α avec lim ϕα (x) = 1 nous dit que f α g α .
ϕ x→a x→a
4. Pour tout x voisin de a tel que (g (x) , k (x)) = (0, 0) on a, en supposant que g
et k sont à valeurs positives ou nulles au voisinage de a :
ϕ (x) g (x) + ψ (x) k (x)
f (x) + h (x) = (g (x) + k (x)) = θ (x) (g (x) + k (x))
g (x) + k (x)
et :
|ϕ (x) − 1| g (x) + |ψ (x) − 1| k (x)
|θ (x) − 1| ≤ ≤ |ϕ (x) − 1| + |ψ (x) − 1|
g (x) + k (x)
avec :
|θ (x) − 1| ≤ |ϕ (x) − 1| + |ψ (x) − 1| → 0
x→a
6.8 Exercices
Solution. Pour x ∈ / Q, on a |cos (m!πx)| < 1 pour tout m ∈ N (0! = 1), donc
p
avec (p, q) ∈ Z × N∗ , on a pour
n
lim (cos (m!πx)) = 0 = 1Q (0) . Pour x =
n→+∞ q
tout m ≥ 2q, m!πx = 2kπ avec k ∈ Z, donc cos (m!πx) = 1 = 1Q (1) .
Exercice 6.2.
1. Montrer que pour tout n ∈ N, la fonction x → xn est continue sur R.
1
2. Montrer que pour tout n ∈ N∗ , la fonction x → x n est continue sur
R+,∗ .
3. Montrer que pour tout r ∈ Q, la fonction x → xr est continue sur R+,∗ .
Solution.
1. Pour n = 0, f0 est la fonction constante égale à 1. La continuité d’une fonction
constante se vérifiant facilement (pour ε > 0 donné tout réel η > 0 convient).
Pour n ≥ 1, α ∈ R, on peut trouver un réel R > 0 tel que α ∈ ]−R, R[ et pour
tout x ∈ ]−R, R[ , on a :
n−1
|xn − αn | = |x − α| xn−1−k αk ≤ nRn−1 |x − α|
k=0
ε
et pour ε > 0 donné, on aura |xn − αn | < ε dès que |x − α| < η = n−1
.
nR
1
2. Pour n ≥ 1 et α > 0, on peut trouver un réel R > 0 tel que α ∈ , R et pour
R
1
tout x ∈ , R , on a :
R
n−1
# 1 $n # 1 $n 1 1
# 1 $n−1−k # 1 $k
|x − α| = x n − αn = xn − αn xn αn
k=0
n−1
n
1 1 1
≥n xn − αn
R
Exercices 185
1 1 1 n−1 n−1
donc x n − α n ≤ R n |x − α| ≤ R n |x − α| et pour ε > 0 donné, on aura
n
1 1 ε
x n − α n < ε dès que |x − α| < η = n−1 .
R n
p # 1 $p
2
3. En notant r = avec (p, q) ∈ (N∗ ) pour r > 0, la fonction x → xr = x q est
q
continue sur R+,∗ comme composée de deux fonctions continues. Pour r = 0,
la fonction est constante et pour r < 0, elle continue comme l’inverse de la
fonction continue non nulle x → x−r .
6 7
Solution. On rappelle que pour x ∈ [0, 1[ , on a an (x) = [10n x] − 10 10n−1 x .
k k+1
1. Pour tout entier k compris entre 0 et 10 − 1 et x ∈
n
, , on a
6 n−1 7 6 n−1 7 10n 10n
an (x) = k − 10 10 x . De plus avec 10 10 x ≤ 10 x < k + 1, on déduit
n
186 Limites et continuité des fonctions d’une variable réelle
6 k 7 6 n−1 7 k 6 7
que 10 x ≤ ≤ 10
n−1 n−1
x < 10 x + 1 et = 10n−1 x . La fonction
10 10
k k+1
an est donc constante (et en conséquence continue) sur , égale à
10n 10n
k
k − 10 . Puis avec :
10
k+1 k+1 k
an n
= k + 1 − 10 = lim a n (x) = k − 10
10 10 x→( k+1
10n )
− 10
k+1
on déduit que an est discontinue en tout point où k est compris entre
n n
10
10 − 1
0 et 10n − 2. Sur le dernier intervalle , 1 , on a an (x) = 9 et an est
10n
continue en 1.
2. La fonction an étant continue par morceaux est intégrable sur [0, 1] avec :
10
n
−1 10 −1 n
1
k+1
1 10n k k
an (x) dx = k − 10 dx = n k − 10
0 k
10n
10 10 10
k=0 k=0
k
En remarquant que la fonction ϕ : k → k −10 est périodique de période 10
10
et en écrivant tout entier k compris entre 0 et 10 − 1 sous la forme k = 10q + r
n
avec 0 ≤ q ≤ 10n−1 − 1 et 0 ≤ r ≤ 9, on a :
10n−1 9
−1 9
1
1 1 9
an (x) dx = n ϕ (r) = r=
0 10 q=0 r=0
10 r=0 2
et pour |a| < 1, avec la continuité de f, on déduit que pour tout réel x on a :
n an − 1 b
f (x) = lim f a x + b =f
n→+∞ a−1 1−a
c’est-à-dire que f est constante. Pour traiter le cas où |a| > 1, on peut remarquer,
en faisant le changement devariablet = ax + b, que la condition f (ax + b) = f (x)
1 b 1
est équivalente à f (t) = f t− pour tout réel t avec < 1, ce qui entraîne
a a a
que f est constante.
Exercice 6.6. Soit f une fonction définie sur R+,∗ , à valeurs réelles,
f (x)
croissante et telle que la fonction g : x → soit décroissante. Montrer
x
+,∗
que la fonction f est continue sur R .
Solution. f qui est croissante admet une limite à gauche et à droite en tout point
de R+,∗ avec f (x− ) ≤ f (x) ≤ f (x+ ) . De même, g qui est décroissante admet une
limite à gauche et à droite en tout point avec g (x− ) ≥ g (x) ≥ g (x+ ) et tenant
compte de :
lim f (t)
f (t) t→x, t<x f (x− )
g x− = lim = =
t→x
t<x
t x x
lim f (t)
f (t) t→x, t>x f (x+ )
g x+ = lim = =
t→x
t>x
t x x
donc :
T1 T1 T1
λT1 = (f (t + T ) − f (t)) dt = f (t + T ) dt − f (t) dt
0 0 0
T +T1 T1
= f (t) dt − f (t) dt = 0
T 0
Solution. La fonction f étant continue périodique non constante, son groupe des
périodes est discret, soit P (f ) = ZT avec T > 0. Si y1 , y2 sont deux solutions
périodiques linéairement indépendantes de y + 2y + 2y = f, alors aucune de ces
solutions ne peut être constante (sinon f = 2yj serait constante) et leurs groupes
de périodes sont discrets engendrés respectivement par T1 > 0 et T2 > 0. Les réels
T1 , T2 sont alors également des périodes de f. Il existe donc des entiers naturels
non nuls n1 , n2 tels que T1 = n1 T et T2 = n2 T et n2 T1 = n1 T2 est une période
commune à y1 et y2 . La fonction y = y1 − y2 est alors une solution périodique de
l’équation homogène y + 2y + 2y = 0, le réel n1 n2 T étant une période de cette
fonction. Mais la forme générale des solutions de cette équation différentielle est
donnée par y (x) = e−t (a cos (x) + b sin (x)) = λe−t cos (x + ϕ) et seule la fonction
nulle est périodique. On a donc y1 = y2 .
∀n ∈ N, f (nT ) = f (0) + nλ
f (nT ) − f (0) f ∞
∀n ≥ 1, |λ| = ≤2 → 0
n n n→+∞
Si x est un réel positif ou nul, on peut alors trouver un entier naturel n tel que
x
x ∈ [nα, (n + 1) α] et avec n ≤ , on déduit que :
α
x
|f (x)| ≤ |f (x) − f (0)| + |f (0)| ≤ n + 1 + |f (0)| ≤ + (1 + |f (0)|)
α
En raisonnant avec la fonction g définie par g (x) = f (−x) , on a un résultat
analogue pour les réels négatifs. Du fait qu’il n’est pas possible de trouver des
réels a, b tels que x2 ≤ ax + b pour tout réel positif, on déduit que la fonction
x → x2 n’est pas uniformément continue sur R.
Solution. Avec l’uniforme continuité de f sur R+ , on déduit que pour tout réel
ε > 0 on peut trouver un réel η > 0 tel que |f (x) − f (y)| < ε pour tous x, y dans
R+ tels que |x − y| < η et, pour tout x ∈ R+ , on a :
x+η x+η x+η
1 1 1
|f (x)| = f (x) dt ≤ |f (x) − f (t)| dt + f (t) dt
η x η x η x
x+η
1
≤ε+ f (t) dt
η x
+∞
D’autre part, avec la convergence de l’intégrale f (x) dx, on déduit qu’il existe
y 0
un réel λ > 0 tel que f (t) dt < εη pour tous x, y dans [λ, +∞[ et de l’inégalité
x
précédente, on déduit que |f (x)| < 2ε pour tout x ≥ λ. On a donc montré que
lim f (x) = 0. Ce résultat n’est plus valable si on suppose seulement f continue
x→+∞
sur R comme le montre l’exemple de la fonction f définie par f (x) = sin x2 .
+
Exercice 6.14. Soit f une application continue de [0, 1] dans R telle que
f (0) = f (1) .Montrer que pour tout entier naturel
non
nul n il existe un
1 1
réel xn dans 0, 1 − tel que f (xn ) = f xn + . Ce résultat est-il
n n
1
valable si on remplace par un réel α ∈ ]0, 1[ qui n’est pas l’inverse d’un
n
entier.
1
Solution. Pour n ≥ 1 on désigne par fn la fonction définie sur In = 0, 1 −
n
1
par fn (x) = f x + −f (x) . Si cette fonction ne s’annule jamais sur In , du fait
n
de sa continuité, on déduit du théorème des valeurs intermédiaires qu’elle garde
un signe constant sur cet intervalle. Supposons que fn (x) > 0 pour tout x ∈ In .
On a alors :
k + 1
n−1 n−1
k k
f (1) − f (0) = f −f = fn >0
n n n
k=0 k=0
ce qui contredit f (0) = f (1) . La fonction fn s’annule donc au moins une fois
sur In . De ce résultat on peut déduire que si une voiture parcourt 100 km en une
192 Limites et continuité des fonctions d’une variable réelle
heure, il existe alors un intervalle de temps égal à une demi-heure pendant lequel
la voiture a parcouru 50 km. Pour ce faire on considère la fonction f définie sur
[0, 1] par f (x) = d (x) − 100x où d (x) est le nombre de kilomètres parcourus en x
heures. Cette application est continue avec f (0) = f (1) = 0. Le résultatprécédent,
1 1
pour n = 2, nous dit qu’il existe x2 ∈ 0, tel que f (x2 ) = f x2 + ,
2 2
1 1
soit d x2 + − d (x2 ) = 50 et l’intervalle de temps x2 , x2 + répond à la
2 2
1
question. Ce résultat n’est plus valable si on remplace par un réel α ∈ ]0, 1[ qui
n
n’est pas l’inverse d’un entier.
En effet, si f est la fonction définie et continue sur
2πx
[0, 1] par f (x) = cos − λx, où λ est choisi tel que f (0) = f (1) (prendre
a
2π
λ = cos − 1), alors pour tout réel x ∈ [0, 1 − a] , on a :
a
2π
f (x + a) − f (x) = −λa = a 1 − cos =0
a
1
puisque n’est pas entier.
a
contenant 0 non réduit à un point (sinon J = f (J) = {0}), on considère les suites
1 1
(xn )n≥n0 , (yn )n≥n0 , définies par xn = π , yn = , où n0 est
2nπ + 2 (2n + 1) π + π2
un entier assez grand pour que ces suites soient à valeurs dans J, et on a f (xn ) = 1,
f (yn ) = −1 pour tout n ≥ n0 et [−1, 1] ⊃ f (J) ⊃ f ([yn , xn ]) ⊃ [−1, 1] , c’est-à-
dire que f (J) = [−1, 1] . En définitive, la fonction f vérifie la propriété des valeurs
intermédiaires.
Solution. La fonction g définie sur R par g (x) = f eix −f ei(x+π) est continue
à valeurs réelles avec g (0) = f (1) − f (−1) = −g (π) . Le théorème des valeurs
intermédiaires nous dit alors qu’il existe c ∈ [0, π] tel que g (c) = 0, ce qui donne
le résultat.
Exercice 6.18. Montrer qu’on peut définir une suite réelle (xn )n∈N par
x5n + nxn − 1 = 0 pour tout n ∈ N. Étudier la limite de cette suite et donner
6
ak 1
un développement asymptotique de la forme xn = + o .
nk n→+∞ n6
k=0
Exercice 6.19. Montrer qu’on peut définir une suite de réels positifs
(xn )n∈N∗ par xnn + xn−1
n + · · · + xn − 1 = 0 pour tout n ∈ N∗ . Montrer
que cette suite a une limite λ et donner un équivalent de xn − λ.
n+1
part, on a ln (2xn ) = (n + 1) ln (2xn ) (n + 1) (2xn − 1) = (n + 1) xn+1
n et en
tenant compte de :
0 ≤ (n + 1) xn+1
n ≤ (n + 1) xn+1
2 → 0
n→+∞
# $
n+1 n+1
(car x2 ∈ ]0, 1[), on déduit que lim ln (2xn ) = 0 et lim (2xn ) = 1,
n→+∞ n→+∞
1 1 1
ce qui entraîne xn − = xn+1 .
2 2 n n→+∞ 2n+2
Exercice
8 6.20. Montrer qu’on peut définir une suite réelle (xn )n∈N∗ par
π9
xn ∈ 2nπ, 2nπ + et xn sin (xn ) − 1 = 0 pour tout n ∈ N∗ . Donner un
2
b 1
développement asymptotique du type xn = na + + o .
n n→+∞ n
# π$
Solution. Soit f (x) = x sin (x) − 1. On a f (2nπ) = −1, f 2nπ + = 2nπ +
π 8 π 9 2
− 1 > 0 et f (x) = sin (x) + x cos (x) > 0 sur 2nπ, 2nπ + . On déduit donc
2 8 π 9 2
que f a un unique zéro xn ∈ 2nπ, 2nπ + . On a :
2
1 1
sin (xn − 2nπ) = sin (xn ) = = sin arcsin
xn xn
8 π9
1 1
avec xn − 2nπ et arcsin dans 0, , donc xn = arcsin + 2nπ. Avec
xn 2 xn
1 1 1
xn 2nπ, on a arcsin , soit :
n→+∞ xn n→+∞ xn 2nπ
1 1 1 1 1
arcsin = + o et xn = 2nπ + + o
xn 2nπ n→+∞ n 2nπ n→+∞ n
Exercice 6.21. Montrer qu’on peut définir une suite réelle (xn )n≥1 par
8 π9
xn ∈ nπ, nπ + et tan (xn ) = xn pour tout n ∈ N. Donner un dévelop-
2
c 1
pement asymptotique de xn de la forme xn = a + bn + + o .
n n→+∞ n
Solution.
8 Soit f (x) = tan (x)# − x. On a f (nπ) = −nπ, f (x) = tan2 (x) > 0 sur
π9 π$
nπ, nπ + et lim f nπ + = +∞. On déduit donc que f a un unique
2 x→(nπ+ π 2)
− 2
8 π 9
zéro xn ∈ nπ, nπ + . On a tan (xn − nπ) = tan (xn ) = xn = tan (arctan (xn ))
2 8 π9
avec xn − nπ et arctan (xn ) dans 0, , donc :
2
π 1
xn = arctan (xn ) + nπ = − arctan + nπ
2 xn
Exercices 195
1 1 1
Avec xn nπ, on déduit que arctan , soit :
xn n→+∞ xn n→+∞ nπ
1 1 1 π 1 1
arctan = + o et xn = + nπ − + o
xn nπ n→+∞ n 2 nπ n→+∞ n
Exercice 6.22. Montrer qu’on peut définir une suite réelle (xn )n≥3 par
xn ∈ ]0, 1[ et xnn − nxn + 1 = 0 pour tout n ≥ 3. Étudier la limite de cette
suite et donner un équivalent de xn quand n tend vers l’infini
Exercice 6.23. Montrer qu’on peut définir une suite réelle (xn )n≥3 par
xn ∈ ]1, +∞[ et xnn − xn − n = 0 pour tout n ∈ N. Montrer que cette suite
a une limite finie λ et donner un équivalent de xn − λ quand n tend vers
l’infini
1 1
xn − 1 = (xn + n) n − 1 = e n ln(xn +n) − 1
1 1 ln (n) ln (n)
= ln (xn + n) + o ln (xn + n) = + o
n n→+∞ n n n→+∞ n
1
du fait que lim ln (xn + n) = 0.
n→+∞ n
cos (x)
Exercice 6.24. Montrer que pour n ∈ N∗ , la fonction f : x → a
9 π 8 x
un unique extremum dans nπ − , nπ en un point xn . Donner un déve-
2
loppement asymptotique de xn de la forme :
c 1
xn = an + b + + o
n n→+∞ n
196 Limites et continuité des fonctions d’une variable réelle
g (x)
Solution. On a f (x) = − , avec :
x2
1
g (x) = x sin (x) + cos (x) = x cos (x) tan (x) + = x cos (x) h (x)
x
1 1
Avec h (x) = − 2 > 0 pour x > 1, on vérifie que h réalise un ho-
cos2 (x) x
9 π 8 1
méomorphisme strictement croissant de nπ − , nπ sur −∞, , d’où l’exis-
2 nπ
1
tence et l’unicité de xn . De tan(xn ) = − , on déduit qu’il existe k ∈ Z tel que
xn 8
1 1 π 9 9 π 8
xn = kπ − arctan et avec − arctan ∈ − , 0 , xn ∈ nπ − , nπ ,
xn xn 2 2
1
on déduit que k = n. Donc xn = nπ − arctan . Avec xn nπ, on a
xn
1 1 1 1 1 1
arctan , soit arctan = + o et xn =
xn xn nπ xn nπ n→+∞ n
1 1
nπ− + o . Comme xn = nπ+ o (1) , on déduit que cos (xn )
nπ n→+∞ n n→+∞ n→+∞
n
n (−1)
(−1) et f (xn ) .
n→+∞ nπ
Chapitre 7
Quand cette limite existe, elle est unique, on la note f (α) et on dit que c’est
le vecteur dérivé (ou le nombre dérivé pour E = K) de f en α.
De manière équivalente, on peut dire que f est dérivable en α si, et seulement
si, elle admet un développement limité d’ordre 1 en α :
f (x) = a0 + a1 (x − α) + o (x − α)
x→α
Quand cette limite existe, elle est unique, on la note fg (α) [resp. fd (α)] et on
dit que c’est le vecteur (ou le nombre pour E = K) dérivé à gauche [resp. à droite]
de f en α.
Là encore des définitions on déduit facilement les résultats suivants.
Théorème 7.2.
◦
Si f est dérivable à gauche et à droite en α ∈ I, elle est alors continue
en ce point.
Théorème 7.3.
◦
f est dérivable en α ∈ I si, et seulement si, elle dérivable à gauche et
à droite en ce point avec fg (α) = fd (α) . Cette valeur commune est alors
égale à f (α) .
Cet ensemble D peut être vide et dans ce cas la fonction dérivée n’est pas définie.
C’est le cas par exemple pour la fonction caractéristique de Q qui est discontinue
en tout point de R (exemples 6.2) et en conséquence ne peut être dérivable.
Une fonction peut très bien être continue et nulle part dérivable sur I. En vue
de construire une telle fonction à valeurs réelles, on désigne par ϕ la fonction
2-périodique sur R définie par ϕ (x) = |x| pour tout x ∈ [−1, 1] .
Preuve. Comme ϕ (x) ∈ [0, 1] pour tout réel x, on a pour tous x, y dans R tels
que |x − y| ≥ 1, |ϕ (x) − ϕ (y)| ≤ 1 ≤ |x − y| . On suppose donc que |x − y| < 1 et
comme x, y jouent des rôles symétriques, on peut même supposer que 0 < y−x < 1.
On distingue alors les cas suivants :
— si x, y sont dans [−1, 1] , on a alors |ϕ (x) − ϕ (y)| = ||x| − |y|| ≤ |x − y| ;
— si x ∈ [−1, 1] et y ∈ [1, 2] , avec 0 < y − x < 1 on a nécessairement x ∈ [0, 1]
et y − 2 ∈ [−1, 0] , ce qui donne :
ϕ (x) − ϕ (y) = ϕ (x) − ϕ (y − 2) = x + y − 2 ≤ y − x
ϕ (y) − ϕ (x) = ϕ (y − 2) − ϕ (x) = 2 − y − x ≤ y − x
— dans le cas général, toujours avec 0 < y − x < 1, en notant n la partie entière
x+1
de , on a :
2
−1 ≤ x − 2n < 1
−1 ≤ x − 2n < y − 2n < 1 + x − 2n < 2
Le lemme qui suit nous sera également utile.
1
Lemme 7.2 Soit x ∈ R. Si l’intervalle x, x + ne contient pas d’entiers, on a
2
1 1
alors ϕ x + − ϕ (x) = .
2 2
x+1
Preuve. Si n est la partie entière de , on a alors −1 < x−2n < 1 (l’inégalité
2
stricte
à gauche est justifiée par x ∈/ Z) et comme il n’y a pas d’entiers dans
1 1 1
x − 2n, x − 2n + , on a soit −1 < x − 2n < 0 et − < x − 2n + ≤ 0, soit
2 2 2
1 1
x − 2n > 0 et < x − 2n + ≤ 1, ce qui donne :
2 2
1 1 1
ϕ x+ − ϕ (x) = ϕ x − 2n + − ϕ (x − 2n) = −
2 2 2
dans le second.
On définit la fonction de Van der Waerden par :
+∞ n
3
∀x ∈ R, f (x) = ϕ (4n x)
n=0
4
n n
3 3
Avec 0 ≤ ϕ (4 x) ≤
n
, on déduit que cette série de fonction est
4 4
uniformément convergente et avec la continuité de ϕ que sa somme f est continue
sur R.
Théorème 7.4.
La fonction f n’est dérivable en aucun point de R.
200 Dérivées des fonctions d’une variable réelle
1 m 1
Preuve. Soient x ∈ R et m ∈ N \ {0} . L’intervalle 4 x − , 4 x +m
qui est
2 2
de longueur 1 contient
exactement un entier
et cet entier
est dans l’un seulement
1 1
des deux intervalles 4m x − , 4m x ou 4m x, 4m x + . On note alors εm = −1
2 2
si le premier intervalle ne contient pas d’entier et εm = 1 si c’est le second. En
εm 1
posant hm = , on a :
2 4m
+∞ n
f (x + hm ) − f (x) 3 ϕ (4n (x + hm )) − ϕ (4n x)
=
hm n=0
4 hm
Il en résulte que :
m n
f (x + hm ) − f (x) 3 ϕ (4n (x + hm )) − ϕ (4n x)
=
hm n=0
4 hm
m−1
3m + 1
≥ 3m − 3n =
n=0
2
f (x + hm ) − f (x)
et lim = +∞ avec lim hm = 0, ce qui implique que f
m→+∞ hm m→+∞
ne peut être dérivable en x.
Un autre exemple de telle fonction est donné par la fonction de Weierstrass
+∞
cos (pn x)
définie sur R par f (x) = , où p ≥ 6 est un entier pair. On peut même
n=0
2n
montrer que cette fonction n’est monotone sur aucun intervalle non réduit à un
point (voir [19]).
En utilisant le théorème de Baire, on peut montrer le résultat suivant.
Théorème 7.5.
Si f est une fonction dérivable sur I et si la dérivée f est également dérivable sur
I, sa dérivée est notée f et on dit que c’est la dérivée seconde de f. Par récurrence,
on peut définir les dérivées successives d’une fonction, quand elles existent, comme
suit : on note f (0) = f et pour n ∈ N, dans le cas où la fonction f (n) est définie
et dérivable sur I, on note f (n+1) = f (n) . Quand la fonction f (n) existe, on dit
que c’est la dérivée d’ordre n de f.
On note :
— C 0 (I, E) l’ensemble des fonctions continues de I dans E ;
— C n (I, E) l’ensemble des fonctions n fois continûment dérivables de I dans
E, où n ∈ N∗ ;
— C ∞ (I, E) l’ensemble des fonctions indéfiniment dérivables de I dans E.
Théorème 7.6.
Soient f, g deux fonctions de I dans E dérivables en α ∈ I.
1. Pour tous réels λ, μ la fonction λf + μg est dérivable en α avec
(λf + μg) (α) = λf (α) + μg (α) .
2. Dans le cas où E = K, la fonction f g est dérivable en α avec (f g) (α) =
f (α) g (α) + f (α) g (α) (formule de Leibniz).
3. Dans le cas où E = K et g (α) = 0, la fonction g ne s’annule pas dans
1 f
un voisinage de α, les fonctions et qui sont définies dans un tel
g g
voisinage sont dérivables en α avec :
1 g (α) f g (α) f (α) − f (α) g (α)
(α) = − 2 , (α) =
g g (a) g g 2 (α)
Preuve.
1. Résulte de τα (λf + μg) = λτα (f ) + μτα (g) .
2. Résulte de τα (f g) (x) = f (x) τα (g) + g (α) τα (f ) .
3. Si g (α) = 0 dans K, on a alors g (x) = 0 pour tout x dans un voisinage de α
1 1
du fait de la continuité de g en ce point. Avec τα (x) = − τα (g)
g g (x) g (α)
1 g (α)
pour x = α, on déduit par passage à la limite en α que (α) = − 2 .
g g (α)
La formule de Leibniz permet d’obtenir le deuxième point.
La formule de Leibniz est fait valable, de manière plus générale, pour les fonc-
tions plusieurs fois dérivables. Précisément on a le résultat suivant.
Théorème 7.7. Leibniz
Soient f, g deux fonctions n fois dérivables de I dans K. La fonction f g
n
(n) n (k) (n−k)
est n fois dérivable sur I avec (f g) = f g .
k
k=0
n
(n) n
sur I, (f g) = f (k) g (n−k) et en dérivant encore une fois, on obtient :
k
k=0
n #
$
(n+1) n
(f g) = f (k+1) g (n−k) + f (k) g (n−k+1)
k
k=0
n
n−1
n n (k+1) (n−k)
= f g (n+1) + f (k) g (n+1−k) + f g + f (n+1) g
k k
k=1 k=0
n n
(n+1) n (k) (n+1−k) n
= fg + f g + f (j) g (n+1−j) + f (n+1) g
k j=1
i−1
k=1
n
n n
= f g (n+1) + + f (k) g (n+1−k) + f (n+1) g
k k−1
k=1
n + 1
n+1
= f (k) g (n+1−k)
k
k=0
f f −1 (y) − f (α)
Avec la continuité de f −1 , on a lim = f (α) , ce qui entraîne :
y→β f −1 (y) − α
f −1 (y) − f −1 (β) 1
lim =
y→β y−β f (α)
De ce résultat, on déduit les dérivées des fonctions trigonométriques et hyper-
boliques inverses, à savoir :
1 1
— ∀x ∈ ]−1, 1[ , arcsin (x) = √ , arccos (x) = − √ ;
1−x 2 1 − x2
1 1
— ∀x ∈ R, arctan (x) = , argsh (x) = √ ;
1 + x2 1 + x2
1
— ∀x ∈ ]1, +∞[ , argch (x) = √ ;
x2 − 1
1
— ∀x ∈ ]−1, 1[ , argth (x) = .
1 − x2
La fonction arcsin + arccos étant de dérivée nulle sur ]−1, 1[ est constante (co-
rollaire 7.1) et la valeur de cette fonction en x = 0, nous donne :
π
∀x ∈ ]−1, 1[ , arcsin (x) + arccos (x) =
2
1
De même en remarquant que la dérivée de x → arctan (x) + arctan est
x
∗
nulle sur R et en prenant les valeurs en −1 et 1, on déduit que :
∗ 1 x π
∀x ∈ R , arctan (x) + arctan =
x |x| 2
k1 kn
(n) n! f (x) f (n) (x)
(g ◦ f ) = g (k) (f (x)) ···
k1 !k2 ! · · · kn ! 1! n!
◦
Preuve. Pour f croissante sur I et x = y dans I, le taux d’accroissement
f (y) − f (x)
est positif ou nul, donc passant à la limite quand y tend vers x,
y−x
on en déduit que f (x) ≥ 0.
206 Dérivées des fonctions d’une variable réelle
◦
Réciproquement, on suppose que f (x) ≥ 0 pour tout x dans I. Si f est non
◦ ◦
croissante sur I, il existe alors a1 < b1 dans I tels que f (a1 ) > f (b1 ) et on a
f (b1 ) − f (a1 )
τ1 = τ (a1 , b1 ) = < 0. En utilisant le principe de dichotomie, on
b1 − a 1
◦
construit par récurrence deux suites (an )n∈N∗ et (bn )n∈N∗ de points de I telles
que : ⎧
⎨ [an+1 , bn+1 ] ⊂ [an , bn ]
∗
∀n ∈ N ,
⎩ bn − an = b1 − a1 > 0, τn = τ (an , bn ) ≤ τ1
2n−1
◦ a n + bn
Supposons an et bn construits dans I pour n ≥ 1. En notant cn = , le
2
lemme précédent nous dit que τ (an , bn ) est entre τ (an , cn ) et τ (cn , bn ) . Préci-
sément, si τ (an , bn ) ≤ τ (an , cn ) , on a alors τ (an , bn ) ∈ [τ (cn , bn ) , τ (an , cn )] et
on pose an+1 = cn , bn+1 = bn , sinon on a τ (an , bn ) ∈ ]τ (an , cn ) , τ (cn , bn )[ et
on pose an+1 = an , bn+1 = cn . Dans tous les cas on a [an+1 , bn+1 ] ⊂ [an , bn ] ,
bn − an b1 − a1
bn+1 − an+1 = = et τ (an+1 , bn+1 ) ≤ τ (an , bn ) ≤ τ1 .
2 2n
Les suites (an )n≥1 et (bn )n≥1 sont alors adjacentes et elles convergent vers un
◦
même réel c ∈ [a1 , b1 ] ⊂ I.
En écrivant que τ1 < 0 ≤ f (c) = lim τ (x, c) , on déduit qu’il existe un réel
x→c
η > 0 tel que τ (x, c) > τ1 pour tout x ∈ [c − η, c + η] \ {c} ⊂ I. De plus, il existe
un entier n0 ≥ 1 tel que an ∈ [c − η, c] et bn ∈ [c, c + η] pour tout n ≥ n0 . Mais
pour n ≥ n0 on a :
— soit an = c et dans ce cas bn > c (on a an < bn ), donc τ (c, bn ) > τ1 ce qui
est en contradiction avec τ (c, bn ) = τ (an , bn ) ≤ τ1 ;
— soit bn = c et dans ce cas an < c, donc τ (an , c) > τ1 ce qui est en contradic-
tion avec τ (an , c) = τ (an , bn ) ≤ τ1 ;
— soit an < c < bn et dans ce cas les inégalités τ (an , c) > τ1 et τ (c, bn ) > τ1
sont en contradiction avec τ (an , bn ) ≤ τ1 et τ (an , bn ) est entre τ (an , c) et
τ (c, bn ) .
◦
En définitive la fonction f est nécessairement croissante sur I et sur I par
continuité de f.
Du théorème précédent, on déduit les résultats classiques suivants.
Preuve.
1. On applique le théorème précédent à la fonction −f.
2. Si f = 0, la fonction f est à la fois croissante et décroissante, donc constante.
La réciproque est évidente.
◦
3. Si f (x) > 0 pour tout x dans I, on sait déjà que la fonction f est croissante.
Si il existe a < b dans I tels f (a) = f (b) , on a alors :
et la fonction f est constante sur [a, b] d’intérieur non vide, ce qui entraîne
f = 0 sur ]a, b[ en contradiction avec f > 0.
4. Résulte de la croissance de la fonction h = g − f.
5. On applique ce qui précède à (mx, f ) et (f, M x) .
On peut remarquer que le point 3. du corollaire précédent implique le théorème
7.11. Les deux résultats sont donc équivalents. En effet, en notant, pour tout réel
◦
m > 0, gm (x) = f (x) + m, l’hypothèse f (x) ≥ 0 pour tout x dans I entraîne
◦
gm (x) > 0 pour tout x dans I, donc gm est strictement croissante sur I et pour
x < y dans I, on a f (x) + m < f (y) + m pour tout m > 0 ce qui entraîne
f (x) ≤ f (y) en faisant tendre m vers 0.
En fait, on a le résultat suivant, un peu plus fin que le théorème 7.11.
Théorème 7.12.
◦
Si f : I → R est continue sur I et dérivable à droite sur I, elle est alors
◦
croissante sur I si, et seulement si, fd (x) ≥ 0 pour tout x dans I.
◦
Preuve. Pour f croissante sur I et x < y dans I, le taux d’accroissement
f (y) − f (x)
est positif ou nul, donc passant à la limite quand y tend vers x+ , on
y−x
en déduit que fd (x) ≥ 0. Réciproquement, on suppose que fd (x) ≥ 0 pour tout x
◦ ◦
dans I. Pour x < y fixés dans I et ε > 0 quelconque, on définit l’ensemble :
ce qui entraîne que f (t) − f (x) ≥ −ε (t − x) pour tout t ∈ [x, z] puisque cette
inégalité est vérifiée sur [x, α] . Mais alors z est dans ]α, y] et dans Iε , ce qui
contredit le caractère maximal de α. On a donc α = y et en particulier f (y) −
f (x) ≥ −ε (y − x) . Faisant tendre ε vers 0, on en déduit que f (y) − f (x) ≥ 0.
◦
En définitive la fonction f est croissante sur I et en conséquence sur I par
continuité de f.
Théorème 7.13.
La dérivée logarithmique d’un produit [resp. quotient] de deux fonctions
dérivables est la somme [resp. la différence] des dérivées logarithmiques.
Deux fonctions ayant même dérivée logarithmique sont proportionnelles.
Une telle fonction est de classe C 1 sur I et les fonctions f et eiθ ont même dérivée
logarithmique, elle sont donc proportionnelles et ayant même valeur en α, elles
sont égales. L’unicité a été montrée en introduction.
Une telle fonction θ est un relèvement de la fonction f.
En écrivant f = x + iy, la condition |f (t)| = 1 pour tout t ∈ I se traduit par
x2 (t) + y 2 (t) = 1 qui entraîne xx + yy = 0 et :
f x + iy (x + iy ) (x − iy)
= = = i (xy − x y)
f x + iy x2 + y 2
On a donc :
t
∀t ∈ I, θ (t) = θ0 + (x (s) y (s) − x (s) y (s)) ds
a
Ce théorème peut être utilisé pour montrer que l’indice d’un lacet dans le plan
complexe est un entier. Précisément, on a le résultat suivant.
1
2π de classe C et 2π-périodique de R
Corollaire 7.2. Si f est une fonction
1 f (t)
dans C∗ , on a alors I (f ) = dt ∈ Z.
2iπ 0 f (t)
f
Preuve. La fonction g = étant de classe C 1 de R dans le cercle unité Γ admet
|f |
un relèvement θ de classe C 1 de R dans R. On a donc f = |f | g = |f | eiθ et :
2π
1 |f | (t) 1 2π
I (f ) = + iθ (t) dt = [ln (|f |) + iθ]0
2iπ 0 |f | (t) 2iπ
Avec la 2π-périodicité de f, on a f (2π) = f (0) et θ (2π) = θ (0) + 2kπ avec k ∈ Z,
θ (2π) − θ (0)
ce qui donne I (f ) = = k ∈ Z.
2π
Théorème 7.15.
Soient I un intervalle réel d’intérieur non vide, f : I → R une fonction
◦
dérivable en un point α ∈ I. Si f admet un extremum local en α, on a alors
f (α) = 0.
Preuve. Soient a < b dans I. Si f (a) = f (b) il n’y a alors rien à montrer.
On suppose donc que f (a) < f (b) et on se donne λ ∈ ]f (a) , f (b)[ . On définit
la fonction ϕ sur [a, b] par ϕ (x) = f (x) − λx. Cette fonction qui est continue
sur le compact [a, b] , est minorée et atteint sa borne inférieure, c’est-à-dire qu’il
existe c ∈ [a, b] tel que ϕ (c) = inf ϕ (x) . Si c = a [resp. c = b], on a alors
x∈[a,b]
ϕ (x) − ϕ (a) ϕ (b) − ϕ (x)
≥ 0 [resp. ≤ 0] pour tout x ∈ ]a, b[ et en passant à
x−a b−x
limite quand x tend vers a [resp. vers b] par valeurs supérieures [resp. inférieures],
on déduit que ϕ (a) ≥ 0 [resp. ϕ (b) ≤ 0] ce qui est en contradiction avec ϕ (a) =
f (a)−λ < 0 < ϕ (b) = f (b)−λ. On a donc c ∈ ]a, b[ et ϕ (c) = 0, soit f (c) = λ.
Le théorème de Darboux nous montre qu’une fonction peut très bien vérifier la
propriété des valeurs intermédiaires
sans être continue. Par exemple la fonction f
2 1
définie par f (x) = x sin prolongée par continuité en 0 est dérivable sur R
x
de dérivée f vérifiant la propriété des valeurs intermédiaires et non continue en 0.
Corollaire 7.3. Il existe des fonctions définies sur un intervalle réel qui
n’admettent pas de primitive.
Preuve. Si f admet une primitive F sur I, elle doit vérifier la propriété des
valeurs intermédiaires. Une fonction ne vérifiant pas cette propriété, par exemple
une fonction en escalier, n’admet donc pas de primitive sur I.
En fait, on peut vérifier directement qu’une fonction en escalier n’admet pas de
primitives (exercice 7.12).
Du théorème de Darboux et du théorème 6.25, on déduit le résultat suivant.
Théorème 7.19.
Une fonction convexe et dérivable de I dans R est continûment dérivable.
étant continue en α avec ε (α) = 0, il existe η ∈ ]0, η] tel que f (α) − a + ε (x) soit
du signe de f (α) − a pour tout x ∈ J = [α − η , α + η ] . On a donc :
∀x ∈ ]α − η , α[ , g (x) < 0
f (α) > a ⇒
∀x ∈ ]α, α + η [ , g (x) > 0
∀x ∈ ]α − η , α[ , g (x) > 0
f (α) < a ⇒
∀x ∈ ]α, α + η [ , g (x) < 0
ce qui signifie que pour f (α) > a [resp. f (α) > a] la courbe C est localement au
dessous [resp. au dessus] de la sécante D si x < α et localement au dessus [resp.
au dessous] si x > α.
Position d’une courbe par rapport aux sécantes et aux tangentes 213
Dans le cas où D est une corde, c’est-à-dire qu’elle coupe C en deux points au
moins, on peut être plus précis dans l’étude précédente si on suppose de plus que
la fonction f est dérivable sur I à dérivée monotone. Cette étude nous conduira
naturellement à la notion de convexité qui est étudiée plus en détail au chapitre 8.
Si la droite D coupe la courbe C en deux points distincts M0 (α, f (α)) et
M1 (β, f (β)) avec α < β dans I, on peut alors écrire une équation de D sous
f (β) − f (α)
la forme y = h (x) = f (α) + (x − α) et la fonction g est définie par :
β−α
f (β) − f (α)
∀x ∈ I, g (x) = f (x) − f (α) − (x − α)
β−α
En écrivant tout réel x ∈ [α, β] sous la forme x = λα + (1 − λ) β avec λ ∈ [0, 1] ,
tout revient à étudier le signe de la fonction ϕ définie sur [0, 1] par :
ce qui équivaut à dire que le graphe de f est au dessous de toutes ses cordes.
On dit que f est concave si la fonction −f est convexe, ce qui équivaut à
dire que le graphe de f est au dessus de toutes ses cordes.
Preuve. En gardant toujours les mêmes notations, dans le cas où f est croissante,
on a le tableau de variation suivant de la restriction de g à [α, β] :
x α c β
g − +
0 0
g
214 Dérivées des fonctions d’une variable réelle
Théorème 7.23.
Soit (fn )n∈N une suite de fonctions continues de [a, b] dans R, dérivables
sur ]a, b[ , qui converge simplement vers une fonction f. S’il existe une
constante M > 0 telle que |fn (x)| ≤ M pour tout n dans N et tout x
dans ]a, b[ , la suite (fn )n∈N converge alors uniformément et f est continue.
Définition 7.10. Soient O un ouvert non vide d’un espace vectoriel normé
(E, ·) , α un point de O et une fonction f : O → R. On dit que f est
différentiable en α s’il existe une forme linéaire continue L sur E telle que
f (α + h) = f (α) + L (h) + o (h) pour tout h dans un voisinage de 0.
En cas d’existence une telle forme linéaire L est unique. On la note L = df (α)
et on dit que L est la différentielle de f en α.
Il est facile de vérifier que si f est différentiable en α, elle est alors continue en
ce point.
Dans le cas où E = Rn , si f est différentiable en α ∈ O, elle admet alors des
dérivées partielles en α par rapport à chacune des variables xk (1 ≤ k ≤ n) et
n
∂f
pour tout h ∈ Rn on a df (α) (h) = (α) hk .
∂xk
k=1
On dit que la fonction f est différentiable sur O si elle est différentiable en tout
point de O.
Exercices 217
Théorème 7.25.
Soient O un ouvert non vide de E, f : O → R une fonction différentiable
en un point α ∈ O. Si f admet un extremum local en α, on alors df (α) = 0.
on déduit que ϕ (0) = 0. On a donc ainsi montré que df (α) (h) = 0 pour tout
h ∈ E, ce qui équivaut à df (α) = 0.
L’équation df (α) = 0 est appelée équation d’Euler.
7.10 Exercices
1 2
et si <x< , alors :
k+1 2k + 1
#π$
f (x) − f (xk ) x2 cos # # π $$
=− x → + − x2 cos = −π
x − xk x − xk x→xk x |x=xk
f est donc dérivable à droite et gauche en x2p avec fg (x2p ) = −π, fd (x2p ) = π.
On vérifie de même que f est dérivable à droite et gauche en x2p+1 , pour tout
entier naturel p, avec fg (x2p+1 ) = −π, fd (x2p+1 ) = π. Ces dérivées à droite et
à gauche étant distinctes, on en déduit que f n’est pas dérivable en xk pour tout
k ∈ N. Avec la parité de la fonction f, on déduit que ce résultat est encore valable
pour tout k ∈ Z.
Exercice 7.2. Soit (ak )1≤k≤n une suite finie de réels ou de complexes.
n
Montrer que si ak sin (kx) ≤ |sin (x)| pour tout réel x dans un voisinage
k=1
n
de 0, on a alors kak ≤ 1.
k=1
n
Solution. Soit f la fonction définie sur R par f (x) = ak sin (kx) . Cette fonc-
k=1
n n
tion est dérivable avec f (0) = kak et la condition ak sin (kx) ≤ |sin (x)|
k=1 k=1
π
dans un intervalle ]−δ, δ[ avec 0 < δ < , entraîne :
2
f (x) f (x) sin (x)
∀x ∈ ]−δ, δ[ \ {0} , = ≤1
x sin (x) x
f (x)
de sorte que |f (0)| = lim ≤ 1.
x→0 x
Exercice 7.3. Calculer, pour tout entier naturel non nul n, la dérivée
1
d’ordre n de la fonction f : x → ainsi que tous les zéros de f (n) .
1 + x2
i 1 1
Solution. La décomposition en éléments simples f (x) = −
2 x+i x−i
donne :
n
(n) i (−1) n! 1 1
f (x) = n+1 − n+1
2 (x + i) (x − i)
# $ # $
n n+1 n+1 n n+1
i (−1) n! (x − i) − (x + i) (−1) n! (x + i)
= n+1 = n+1
2 (x2 + 1) (x2 + 1)
Exercices 219
f (yn ) − f (xn )
on a lim = f (α) . Le résultat est-il encore valable sans
n→+∞ yn − x n
l’hypothèse xn < α < yn pour tout n ∈ N ?
yn − α
Solution. En posant λn = , pour tout n ∈ N, on a 0 < λn < 1,
yn − x n
α − xn
1 − λn = et on peut écrire :
yn − x n
1 π 1 π
∀n ∈ N∗ , = 2nπ + , = 2nπ −
xn 2 yn 2
Solution.
(
n
1. En écrivant P (x) = an (x − xk ) , avec an = 0, on a la décomposition en
k=1
1 n
αk
éléments simples sur R \ {x1 , · · · , xn } ,= , les coefficients αk ,
P (x) x − xk
k=1
pour k compris entre 1 et n, étant donnés par :
x − xk x − xk 1
αk = lim = lim =
x→xk P (x) x→xk P (x) − P (xk ) P (xk )
(les racines xk de P étant simples, les P (xk ) sont tous non nuls). On a donc :
1 n
1 1
∀x ∈ R \ {x1 , · · · , xn } , =
P (x) P (xk ) x − xk
k=1
n
1
et l’identification des coefficients de xn−1 nous donne = 0 (n ≥ 2).
P (xk )
k=1
(
n
n
2
n
2. Pour P (x) = (x + k) , on a P (x) = (x + j) , donc :
k=0 k=0 j=0
j =k
(
n
(−1)
k
P (−k) =
k
(j − k) = (−1) k! (n − k)! = n! n
j=0 k
j =k
1
et la décomposition en éléments simples de donne :
P
n k
n (−1) n!
∀x ∈ R \ {−n, · · · , −1, 0} , = 2
n
k x+k
k=0 (x + k)
k=0
Exercices 221
1 1
Pour tout entier n > , on a 0 < < η pour tout entier k compris entre 1 et
η n+k
1 1 1
n, donc f − f (0) < ε, ce qui entraîne :
n+k n+k n+k
n n
n
1
1 1
f − f (0) < ε<ε
n+k n+k n+k
k=1 k=1 k=1
En considérant que :
1 1 1
n n
1 dx
lim = lim k
= = ln (2)
n→+∞ n + k n→+∞ n 1+ n 0 1+x
k=1 k=1
on aboutit au résultat. Par exemple pour f (x) = x2 et pour f (x) = arctan (x) ,
n n
1 1
on obtient lim 2 = 0 et n→+∞
lim arctan = ln (2) .
n→+∞ (n + k) n+k
k=1 k=1
1 k 1
Pour tout entier n > , on a 0 < 2 ≤ < η pour tout entier k compris entre 1
η n n
k k k
et n, donc f − 2 f (0) < 2 ε, ce qui entraîne :
n2 n n
n
n
k
n
k k n+1
f − f (0) < ε= ε≤ε
n2 n2 n2 2n
k=1 k=1 k=1
222 Dérivées des fonctions d’une variable réelle
n
n
k f (0) k n+1 |f (0)|
f 2
− ≤ f 2
− f (0) +
n 2 n 2n 2n
k=1 k=1
|f (0)|
≤ε+ < 2ε
2n
n
(
n
k k 1
En notant un = 1+ 2 , on a ln (un ) = ln 1 + 2 → , donc
n n n→+∞ 2
√ k=1 k=1
lim un = e.
n→+∞
Exercice 7.8. Soit f : [0, 1] → R une fonction dérivable telle que f (0) =
f (c)
f (0) = f (1) = 0. Montrer qu’il existe c ∈ ]0, 1] tel que f (c) = .
c
f (x) − f (0)
lim+ g (x) = lim+ = f (0) = 0 = g (0)
x→0 x→0 x
on déduit qu’elle est également continue en 0. Cette fonction est dérivable sur ]0, 1]
xf (x) − f (x)
de dérivée g (x) = . La fonction g étant continue sur le compact
x2
[0, 1] est majorée et atteint sa borne supérieure en un point c ∈ [0, 1] . Si c = 0,
alors g (c) = g (0) = 0 contredit g (c) ≥ g (1) = f (1) > 0. Si c = 1, on a alors :
g (1) − g (x)
f (1) = −g (1) = − lim− ≤0
x→1 1−x
f (c)
ce qui contredit f (1) > 0. On a donc c ∈ ]0, 1[ et g (c) = 0, soit f (c) = .
c
Solution. Pour tout réel x, on a f (x) = ±1. Si il existe x < y tels que f (x) = −1
et f (y) = 1, le théorème de Darboux nous dit qu’il existe z ∈ ]x, y[ tel que
2
f (z) = 0, ce qui contredit l’hypothèse (f ) = 1. La fonction f a donc un signe
constant, c’est-à-dire que l’on a f = −1 ou f = 1, soit f (x) = −x + b pour
tout réel x ou f (x) = x + c pour tout réel x, où b, c sont deux constantes réelles.
Réciproquement, ces fonctions conviennent.
Exercices 223
a+b
Solution. En notant c = , on a lim f (c + h) = lim f (x) = +∞
2 h→( b−a
2 )
− x→b−
f (c) − f (c − h) f (c + k) − f (c)
= f (α) < λ < = f (β)
h k
Solution.
1. Si f ne s’annule jamais sur R il en est de même de f (|f | = |f |). De plus la
fonction dérivée f vérifiant la propriété des valeurs intermédiaires, s’il existe
x < y dans R tels que f (x) f (y) < 0 il en résulte alors l’existence de z ∈ ]x, y[
tel que f (z) = 0, ce qui contredit f (t) = 0 pour t ∈ R. En conclusion f garde
un signe constant sur R et comme il en est de même de f (théorème des valeurs
intermédiaires), on déduit que l’on a soit f = f, soit f = −f, ce qui entraîne
f (x) = αex ou f (x) = αe−x pour tout x ∈ R avec α ∈ R∗ .
224 Dérivées des fonctions d’une variable réelle
2.
(a) L’ensemble E = [a, +∞[ ∩ f −1 {0} est fermé du fait de la continuité de
f. Si cet ensemble est non vide, étant minoré par a, il admet une borne
inférieure b et cette dernière est dans E. On a donc f (b) = 0, b > a et
f (x) = 0 sur [a, b[ , ce qui entraîne f (x) > 0 pour tout x ∈ [a, b[ du fait
de la continuité de f et de f (a) > 0.
(b) Supposons qu’il existe c ∈ [a, b[ tel que f (c) = −f (c) . On a donc c ∈ ]a, b[
(car f (a) = f (a) > 0). L’ensemble F = {x ∈ ]−∞, c[ | f (x) = f (x)} est
non vide (il contient a) majoré par c, il admet donc une borne supérieure
d ∈ [a, c] . Si d = a, alors f (x) = −f (x) < 0 sur ]a, c[ , donc f est
strictement décroissante et f = −f est strictement croissante, ce qui en-
traîne pour x ∈ ]a, c[ , f (a) < f (x) = −f (x) < 0 en contradiction avec
f (a) = f (a) > 0. On a donc d ∈ ]a, c[ ⊂ ]a, b[ , ce qui entraîne f (d) > 0
et avec la continuité de f en d l’existence d’un réel η > 0 tel que :
1
∀x ∈ ]d − η, d + η[ ⊂ ]a, b[ , f (x) > f (d) > 0
2
De plus par définition de la borne supérieure on peut trouver e ∈ ]d − η, d]
1
tel que f (e) = f (e) > f (d) > 0. On a donc f (c) < 0, f (e) > 0 avec
2
e ≤ d ≤ c, donc e < c et le théorème de Darboux dit que f s’annule sur
]e, c[ ⊂ ]a, b[ , ce qui est faux. En première conclusion, on a f (x) = f (x)
sur tout [a, b[ , donc f (x) = αex sur cet intervalle avec α ∈ R∗ et f (b) =
αeb = 0 par continuité, ce qui contredit f (b) = 0. En conclusion E est
vide, ce qui signifie que f (x) > 0 sur tout [a, +∞[ .
3. Comme dans la question précédente, on montre que f a un signe constant sur
]−∞, a] . Cette fonction a donc un signe constant sur R et on conclut avec la
première question.
Fonctions convexes
On rappelle qu’une partie I d’un espace vectoriel E est convexe, si elle est non
vide, non réduite à un point et si pour tout couple (a, b) d’éléments de I, le segment
[a, b] = {(1 − λ) a + λb | 0 ≤ λ ≤ 1} est contenu dans I.
Pour l’étude des fonctions convexes, on se ramènera rapidement au cas où E
est la droite réelle et dans ce cas, les convexes sont les intervalles (corollaire 2.1).
On dit que f est strictement convexe si pour tout couple (x, y) de points
distincts de I et tout réel λ ∈ ]0, 1[ , on a :
Théorème 8.1.
L’application f est convexe si, et seulement si, son épigraphe est convexe
dans E × R.
et on a :
Exemples 8.1
1. En utilisant l’inégalité triangulaire sur R (ou sur E) on voit que l’application
x → |x| (ou x → x) est convexe sur R (ou sur E).
2. On peut vérifier à partir de la définition et en utilisant le théorème de Rolle que
la fonction exponentielle est convexe (voir le théorème 9.12).
3. Une fonction affine est à la fois convexe et concave sur R. Graphiquement on
peut se convaincre que la réciproque est vérifiée, c’est ce qu’on montrera un peu
plus loin (théorème 8.10).
4. Une combinaison linéaire à coefficients réels positifs de fonctions convexes est
convexe. Mais le produit de deux fonctions convexes n’est pas nécessairement
convexe comme le montre l’exemple de la fonction x → x3 = x · x2 (le graphe
de la restriction à [−1, 1] n’est pas sous la corde).
5. La composée f = ϕ ◦ g d’une fonction convexe croissante ϕ : J → R avec
une fonction convexe g : I → J est convexe. En effet, pour (x, y) ∈ I 2 et
λ ∈ [0, 1] , on a g ((1 − λ) x + λy) ≤ (1 − λ) g (x) + λg (y) pour g convexe avec
g ((1 − λ) x + λy) et (1 − λ) g (x) + λg (y) dans J, donc avec la croissance et la
convexité de ϕ, on a :
Théorème 8.4.
Une fonction log-convexe est convexe.
Preuve. (1) ⇒ (2) Si f est logarithmiquement convexe, pour tout réel α > 0 la
fonction x → ln (αx f (x)) = x ln (α) + ln (f (x)) est alors convexe comme somme
de deux fonctions convexes, ce qui signifie que x → αx f (x) est logarithmiquement
convexe, donc convexe.
(2) ⇒ (3) Soit f : I → R+,∗ telle que, pour tout réel α > 0, la fonction
x → αx f (x) soit convexe. Pour x < y fixés dans I et λ fixé dans ]0, 1[ , on a :
ou encore :
donc f ((1 − λ) x + λy) ≤ inf ϕ (α) , cette borne inférieure étant atteinte pour
α>0
α > 0 tel que ϕ (α) = λ (1 − λ) (y − x) α−λ(y−x)−1 (αy−x f (y) − f (x)) = 0, ce qui
Fonctions convexes 229
f (x)
équivaut à αy−x = . On a donc :
f (y)
−λ 1−λ
f (x) f (x)
f ((1 − λ) x + λy) ≤ (1 − λ) f (x) + λ f (y)
f (y) f (y)
1−λ λ
≤ (f (x)) (f (y))
ce qui équivaut à :
(f α (x) et f α (y) sont dans R+,∗ , donc aussi (1 − λ) f α (x) + λf α (y)), la fonction
ϕ (à λ, x, y fixés) étant de classe C ∞ sur R+,∗ avec lim+ ϕ (α) = ln (1) = 0, elle se
α→0
prolonge donc par continuité en 0. De plus, on a :
ϕ (α)
ln (f ((1 − λ) x + λy)) ≤ lim = ϕ (0) = ln f 1−λ (x) f λ (y)
α→0+ α
1−λ λ
soit f ((1 − λ) x + λy) ≤ (f (x)) (f (y)) .
Théorème 8.6.
Une fonction continue f : I → R est convexe si, et seulement si :
2 x+y f (x) + f (y)
∀ (x, y) ∈ I , f ≤ (8.1)
2 2
z = (1 − λn+1,k ) x + λn+1,k y
1
= (((1 − λn,p ) x + λn,p y) + ((1 − λn,p+1 ) x + λn,p+1 y))
2
1
et f (z) ≤ (f ((1 − λn,p ) x + λn,p y) + f ((1 − λn,p+1 ) x + λn,p+1 y)) , puis, avec
2
l’hypothèse de récurrence on obtient :
1
f (z) ≤ ((1 − λn,p ) f (x) + λn,p f (y) + (1 − λn,p+1 ) f (x) + λn,p+1 f (y))
2
≤ (1 − λn+1,k ) f (x) + λn+1,k f (y) .
[2n λ]
Si λ est un réel compris entre 0 et 1, on a λ = lim λn , où λn = avec
n→+∞ 2n
0 ≤ [2n λ] ≤ 2n et avec la continuité de f on déduit de ce qui précède que :
◦
Preuve. On se donne, une fonction f convexe sur I, un intervalle [a, b] ⊂ I et un
y−x
réel ε > 0 tel que [a − ε, b + ε] ⊂ I. Pour x = y dans [a, b] , on note z = y + ε
|y − x|
(z = y ± ε, où ± est le signe y − x).
Pour x < y, on a z = y +ε et y ∈ ]x, z[ et pour x > y, on a z = y −ε et y ∈ ]z, x[ ,
donc dans tous les cas, on peut écrire que y = (1 − λ) x + λz avec λ ∈ ]0, 1[ est
donné par :
y−x y−x (y − x) |y − x| |y − x|
λ= = = =
z−x y−x
y + |y−x| ε−x |y − x| (y − x) + (y − x) ε |y − x| + ε
|y − x|
f (y) − f (x) ≤ λ (f (z) − f (x)) = (f (z) − f (x))
|y − x| + ε
(f (z) − f (x))
≤ |y − x|
ε
Comme la fonction convexe f est bornée sur [a − ε, b + ε] , il existe des constantes
m ≤ M telles que m ≤ f (t) ≤ M pour tout t ∈ [a − ε, b + ε] , ce qui nous donne
M −m
f (y) − f (x) ≤ |y − x| pour tous réels x = y dans [a, b] , ce qui équivaut
ε
M −m
à |f (y) − f (x)| ≤ |y − x| (pour f (x) > f (y) , on applique l’inégalité
ε
◦
précédente au couple (y, x)). La fonction f est donc lipschitzienne sur tout [a, b] ⊂ I
et en conséquence elle est uniformément continue sur ces intervalles. Il en résulte
◦
que f est continue sur I.
Une fonction convexe sur I n’est pas nécessairement continue sur tout l’inter-
valle I comme le montre l’exemple de la fonction f définie sur [0, 1] par f (x) = 0
si 0 < x < 1 et f (0) = f (1) = 1.
Théorème 8.8.
◦
Si f est continue sur I et convexe sur I, elle est alors convexe sur I.
1
Preuve. Pour x < y dans I il existe un entier n0 ≥ 1 tel que xn = x + et
n
1 ◦
yn = y − soient dans I pour tout n ≥ n0 avec xn < yn . On a alors avec la
n
232 Fonctions convexes
◦
convexité de f sur I et la continuité sur I, pour tout réel λ ∈ [0, 1] :
f (y) − f (x)
Pour x = y dans I, on note p (x, y) = la pente de la droite (M N )
y−x
où M (x, f (x)) et N (y, f (y)) . Comme x et y jouent des rôles symétriques, on a
p (x, y) = p (y, x) .
y z
x
Théorème 8.9.
Pour f : I → R les propriétés suivantes sont équivalentes :
1. f est convexe ;
2. pour tous x < y < z dans I, on a p (x, y) ≤ p (x, z) ≤ p (y, z) (inégalité
des trois pentes, figure 8.1) ;
f (x) − f (a)
3. pour tout a ∈ I la fonction τa : x → est croissante sur
x−a
I \ {a} .
Preuve. Tout est basé sur le fait que tout point y ∈ ]x, z[ s’écrit y = (1 − λ) x+λz
y−x z−y
avec λ = et 1 − λ = dans ]0, 1[ .
z−x z−x
(1) ⇒ (2) Si f est convexe, on a alors pour y = (1 − λ) x + λz ∈ ]x, z[ :
y−x
soit f (y) − f (x) ≤ λ (f (z) − f (x)) = (f (z) − f (x)) et en conséquence,
z−x
z−y
f (y) − f (z) ≤ (1 − λ) (f (x) − f (z)) = (f (x) − f (z)) , ce qui nous donne :
z−x
f (y) − f (x) f (z) − f (x)
p (x, y) = ≤ = p (x, z)
y−x z−x
f (y) − f (z) f (x) − f (z)
et −p (y, z) = ≤ −p (x, z) = , soit p (x, z) ≤ p (y, z) .
z−y z−x
(2) ⇒ (3) Pour x < y < a, on a τa (x) = p (x, a) ≤ p (y, a) = τa (y) , pour
x < a < y, on a τa (x) = p (x, a) ≤ p (a, y) = τa (y) et pour a < x < y, on a
τa (x) = p (a, x) ≤ p (a, y) = τa (y) . Ou alors, on peut remarquer que la fonction :
τa (y) − τa (x) p (a, y) − p (a, x)
(a, x, y) → =
y−x y−x
est invariante par permutation de (a, x, y) et positive pour x < y < a.
(3) ⇒ (1) Pour x = y, l’inégalité de convexité est une égalité trivialement
vérifiée. On se donne donc x < y dans I, λ dans ]0, 1[ et t = (1 − λ) x + λy dans
]x, y[ . Avec la croissance de τy sur I − {y} on a :
f (x) − f (y) f (t) − f (y)
τy (x) = ≤ τy (t) =
x−y t−y
f (x) − f (y)
ce qui s’écrit (t − y) + f (y) ≥ f (t) , ou encore :
x−y
y−t t−x
f (t) ≤ f (x) + f (y) = (1 − λ) f (x) + λf (y)
y−x y−x
et traduit la convexité de f.
De ce théorème, on déduit que la fonction f est concave si, et seulement si,
pour tout a ∈ I la fonction τa est décroissante sur I \ {a} , ce qui se déduit
immédiatement de τ−f,a = −τf,a .
On démontre de manière analogue que la fonction f est strictement convexe
[resp. strictement concave] si, et seulement si, pour tout a ∈ I la fonction τa est
strictement croissante [resp. strictement décroissante] sur I − {a} .
C’est principalement la propriété (3) qui va nous permettre de déduire quelques
propriétés importantes de régularité des fonctions convexes.
Théorème 8.10.
Une fonction f de R dans R est affine si, et seulement si, elle est à la
fois convexe et concave.
Preuve. Il est clair qu’une fonction affine est convexe et concave. Si f est convexe
et concave, la fonction τ0 est alors constante sur R∗ puisque croissante et décrois-
sante. On a donc τ0 (x) = τ0 (1) pour tout x ∈ R∗ , ce qui équivaut à f (x) = ax + b
pour tout x ∈ R∗ avec a = τ0 (1) = f (1) − f (0) et b = f (0) . Cette égalité étant
encore vérifiée pour x = 0, la fonction f est affine.
De la propriété (3) on peut aussi déduire le résultat suivant.
234 Fonctions convexes
Théorème 8.11.
Une fonction f de R dans R est constante si, et seulement si, elle est
convexe et majorée.
◦
est donc continue sur I et dans le cas où f est dérivable sur I on disposera d’une
critère simple de convexité qui est la croissance de f , simplement traduite par la
condition f ≥ 0 dans le cas où f est deux fois dérivable.
Théorème 8.14.
Si f est convexe sur I, elle admet alors une dérivée à droite et à gauche
◦
en tout point de l’intérieur I de I, les fonctions dérivées à droite et à gauche
◦ ◦
sont croissantes sur I et pour a < b dans I on a :
f (b) − f (a)
fg (a) ≤ fd (a) ≤ ≤ fg (b) ≤ fd (b)
b−a
◦
Preuve. Pour c ∈ I et a, b dans I tels que a < c < b, avec la croissance de τc
sur I \ {c} , on a τc (a) ≤ τc (x) ≤ τc (b) pour tout x ∈ [a, b] − {c} , ce qui entraîne
l’existence de :
◦
Pour a < b dans I, on a :
fd (a) = inf τa (x) ≤ τa (b) = τb (a) ≤ sup τb (x) = fg (b)
x∈]a,+∞[∩I x∈]−∞,b[∩I
Une fonction convexe n’est pas nécessairement dérivable en tout point comme
le montre l’exemple de la fonction valeur absolue sur [−1, 1] .
Avec théorème précédent, on peut retrouver le théorème 8.7.
◦
Corollaire 8.2. Une fonction convexe sur I est continue sur I.
qui par passage à la limite quand x tend vers c donne lim (f (x) − f (c)) = 0, ce
x→c+
qui traduit la continuité à droite en c. La continuité à gauche se montre de manière
analogue.
Sur un intervalle ouvert on a la caractérisation suivante des fonctions convexes.
236 Fonctions convexes
Théorème 8.15.
Soit I un intervalle réel ouvert non vide et f : I → R. La fonction f est
convexe sur I si, et seulement si, elle est continue et dérivable à droite sur
I de dérivée droite fd croissante.
Preuve. On sait déjà que f convexe est continue et dérivable à droite sur I de
dérivée droite fd croissante. Réciproquement, supposons f continue et dérivable
à droite sur I de dérivée droite fd croissante. Pour x < y dans I et λ ∈ [0, 1] la
fonction ϕ : t → f ((1 − λ) t + λy) − (1 − λ) f (t) − λf (y) est continue sur [x, y]
et admet une dérivée à droite ϕd : t → (1 − λ) (fd ((1 − λ) t + λy) − fd (t)) ≥ 0
((1 − λ) t + λy ∈ [t, y]), elle est donc croissante (théorème 7.12), ce qui donne
ϕ (x) ≤ ϕ (y) = 0, c’est-à-dire l’inégalité de convexité.
Dans le cas où f est dérivable, on dispose du critère de convexité suivant qui
est le plus fréquemment utilisé.
Théorème 8.16.
Soit f une fonction dérivable sur I. Les propriétés suivantes sont équi-
valentes :
1. f est convexe sur I ;
2. la fonction dérivée f est croissante sur I ;
3. la courbe représentative de f est située au dessus de sa tangente en tout
point de I.
Preuve. (1) ⇒ (2) Si f est convexe et dérivable, pour x < y dans I il existe u, v
◦
dans I tels que x < u < v < y et avec la croissance de τu et τv on a :
Preuve. (1) ⇒ (2) Si f est convexe sur I alors pour x = y dans I (le cas x = y est
trivial) la fonction ϕ : λ → f ((1 − λ) x + λy) est convexe sur [0, 1] . Cette fonction
est dérivable sur [0, 1] de dérivée croissante donnée par :
soit
(df ((1 − λ) x + λy) − df ((1 − λ ) x + λ y)) (x − y) ≤ 0
ou encore ϕ (λ) ≤ ϕ (λ ) . La fonction ϕ est donc croissante sur [0, 1] , ce qui
entraîne, avec les notations qui précèdent, que ϕ (0) ≥ ϕ (1) − ϕ (1) équivalent à
f (x) ≥ f (y) + df (y) (x − y) .
(3) ⇒ (1) Toujours en gardant les mêmes notations, on a :
Pour les fonctions deux fois dérivables on dispose du critère de convexité qui
suit.
238 Fonctions convexes
Théorème 8.19.
Si f est deux fois dérivable sur I, elle est alors convexe [resp. concave]
sur I si, et seulement si, f (x) ≥ 0 [resp. f (x) ≤ 0] pour tout x ∈ I.
Exemples 8.2
1. La fonction exponentielle est strictement convexe sur R.
2. La fonction logarithme est strictement concave sur R+,∗ .
3. Pour p > 1 la fonction x → xp est strictement convexe sur R+,∗ et pour
0 < p < 1 elle est strictement concave.
4. La fonction sin est strictement convexe sur [(2k + 1) π, (2k + 2) π] et stricte-
ment concave sur [2kπ, (2k + 1) π] pour tout k ∈ Z.
+∞
5. La fonction Γ définie sur R+,∗ par Γ (x) = tx−1 e−t dtest convexe. En effet
0
avec la concavité du logarithme on déduit que :
2
∀ (u, v) ∈ R+,∗ , ∀λ ∈ [0, 1] , uλ v 1−λ ≤ λu + (1 − λ) v
On peut également montrer que cette fonction est log-convexe (lemme 13.11).
En fait la fonction Γ est l’unique fonction de classe C 1 sur R+,∗ , log-convexe et
solution de l’équation fonctionnelle f (x + 1) = xf (x) avec f (1) = 1 (théorème
13.9).
Définition 8.3. Soit (xi )1≤i≤p une suite de points d’un espace vectoriel
E. On dit que x ∈ E est combinaison linéaire convexe des xi s’il existe des
p
p
réels positifs ou nuls λ1 , · · · , λp tels que λi = 1 et x = λi x i .
i=1 i=1
Théorème 8.21.
Toute partie convexe d’un espace vectoriel E est stable par combinaison
linéaire convexe.
Preuve. Il est clair que la condition est suffisante (prendre p = 2). Pour la
réciproque, on procède par récurrence sur p ≥ 1. Pour p = 1 le résultat est trivial
et pour p = 2 il s’agit de la définition d’une fonction convexe. Supposons le résultat
acquis pour p ≥ 2 et soient x1 , · · · , xp+1 dans I, λ1 , · · · , λp+1 dans R+ tels que
p+1 p
λi = 1. On note λ = λi .
i=1 i=1
Si λ = 0, tous les λi , pour 1 ≤ i ≤ p, sont alors nuls, λp+1 = 1 et l’inégalité est
p
λi p
λi
trivialement une égalité. Si λ = 0, en notant x = xi , on a = 1, x ∈ I
i=1
λ i=1
λ
Inégalités de convexité 241
p+1
et f λi x i = f (λx + λp+1 xp+1 ) ≤ λf (x ) + λp+1 f (xp+1 ) puisque λ ≥ 0,
i=1
λp+1 ≥ 0 et λ + λp+1 = 1. Avec l’hypothèse de récurrence on déduit alors que :
p+1
p
λi
p+1
f λi x i ≤λ f (xi ) + λp+1 f (xp+1 ) = λi f (xi )
i=1 i=1
λ i=1
On est parfois amené à utiliser cette inégalité de convexité sous la forme sui-
vante.
Corollaire 8.3. Si f est une fonction convexe définie sur une partie
convexe d’un espace vectoriel E alors pour toute combinaison linéaire à
p
coefficients réels positifs non tous nuls λi xi d’éléments de I, on a en
p i=1
p
1 1
p
posant λ = λi , f λi x i ≤ λi f (xi ) .
i=1
λ i=1 λ i=1
Preuve. On remarque tout d’abord que f convexe sur R est continue, il en donc
de même de f ◦ u et cette fonction est bien intégrable sur [a, b] . Avec la convexité
de f, on peut écrire que pour tout entier n ≥ 1 on a :
n
1 1
n
b−a b−a
f u a+k ≤ f ◦u a+k
n n n n
k=1 k=1
qui par passage à la limite quand n tend vers l’infini donne, compte tenu de la
continuité de f et de la définition de l’intégrale d’une fonction continue sur [a, b]
comme limite des sommes de Riemann :
b b
1 1
f u (t) dt ≤ f ◦ u (t) dt
b−a a b−a a
242 Fonctions convexes
a1
n
M (α, x, λ) = λi x α
i
i=1
n
puisque λi = 1.
i=1
1
Dans le cas où les λi sont tous égaux, on a nécessairement λi = pour tout i
n a1 n
1 α
et M (α, x, λ) = x .
n i=1 i
Pour α = 1 (et les λi sont tous égaux), on reconnaît la moyenne arithmétique
A (x) et pour α = −1, la moyenne harmonique H (x) .
La moyenne géométrique correspond au cas limite α = 0.
Lemme 8.2 Avec les notations qui précèdent, la fonction α → M (α, x, λ) , pour
(
n
x et λ fixés, se prolonge en une fonction continue sur R avec M (0, x, λ) = xλi i .
i=1
1 %n
Preuve. En écrivant que M (α, x, λ) = exp ln λi x α
i , on voit que la
α i=1
fonction α → M (α, x, λ) est continue sur R∗ et pour montrer qu’elle se prolonge
1 n
par continuité en 0, il suffit de montrer que la fonction ϕ : α → ln λi x α
i
α i=1
admet une limite en 0, ce qui peut se faire en utilisant les développements limités.
α ln(xi )
Pour tout i, on a xαi =e = 1 + α ln (xi ) + o (α) et :
n
n
n
λi x α
i = λi + α λi ln (xi ) + o (α)
i=1 i=1 i=1
n (
n
=1+α λi ln (xi ) + o (α) = 1 + α ln xλi i + o (α)
i=1 i=1
n (
n
ce qui donne ln λi x α
i = α ln xλi i + o (α) et enfin :
i=1 i=1
(
n (
n
ϕ (α) = ln xλi i + o (1) → ln xλi i
α→0
i=1 i=1
(
n
Il en résulte que lim M (α, x, λ) = lim exp (ϕ (α)) = xλi i .
α→0 α→0
i=1
On vérifie facilement que la relation (8.2) est encore valable pour α = 0. En
(n
1 1
effet, dans ce cas, on a M (0, x, λ) = xλi i = n # $λi = .
2 1 M (0, x , λ)
i=1
xi
i=1
244 Fonctions convexes
n1
(
n
Dans le cas où les λi sont tous égaux, on a M (0, x, λ) = xi = G (x) .
i=1
i ≥ λk x k
λi x α α
un entier k compris entre 1 et n tel que μ = xk , de sorte que
i=1
1 1
et λkα xk ≤ M (α, x, λ) . On a donc pour tout α > 0, λkα μ ≤ M (α,x, λ) ≤ μ
1 ln (λk )
(k ne dépendant que de x) et avec lim λkα = lim exp = 1, on
α→+∞ α→+∞ α
1
déduit que lim M (α, x, λ) = max xi . Avec M (α, x, λ) = , où
α→+∞ 1≤i≤n M (−α, x , λ)
1
x = , on déduit que :
xi 1≤i≤n
1 1
lim M (α, x, λ) =
= # $ = min xi
α→−∞ lim M (α , x , λ) max x1i 1≤i≤n
α →∞
1≤i≤n
En utilisant la stricte concavité des fonctions ln et t → tγ pour 0 < γ < 1 (dans
ce cas la dérivée seconde est strictement négative) on obtient le résultat suivant.
Théorème 8.25.
En supposant les xi non tous égaux, la fonction α → M (α, x, λ) , pour x
et λ fixés, est strictement croissante.
1 1
M (α, x, λ) = < = M (β, x, λ)
M (−α, x , λ) M (−β, x , λ)
1
En prenant les λi tous égaux à , on retrouve l’encadrement :
n
M (−1, x, λ) = H (x) ≤ M (0, x, λ) = G (x) ≤ M (1, x, λ) = A (x)
l’une des égalités étant réalisée si, et seulement si, tous les xi sont égaux.
8.4 Exercices
1 1 1
d (x, y, z) = x y z ≥0
f (x) f (y) f (z)
246 Fonctions convexes
1 0 0
d (x, y, z) = x y−x z−x
f (x) f (y) − f (x) f (z) − f (x)
1 1
= (y − x) (z − x) f (y) − f (x) f (z) − f (x)
y−x z−x
1 1
d (x, y, z) = (y − x) (z − x)
p (x, y) p (x, z)
= (y − x) (z − x) (p (x, z) − p (x, y))
1 1 1 x−y 1
où μ est défini par = (1 − μ) + μ = μ + , ce qui nous
(1 − λ) x + λy x y xy x
λy
donne μ = ∈ ]0, 1[ . Si f est convexe, on a alors :
(1 − λ) x + λy
λy 1 1 λy 1 1
g ((1 − λ) x + λy) = f (1 − μ) + μ ≤ (1 − μ) f + μf
μ x y μ x y
μ
ce qui donne, en écrivant que 1 − μ = (1 − λ) x :
λy
λy μ 1 λy 1
g ((1 − λ) x + λy) ≤ (1 − λ) x f + μf = (1 − λ) g (x) + λg (y)
μ λy x μ y
1
ce qui signifie que g convexe. En remarquant que f (x) = xg , on obtient la
x
réciproque.
Solution.
f (x) − f (0)
1. Si f est convexe sur R+ , la fonction τ0 : x → est alors croissante de
x
f (0)
R+ dans R, elle admet donc une limite α ∈ R ∪ {+∞} et avec lim =0
x→+∞ x
f (x) f (x)
on déduit que lim = α. Pour f : x → x2 on a lim = +∞.
x→+∞ x x→+∞ x
2. On montre tout d’abord que la fonction h est décroissante de R+ dans R. Cette
fonction est convexe comme somme de deux fonctions convexes, donc pour tout
h (x) − h (a)
réel a ∈ R+ la fonction τa : x → est croissante sur R+ \ {a} et
x−a
avec :
f (x) − f (a) f (x)
lim τa (x) = lim − α = lim −α =0
x→+∞ x→+∞ x−a x→+∞ x
Il en résulte que z est convexe sur R et cette fonction est bornée si y l’est, elle
est alors constante et avec la continuité de y, on déduit que la solution y est
également constante, ce qui entraîne que qy = y = 0, soit y = 0 puisque q
n’est pas la fonction nulle.
2. On utilise encore la fonction z = y 2 . Si y (x1 ) = y (x2 ) avec x1 < x2 , on a alors
z (x1 ) = z (x2 ) et avec la convexité de la fonction z qui est à valeurs positives on
déduit que z est nulle sur l’intervalle [x1 , x2 ] . En effet, tout x ∈ [x1 , x2 ] s’écrit
x = (1 − λ) x1 + λx2 avec λ ∈ [0, 1] et on a :
Exercice 8.9.
1. Montrer que si f est une fonction convexe et continue sur [0, 1] , pour
tout entier naturel non nul n la fonction polynomiale Bn (f ) définie par
n
k n k n−k
Bn (f ) (x) = f x (1 − x) est alors convexe sur [0, 1]
n k
k=0
((Bn (f ))n≥1 est la suite des polynômes de Bernstein).
2. En déduire que toute fonction convexe et continue sur un intervalle com-
pact est limite uniforme d’une suite de fonctions convexes de classe C ∞ .
Solution.
1. Pour n = 1, la fonction B1 (f ) estaffine donc convexe.
1
Pour n = 2, on a B2 (f ) (x) = 2 f (0) − 2f + f (1) et pour f convexe
2
250 Fonctions convexes
1 1
on a f ≤ (f (0) + f (1)) , ce qui donne B2 (f ) ≥ 0 et la convexité de
2 2
B2 (f ) . Pour n ≥ 3, on a :
k + 2
n−2
k+1
k
Bn (f ) = n (n − 1) f − 2f +f Bn−2,k
n n n
k=0
et pour f convexe on a :
k+1 1k+2 1k 1 k+2 k
f =f + ≤ f +f
n 2 n 2n 2 n n
ce qui donne Bn (f ) ≥ 0 et la convexité de Bn (f ) .
2. Résulte du théorème sur l’approximation uniforme d’une fonction continue sur
un intervalle compact par la suite des polynômes de Bernstein (exercice 2.8).
Exercice 8.10. Déterminer, parmi toutes les ellipses d’aire donnée S >
0, celles de périmètre minimal.
l’intervalle ouvert ]a, b[ avec f (a) = f (b) , il existe alors un point c ∈ ]a, b[
tel que f (c) = 0.
√
Le cas de la fonction x → 1 − x2 sur [−1, 1] donne un exemple de situation
où f n’est pas dérivable au bord.
Il n’y a pas unicité du point c tel que f (c) = 0.
Le théorème n’est plus vrai si f n’est pas continue au bord comme le montre
l’exemple de la fonction f définie par f (x) = x sur ]0, 1] et f (0) = 1.
Le théorème n’est plus vrai si f n’est pas dérivable sur ]a, b[ tout entier comme
le montre l’exemple de la fonction x → |x| sur [−1, 1] .
Ce théorème est encore valable sur une demi-droite fermée. Précisément on a
le résultat suivant.
Théorème 9.3.
Si f est une fonction à valeurs réelles définie sur un intervalle fermé
[a, +∞[ , continue sur cet intervalle et dérivable sur l’intervalle ouvert
]a, +∞[ avec lim f (x) = f (a) , il existe alors un point c ∈ ]a, +∞[ tel
x→+∞
que f (c) = 0.
Cette fonction est continue sur ]0, e−a ] comme composée de fonctions continues
et avec lim g (t) = lim f (x) = f (a) , on déduit qu’elle est continue en a. Elle
t→0 x→+∞
f (− ln (t))
est dérivable sur ]0, e−a [ avec g (t) = − . Enfin avec g (0) = g (e−a ) =
t
f (a) , on peut utiliser le théorème de Rolle pour dire qu’il existe d ∈ ]0, e−a [ tel
que g (d) = 0 et c = − ln (d) ∈ ]a, +∞[ est tel que f (c) = 0.
On a également le résultat suivant.
Théorème 9.4.
Si f : R → R est dérivable avec lim f (x) = lim f (x) , il existe alors
x→−∞ x→+∞
un réel c tel que f (c) = 0.
Preuve. Pour m = 0, le résultat est évident. On suppose donc que m est non
nul. Si a, b sont deux racines distinctes de f, le théorème de Rolle nous dit alors
qu’entre ces deux racines il existe une racine de f . On déduit donc que la fonction
f admet m racines distinctes dans I. Une récurrence finie nous permet alors de
montrer que la dérivée d’ordre m, f (m) admet au moins une racine dans I.
On peut donner une autre démonstration du théorème de Rolle basée sur un
principe de dichotomie. L’idée repose sur les trois lemmes suivants, où f est une
fonction à valeurs réelles définie sur un intervalle compact [a, b] non réduit à un
point, continue sur cet intervalle et telle que f (a) = f (b) .
b−a
Lemme 9.1 Il existe un segment [α, β] contenu dans [a, b] tel que β − α =
2
et f (α) = f (β) .
b−a b−a
Preuve. Soit g définie sur J = a, a + par g (x) = f x + −
2 2
f (x) . Si la fonction g ne s’annule jamais sur J, elle garde alors un signe constant
(théorème des valeurs intermédiaires),
supposons que g (x) > 0 pour tout x ∈ J.
b−a b−a
On a alors f (x) < f x + pour tout x ∈ J et x = a, x = a+ donnent
2 2
a+b
f (a) < f < f (b) en contradiction avec f (a) = f (b) . Il existe donc γ ∈ J
2
b−a
tel que g (γ) = 0 et l’intervalle [α, β] = γ, γ + convient.
2
b−a
Lemme 9.2 Il existe un segment [α, β] contenu dans ]a, b[ tel que β − α ≤
2
et f (α) = f (β) .
Preuve. En reprenant
les notations
de la démonstration précédente, on distingue
b−a b−a
deux cas. Soit γ ∈ a, a + et dans ce cas [α, β] ⊂ ]a, b[ avec β − α = ,
2 2
a+b a+b
f (α) = f (β) . Soit γ = a ou γ = et on a f (a) = f = f (b) . Le
2 2
254 Théorèmes de Rolle et des accroissements finis
b−a
lemme précédent appliqué à la fonction f sur l’intervalle [α, β] = a, a +
2
b−a b−a
nous donne un intervalle δ, δ + = [δ, ε] avec δ ∈ a, a + tel que
4 4
b−a b−a
f (δ) = f (ε) . Si δ ∈ a, a + , alors [δ, ε] ⊂ ]a, b[ avec ε − δ = ,
4 4
b−a a+b
f (δ) = f (ε) . Sinon on a f (a) = f a + =f et on applique le
4 2
b−a a+b
lemme précédent à l’intervalle a + , ⊂ ]a, b[ .
4 2
Lemme 9.3 Il existe une suite ([an , bn ])n≥1 d’intervalles strictement emboîtés (i.
e. [an+1 , bn+1 ] ]an , bn [) dans ]a, b[ telle que pour tout n ≥ 1 on ait :
bn − an
0 < bn+1 − an+1 ≤ , f (an ) = f (bn )
2
Preuve. On construit [a1 , b1 ] en utilisant le lemme 9.2. Puis supposant construit
[an , bn ] , on applique à nouveau le lemme 9.2 à la fonction f sur cet intervalle pour
construire [an+1 , bn+1 ] .
Le théorème de Rolle s’en déduit alors de la manière suivante.
Le théorème des segments emboîtés nous dit que [an , bn ] = {c} avec c dans
n≥1
]an , bn [ ⊂ ]a, b[ pour tout n ≥ 1. Si on suppose de plus que f est dérivable sur
l’ouvert ]a, b[ , on a alors nécessairement f (c) = 0. En effet si f (c) = 0, supposons
f (bn ) − f (c) f (c) − f (an )
f (c) > 0, avec lim = lim = f (c) , on déduit
n→+∞ bn − c n→+∞ c − an
que pour n assez grand on aura f (an ) < f (c) < f (bn ) en contradiction avec
f (an ) = f (bn ) .
Avec cette construction il n’y a pas, a priori, d’extremum local pour f en c.
Preuve. Soient a < b dans I. Si f (a) = f (b) il n’y a alors rien à montrer.
On suppose donc que f (a) < f (b) et on se donne λ ∈ ]f (a) , f (b)[ . On définit
la fonction ϕ sur [a, b] par ϕ (x) = f (x) − λx. Cette fonction est dérivable sur
[a, b] avec ϕ (a) < 0 < ϕ (b) et en conséquence elle ne peut être monotone sur
Applications du théorème de Rolle 255
I. Le théorème 6.28 nous dit alors que ϕ n’est pas injective (elle est continue
puisque dérivable), c’est-à-dire qu’il existe x < y dans I tels que ϕ (x) = ϕ (y)
et le théorème de Rolle nous dit qu’il existe c ∈ ]x, y[ tel que ϕ (c) = 0, ce qui
équivaut à f (c) = λ.
Théorème 9.8.
Pour n ≥ 1, le polynôme Ln admet n racines réelles distinctes dans
l’intervalle ]−1, 1[ .
Ces résultat sont vrais pour toute famille de polynômes orthogonaux et se dé-
montrent en utilisant uniquement les propriétés d’orthogonalité (chapitre 15).
(
n
x − xj
Ln,i (x) = (0 ≤ i ≤ n)
xi − xj
j=0, j =i
Dans le cas où la fonction f est de classe C n+1 sur I, on peut donner une
expression de l’erreur d’interpolation f − Ln (f ) en tout point de l’intervalle I.
Précisément on a le résultat suivant où, pour n ≥ 1, πn+1 est la fonction polyno-
(n
miale définie par πn+1 (x) = (x − xi ) .
i=0
Théorème 9.11.
Soit f une fonction de classe C n+1 sur l’intervalle I. Pour tout x dans I
il existe un point cx appartenant à I tel que :
1
f (x) − Ln (f ) (x) = πn+1 (x) f (n+1) (cx )
(n + 1)!
Preuve. Si x est l’un des points xi , on a alors f (x) − Ln (f ) (x) = πn+1 (x) = 0
et tout point cx ∈ I convient. On se donne donc un point x dans I \ {x0 , · · · , xn } .
On désigne par Px ∈ Rn+1 [X] le polynôme d’interpolation de Lagrange associé à
la fonction f et aux points x0 , · · · , xn , x. Ce polynôme est défini par :
f (x) − Ln (f ) (x)
On vérifie facilement que Px = Ln (f ) + πn+1 . La fonction gx =
πn+1 (x)
f − Px est alors de classe C n+1 sur l’intervalle I, nulle en n + 2 points distincts (x
et les xi ), le théorème de Rolle itéré nous dit alors qu’il existe un point cx ∈ I tel
(n+1) (n+1) f (x) − Ln (f ) (x)
que gx (cx ) = 0, ce qui compte tenu de Px = (n + 1)!
πn+1 (x)
f (x) − Ln (f ) (x)
s’écrit f (n+1) (cx ) − (n + 1)! = 0, ou encore :
πn+1 (x)
1
f (x) − Ln (f ) (x) = πn+1 (x) f (n+1) (cx )
(n + 1)!
258 Théorèmes de Rolle et des accroissements finis
Une démonstration analogue nous permet d’obtenir une majoration de l’erreur
dans l’interpolation d’Hermite (voir [20] problème 33).
9.2.5 Convexité
Le théorème de Rolle peut être utilisé pour montrer le critère de convexité
suivant.
Théorème 9.12.
Soit I un intervalle réel non réduit à un point. Si f : I −→ R est une
fonction deux fois dérivable telle que f (x) ≥ 0 pour tout x ∈ I, alors f
est convexe.
La fonction ϕ est donc croissante sur [0, 1] . D’autre part, on a ϕ (0) = ϕ (1) = 0,
le théorème de Rolle nous dit alors qu’il existe c ∈ ]0, 1[ tel que ϕ (c) = 0. Avec
la croissance de ϕ on a alors ϕ (λ) ≤ ϕ (c) = 0 pour tout λ ∈ [0, c] et ϕ (λ) ≥
ϕ (c) = 0 pour tout λ ∈ [c, 1] , c’est-à-dire que ϕ est décroissante sur [0, c] et
croissante sur [c, 1] , il en résulte que ϕ (λ) ≤ 0 pour tout λ ∈ [0, 1] , c’est-à-dire
que f est convexe.
n
∂f
f (b) − f (a) = (c) (bk − ak )
∂xk
k=1
f (y) − f (x) ≤ M |y − x|
Preuve. On suppose dans un premier temps que f (x) < g (x) pour tout
x ∈ ]a, b[ . On se fixe un réel α ∈ ]a, b[ et on note :
Cet ensemble est ouvert dans [α, b] comme image réciproque d’un ouvert par une
application continue. En le supposant non vide, on note γ sa borne inférieure. On
a γ = b du fait que I qui est ouvert ne peut être réduit à {b} . Si γ = α, par
Applications des théorèmes et inégalités des accroissements finis 261
définition de la borne inférieure, pour tout réel ε > 0 assez petit il existe alors
f (x) − f (α) g (x) − g (α)
x ∈ I ∩ ]α, α + ε[ (I est ouvert), donc > qui par
x−α x−α
passage à la limite quand ε tend vers 0 donne f (α) ≥ g (α) en contradiction
avec f (α) < g (α) . Donc γ ∈ ]α, b[ et γ ∈
/ I puisque I est ouvert. On a donc
f (γ) − f (α) ≤ g (γ) − g (α) et f (γ) < g (γ) , ce qui entraîne pour x > γ
f (x) − f (γ) g (x) − g (γ)
voisin de γ, que < et :
x−γ x−γ
◦
Preuve. Si f est croissante sur I alors pour x = y dans I le taux d’accroissement
f (y) − f (x)
est positif ou nul et en passant à la limite quand y tend vers x,
y−x
on déduit que f (x) ≥ 0. Réciproquement si f (x) ≥ 0 pour tout x dans I, en
utilisant le théorème des accroissements finis on déduit alors que pour tout y > x
◦
dans I on a f (y) − f (x) = f (z) (y − x) ≥ 0 puisque z ∈ I.
262 Théorèmes de Rolle et des accroissements finis
1
lim (f (x) − f (a)) = ] et signifie que f est dérivable à gauche [resp. à
x→a+ x − a
droite] en a avec fg (a) = [resp. fd (a) = ]. Dans le cas où f admet une limite
en a, on a = lim f (x) = lim f (x) , donc = fg (a) = fg (a) , ce qui signifie
x→a− x→a+
que f est dérivable en a avec f (a) = .
Dans le cas, où f a une limite en a, on peut remarquer que f est également
continue en c.
On peut utiliser ce résultat pour montrer que la fonction f : R → R définie par
1
f (0) = 0 et f (x) = e− x2 pour x = 0 est de classe C ∞ sur R avec f (n) (0) = 0
1
pour tout n ∈ N. En effet cette fonction est continue sur R ( lim e− x2 = 0 = f (0))
x→0
2 1
et dérivable sur R∗ avec lim f (x) = lim 3 e− x2 = 0, donc elle est dérivable en
x→0 x→0 x
0 de dérivée nulle et f est continue sur R. En supposant,
pour n ≥ 1, que f est
1 1
(n)
de classe C sur R avec f (0) = 0, f (x) = Pn
n (n)
e− x2 pour x = 0, où
x
Pn est une fonction polynomiale
de
degré 3n, on
que f est de
déduit classe
C n+1
2 1 1 1 1 1 1
sur R∗ avec f (n+1) (x) = 3
Pn − 2 Pn e− x2 = Pn+1 e− x2 , le
x x x x x
polynôme Pn+1 étant de degré 3n + 3. Puis avec lim f (n+1) (x) = 0, on déduit que
x→0
f est de classe C n+1 sur R avec f (n+1) (0) = 0.
Applications des théorèmes et inégalités des accroissements finis 263
On dispose ainsi d’une fonction de classe C ∞ qui n’est pas développable en série
entière au voisinage de 0.
Corollaire 9.1. Soit I un intervalle réel non réduit à un point Une fonction
f : I → R dérivable et convexe est continûment dérivable.
Preuve. Comme lim df (x) = L, pour tout réel ε > 0, il existe un réel η > 0 tel
x→a
que la boule ouverte B (a, η) de centre a et de rayon η soit contenue dans l’ouvert
O et |||df (x) − L||| < ε pour tout x ∈ B (a, η) \ {a} . La fonction g définie sur O
par g (x) = f (x) − f (a) − L (x − a) est continue sur O, différentiable sur O \ {a}
avec dg (x) = df (x) − L pour tout x ∈ O \ {a} . On a donc |||dg (x)||| < ε pour tout
x ∈ B (a, η) \ {a} et de l’inégalité des accroissements finis, on déduit que :
(le segment [a, x] est contenu dans O car B (a, η) est convexe et g est différentiable
sur ]a, x[). On a donc prouvé que :
Preuve. Pour tout entier naturel non nul n et tout entier k compris entre 0 et
b−a
n, on note xk = a + k . En utilisant le théorème des accroissements finis, on
n
peut écrire pour tout n ≥ 1 :
n−1
n−1
b−a
n−1
f (b)−f (a) = (f (xk+1 ) − f (xk )) = f (ck ) (xk+1 − xk ) = f (ck )
n
k=0 k=0 k=0
Théorème 9.24.
Soient I est un intervalle réel non réduit à un point, a < b dans R et f
une fonction à valeurs réelles définie et continue sur I × [a, b] telle que la
∂f ∂f
dérivée partielle (x, t) existe en tout point de I × [a, b] , la fonction
∂x ∂x
étant continue sur I × [a, b] . La fonction ϕ définie sur I par :
b
ϕ (x) = f (x, t) dt
a
Le théorème précédent nous dit que la fonction β est dérivable sur ]x0 − r, x0 + r[
v(x0 )
∂f
de dérivée définie par β (x) = (x, t) dt, ce résultat étant en particulier
a ∂x
Applications des théorèmes et inégalités des accroissements finis 267
valable pour x = x0 . Il nous suffit donc de montrer que la fonction γ est dérivable
en x0 de dérivée γ (x0 ) = f (x0 , v (x0 )) v (x0 ) . Pour ce faire, on considère pour h
tel que 0 < |h| < r, la quantité :
γ (x0 + h) − γ (x0 )
τ (h) = − f (x0 , v (x0 )) v (x0 )
h
v(x0 +h)
f (x0 + h, t)
= dt − f (x0 , v (x0 )) v (x0 )
v(x0 ) h
et il s’agit de montrer que lim τ (h) = 0. Par définition du nombre dérivé, on peut
h→0
v (x0 + h) − v (x0 )
écrire que v (x0 ) = + δ (h) avec lim δ (h) = 0 et :
h h→0
v(x0 +h)
f (x0 + h, t) − f (x0 , v (x0 ))
τ (h) = dt − f (x0 , v (x0 )) δ (h)
v(x0 ) h
≤ |v (x0 ) − δ (h)| ε
ce qui donne pour 0 < |h| < min (η, η ) , |τ (h)| ≤ |v (x0 )| ε + |δ (h)| (1 + ε) et
|τ (h)| ≤ |v (x0 )| ε+ε (1 + ε) pour h > 0 assez petit, ce qui prouve que lim τ (h) =
h→0
0.
(figure 9.1).
268 Théorèmes de Rolle et des accroissements finis
Mi = γ (ti )
p−1
p−1
L (γσ ) = Mi Mi+1 = γ (ti+1 ) − γ (ti )
i=0 i=0
est fini. Dans ce cas cette borne supérieure est la longueur de l’arc paramétré
(γ, [a, b]) et on la note L (γ, [a, b]) .
Si f = γ ◦ ϕ est une autre paramétrisation de γ sur l’intervalle [α, β] , l’homéo-
morphisme ϕ permet alors de réaliser une bijection de l’ensemble des subdivisions
de [α, β] sur l’ensemble des subdivisions de [a, b] (pour ϕ décroissante, cette bijec-
tion inverse l’ordre des points des subdivisions) et on a L (γ, [a, b]) = L (f, [α, β]) .
C’est-à-dire que la longueur d’un arc géométrique (quand elle est définie) ne dé-
pend pas du choix d’une paramétrisation. De manière précise, on peut donner la
définition suivante.
Théorème 9.25.
p−1 p−1
ti+1
L (γσ ) = γ (ti+1 ) − γ (ti ) = γ (t) dt
i=0 i=0 ti
p−1 ti+1
b
≤ γ (t) dt = γ (t) dt < +∞
i=0 ti a
Donc :
b
L (γ) = sup {L (γσ ) | σ subdivision de [a, b]} ≤ γ (t) dt < +∞
a
La fonction γ étant continue sur le compact [a, b] , pour tout ε > 0, on peut
ε
trouver η > 0 tel que |t − t | < η ⇒ γ (t) − γ (t ) < . En prenant une
2 (b − a)
subdivision σ de pas h = max (ti+1 − ti ) , on a :
0≤i≤p−1
ti+1
γ (t) dt − γ (ti+1 ) − γ (ti ) ≤ I1 + I2
ti
avec :
ti+1 ti+1
I1 = γ (t) dt − (ti+1 − ti ) γ (ti ) = (γ (t) − γ (ti )) dt
ti ti
ti+1
ε
≤ γ (t) − γ (ti ) dt ≤ (ti+1 − ti )
ti 2 (b − a)
et :
c’est-à-dire que pour tout ε > 0, on peut trouver une subdivision σ telle que :
b b
γ (t) dt − ε ≤ L (γ) ≤ γ (t) dt
a a
270 Théorèmes de Rolle et des accroissements finis
'b
ce qui prouve que L (γ) = a γ (t) dt.
Une courbe continue non dérivable n’est pas nécessairement rectifiable. Par
2
exemple l’arc géométrique # π $γ : [0, 1] → R paramétré par γ (t) = (t, y (t)) , où
y (0) = 0 et y (t) = t sin pour t = 0 n’est pas rectifiable.
t
Preuve.
1. Si on suppose que |f (α)| < 1, de la continuité de f on déduit qu’il existe un réel
η > 0 tel que [α − η, α + η] ⊂ I (α est dans l’intérieur de I) et |f (x)| < 1 pour
tout x ∈ [α − η, α + η] . On a alors λ = sup |f (x)| < 1 (la borne supérieure
x∈I
Applications des théorèmes et inégalités des accroissements finis 271
Avec les notations du théorème précédent, on dit que α est un point fixe attractif
dans le premier cas et que c’est un point fixe répulsif dans le second (figure 9.2).
b
b−a a+b M4 5
f (x) dx − f (a) + 4f + f (b) ≤ (b − a)
a 6 2 2880
(erreur dans la méthode de Simpson sur [−x, x]). Cette fonction est de classe C 4
sur [0, 1] avec :
⎧ 2 4 x
⎪
⎪ ϕ (x) = 3 (g (−x) + g (x)) − 3 g (0) − 3 (g (x) − g (−x))
⎪
⎪
⎪
⎨
1 x
⎪ ϕ (x) = (g (x) − g (−x)) − (g (x) + g (−x))
⎪
⎪ 3 3
⎪
⎪
⎩ ϕ (x) = − x (g (x) − g (−x))
3
x2 (4)
Le théorème des accroissements finis nous dit que ϕ (x) = −2 g (cx ) pour
3
x2
x > 0, où cx ∈ ]−x, x[ , ce qui donne |ϕ (x)| ≤ 2 L4 , où :
3
4
(4) b−a
L4 = sup g (x) = M4
x∈[−1,1] 2
Preuve. En utilisant le théorème des accroissements finis, on voit que les fonctions
fn et f sont M -lipschitzienne. En effet, on a :
2
∀n ∈ N, ∀ (x, y) ∈ [a, b] , |fn (x) − fn (y)| ≤ M |x − y|
274 Théorèmes de Rolle et des accroissements finis
Pour tout x ∈ [a, b] , il existe un entier k compris entre 0 et p − 1 tel que x soit
dans [xk , xk+1 ] et pour n ≥ n0 , on a :
|fn (x) − f (x)| ≤ |fn (x) − fn (xk )| + |fn (xk ) − f (xk )| + |f (xk ) − f (x)|
≤ M |x − xk | + ε + M |x − xk | ≤ (2M + 1) ε
|fn (x) − fm (x)| ≤ |(fn − fm ) (x) − (fn − fm ) (x0 )| + |fn (x0 ) − fm (x0 )|
≤ fn − fm
∞ |x − x0 | + |fn (x0 ) − fm (x0 )|
où on note pour toute fonction h continue sur [a, b] , h∞ = sup |h (x)| . Il en
x∈[a,b]
résulte que :
fn − fm ∞ ≤ (b − a) fn − fm
∞ + |fn (x0 ) − fm (x0 )|
ce qui permet, d’après les hypothèses, de conclure que la suite (fn )n∈N vérifie le
critère de Cauchy uniforme sur [a, b] et donc qu’elle converge uniformément vers
une fonction f.
Pour x, y dans [a, b] et n ∈ N on peut écrire :
avec :
|f (x) − f (y) − (fn (x) − fn (y))| = lim |(fm − fn ) (x) − (fm − fn ) (y)|
m→+∞
≤ lim fm − fn ∞ |x − y|
m→+∞
≤ g − fn ∞ |x − y|
Preuve. On se place dans le cas d’une fonction de deux variables à valeurs réelles
∂f ∂f
et on note (x, y) les variables. En supposant que , existent en tout point de
∂x ∂y
O et qu’elles sont continues en (a, b) , il s’agit de montrer, en notant h = x − a,
∂f ∂f
k = y − b, p = (a, b) , q = (a, b) que :
∂x ∂y
f (x, y) = f (a, b) + ph + qk + o (|h| + |k|)
276 Théorèmes de Rolle et des accroissements finis
Avec la continuité des dérivées partielles en (a, b) , on déduit que pour tout réel
ε > 0 il existe un réel η > 0 tel que les conditions |u − a| < η et |v − b| < η
∂f ∂f ∂f ∂f
entraînent (u, v) − (a, b) < ε, (u, v) − (a, b) < ε. On déduit alors
∂x ∂x ∂y ∂y
que pour |x − a| < η, |y − b| < η on a :
Preuve. Pour h, k strictement positifs tels que [a, a + h] × [b, b + k] soit contenu
dans O, on note g (h, k) = f (a + h, b + k) − f (a + h, b) − f (a, b + k) + f (a, b) . En
notant ϕ (x) = f (x, b + k) − f (x, b) , on a g (h, k) = ϕ (a + h) − ϕ (a) qui avec le
théorème des accroissements finis s’écrit g (h, k) = hϕ (a + θh) , soit :
∂f ∂f
g (h, k) = h (a + θh, b + k) − (a + θh, b)
∂x ∂x
ce qui peut s’écrire en utilisant à nouveau le théorème des accroissements finis :
∂2f
g (h, k) = hk (a + θh, b + θ k)
∂y∂x
Applications des théorèmes et inégalités des accroissements finis 277
∂2f ∂2f
Ce qui donne (a + θh, b + θ k) = (a + η h, b + ηk) où θ, θ , η, η sont
∂y∂x ∂x∂y
dans ]0, 1[ . En faisant tendre (h, k) vers (0, 0) et en utilisant la continuité des
∂2f ∂2f
dérivées partielles d’ordre 2, en on déduit que (a, b) = (a, b) .
∂x∂y ∂y∂x
2 2
xy x − y
L’exemple de f définie sur R2 par f (0, 0) = 0 et f (x, y) = pour
x2 + y 2
(x, y) = (0, 0) nous montre que le résultat précédent est faux si on en enlève
l’hypothèse de continuité des dérivées partielles d’ordre 2.
Preuve. Il s’agit de montrer que f (I) est connexe dans R, ce qui revient à dire
que c’est un intervalle
(théorème 2.1).
f (x) − f (y)
L’ensemble C = | (x, y) ∈ I 2 , x < y est connexe comme image
x−y
du connexe de R2 , E = (x, y) ∈ I 2 , x < y (cet ensemble est convexe donc
f (x) − f (y)
connexe), par l’application continue (x, y) → . Le théorème des ac-
x−y
◦
croissements finis nous dit que tout z ∈ C s’écrit z = f (t) avec t ∈ I et en écrivant
f (t + h) − f (t)
que f (t) = lim , on déduit que z est aussi dans C. On a donc
h→0 + h
C ⊂ f (I) ⊂ C avec C connexe, ce qui entraîne que f (I) est connexe.
1 1
donc C1 = sup |Qα (s)| > 0 et |α − r| ≥ ;
s∈[α−1,α+1] C1 q d
1
soit |α − r| > 1 et dans ce cas |α − r| > d .
q
1 p Cα
En posant Cα = min 1, , on a alors α − ≥ d.
C1 q q
Exercices 279
+∞
an
Les nombres de Liouville sont définis par ξ = n!
où (an )n≥1 est une suite
n=1
10
d’entiers compris entre 0 et 9 avec an ≥ 1 pour n ≥ n0 . En notant pour k ≥ n0
k
an
donné, p = 10k! n!
, q = 10k! , on a :
n=1
10
+∞
+∞
p an 9 1 9 10 1
0< ξ− = ≤ (k+1)!
= (k+1)! ≤ k
q 10n! 10 n=0
10n 10 9 q
n=k+1
Cξ p 1
Si ξ est algébrique de degré d ≥ 1, alors ≤ ξ− ≤ k pour tout k ≥ n0
qd q q
et faisant tendre k vers l’infini on aboutit à une absurdité. En conclusion ξ est
transcendant.
On peut utiliser ce résultat pour montrer qu’il y a autant de nombres transcen-
an
dants que de réels. Pour ce faire on utilise l’application qui associe à ξ =
10n!
n≥1
an
le réel ∈ ]0, 1[ et on vérifie que c’est une bijection (si x ∈ ]0, 1[ est décimal
10n
n≥1
on utilise son écriture décimale impropre comportant une infinité de 9).
9.5 Exercices
Solution.
1. La fonction g définie sur [a, b] par g (x) = eλx f (x) est continue sur [a, b] ,
dérivable sur ]a, b[ avec g (x) = eλx (λf (x) + f (x)) et g (a) = g (b) = 0. Le
théorème de Rolle nous dit alors qu’il existe cλ ∈ ]a, b[ tel que g (cλ ) = 0, ce
qui équivaut à λf (cλ ) + f (cλ ) = 0.
2. La fonction g définie sur [a, b] par g (x) = ex (f (x) − f (x)) est dérivable sur
[a, b] avec g (x) = ex (f (x) − f (x)) et g (a) = g (b) = 0. Le théorème de
Rolle nous dit alors qu’il existe c ∈ ]a, b[ tel que g (c) = 0, ce qui équivaut à
f (c) = f (c) .
280 Théorèmes de Rolle et des accroissements finis
f (x)
3. La fonction g définie sur [a, b] par g (x) = est continue sur [a, b] , dérivable
x
xf (x) − f (x)
sur ]a, b[ avec g (x) = et g (a) = g (b) . Le théorème de Rolle
x2
nous dit alors qu’il existe c ∈ ]a, b[ tel que g (c) = 0, ce qui équivaut à f (c) =
f (c)
.
c
Solution.
1. La fonction h définie sur [a, b] par g (x) = eg(x) f (x) est continue sur [a, b] ,
dérivable sur ]a, b[ avec h (x) = eg(x) (g (x) f (x) + f (x)) et h (a) = h (b) = 0.
Le théorème de Rolle nous dit alors qu’il existe c ∈ ]a, b[ tel que g (c) = 0, ce
qui équivaut à g (c) f (c) + f (c) = 0.
f (x)
2. La fonction h définie sur [a, b] par g (x) = est continue sur [a, b] , dérivable
g (x)
g (x) f (x) − f (x) g (x)
sur ]a, b[ avec h (x) = 2 et h (a) = h (b) . Le théorème
g (x)
de Rolle nous dit alors qu’il existe c ∈ ]a, b[ tel que g (c) = 0, ce qui équivaut
f (c) g (c)
à = .
f (c) g (c)
Exercice 9.4. Montrer que pour tout entier naturel n et toutes suites de
réels (ak )0≤k≤n et (λk )0≤k≤n , les ak étant tous non nuls et les λk deux à
Exercices 281
n
deux distincts, la fonction fn définie sur R+,∗ par fn (x) = ak xλk a au
k=0
plus n racines réelles distinctes dans R+,∗ .
n+1
gn+1 (x) = x−λn+1 fn+1 (x) = ak xλk −λn+1
k=0
Exercice 9.5. En utilisant les théorèmes de Rolle, montrer que pour tout
entier n, on a :
(n)
1 Pn (x)
∀x ∈ R, =
1 + x2 (1 + x2 )
n+1
1
1
Exercice 9.6. Montrer que si f : [0, 1] → R est telle que f (t) dt = ,
0 2
elle a alors un point fixe dans ]0, 1[ .
x
x2
Solution. La fonction g définie sur [0, 1] par g (x) = f (t) dt −
est continue
0 2
sur [0, 1] , dérivable sur ]0, 1[ avec g (0) = g (1) = 0. Le théorème de Rolle nous dit
alors qu’il existe c ∈ ]0, 1[ tel que g (c) = 0, ce qui signifie f (c) = c.
Montrer qu’il existe un réel c ∈ ]a, b[ tel que ϕ (c) = 0. Quels résultats
obtient-on pour h (x) = 1 ?
Solution. La fonction ϕ est continue sur [a, b] dérivable sur ]a, b[ et avec le
caractère 3-linéaire alterné du déterminant, on a :
⎛ ⎞
f (x) g (x) h (x)
ϕ (x) = det ⎝ f (a) g (a) h (a) ⎠ et ϕ (a) = ϕ (b) = 0
f (b) g (b) h (b)
Le théorème de Rolle nous dit alors qu’il existe un réel c ∈ ]a, b[ tel que ϕ (c) = 0.
Pour h = 1, on obtient :
⎛ ⎞
f (c) g (c) 0
ϕ (c) = det ⎝ f (a) g (a) 1 ⎠ = f (c) (g (a) − g (b))−g (c) (f (a) − f (b)) = 0
f (b) g (b) 1
soit (f (b) − f (a)) g (c) = (g (b) − g (a)) f (c) . C’est le théorème généralisé des
accroissements finis. Prenant g (x) = x, on a le théorème classique des accroisse-
ments finis.
Exercice 9.8. Soient (fk )1≤k≤n et (gk )1≤k≤n deux familles de fonctions
à valeurs réelles, continues sur [a, b] , dérivables sur ]a, b[ et telles que
gk (a) = gk (b) pour tout k compris entre 1 et n. Monter qu’il existe un
n
n
fk (b) − fk (a)
réel c dans ]a, b[ tel que fk (c) = gk (c) .
gk (b) − gk (a)
k=1 k=1
où les constantes λk sont choisies telles que ϕ (a) = ϕ (b) . On peut prendre :
fk (b) − fk (a)
λk = (1 ≤ k ≤ n)
gk (b) − gk (a)
Cette fonction est continue sur [a, b] , dérivable sur ]a, b[ avec ϕ (a) = ϕ (b) . Le
théorème de Rolle nous dit alors qu’il existe un réel c dans ]a, b[ tel que ϕ (c) , ce
qui donne le résultat annoncé.
Exercice 9.9. Soit f une fonction dérivable de ]0, +∞[ dans R telle que
f (x)
lim f (x) = . Montrer que lim = .
x→+∞ x→+∞ x
Solution. La dérivée de f étant bornée il existe une constante M > 0 telle que
|f (x)| ≤ M pour tout x ∈ ]0, 1[ . Si (xn )n∈N est une suite de points de ]0, 1[ qui
converge vers 0, en utilisant l’inégalité des accroissements finis, on a pour tous n, m
dans N, |f (xn ) − f (xm )| ≤ M |xn − xm | et il en résulte que la suite (f (xn ))n∈N
est de Cauchy dans R, elle est donc convergente vers un réel λ. Si (yn )n∈N est
une autre suite de points de ]0, 1[ qui converge vers 0, alors la suite (f (yn ))n∈N
converge vers un réel μ et :
Exercice 9.11.
1
1. Montrer que la fonction f définie sur R par f (x) = e− x pour x > 0 et
f (x) = 0 pour x ≤ 0, est indéfiniment dérivable.
2. Construire une fonction indéfiniment dérivable sur R, nulle sur R− ,
strictement croissante sur [0, 1] et constante égale à 1 sur [1, +∞[ .
3. Construire une fonction indéfiniment dérivable sur R, nulle pour
|x| ≥ 1,
1 1
constante égale à 1 pour |x| ≤ , strictement croissante sur −1, −
2 2
1
et strictement décroissante sur , 1 (fonction plateau).
2
Solution.
1. Avec lim f (x) = 0, on déduit que f est continue sur R. Cette fonction est
x→0
1 1
dérivable sur R∗ avec f (x) = 0 pour x < 0 et f (x) = 2 e− x pour x > 0.
x
Avec lim f (x) = 0, on déduit qu’elle est dérivable en 0 de dérivée nulle et f
x→0
est continue sur R. En supposant, pour n ≥ f est de classe C sur R
1, que n
1 1
avec f (n) (0) = 0 pour x ≤ 0 et f (n) (x) = Pn e− x pour x > 0, où Pn est
x
une fonction polynomiale de degré 2n, on déduit que f est de classe C n+1 sur
R∗ avec :
⎧
⎪
⎨ 0 si x < 0
(n+1)
f (x) = 1 1 1 1
⎪
⎩ 2 Pn − Pn
e
1
−x
= Pn+1
1
e− x si x > 0
x x x x
le polynôme Pn+1 étant de degré 2n+2. Puis avec lim f (n+1) (x) = 0, on déduit
x→0
que f est de classe C n+1 sur R avec f (n+1) (0) = 0.
2. La fonction g définie sur R par g (x) = f (x) f (1 − x) est indéfiniment dérivable,
nulle en dehors de ]0, 1[ et à valeurs strictement positives pour x ∈ ]0, 1[ . En
1 x
dt
notant d = g (t) dt, on a d > 0 et la fonction h définie par h (x) = g (t)
0 0 d
est indéfiniment dérivable sur R, nulle sur R− , strictement croissante sur [0, 1]
et constante égale à 1 sur [1, +∞[ .
3. La fonction ϕ définie sur R par ϕ (x) = h (2x + 2) + h (2 − 2x) − 1 répond à la
question.
Exercice 9.13. Soit f une fonction dérivable de R+,∗ dans R telle que
lim (f (x) + f (x)) = 0. Montrer que lim f (x) = 0.
x→+∞ x→+∞
Solution. Le théorème généralisé des accroissements finis nous dit que pour x < y
ex f (x) − ey f (y)
dans R+,∗ on peut trouver t dans ]x, y[ tel que = f (t) + f (t)
ex − ey
et en conséquence, |ex−y f (x) − f (y)| = (1 − ex−y ) |f (t) + f (t)| , ce qui entraîne
que :
|f (y)| ≤ ex−y |f (x)| + 1 − ex−y |f (t) + f (t)| (9.1)
Avec l’hypothèse lim (f (x) + f (x)) = 0, on déduit que pour tout réel ε > 0
x→+∞
on peut trouver un réel λ > 0 tel que |f (t) + f (t)| < ε pour tout t ≥ λ. Prenant
x = λ et y > λ quelconque dans l’inégalité (9.1) , on a :
∀y ≥ λ, |f (y)| ≤ eλ−y |f (λ)| + 1 − eλ−y ε = ε + eλ−y (|f (λ)| − ε)
et avec lim eλ−y = 0, on déduit qu’il existe un réel μ > λ tel que |f (y)| ≤ 2ε
y→+∞
pour tout y ≥ μ. On a donc ainsi montré que lim f (x) = 0.
x→+∞
286 Théorèmes de Rolle et des accroissements finis
Solution.
1. En notant F la primitive de f nulle en 0, on a pour tout réel x > 0 :
x
(f (t + 1) − f (t)) dt = F (x + 1) − F (x) − F (1)
0
+∞
(f (t + 1) − f (t)) dt = − F (1)
0
0
(f (t + 1) − f (t)) dt = F (1) −
−∞
+∞
Ce qui donne en définitive, (f (t + 1) − f (t)) dt = − .
−∞
π π
2. Avec lim arctan (x) = et lim arctan (x) = − , on déduit que :
x→+∞ 2 x→−∞ 2
+∞
(arctan (t + 1) − arctan (t)) dt = π
−∞
Chapitre 10
Si f est une fonction à valeurs réelles définie sur un segment [a, b] non
réduit à un point, de classe C n sur ce segment et n + 1 fois dérivable sur
l’intervalle ouvert ]a, b[ , il existe alors un réel c ∈ ]a, b[ tel que :
n
f (k) (a) k f (n+1) (c) n+1
f (b) = (b − a) + (b − a)
k! (n + 1)!
k=0
où la constante réelle λ est telle que g (b) = g (a) . Le théorème de Rolle appliqué
à cette fonction nous assure de l’existence d’un réel c ∈ ]a, b[ tel que g (c) = 0, ce
qui équivaut à :
n
f (k) (c) k−1
n
f (k+1) (c) k λ n
(b − c) − (b − c) + (b − c) = 0
(k − 1)! k! n!
k=1 k=0
(n+1)
ou encore à λ = f (c) . L’égalité g (a) = g (b) = 0 donne alors le résultat.
Dans le cas où a = 0 cette formule est appelée formule de Mac-Laurin.
Pour n = 0 on retrouve le théorème des accroissements finis.
Corollaire 10.1. Inégalité de Taylor-Lagrange. Si f est une fonction à
valeurs dans un espace vectoriel normé (E, ·) définie sur un segment [a, b]
non réduit à un point, de classe C n sur ce segment et n + 1 fois dérivable
288 Les formules de Taylor
sur l’intervalle ouvert ]a, b[ avec f (n+1) majorée sur ]a, b[ par une constante
M, on a alors :
n
f (k) (a)
k M n+1
f (b) − (b − a) ≤ (b − a)
k! (n + 1)!
k=0
n
f (k) (x) k M n+1
g (x) = f (b) − (b − x) , h (x) = − (b − x)
k! (n + 1)!
k=0
on a : (n+1)
f (x) n M
g (x) = (b − x) ≤ h (x) = (b − x)
n
n! n!
et l’inégalité généralisée des accroissements finis (théorème 9.18) nous donne :
n
f (k) (a)
k
g (b) − g (a) = f (b) − (b − a)
k!
k=0
M n+1
≤ h (b) − h (a) = (b − a)
(n + 1)!
n
f (k) (x) k
Preuve. La fonction g définie sur [a, b] par g (x) = f (b) − (b − x)
k!
k=0
b
étant de classe C 1 sur [a, b] on peut écrire que g (b) − g (a) = g (t) dt, soit :
a
n
f (k) (a) k
b
f (n+1) (t) n
−f (b) + (b − a) = − (b − t) dt
k! a n!
k=0
i j
(x − a) (y − b) ∂ i+j f
f (x, y) = (a, b)
i!j! ∂xi ∂y j
i+j≤p−1
(x − a)i (y − b)j ∂ p f
+ (a + θu, b + θv)
i+j=p
i!j! ∂xi ∂y j
p−1 (k)
ϕ (0) ϕ(p) (θ)
ϕ (1) = + (10.1)
k! p!
k=0
où θ est un réel dans ]0, 1[ . En notant Mt (a + tu, b + tv) , on vérifie facilement par
récurrence que les dérivées successives de la fonction ϕ sont données par :
⎧ ∂f ∂f
⎪
⎪ ϕ (t) = (Mt ) u + (Mt ) v
⎪
⎨ ∂x ∂y
⎪ k ∂ k f
⎪
⎪ ϕ(k)
(t) = (Mt ) ui v j (2 ≤ k ≤ p)
⎩ i ∂xi ∂y j
i+j=k
On a donc :
⎧ k! ∂ k f
⎪
⎪ (k)
(a, b) ui v j (0 ≤ k ≤ p − 1)
⎪
⎪ ϕ (0) =
⎨ i+j=k
i!j! ∂xi ∂y j
⎪
⎪ p! ∂ p f
⎪
⎪ ϕ(p)
(θ) = (Mθ ) ui v j
⎩ i!j! ∂x i ∂y j
i+j=p
ou encore :
i j
(x − a) (y − b) ∂ i+j f
f (x, y) = (a, b)
i!j! ∂xi ∂y j
i+j≤p−1
(x − a)i (y − b)j ∂ p f
+ (a + θu, b + θv) .
i+j=p
i!j! ∂xi ∂y j
Cas des fonctions de plusieurs variables 291
Comme dans le cas du théorème de Rolle, cette formule n’est plus valable pour
les fonctions à valeurs dans Rq où q ≥ 2.
En munissant R2 de la norme (x, y) → (x, y) = max (|x| , |y|) (ou de n’importe
quelle autre norme), le théorème précédent nous fournit un développement limité
de f à l’ordre p au voisinage de (a, b) .
on obtient :
p ∂ p f ∂pf
ϕ(p) (θ) − ϕ(p) (0) ≤ (u, v)
p
(Mθ ) − (A)
i+j=p
i ∂xi ∂y j ∂xi ∂y j
et en posant :
⎧ (p) (p)
⎨ ϕ (θ) − ϕ (0) pour (x, y) = (a, b)
⎪
p
ε (x, y) = (u, v)
⎪
⎩
0 pour (x, y) = (a, b)
toujours avec u = x − a et v = y − b.
Dans le cas des fonction de n variables de classe C 2 et à valeurs réelles, on a le
résultat suivant, où df (a) désigne la différentielle de f en a, c’est-à-dire la forme
linéaire définie sur Rn par :
n
∂f
∀h ∈ Rn , df (a) (h) = (a) hi
i=1
∂xi
n
∂2f ∂2f
∀h ∈ Rn , d2 f (a) (h) = (a) h2i + 2 (a) hi hj
∂x2i ∂xi ∂xj
i=1 1≤i<j≤n
Preuve. Soit η > 0 tel que ]a − η, a + η[ ⊂ I. Pour tout réel h tel que |h| < η il
existe un réel θ ∈ ]0, 1[ tel que :
n−1
f (k) (a) k f (n) (a + θh) n f (n) (a + θh) n
f (a + h) = f (a) + h + h = f (a) + h
k! n! n!
k=1
Si f (n) (a) < 0, du fait de la continuité de f (n) , on peut choisir η assez petit de
sorte que f (n) (x) < 0 pour tout x ∈ ]a − η, a + η[ et f (a + h) − f (a) et de signe
contraire à celui de hn . Il en résulte que pour n pair f admet un maximum local
en a et pour n impair on a f (a + h) > f (a) si h < 0, f (a + h) < f (a) si h > 0,
ce qui signifie qu’il n’y a pas d’extremum local en a.
Pour f (n) (a) > 0 le raisonnement est analogue.
Dans le cas n = 2, si f (a) = 0 et f (a) = 0, on a donc :
Preuve. Pour tout x dans une boule ouverte B (a, r) de centre a et de rayon
r > 0 contenue dans U, la formule de Taylor-Young à l’ordre 2 s’écrit, en tenant
294 Les formules de Taylor
10.4.3 Inégalités
L’utilisation de l’inégalité de Taylor-Lagrange permet d’obtenir facilement les
inégalités classiques suivantes :
⎧ 3
⎪
⎪ |x|
⎪
⎪ ∀x ∈ R, |sin (x) − x| ≤
⎪
⎪ 3!
⎪
⎪
⎪
⎪ x 3
|x|
5
⎪
⎪ ∀x ∈ R, sin (x) − x + ≤
⎪
⎪
⎪
⎨ 3! 5!
x2
⎪ ∀x ∈ R, |cos (x) − 1| ≤
⎪
⎪ 2
⎪
⎪
⎪
⎪ x2 x
⎪ ∀x ∈ R , |e − 1 − x| ≤
⎪
+ x
e
⎪
⎪ 2
⎪
⎪
⎪
⎪
2
⎩ ∀x ∈ R− , |ex − 1 − x| ≤ x
2
n
f (k) (0)
Rn (x) = f (x) − xk
k!
k=0
+∞ (n)
f (0)
converge simplement vers 0 sur ]−r, r[ . Dans ce cas f (x) = xn
n=0
n!
pour tout x ∈ ]−r, r[ et le rayon de convergence de cette série entière est
supérieur ou égal à r.
Pour montrer que la suite (Rn )n∈N des restes converge simplement vers 0, on
f (n+1) (θx) n+1
peut utiliser l’expression de Lagrange du reste Rn (x) = x avec
(n + 1)!
296 Les formules de Taylor
+∞
1 n
Il en résulte que ex = x pour tout x ∈ R et le rayon de convergence de
n=0
n!
cette série est infini.
À partir de ce résultat on est amené à définir la fonction exponentielle complexe
+∞
1 n
z
par e = z pour tout z ∈ C.
n=0
n!
Ce exemple est un cas particulier du résultat suivant.
n
Sur Rn [X] on définit des normes en posant pour tout P = ak tk ∈ Rn [X] :
k=0
L’espace vectoriel Rn [X] étant de dimension finie, toutes les normes y sont équi-
valentes, il existe donc une constante α > 0 telle que P ≤ α P ∞ pour tout
P ∈ Rn [X] . De l’inégalité (10.2) on déduit alors que :
f (k) (x)
∀x ∈ R, Px = max ≤ α Px ∞ ≤ αM
0≤k≤n k!
et :
∀k ∈ {1, · · · , n} , ∀x ∈ R, f (k) (x) ≤ αk!M
c’est-à-dire que toutes les dérivées f (k) , pour k compris entre 1 et n, sont bornées
sur R.
On peut donner une autre démonstration de ce résultat en utilisant des matrices
de Vandermonde.
Pour tout réel x et tout entier p compris entre 1 et n, la formule de Taylor à
l’ordre n sur l’intervalle [x, x + p] s’écrit :
1 1 ··· 1
1 2 ··· 2n−1 (
det (A) = n! .. .. .. .. = n! (i − j) = 0
. . . . 1≤1<j≤n
1 n ··· nn−1
298 Les formules de Taylor
Les inégalités de Kolmogorov qui suivent nous donnent une majoration plus
précise.
Dans le cas n = 1 on a le résultat classique suivant.
Preuve. Si f ∞ = 0, f est alors affine. Mais étant bornée elle est nécessai-
rement constante, donc f = 0 et l’inégalité est triviale. On suppose donc que
f ∞ > 0.
La formule de Taylor-Lagrange permet d’écrire pour x ∈ R et h > 0 :
⎧
⎪ f (x + θ1 h) 2
⎨ f (x + h) = f (x) + hf (x) + h
2
⎪
⎩ f (x − h) = f (x) − hf (x) + f (x + θ2 h) h2
2
et en soustrayant ces deux égalités :
f (x + h) − f (x − h) h
f (x) = + (f (x + θ2 h) − f (x + θ1 h))
2h 4
f ∞ h f ∞
Il en résulte que |f (x)| ≤ + et en conséquence :
h 2
f ∞ h f ∞
∀h > 0, f ∞ ≤ ϕ (h) = +
h 2
L’étude des variations
de la fonction ϕ nous montre que cette fonction atteint son
2 f ∞
minimum en et que ce minimum vaut 2 f ∞ f ∞ . D’où le résultat.
f ∞
Théorème 10.10. Kolmogorov
soit : n
(n) n 1 (n+1) n+1
f ≤ 2 2 f ∞
n+1
f
∞ ∞
1− k k
soit f (k) ∞ ≤ 2 f ∞ n+1 f (n+1) ∞ , c’est-à-dire les inégalités de Kol-
k(n+1−k)
n+1
2
mogorov.
Théorème 10.11.
k k+1
Preuve. La formule de Taylor-Lagrange en t ∈ , s’écrit :
n n
2 3
k k k 1 k k 1 k
f (t) = f + t− f + t− f + t− f (ck )
n n n 2 n n 3! n
ce qui donne :
2
λ k k k 1 k k λ
− ≤ f (t) − f − t− f − t− f ≤ 3
n3 n n n 2 n n n
1 k k+1
où λ = sup |f (t)| . En intégrant de à , on obtient :
3! t∈[0,1] n n
k+1
λ n 1 k 1 k 1 1 k λ
− 4 ≤ f (t) dt − f − 2f − f ≤ 4
n k
n
n n 2n n 3! n3 n n
C’est-à-dire que :
1
1 1 1
Sn (f ) = f (t) dt − Sn (f ) − 2 Sn (f ) + O
0 2n 6n n3
1
Par exemple, pour f (t) = , on obtient :
1+t
2n−1
1 1 1 1
= ln (2) + + +O
k 4n 16n2 n3
k=n
1
et pour f (t) = α avec α > 0, α = 1 :
(1 + t)
2n−1
1 1 1 1 1 α 1 1
nα−1 = −1 − − 1 + 1 − +O
kα 1−α 2α−1 2n 2α 12n2 2α+1 n3
k=n
Lemme 10.2 Soit f une fonction à valeurs réelles de classe C ∞ sur ]−a, a[ avec
a > 0. Si f est paire et f (2k) (x) ≥ 0 pour tout entier naturel k et tout x ∈ ]−a, a[ ,
elle est alors développable en série entière sur ]−a, a[ .
n
f (k) (0)
Pn (x) = xk , Rn (x) = f (x) − Pn (x)
k!
k=0
D’autre part, avec la formule de Taylor avec reste intégral on peut écrire pour tout
x ∈ ]0, a[ :
2n 1
x
(x − t) x2n+1 2n
R2n (x) = f (2n+1) (t) dt = (1 − u) f (2n+1) (xu) du
0 (2n)! (2n)! 0
et avec la croissance de f (2n+1) (du fait que f (2n) ≥ 0) on a pour tous r ∈ ]0, a[ ,
x ∈ ]0, r[ , u ∈ [0, 1] :
ce qui entraîne :
1
x2n+1 2n x2n+1 x2n+1
0 ≤ R2n (x) ≤ (1 − u) f (2n+1) (ru) du = R 2n (r) ≤ f (r)
(2n)! 0 r2n+1 r2n+1
Il en résulte que lim R2n (x) = 0 pour tout x ∈ ]0, a[ et par parité le résultat
n→+∞
est également vrai sur ]−a, a[ . Enfin avec P2n (x) = P2n+1 (x) , on déduit que
R2n (x) = R2n+1 (x) et lim Rn (x) = 0 pour tout x ∈ ]−a, a[ .
n→+∞
et :
1
x2n 2n−1
0 ≤ |R2n−1,f (x)| = (1 − u) f (2n) (xu) du ≤ R2n−1,g (x)
(2n − 1)! 0
En utilisant le lemme précédent, on déduit donc que lim R2n−1,f (x) = 0 pour
n→+∞
tout x ∈ ]−a, a[ , puis avec :
on déduit que :
g (2n) (0) 2n
et avec lim x = 0 (convergence de la série de Taylor de la fonction
n→+∞ (2n)!
paire g), on a lim R2n,f (x) = 0 pour tout x ∈ ]−a, a[ . D’où le résultat.
n→+∞
Dans le cas particulier où toutes les dérivées de f sont positives, on peut donner
une démonstration plus simple du théorème de Bernstein.
Théorème 10.13. Bernstein
Soit f une fonction à valeurs réelles de classe C ∞ sur ]−a, a[ avec a > 0.
Si f (k) (x) ≥ 0 pour tout entier naturel k et tout x ∈ ]−a, a[ , f est alors
développable en série entière sur ]−a, a[ .
Exercices 303
10.5 Exercices
Exercice 10.2. Soit f une fonction deux fois dérivable de R dans R telle
f (x)
que lim = 0. Montrer qu’il existe un réel c tel que f (c) = 0.
|x|→+∞ x
ε h
∀x > a, ∀h > 0, |f (x)| ≤ ϕ (h) = 2 +M
h 2
L’étude des variations de la fonction
5 ϕ sur ]0, +∞[ nous montre que cette fonc-
ε √
tion atteint son minimum en 2 et que ce minimum vaut 2 εM . On déduit
M √ √
alors de l’inégalité précédente que |f (x)| ≤ 2 M ε pour tout x > a, ce qui
prouve que lim f (x) = 0.
x→+∞
Exercices 305
n
f (k) (a) hn+1 (n+1)
f (a + h) = hk + f (a + θh h) (10.4)
k! (n + 1)!
k=0
Montrer que si f est dérivable à l’ordre n + 2 en a avec f (n+2) (a) non nul,
1
on a alors lim θh = .
h→0 n+2
+∞
n
Solution. Avec |sin (λn x)| ≤ |λ| |x| et |λ| < 1, on déduit que la série sin (λn x)
n=0
est uniformément convergente sur tout compact de R et sa somme f définie une
fonction continue sur R. En notant fn (x)#= sin (λn x)$, on a pour tout naturel non
(k) π nk
nul k et tout réel x, fn (x) = λnk sin λn x + k ≤ |λ| , ce qui entraîne la
2
+∞
(k)
convergence uniforme sur R de la série fn . La fonction f est donc indéfiniment
n=0
dérivable sur R avec, pour tout k ≥ 1 et tout x ∈ R :
+∞
# π$
+∞
1 1
f (k) (x) =
nk
λnk sin λn x + k ≤ |λ| = ≤
n=0
2 n=0 1 − |λ|
k 1 − |λ|
306 Les formules de Taylor
+∞
p
1 (−1)
ce qui donne en définitive f (x) = 2p+1
x2p+1 .
p=0
(2p + 1)! 1 − λ
Chapitre 11
Développements limités
Exemples 11.1
1. Une fonction polynomiale admet un développement limité à tout ordre en tout
point.
2. Avec 1 − xn+1 = (1 − x) (1 + x + · · · + xn ) , on déduit le développement limité
en 0 :
1 n
x n
∀x ∈ ]−1, 1[ , = xk + xn = xk + o (xn )
1−x 1−x x→0
k=0 k=0
1
On peut aussi par changement de variable x = s’intéresser aux développe-
t
ments limités à l’infini. Si par exemple I = ]α, +∞[ avec α > 0, dire que f admet
un développement limité d’ordre n à l’infini signifie qu’il existe un polynôme P
dans Kn [X] et une fonction ε définie sur I à valeurs réelles ou complexes telles
que : ⎧
⎨ ∀x ∈ I, f (x) = P 1 + ε (x) = % ak + ε (x)
⎪ n
x x n k xn
k=0 x
⎪
⎩ lim ε (x) = 0
x→+∞
n
f (k) (a) k
Preuve. En définissant la fonction g sur I par g (x) = f (x)− (x − a) ,
k!
k=0
g (x)
il s’agit de montrer que lim n = 0. Pour ce faire on procède par récurrence
x→a (x − a)
sur n ≥ 1. Pour n = 1 le résultat découle de la définition du nombre dérivé f (a) .
Supposons le résultat acquis pour n − 1 ≥ 1. La fonction g est dérivable dans un
(f )(k) (a)
n−1
k
voisinage J de a avec g (x) = f (x) − (x − a) et l’hypothèse de
k!
k=0
g (x)
récurrence appliquée à f nous dit que lim = 0, c’est-à-dire que pour
x→a (x − a)n−1
tout réel ε > 0 il existe un réel η > 0 tel que [a − η, a + η] soit contenu dans J et :
# $
(|x − a| < η) ⇒ |g (x)| ≤ ε |x − a|
n−1
On a alors :
≤ g (x) ≤ ε (a − x)
n−1 n−1
∀x ∈ [a − η, a] , −ε (a − x)
≤ g (x) ≤ ε (x − a)
n−1 n−1
∀x ∈ [a, a + η] , −ε (x − a)
il en résulte que :
⎧ ε ε
⎪ n
⎨ ∀x ∈ [a − η, a] , − (a − x) ≤ g (a) − g (x) ≤ (a − x)
n
n n
⎪
⎩ ∀x ∈ [a, a + η] , − ε (x − a)n ≤ g (x) − g (a) ≤ ε n
(x − a)
n n
(on utilise le fait que si u ≤ v sur [α, β] , alors u (β) − u (α) ≤ v (α) − v (β)),
c’est-à-dire en définitive que :
ε n
∀x ∈ [a − η, a + η] , |g (x)| ≤ |x − a|
n
g (x)
ce qui signifie bien que lim n = 0.
x→a (x − a)
310 Développements limités
n
(−1) x2k
k
n
(−1) x2k+1
k
cos (x) = + o x2n+1 , sin (x) = + o x2n+2
(2k)! (2k + 1)! x→0
k=0 k=0
α
n
α (α − 1) · · · (α − k + 1) k
(1 + x) = 1 + x + o (xn ) (α ∈ R \ N)
k! x→0
k=1
ex + e−x x2kn
ch (x) = = + o x2n+1
2 (2k)! x→0
k=0
ex − e−x x2k+1
n
sh (x) = = + o x2n+2
2 (2k + 1)! x→0
k=0
x
e
Pour f (x) = , on obtient :
1+x
1 1 3 11 53 6 103 7 2119 8
f (x) = 1 + x2 − x3 + x4 − x5 + x − x + x + o x8
2 3 8 30 144 280 5760 x→0
n
n
(g (x)) η (g (x)) = xn ε1 (x) avec lim ε1 (x) = 0. D’autre part, si P (y) = ak y k ,
x→0
k=0
312 Développements limités
on a alors :
n
k
n
k
P (g (x)) = ak (g (x)) = ak (Q (x) + xn ε (x))
k=0 k=0
n
k
n
k
k−j j
= ak (Q (x)) + ak Ckj (Q (x)) xnj (ε (x))
k=0 k=1 j=1
n
= P (Q (x)) + x ε2 (x)
Exemples 11.2 On a :
1 1 5 61 6
= 1 + x2 + x4 + x + o x7
cos (x) 2 24 720 x→0
&
√ √ 1 5 2 21 3 429 4
1+ 1−x= 2 1− x− x − x − x + o x4
8 128 1024 32 768 x→0
1 1 1
ln (cos (x)) = − x2 − x4 − x6 + o x7
2 12 45 x→0
on a :
2
x2 x3 x2 3
x = f −1 (f (x)) = a 2x − + + b 2x − + c (2x) + o (x3)
2 3 2 x→0
# a$ 2 #a $
= 2ax + 4b − x + − 2b + 8c x3 + o (x3)
2 3 x→0
On dit que K est le quotient et R le reste dans la division suivant les puissances
croissantes à l’ordre n de P par Q.
314 Développements limités
P (x)
= 2x − x2 + x3 + o x5
Q (x)
Théorème 11.7.
Soient f, g deux fonctions définies dans un voisinage de 0 et admettant
des développements limités en 0 d’ordre n de parties régulières respectives
f
P et Q avec g (0) = Q (0) = 0. La fonction qui est définie au voisinage de
g
0 admet un développement limité en 0 d’ordre n de partie régulière K égale
au quotient dans la division suivant les puissances croissantes à l’ordre n
de P par Q.
Preuve. Au voisinage de 0, on a :
1
De manière analogue, avec arctan (x) = , on déduit les développements
1 + x2
limités de arctan (x) en 0.
Pour ce qui est de la dérivation, en général il n’est pas possible de dériver un
3 1
développement limité. Par exemple la fonction f définie par f (x) = x sin
x
pour x = 0 et f (0) = 0 admet un développement d’ordre 2 en 0 de partie régulière
2 2 1 1
nulle (f (x) = o x ) mais sa dérivée, définie par f (x) = 3x sin −x cos
x x
pour x = 0 et f (0) = 0, n’est pas dérivable en 0 et en conséquence n’a pas de
développement limité d’ordre 1 en 0. Toutefois, on a le résultat suivant conséquence
immédiate du théorème précédent et de l’unicité du développement limité d’ordre
n en 0.
Théorème 11.9.
x2
ex − 1 x, sin (x) x, 1 − cos (x)
x→0 x→0 x→0 2
1 7
ln (1 + x) x, sin (sh (x)) − sh (sin (x)) − x
x→0 x→0 45
Les équivalents peuvent être utiles pour l’étude de suites ou de séries.
Dans le cas des séries à termes positifs (ou négatifs), on le résultat suivant.
Théorème 11.10.
Soient (un )n∈N et (vn )n∈N deux suites à valeurs réelles positives telles
que un vn .
n→+∞
Preuve. Dire que les suites à termes positifs (un )n∈N et (vn )n∈N sont équivalentes
équivaut à dire que pour tout réel ε ∈ ]0, 1[ il existe un entier n0 tel que :
∀n ≥ n0 , (1 − ε) un ≤ vn ≤ (1 + ε) un
1
avec |vn | ≤ λ 3 , ce qui implique que la série de terme général un est divergente
n2 n
(−1)
et pourtant un est équivalent √ qui est le terme général d’une série alternée
n
convergente.
Le théorème 11.10 peut être utilisé pour obtenir des développements asympto-
tiques de certaines suites. Considérons par exemple le cas de la série harmonique
n
1
(Hn )n∈N∗ définie par Hn = pour tout n ∈ N∗ . Cette série est à termes positifs
k
k=1
1 1
divergente avec ln 1 + , ce qui entraîne que :
n n→+∞ n
n
n
1 ( k + 1
Hn ln 1 + = ln = ln (n + 1)
k k
k=1 k=1
ou encore Hn ln (n) .
La suite (Kn )n≥1 définie par Kn = Hn − ln (n) est de même nature que la série
de terme général :
1 1 1
Kn+1 − Kn = + ln 1 − = O
n+1 n+1 n→+∞ n2
318 Développements limités
elle est donc convergente. Sa limite est la constante d’Euler γ. On considère ensuite
la suite (Ln )n≥1 définie par Ln = Hn − ln (n) − γ. Cette suite est convergente vers
0 de même nature que la série de terme général :
1 1 1
Ln+1 − Ln = Kn+1 − Kn = + ln 1 − −
n+1 n + 1 n→+∞ 2n2
Cette série est donc convergente à termes négatifs à partir d’un certain rang, ce
qui entraîne l’équivalence des restes :
+∞
+∞
1 1
(Lk+1 − Lk ) −
n→+∞ 2 k2
k=n k=n
avec :
+∞
m
(Lk+1 − Lk ) = lim (Lk+1 − Lk ) = lim Lm+1 − Ln = −Ln
m→+∞ m→+∞
k=n k=n
+∞
1 1
On a donc Ln ∼ . Enfin avec :
n→+∞ 2 k2
k=n
k+1 k
dt 1 dt
∀k ≥ 2, ≤ 2 ≤
k t2 k k−1 t2
on déduit que :
+∞ +∞
+∞
dt 1 1 dt 1
∀n ≥ 2, 2
= ≤ 2
≤ 2
=
n t n k n−1 t n−1
k=n
+∞
1 1 1
ce qui implique que Ln
. On a donc en définitive le
n→+∞ 2 k22n n→+∞
k=n
1 1
développement asymptotique Hn = ln (n) + γ + + o .
2n n→+∞ n
En itérant ce procédé on peut obtenir des termes supplémentaires du dévelop-
pement asymptotique.
Dans le cadre des séries à termes positifs (ou négatifs), on dispose également
du critère de d’Alembert.
Théorème 11.11. d’Alembert
Soit (un )n∈N une suite à valeurs réelles strictement positives telle que
un+1
lim = λ. Pour λ < 1, la série de terme général un est convergente
n→+∞ un
et pour λ > 1, elle est divergente.
un+1 1
= a 1
un 1+ n + O n2
n→+∞
λ
On a alors un ∼ où λ est une constante réelle et la série de terme
n→+∞ na
général un est convergente si, et seulement si, a > 1.
Preuve. Soit (vn )n∈N la suite définie par vn = ln (na un ) . Cette suite est de même
nature que la série de terme général :
a
n+1 un+1
wn = vn+1 − vn = ln + ln
n un
1 a 1 1
= a ln 1 + − ln 1 + + O = O
n n n2 n→+∞ n2
On désigne par f une fonction à valeurs réelles (ou complexes) définie sur un
intervalle réel I non réduit à un point et par a un point de l’adhérence de I.
Utilisation des développements limités 321
Dans ce qui suit nous allons voir comment les développements limités peuvent
être utilisés pour obtenir des développement asymptotiques de suites définies par
une relation de récurrence de la forme xn+1 = f (xn ) .
On se donne une fonction f à valeurs réelles définie et continue sur l’intervalle
ouvert ]−1, 1[ admettant un développement limité en 0 de la forme :
c’est-à-dire :
∀x ∈ ]0, η] , 0 < f (x) < x ≤ η
322 Développements limités
L’intervalle [0, η] étant stable par f, la suite (xn )n∈N est bien définie. De plus les
inégalités précédentes donnent :
c’est-à-dire que la suite (xn )n∈N est décroissante minorée par 0. Elle converge donc
vers un réel λ ∈ [0, η] qui vérifie f (λ) = λ (f est continue). Et avec f (x) < x sur
]0, η] , on déduit que λ = 0.
Pour tout réel λ ≥ −p, on désigne par (yn )n∈N la suite définie par :
∀n ∈ N, yn = xλn+1 − xλn
1
Lemme 11.2 On a xn √ .
n→+∞ p pnα
En prenant λ = −p, on a :
p (p + 1) 2
yn = pα + p α − β xpn + o (xpn )
2 n→+∞
−p
1
n−1
x−p
n − x0
= yk = αp + o (1)
n n n→+∞
k=0
x−p x−p
soit n
= 0 +αp+ o (1) = αp 1 + o (1) , ce qui donne en définitive
n n n→+∞ n→+∞
1 1
−p 1
xn = √p pnα
(1 + o (1)) √ .
n→+∞ p pnα
(1 + p) α2
On note γ = − β et on suppose γ = 0.
2
Théorème 11.13.
On a le développement asymptotique :
1 γ ln (n) ln (n)
xn = √ − 2 2√ √ + o √
p pnα p α pα n p n n→+∞
p npn
Exercices 323
n−1
n−1
Preuve. On a yk = npα + pγ xpk 1+ o (1) avec :
n→+∞
k=0 k=0
p 1 1 1 1
(xn ) (1 + o (1))
n→+∞ pα n n→+∞ pα (n + 1)
En remarquant que les séries considérées sont à termes positifs et que la série
+∞
1
est divergente, on déduit que :
n=0
n + 1
1 1
n−1 n−1
1
xpk 1+ o (1) ln (n)
n→+∞ n→+∞ αp k+1 n→+∞ αp
k=0 k=0
n−1
γ
yk = npα + ln (n) 1 + o (1)
α n→+∞
k=0
et :
−p γ γ
x−p
n = x0 + npα + ln (n) 1 + o (1) = npα + ln (n) + o (ln (n))
α n→+∞ α n→+∞
Ou encore :
− p1
1
−p γ ln (n) ln (n)
xn = (npα) 1+ 2 + o
pα n n→+∞ n
1 1 γ ln (n) ln (n)
= 1 1 − 2+ 1 1+ 1
+ o 1
(pα) p n p (pα) p n p n→+∞ n1+ p
On peut8 appliquer ce résultat à l’étude des suites définies par x = sin (x )
π9
n+1 n
avec x0 ∈ 0, ou xn+1 = ln (1 + xn ) avec x0 ∈ ]0, 1[ .
2
x 3 x5 1 1 1
Avec sin (x) = x− + + o x5 (p = 2, α = , β = ,γ = ) on déduit
√ √ 3! 5! x→0 6 120 30
3 3 3 ln (n) ln (n) x2 x3
que xn = √ − √ + o √ et avec ln (1 + x) = x − + +
n 10n n n→+∞ n n 2 3
1 1 1 2 2 ln (n) ln (n)
o x3 (p = 1, α = , β = , γ = − ) que xn = + + o .
x→0 2 3 12 n 3n2 n→+∞ n2
11.4 Exercices
Exercice 11.1. Montrer que pour tout entier n ≥ 81, la fonction9 f définie
π
par f (x) = tan (x)−th (x) a un unique zéro xn dans nπ, nπ + . Donner
4
324 Développements limités
xn = an + b + ce−δn + o e−δn
n→+∞
1 1 .π /
Solution. On a f (x) = − > 0 pour tout x ∈ R \ + kπ | kZ
cos2 (x) ch2 (x) 9 2 π8
et f réalise alors un homéomorphisme strictement croissant de nπ, nπ + sur
8 # π $8 # π$
4
− th (nπ) , 1 − th nπ + , avec − th (nπ) < 0 et 1 − th nπ + > 0, d’où
4 8 π9
4
l’existence et l’unicité de xn dans nπ, nπ + .
4
De tan(xn ) = th (xn ) , on 8déduit qu’il9 existe k ∈ Z tel que xn = kπ +
π
arctan (th (xn )) et avec xn ∈ nπ, nπ + , on déduit que th (xn ) ∈ ]0, 1[ et
8 π9 4
arctan (th (xn )) ∈ 0, , ce qui entraîne k = n. Donc xn = nπ + arctan (th (xn )) .
4 #π $
−2xn
1−e −2xn π
Avec th (xn ) = −2x
= tan − arctan e et − arctan e−2xn ∈
8 π9 1+e n 4
π
4
0, , on déduit que arctan (th (xn )) = −arctan e−2xn . Avec xn ∼ nπ, on
4 4 n→+∞
π
a arctan e−2xn ∼ e−2xn . En écrivant que xn = nπ+ +εn avec lim εn = 0,
n→+∞
π π
4 n→+∞
on déduit que e−2xn = e− 2 e−2nπ eεn ∼ e− 2 e−2nπ et :
n→+∞
π π π
xn = nπ + − arctan e−2xn = nπ + − e− 2 e−2nπ + o e−2nπ
4 4 n→+∞
Solution. Pour a = 0 le résultat est évident. On suppose donc que a est non
nul. Comme f (0) = 1 et f est continue, on a f (t) > 0 pour t voisin de0 et on
a
peut définir la fonction g sur un voisinage ]α, +∞[ de l’infini par g (x) = f √ .
x
2
t
Avec le développement limité en 0 à l’ordre 2, f (t) = 1 − + o t2 , on déduit
2 t→0
a2 1 1
celui de g à l’ordre 1 en +∞, g (x) = 1 − + o , puis celui de
2 x x→+∞ x
x
h (x) = ln ((g (x)) ) :
2
a 1 1 a2
h (x) = x ln (g (x)) = x − + o = − + o (1)
2 x x→+∞ x 2 x→+∞
Exercices 325
x
a2 a a2
ce qui permet de déduire que lim h (x) = − et lim f √ = e− 2 .
x→+∞ 2 x→+∞ x
1 b c 11 b c
α = a + b + c, β = − a+ + , γ= a+ +
2 2 3 24 4 9
de sorte que :
⎧
⎪
⎪
+∞ si α > 0 ou (α = 0 et β > 0)
⎪
⎨ −∞ si α < 0 ou (α = 0 et β < 0)
lim f (x) =
x→+∞ ⎪
⎪ 11 b
⎪
⎩ γe = a+ e si α = β = 0
24 6
11
Par exemple pour (a, b, c) = (1, −4, 3) , on a lim f (x) = e.
x→+∞ 72
t2
etA etB = In + t (A + B) + (A + 2AB + B) + o t2
2 t→0
et, du fait de l’unicité du développement limité d’ordre 2, l’égalité et(A+B) = etA etB
2
est réalisée si et seulement si (A + B) = A+2AB+B, ce qui équivaut à AB = BA.
326 Développements limités
Exercice 11.5. Pour tout λ ∈ [2, +∞[ et tout x ∈ ]−2, −1[ , on note
x
fλ (x) = x − λ ln 1 + . Montrer que l’équation fλ (x) = 0 a une
1+λ
unique racine xλ dans ]−2, −1[ . Déterminer la limite de xλ quand λ tend
vers l’infini.
x+1
Solution. On a fλ (x) = < 0 pour x ∈ ]−2, −1[ , fλ (−2) = −λg (λ) ,
x 1+λ
+
2 λ−1 2
avec g (λ) = + ln < 0 (g (λ) = 2 2 > 0 et lim g (λ) = 0),
λ λ+1 λ (λ − 1)
λ→+∞
1 λ
donc fλ (−2) > 0 et fλ (−1) = −λh (λ) , avec h (λ) = + ln > 0
λ λ+1
1
(h (λ) = − 2 < 0 et lim h (λ) = 0), donc fλ (−1) < 0. On déduit
λ (λ + 1) λ→+∞
donc que fλ a un unique zéro xλ ∈ ]−2,
−1[ . Pour x fixé dans ]−2, −1[ , en posant
x
μ = 1+λ, on a fλ (x) = x−(μ − 1) ln 1 + et un développement limité donne :
μ
x2 + 2x 1 x2 + 2x x (x + 2)
fλ (x) = + o
2μ μ→+∞ μ μ→+∞ 2μ λ→+∞ 2λ
x (x + 2)
Pour tout réel ε ∈ ]0, 1[ , en prenant x = −2 + ε, on a < 0 et il existe
2λ
λ0 ≥ 2 tel que fλ (x) < 0 pour λ > λ0 et nécessairement −2 < xλ < x = −2 + ε.
On a donc ainsi montré que lim xλ = −2.
λ→+∞
P
est l’approximant de Padé d’ordre (p, q) de f si, et seulement si :
Q
(k)
P
(0) = f (k) (0) (0 ≤ k ≤ p + q)
Q
Solution. La condition Q (0) = 1 nous assure l’existence d’un réel r ∈ ]0, R] tel
que Q (x) = 0 pour x ∈ [−r, r] .
P
1. Supposons que soit une approximation de Padé d’ordre (p, q) de f. La fonc-
Q
tion g = Qf − P est alors développable en série entière sur ]−r, r[ . En notant
M la borne supérieure de Q sur [−r, r] , il existe une constante M telle que :
P (x)
≤ M M |x|
p+q+1
∀x ∈ ]−r, r[ , |g (x)| = |Q (x)| f (x) −
Q (x)
c’est-à-dire que g (x) = o (xp+q ) et avec l’unicité du développement limité en
x→0
0 à l’ordre p + q, on déduit que :
+∞
∀x ∈ ]−r, r[ , g (x) = an xn = xp+q+1 E (x)
n=p+q+1
Solution.
n p 2
1. Il est clair que pour n = 2p, le polynôme (X − a) = ((X − a) ) est dans F.
Si P (X) = aX 2 + bX + c avec a5> 0 et Δ = b2 − 4ac < 0, on a P (X) =
2
√ b 4ac − b2
a X+ + λ2 avec λ = ∈ R et P est dans F.
2a 4a
2. Si P = A2 + B 2 et Q = C 2 + D2 sont dans F avec A, B, C, D dans R [X] , on a
2 2
alors P Q = (AD + BC) + (AC − BD) ∈ F.
3. Si P ∈ E est sans racines réelles, il est non nul de degré pair et de coefficient
n
dominant strictement positif. En effet si P (X) = ak X k est sans racine
k=0
réelle il est nécessairement de degré pair non nul (avec le théorème des valeurs
intermédiaires, on voit facilement qu’un polynôme de degré impair a au moins
une racine réelle) et an < 0 entraîne que lim P (x) = −∞ et lim P (x) =
x→−∞ x→+∞
+∞ ce qui contredit encore le fait que P ne s’annule jamais. La décomposition
(p
en facteurs irréductibles de P est donc de la forme P = an Pj où les Pj sont
j=1
des polynômes unitaires de degré 2 irréductibles. Les Pj étant dans F qui est
stable par multiplication, on en déduit que P est dans F.
4. Comme F est contenu dans E, il s’agit de montrer que E est contenu dans F
et avec le résultat de la question précédente il nous suffit de montrer que tout
P dans E ayant des racines réelles est dans F. Soit donc P dans E admettant
m
une racine réelle a de multiplicité m ≥ 1. On a P (x) = (x − a) Q (x) avec
m
Q (a) = 0. Au voisinage de a, P (x) est équivalent à (x − a) Q (a) , ce qui
entraîne que m est nécessairement pair (si m est impair P change de signe au
voisinage de a). Le polynôme Q est alors nécessairement à valeurs positives,
c’est-à-dire qu’il est dans E. En raisonnant par récurrence sur les degrés, on
déduit que P est dans F comme produit de deux éléments de F.
Chapitre 12
Points fixes et
approximations successives
Définition 12.1. On dit que f est strictement contractante s’il existe une
constante λ ∈ [0, 1[ telle que :
Lemme 12.1 Si une orbite suivant f converge (pour F stable par f ), sa limite α
est alors dans F et si de plus la fonction f est continue sur F, on a alors f (α) = α.
Preuve. Pour l’existence d’un point fixe, on montre qu’une orbite (xn )n∈N est
de Cauchy dans l’espace métrique complet (E, d) . Pour q > p ≥ 0, on a :
d (xq , xp ) ≤ d (xq , xq−1 ) + · · · + d (xp+1 , xp )
avec pour tout k ≥ 1 :
d (xk+1 , xk ) = d (f (xk ) , f (xk−1 )) ≤ λd (xk , xk−1 ) ≤ · · · ≤ λk d (x1 , x0 )
ce qui nous donne :
⎛ ⎞
q−1
λp (1 − λq−p )
d (xq , xp ) ≤ ⎝ λk ⎠ d (x1 , x0 ) = d (x1 , x0 )
1−λ
k=p
λp
≤ d (x1 , x0 ) → 0
1−λ p→+∞
puisque λ ∈ [0, 1[ . On a donc ainsi montré que la suite (xn )n∈N est de Cauchy
dans (E, d) et en conséquence, elle converge vers un élément α ∈ F puisque E est
complet et F fermé dans E. Avec la continuité de f, on déduit que f (α) = α, c’est-
à-dire que α est un point fixe de f. Faisant tendre q vers l’infini dans la majoration
λp
précédente (à p fixé) on obtient la majoration d (α, xp ) ≤ d (x1 , x0 ) .
1−λ
Si β ∈ F est un autre point fixe, on a alors d (α, β) = d (f (α) , f (β)) ≤ λd (α, β)
et nécessairement α = β puisque λ ∈ [0, 1[ .
Dans le cas des fonctions d’une variable réelle dérivables, le théorème des ac-
croissements finis nous fournit un critère pour vérifier qu’une application est stric-
tement contractante et nous conduit aux notions de points fixes attractifs et ré-
pulsifs. Cette étude est faite au paragraphe 9.4.5.
Le théorème du point fixe de Picard 331
La fonction f admet un unique point fixe dans K et ce point fixe est limite
de toute orbite suivant f.
Cette suite est bien définie du fait la convexité de K, chaque fonction fn est à
valeurs dans K et pour x, y dans K, on a :
1
fn (x) − fn (y) ≤ 1 − x − y
n
avec :
⎧
⎪ 1 1 1
⎪
⎨ f (α) − gn (α) = f (α) − f ϕ (n) a + 1 − ϕ (n) α ≤ ϕ (n) α − a
⎪
⎪
⎪ 1
⎩ gn (α) − gn (yn ) = fϕ(n) (α) − fϕ(n) xϕ(n) ≤ 1 −
⎪ α − xϕ(n)
n
ce qui entraîne que lim fϕ(n) xϕ(n) = f (α) . Tenant compte du fait que xϕ(n)
n→+∞
est point fixe de fϕ(n) , on a fϕ(n) xϕ(n) = xϕ(n) et f (α) = lim xϕ(n) = α,
n→+∞
c’est-à-dire que α est point fixe de f.
Il peut arriver que la fonction f : F → F ne soit pas strictement contractante,
mais que l’une de ces itérées le soit. Dans ce cas on a encore existence et unicité
du point fixe de f qui est limite de toute orbite. Ce résultat est utilisé par exemple
dans la démonstration du théorème de Cauchy-Lipschitz linéaire.
Lemme 12.2 Soient p ∈ N∗ et (xn )n∈N une suite de points dans un espace mé-
trique (E, d) telle que pour tout r ∈ {0, · · · , p − 1} la suite extraite (xjp+r )j∈N
converge vers x ∈ E. La suite (xn )n∈N converge alors vers x.
Preuve. Soit ε > 0. Pour tout r ∈ {0, · · · , p − 1} , on peut trouver un entier jr tel
que d (xjp+r , x) < ε pour tout j ≥ jr . On note jε = max jr . Tout entier n ∈ N
0≤r≤p−1
s’écrit de manière unique n = jp + r avec j ∈ N, r ∈ {0, · · · , p − 1} et pour j ≥ jε
on a d (xn , x) < ε. On déduit donc que d (xn , x) < ε pour tout n ≥ (jε + 1) p. On
a donc ainsi prouvé que la suite (xn )n∈N converge vers x.
Théorème 12.3.
Si f : F → F est telle que l’une de ses itérées f p = f ◦ · · · ◦ f , où p ∈ N∗ ,
; <= >
p fois
soit strictement contractante, elle admet alors un unique point fixe dans F
limite de toute orbite.
on déduit que f p (f (α)) = f (f p (α)) = f (α) et f (α) est aussi point fixe de f p .
On a donc f (α) = α du fait de l’unicité du point fixe de f p . L’application f admet
donc un point fixe dans F. En considérant que tout point fixe de f est aussi point
fixe de f p , on déduit que ce point fixe est unique dans F.
Si (xn )n∈N est définie par x0 ∈ E et xn+1 = f (xn ) pour tout n ∈ N, on a alors
j
xjp+r = f jp+r (x0 ) = (f p ) (f r (x0 )) pour tout r ∈ {0, · · · , p − 1} et tout j ∈ N,
c’est-à-dire que (xjp+r )j∈N est une orbite suivant f p de valeur initiale f r (x0 ) . On
a donc lim xjp+r = α pour tout r ∈ {0, · · · , p − 1} ce qui équivaut à dire que
j→+∞
lim xn = α.
n→+∞
Si (F, ·) est un espace de Banach et a < b deux réels, l’espace vectoriel
E = C 0 ([a, b] , F ) muni de la norme de la convergence uniforme :
f → f ∞ = sup f (x)
x∈[a,b]
k k
ϕ (f ) (x) − ϕk (g) (x) ≤ (M |x − x0 |) f − g
∞
k!
En effet, on vient de voir que cela est vrai pour k = 1 et supposant le résultat
acquis pour k ≥ 1, on a :
x
k+1 k
ϕ (f ) (x) − ϕ k+1
(g) (x) ≤ M ϕ (f ) (t) − ϕk (g) (t) dt
x0
x
Mk k
≤M f − g∞ |t − x0 | dt
k! x0
k+1
x
k |x − x0 |
avec |t − x0 | dt = , ce qui nous donne :
x0 k+1
k+1 (M |x − x0 |)k+1
ϕ (f ) (x) − ϕk+1 (g) (x) ≤ f − g∞
(k + 1)!
Il en résulte que :
(M (b − a))
k
∀k ≥ 1, ϕk (f ) − ϕk (g)∞ ≤ f − g∞
k!
k
(M (b − a))
et, avec lim = 0, on en déduit que pour k ≥ 1 assez grand, l’ap-
k→+∞ k!
plication ϕk est contractante. Le théorème du point fixe itéré nous dit alors que ϕ
admet un unique point fixe dans E.
Le théorème précédent est utile pour la démonstration du théorème de Cauchy-
Lipschitz linéaire.
Preuve. Le cas d’une fonction continue de [a, b] dans [a, b] a été déjà vu avec
l’exercice 5.3.
Pour le cas d’une fonction croissante de [a, b] dans [a, b] , on introduit l’ensemble
E = {x ∈ [a, b] | f (x) ≥ x} . Cet ensemble étant non vide (f (a) ∈ [a, b] , donc
Cas des fonctions d’une variable réelle 335
Lemme 12.3 Si (xn )n∈N est une suite de réels telle que lim (xn+1 − xn ) = 0,
n→+∞
alors l’ensemble de ses valeurs d’adhérences est soit vide soit un intervalle fermé.
Preuve. Notons V l’ensemble des valeurs d’adhérences de la suite (xn )n∈N , c’est-
à-dire l’ensemble des limites de suites extraites de (xn )n∈N . On sait que cet en-
semble est fermé (théorème 1.9). On suppose que cet ensemble est non vide, non
réduit à un point et on se donne a < b dans V. Il s’agit alors de montrer que ]a, b[
est inclus dans V.
Si c ∈ ]a, b[ n’est pas dans V, il existe alors un réel ε > 0 tel que ]c − ε, c + ε[
est contenu dans ]a, b[ et un entier n0 tel que pour tout n ≥ n0 , xn ∈
/ ]c − ε, c + ε[ .
Avec lim (xn+1 − xn ) = 0 on déduit qu’il existe un entier n1 ≥ n0 tel que
n→+∞
|xn+1 − xn | < 2ε pour tout n ≥ n1 . En particulier on a xn1 ∈ / ]c − ε, c + ε[ . Si
xn1 ≤ c − ε alors xn1 +1 < 2ε + xn1 ≤ c + ε et comme xn1 +1 ∈ / ]c − ε, c + ε[ cela
signifie que xn1 +1 ≤ c − ε. Par récurrence on déduit alors que xn ≤ c − ε pour tout
Suites homographiques 337
n ≥ n1 , ce qui contredit le fait que b est valeur d’adhérence de la suite (xn )n∈N .
De manière analogue xn1 ≥ c + ε va contredire le fait que a est valeur d’adhérence
de la suite (xn )n∈N . On aboutit donc ainsi à une contradiction. En conclusion, V
est un intervalle fermé.
Théorème 12.8.
Soit f une fonction continue de [a, b] dans lui même et (xn )n∈N une
orbite suivant f. Cette suite est convergente si, et seulement si, on a
lim (xn+1 − xn ) = 0.
n→+∞
Pour a = 1, b = 0, la fonction f n’a pas de point fixe, la suite (xn )n∈N est
arithmétique de raison b et une récurrence immédiate donne xn = x0 + nb pour
tout n ∈ N. On a donc lim |xn | = +∞.
n→+∞
b
Pour a ∈
/ {0, 1} , l’unique point fixe de f est α = . De xn+1 = axn + b
1−a
et α = aα + b, on déduit que xn+1 − α = a (xn − α) et par récurrence xn − α =
an (x0 − α) , soit xn = α + an (x0 − α) . On en déduit alors les résultats suivants :
— pour a = −1 ou |a| > 1, la suite (xn )n∈N converge (vers α) si, et seulement
si, x0 = α ;
— pour |a| < 1, la suite (xn )n∈N converge vers α pour toute valeur initiale x0 .
Pour la suite de ce paragraphe, f est une fonction homographique de paramètres
d
a, b, c, d réels tels c = 0. Cette fonction est indéfiniment dérivable sur R \ −
c
avec :
d ad − bc
∀x ∈ R \ − , f (x) = 2
c (cx + d)
En particulier
pour ad − bc = 0, cette fonction est constante sur chacun des
d d
intervalles −∞, − et − , +∞ . On suppose donc que ad − bc = 0 et dans ce
c c
d .a/
cas f réalise un homéomorphisme de R \ − sur R \ .
c c
ax + b a b
À une telle homographie f : x → on associe la matrice A =
cx + d c d
ax + b a x + b
dans GL2 (R) et on peut remarquer que si f : x → et g : x →
cx + d c x + d
d
sont deux fonctions homographiques définies respectivement sur R \ − et
c
d
R \ − avec c, c , ad − bc, a d − b c non nuls, alors la composée f ◦ g, définie a
c
d d
priori sur R \ − ∩ R \ g −1 − , est homographique et ses coefficients
c c
aa + bc ab + bd
sont ceux de la matrice produit A = AA = . Pour
ca + dc cb + dd
c = 0, on a d = 0 (det (A ) = 0)
et f ◦ g est affine définie sur R tout entier et
d
pour c = 0, elle est définie sur R \ − .
c
Pour tout entier naturel non nul n, on peut définir la n-ème itérée
de f, notée
n n a n bn
f et cette homographie est associée à la matrice A = , elle est donc
c n dn
dn
définie sur R si cn = 0 et sur R \ − si cn = 0.
cn
Si f est une homographie, on peut alors définir une orbite (xn )n∈N suivant f
de valeur initiale x0 si la condition suivante est réalisée :
∀n ≥ 1, cn x0 + dn = 0
Suites homographiques 339
an x 0 + bn
Cette suite étant définie par xn = pour tout n ∈ N en posant
c n x0 + dn
d d
a0 = d0 = 1 et b0 = c0 = 0. On a x0 = − et pour n ≥ 1 l’égalité xn = −
c c
implique (can + dcn ) x0 + (cbn + ddn ) = 0, soit à cn+1 x0 + dn+1 = 0, ce qui est
exclut. Le réel xn+1 = f (xn ) est donc bien défini. En supposant cette condition
vérifiée, on a axn + b = (cxn + d) xn+1 pour tout n ∈ N. Dans le cas où la suite
(xn )n∈N converge vers un réel α, ce réel est nécessairement solution de l’équation :
cα2 + (d − a) α − b = 0 (12.1)
2
On peut remarquer que le discriminant Δ = (d − a) + 4bc de cette
équation
a b
est celui du polynôme caractéristique de la matrice A = associé à
c d
l’homographie f. En effet ce polynôme caractéristique est λ2 − (a + d) λ + ad − bc
2
et son discriminant est (a + d) − 4 (ad − bc) = Δ.
Pour Δ < 0, l’équation (12.1) n’a pas de solution réelle. On a donc le premier
résultat suivant.
2
Lemme 12.4 Avec les hypothèses et notations qui précèdent, si Δ = (d − a) +
4bc < 0, l’orbite (xn )n∈N est alors divergente.
a−d
Pour Δ = 0, l’équation (12.1) a une unique racine réelle α = . De plus,
2c
d d
α = − . En effet, α = − équivaut à d = −a et Δ = 0 équivaut alors à a2 +bc = 0
c c
qui est en contradiction
avec
ad−bc = − a2 + bc = 0. Ce réel α est l’unique point
d
fixe de f dans R \ − (l’équation f (x) = x équivaut à cx2 + (d − a) x − b = 0).
c
Pour x0 = α, la suite (xn )n∈N est stationnaire sur α et donc convergente vers
l’unique point fixe de f. On suppose donc que x0 = α.
2
Lemme 12.5 Avec les hypothèses et notations qui précèdent, si Δ = (d − a) +
a−d
4bc = 0 et x0 = α = , on a alors xn = α pour tout n ∈ N.
2c
.a/
d
Preuve. La fonction f réalisant un homéomorphisme de R \ − sur R \ ,
c c
d . a /
l’équation f (α) = α avec α ∈ R \ − équivaut à α ∈ R \ et α = f −1 (α) .
c c
d
Pour x0 ∈ R \ − , x1 = f (x0 ) = α équivaut à x0 = f −1 (x1 ) = α. On a donc
c
x1 = α si x0 = α. Et par récurrence, on montre que xn = α pour tout n ∈ N.
a−d 1
Pour x0 = α = , on peut donc définir la suite (yn )n∈N = .
2c xn − α n∈N
2c
Lemme 12.6 La suite (yn )n∈N est arithmétique de raison β = . Soit :
a+d
∀n ∈ N, yn+1 = β + yn
340 Points fixes et approximations successives
a+d a+d
En tenant compte de cα + d = , cxn + d = c (xn − α) + et Δ = 0
2 2
2
équivalent à (a + d) = 4 (ad − bc) , on obtient :
c (xn − α) + a+d
2
a+d
2 2c
yn+1 = (a+d)2
= + yn
(xn − α) a+d
4
Théorème 12.9.
2
Avec les hypothèses et notations qui précèdent, si Δ = (d − a) + 4bc = 0
et x0 = α, on a alors :
1
∀n ∈ N, xn = +α
y0 + nβ
a−d 1 2c
où α = est l’unique point fixe de f, y0 = ,β = . Il en
2c x0 − α a+d
résulte que lim xn = α.
n→+∞
1
Preuve. Résulte de yn = y0 + nβ = .
xn − α
On peut essayer d’utiliser le théorème du point fixe, spécialement le théorème
9.27, pour étudier la convergence de la suite (xn )n∈N . Mais ici, on a f (α) =
4 (ad − c)
2 = 1 et on ne peut conclure avec ce théorème. Un exemple de telle
(a + d)
x
situation est donné par la fonction f définie sur R \ {−1} par f (x) = .
1+x
xn
Pour x0 bien choisi la suite (xn )n∈N définie par xn+1 = converge vers
1 + xn
0 quiest l’unique
point fixe de f. La matrice associée
à cette homographie est
1 0 1 0 1
A= et pour n ≥ 1, on a An = et pour x0 = − la suite
1 1 n 1 n
x0 1
(xn )n∈N est bien définie par xn = (pour x0 = 0, on a y0 = et β = 1).
nx0 + 1 x0
Pour Δ > 0, l’équation (12.1) a deux racines réelles α, β qui sont les deux points
fixes de f (la condition ad − bc = 0 entraîne bien que α et β sont différents de
d
− ).
c
Pour x0 = α, la suite stationne sur α.
Suites homographiques 341
xn − β
∀n ∈ N, yn =
xn − α
Lemme 12.7 Avec le hypothèses et notations qui précèdent, la suite (yn )n∈N est
cα + d
géométrique de raison , soit :
cβ + d
cα + d
∀n ∈ N, yn+1 = yn
cβ + d
f (xn ) − f (β) cα + d xn − β
Preuve. On a yn+1 = = .
f (xn ) − f (α) cβ + d xn − α
Théorème 12.10.
2
Avec les hypothèses et notations qui précèdent, si Δ = (d − a) + 4bc > 0
et x0 = α, on a alors :
β − αy0 λn
∀n ∈ N, xn =
1 − y 0 λn
√ √
a−d− Δ a−d+ Δ
où α = , β = sont les points fixes de f, y0 =
2c 2c
x0 − β cα + d
et λ = . De plus :
x0 − α cβ + d
— si |λ| < 1, alors lim xn = β ;
n→+∞
— si |λ| > 1, alors lim xn = α ;
n→+∞
β − αy0
— si |λ| = 1, alors λ = −1, lim x2n = γ = , lim x2n+1 =
n→+∞ 1 − y0 n→+∞
β + αy0
δ= = γ et la suite (xn )n∈N diverge.
1 + y0
xn − β
Preuve. Résulte de yn = y0 λn = et α = β.
xn − α
ax + 1
Un exemple de telle situation est donné par f (x) = avec a > 0, a = 1
x+a
a−1
(d = a, b = c = 1). On a ici, Δ = 4, α = −1, β = 1, λ = et :
a+1
1 + y0 λ n
∀n ∈ N, xn =
1 − y0 λn
x0 − 1
avec y0 = pour x0 = −1. Pour a > 0 on a |λ| < 1 et lim xn = 1. La
x0 + 1 n→+∞
a 1
matrice associée à f est A = , cette matrice a deux valeurs propres
1 a
342 Points fixes et approximations successives
distinctes λ1 = a − 1, λ2 = a + 1 et :
−1 −1 1 a−1 0 1 −1 1
A = P DP =
1 1 0 a+1 2 1 1
ce qui donne :
n
1 −1 1 (a − 1) 0 −1 1
∀n ≥ 1, An = n
2 1 1 0 (a + 1) 1 1
soit :
n n n n
1 (a − 1) + (a + 1) − (a − 1) + (a + 1)
∀n ≥ 1, An = n n n n
2 − (a − 1) + (a + 1) (a − 1) + (a + 1)
de la sécante passant par les points M (x, f (x)) et B (b, f (b)) (interpolation de
Lagrange). L’équation de cette sécante est, en supposant x < b :
f (b) − f (x)
Y = f (x) + (X − x)
b−x
Dans le cas où f (b) = f (x) , le point d’intersection de cette sécante avec l’axe
b−x
des x est donné par g (x) = x − f (x) et la résolution de l’équation
f (b) − f (x)
f (x) = 0 est ainsi ramenée à la résolution du problème de point fixe g (x) = x, ce
qui revient à considérer la suite (xn )n∈N définie par x0 ∈ I et :
b − xn
xn+1 = xn − f (xn ) (n ≥ 0)
f (b) − f (xn )
quand cette dernière peut être définie.
◦
Dans le cas où la fonction f : I → R est de classe C 2 , admet une racine α ∈ I
et est telle que f f garde un signe constant au voisinage de α (f est strictement
monotone et à convexité constante sur ce voisinage), la suite (xn )n∈N est bien
définie, strictement monotone ou stationnaire sur α, converge vers α et on peut
donner une majoration de l’erreur d’approximation. Pour démontrer ce résultat
nous aurons besoin du lemme suivant.
Lemme 12.8 Soit f une fonction de classe C 2 sur un intervalle [a, b] telle que
f (a) f (b) < 0 et f (x) = 0 pour tout x ∈ [a, b] . L’équation f (x) = 0 admet
une unique solution α ∈ ]a, b[ , on peut définir la fonction g sur [a, b[ par g (x) =
b−x
x− f (x) et on a :
f (b) − f (x)
b − α M2
∀x ∈ [a, b[ , |g (x) − α| ≤ |x − α|
2 m1
où M2 = sup |f (x)| et m1 = inf |f (x)| .
x∈[a,b] x∈[a,b]
la fonction h étant de classe C 2 sur [a, b] avec h (α) = h (b) = 0. Pour x fixé dans
[a, b] , on définit la fonction ϕx sur [a, b[ par ϕx (t) = h (t) − kx (t − α) (t − b) , la
constante kx étant choisie de telle sorte que ϕx (x) = 0, ce qui équivaut à dire
h (x)
que kx = . Cette fonction est de classe C 2 sur [a, b] avec ϕx (α) =
(x − α) (x − b)
344 Points fixes et approximations successives
b − xn
∀n ∈ N, xn+1 = xn − f (xn )
f (b) − f (xn )
Preuve. On peut supposer que f (x) > 0 et f (x) > 0 pour tout x ∈ [a, b] . En
effet, si f < 0 et f < 0, on remplace f par −f, si f < 0 et f > 0, on remplace
f par x → f (−x) et si f > 0 et f < 0, on remplace f par x → −f (−x) . Dans
la démonstration du lemme précédent, on a montré l’existence et l’unicité de la
racine α de l’équation f (x) = 0 et on a vu qu’on peut définir la fonction g sur
b−x
[a, b[ par g (x) = x − f (x) . Cette fonction est de classe C 2 sur [a, b[
f (b) − f (x)
f (b)
et peut se prolonger par continuité en b en posant g (b) = b − . Pour tout x
f (b)
dans [a, b[ , on a :
f (b)
g (x) = 2 (f (b) − f (x) − (b − x) f (x))
(f (b) − f (x))
2
f (b) (b − x)
= 2 f (cx )
(f (b) − f (x)) 2
Applications à la résolution d’équations numériques 345
x2 x1 x0
Théorème 12.12.
◦
Soient f ∈ C 2 (I, R) et α ∈ I tel que f (α) = 0 et f (α) = 0. Il existe un
réel η > 0 tel que pour tout x0 ∈ [α − η, α + η] la suite (xn )n∈N définie par
f (xn )
xn+1 = xn − converge vers α.
f (xn )
f (xn )
∀n ≥ 0, xn+1 = xn −
f (xn )
2 f (cx )
∀x ∈ [a, b] , g (x) − α = (x − α)
2f (x)
2 f (cn ) 2 (p − 1) cn
p−2
xn+1 − α = (xn − α)
= (xn − α) p−1
2f (xn ) 2xn
f (xn )
et par récurrence xn > α pour n ≥ 1. De plus xn+1 = xn − < xn . La suite
f (xn )
(xn )n∈N est donc décroissante minorée par α.
12.5 Exercices
Exercice 12.1.
1. Montrer qu’une suite numérique (xn )n∈N est arithmétique si, et seule-
ment si, xn + xn+2 = 2xn+1 pour tout n ∈ N.
2. Montrer qu’une suite numérique (xn )n∈N est géométrique de raison non
nulle si, et seulement si, x0 = 0, x1 = 0 et xn xn+2 = x2n+1 pour tout
n ∈ N.
Solution.
1. Si (xn )n∈N est arithmétique de raison b, on a alors :
x1
(par récurrence) et en posant a = , on a x1 = ax0 , puis en supposant que
x0
x2
xk = x0 ak pour 0 ≤ k ≤ n avec n ≥ 1, on a xn+1 = n = x0 ak+1 , c’est-à-dire
xn−1
que (xn )n∈N est géométrique de raison a.
1
Exercice 12.2. Soit (xn )n∈N définie par x0 > 0 et xn+1 = arctan (xn )
2
pour tout n ∈ N.
1. Montrer que lim (2n xn ) = λ > 0.
n→+∞
λ 4λ3 1 1
2. Montrer que xn = + + o .
2n 9 23n n→+∞ 23n
Solution.
1. Pour tout réel x > 0, on a 0 < arctan (x) < x. On déduit alors que, pour x0 > 0,
on a :
∀n > 0, 0 < 2n xn < 2n−1 xn−1 < x0
C’est-à-dire que la suite (2n xn )n≥0 est décroissante et minorée. Elle converge
donc vers un réel λ ≥ 0. La suite (ln (2n xn ))n≥0 est de même nature que la
série de terme général ln (2n xn ) − ln 2n−1 xn−1 . En remarquant que :
2xn arctan (xn−1 ) x2n−1
ln (2n xn ) − ln 2n−1 xn−1 = ln = ln −
xn−1 xn−1 n→+∞ 3
x2
et x2n < n0 , on déduit que la série de terme général ln (2n xn ) − ln 2n−1 xn−1
4
est convergente, ce qui entraîne l’existence d’une limite réelle pour la suite
(ln (2n xn ))n≥0 et λ > 0 (sinon lim 2n xn = 0 et lim ln (2n xn ) = −∞).
n→+∞ n→+∞
yn+1
2. On note yn = 2n xn . De lim yn = λ > 0 et lim = 1, on déduit que
n→+∞ yn
n→+∞
λ yn+1 yn+1 yn+1 − yn
xn et ln −1 . Mais on a aussi :
n→+∞ 2n yn n→+∞ yn n→+∞ λ
yn+1 arctan (xn ) x2 1 λ2
ln = ln − n − n
yn xn n→+∞ 3 n→+∞ 3 4
1 λ3
Ce qui donne yn+1 − yn − et assure la convergence de la série de
n→+∞ 3 4n
terme général yn+1 − yn . En écrivant que :
λ − yn = lim yk − yn = (yk+1 − yk ) + y0 − yn
k→+∞
k≥0
λ3 1 4λ3 1
= (yk+1 − yk ) − k
=−
3 4 9 4n
k≥n k≥n
350 Points fixes et approximations successives
3. Montrer que pour tout x0 ∈ J on peut définir la suite (xn )n∈N de points
de J par xn+1 = fλ (xn ) pour tout n ∈ N et que cette suite converge vers
α.
4. par f la fonction définie par f (x) = tan (x) − x sur
On désigne
3π 5π
, .
2 2
(a) Montrer que l’équation f (x) = 0 admet une unique solution α dans
J = [a, b] = [7.65, 7.75] .
(b) Déterminer le coefficient λ qui intervient dans la question 2.
(c) Proposer un procédé d’accélération de la convergence de la suite
(xn )n∈N et donner une valeur approchée de α à 10−6 près.
Solution.
1. Avec la continuité de f et l’hypothèse f (α) > 0 on déduit que f (x) > 0 dans
un voisinage de α et considérant que α est intérieur à I, on déduit qu’il existe
η > 0 tel que J = [α − η, α + η] ⊂ I et f (x) > 0 pour tout x ∈ J.
2. La fonction f étant continue sur le compact J est bornée sur cet intervalle et
atteint ses bornes, on peut donc poser m = inf f (x) , M = sup f (x) et on a
x∈J x∈J
0 < m = f (u) ≤ M = f (v) , avec u, v dans J. Pour tout réel non nul λ et tout
x dans J, on a fλ (x) = 1 − λf (x) et :
M −m M −m 2m 2M
− ≤ fλ (x) ≤ ⇔ ≤ λf (x) ≤
M +m M +m M +m M +m
Exercices 351
4.
(a) La fonction f est continue strictement
8 croissante sur J (en effet, f (x) =
2 π9
tan (x) > 0 pour tout x ∈ I ⊂ 2π, 5 ) avec f (a) f (b) < 0, en consé-
2
quence l’équation f (x) = 0 admet une unique solution α ∈ J.
(b) On a m = inf f (x) = tan2 (a) 23.36 et M = sup f (x) = tan2 (b)
x∈J x∈J
2
91.82, ce qui donne λ = 7.73 × 10−2 . Un algorithme de calcul
M +m
approché de α est donc donné en considérant la suite (xn )n∈N définie par
x0 = 7.7 ∈ J et :
Solution. La suite (xn )n∈N est bien définie du fait que I est stable par f et pour
tout n ∈ N, en notant rn = |xn − α| , on a :
(l’égalité est réalisée si xn = α), c’est-à-dire que la suite (rn )n∈N est décroissante
minorée, elle est donc convergente. Avec :
on déduit que la suite (xn )n∈N est bornée, on peut donc en extraire une sous-suite
xϕ(n) n∈N convergente vers β ∈ I (l’intervalle I est fermé). Avec la continuité de
f et lim rϕ(n)+1 = lim rϕ(n) on déduit que :
n→+∞ n→+∞
Exercice 12.5. Soit f la fonction définie sur I = [0, 1] par f (x) = 1−x2 .
1. Montrer que l’intervalle I est stable par f et que f a un unique point
fixe α ∈ I.
2. Vérifier que f ◦ f a trois points fixes γ < α < δ dans I.
3. Soit (xn )n∈N une orbite suivant f avec x0 = α.
(a) Montrer que xn = α pour tout n ∈ N et que la suite (xn )n∈N diverge.
(b) On suppose que x0 < α. Montrer que lim x2n = γ et
n→+∞
lim x2n+1 = δ.
n→+∞
Solution.
1. L’équation f (x) = x√équivaut à x2 + x√− 1 = 0. Cette dernière équation a deux
5−1 5+1
racines réelles α = et β = − , seule α est dans I. La fonction
2
2
f est strictement décroissante sur I (f (x) = −2x < 0 pour 0 < x < 1) avec
f (0) = 1 ∈ I et f (1) = 0 ∈ I, donc f (I) = [0, 1] = I.
Exercices 353
2
2. On a g (x) − x = f ◦ f (x) − x = 1 − 1 − x2 = 2x2 − x4 − x. Comme f et g
sont polynomiales et les points fixes de f sont aussi points fixes de g, il existe
des réels a, b, c tels que g (x) − x = (f (x) − x) ax2 + bx + c , soit :
|xn+1 − α| = |α − xn | (α + xn ) ≥ α |α − xn | > 0
Exercice 12.6. F est un fermé non vide d’un espace métrique complet
(E, d) . Soient (T, δ) un espace métrique et f : F × T → F une application
continue et uniformément contractante, c’est-à-dire qu’il existe λ ∈ [0, 1[
tel que :
d (f (α (t0 ) , t) , f (α (t0 ) , t0 ))
et en conséquence d (α (t) , α (t0 )) ≤ . La continuité
1−λ
de α se déduit alors de celle de f.
Chapitre 13
Équations fonctionnelles
Lemme 13.1 Si f est un morphisme du groupe additif (R, +) dans lui même, on
a alors :
∀a ∈ R, ∀r ∈ Q, f (ra) = rf (a)
Preuve. En prenant (x, y) = (0, 0) dans (13.1) , on obtient f (0) = 2f (0) , ce qui
équivaut à f (0) = 0 (un morphisme de groupes transforme le neutre en neutre).
En prenant (x, y) = (x, −x) dans (13.1) , on obtient f (x) + f (−x) = 0. On a
donc f (−x) = −f (x) pour tout x ∈ R, c’est-à-dire que la fonction f est impaire
(un morphisme de groupes transforme l’opposé en opposé).
De (13.1) on déduit par récurrence que pour tout a ∈ R on a :
∀n ∈ N, f (na) = nf (a)
Enfin avec l’imparité de f, on déduit que ce dernier résultat est encore vrai pour
les rationnels négatifs. On a donc f (ra) = rf (a) pour tout a ∈ R et tout r ∈ Q.
Pour a = 1, en notant λ = f (1) , on obtient f (r) = λr pour tout r ∈ Q.
En considérant R comme un espace vectoriel sur le corps Q des rationnels, le
lemme précédent s’exprime en disant que tout morphisme du groupe additif (R, +)
dans lui même est une application Q-linéaire.
Dans ce qui suit nous allons montrer que si f est un morphisme du groupe
additif (R, +) dans lui même, une hypothèse supplémentaire (continuité en un
point, monotonie, f bornée sur un intervalle) va entraîner que f est R-linéaire, ce
qui revient à dire que c’est une homothétie.
On peut montrer, en utilisant le lemme de Zorn, qu’il existe une fonction vé-
rifiant l’équation fonctionnelle de Cauchy qui n’est pas une homothétie. Pour ce
faire, on se donne une Q-base (ei )i∈I de R (utilisation du lemme de Zorn) et
l’application Q-linéaire f définie sur R par f (ej ) = 1 et f (ei ) = 0 pour tout
i ∈ I \ {j} où j est fixé dans I, vérifie bien l’équation fonctionnelle (13.1) sans être
une homothétie.
En utilisant les approximations décimales par défaut et par excès d’un réel
(théorème 4.20), on obtient le résultat suivant.
Théorème 13.1.
Les morphismes du groupe additif (R, +) dans lui même qui sont mono-
tones sont les homothéties.
Lemme 13.2 Si f vérifiant (13.1) est continue à droite en 0, elle est alors conti-
nue à droite en tout point de R.
Preuve. Soient m ≤ M deux réels tels que m ≤ f (x) ≤ M pour tout x ∈ [a, b] .
Pour x ∈ [0, b − a] , on a x + a ∈ [a, b] , donc m ≤ f (x + a) ≤ M et avec (13.1) , on
obtient m = m − f (a) ≤ f (x)
≤ M = M − f (a) pour tout x ∈ [0, b − a] . Pour
b−a
n ∈ N \ {0} et x ∈ 0, , on a nx ∈ [0, b − a] , de sorte que m ≤ f (nx) =
n
m M
nf (x) ≤ M et ≤ f (x) ≤ . Si on se donne un réel ε > 0, il existe un entier
n
n
m M b−a
n ≥ 1 tel que , soit contenu dans ]−ε, ε[ et pour tout x ∈ 0, , on
n n n
a −ε < f (x) < ε. On a donc ainsi montré que f est continue à droite en 0. C’est
donc une homothétie.
On peut montrer que si f vérifiant (13.1) est bornée sur un ensemble mesurable
de mesure non nulle (pour la mesure de Lebesgue), elle est alors bornée sur un
intervalle et c’est une homothétie (voir [12], p. 63).
On peut également montrer (voir [12], p. 75) que si f vérifiant (13.1) est mesu-
rable, c’est alors une homothétie.
Théorème 13.4.
Soit f un morphisme de groupes de (R, +) dans (C, +) . Si l’une des deux
conditions suivantes est réalisée :
— f est continue en 0 ;
— f est bornée sur un intervalle non réduit à un point ;
il existe alors un nombre complexe α tel que f (x) = αx pour tout réel x.
On s’intéresse tout d’abord aux solutions dérivables sur R+,∗ de cette équation
fonctionnelle.
Morphismes de groupes de (R∗ , ·) dans (R, +) 359
Lemme 13.3 Les solutions dérivables sur R+,∗ de (13.2) sont les fonctions défi-
nies par : x
dt
∀x ∈ R+,∗ , f (x) = λ
1 t
où λ est une constante réelle.
(x ∈ R et y = ex ) ⇔ (y > 0 et x = ln (y))
Avec ln (x) > 0, on déduit du théorème de dérivation des fonctions réciproques
que la fonction exponentielle est dérivable avec (ex ) = ex pour tout x ∈ R.
De ln (xy) = ln (x) + ln (y) pour tous x, y dans R+,∗ , on déduit que la fonction
exponentielle est une solution de l’équation fonctionnelle :
Si f est solution de (13.2) sur R+,∗ , alors la fonction g définie sur R par g (t) =
f (et ) vérifie l’équation fonctionnelle de Cauchy et on déduit le résultat suivant.
Théorème 13.5.
Soit f vérifiant l’équation fonctionnelle (13.2) sur R+,∗ . Si l’un des condi-
tions suivantes est vérifiée :
— f est monotone ;
— f est continue à droite en 1 ;
360 Équations fonctionnelles
Preuve. Si f est monotone [resp. continue à droite en 1, resp. bornée sur [a, b]
avec 0 < a < b], g est alors monotone (la fonction exponentielle est croissante),
[resp. continue à droite en 0, resp. bornée sur [ln (a) , ln (b)]] donc g (t) = αt et
pour tout x > 0, on a f (x) = f (et ) = g (t) = αt = α ln (x) .
Preuve.
1. Si f est monotone, il en est de même de g = ln ◦f (la fonction ln est croissante).
On a donc g (x) = αx pour tout x ∈ R avec α = g (1) = ln (f (1)) et f (x) =
eg(x) = eαx .
2. Avec la continuité de la fonction ln on déduit que si f est continue à droite en
0 alors il en est de même de g = ln ◦f (f (0) > 0 si f n’est pas identiquement
nulle). D’où le résultat.
L’équation fonctionnelle f (xy) = f (x) f (y) sur R+,∗ 361
f (b) f (b) f (x + a) M
f (x) = > 0, f (x) = ≤
f (b − x) M f (a) f (a)
(f (t) > 0 pour tout t ∈ R). La fonction f est donc bornée sur [0, b − a] avec
une borne inférieure strictement positive. Il en résulte que la fonction g = ln ◦f
est bornée sur [0, b − a] (l’image d’un compact par l’application continue ln est
un compact) et on peut conclure.
la fonction g définie sur R par g (x) = f (ex ) vérifie alors l’équation fonctionnelle
(13.3) .
Si f est monotone, il en est de même de g (la fonction exponentielle est crois-
sante), donc g (x) = eαx et pour tout t > 0, on a :
Lemme 13.5 Si f est une fonction non identiquement nulle vérifiant (13.4) , elle
est alors paire et f (0) = 1.
On suppose que f est une fonction continue sur R qui vérifie l’équation fonc-
tionnelle (13.4) . Avec la continuité en 0 et f (0) = 1 on déduit qu’il existe un
réel α > 0 tel que f (x) > 0 pour tout x ∈ [−α, α]9. On8se fixe un tel réel α. Si
π
|f (α)| ≤ 1, on peut alors trouver un unique réel θ ∈ 0, tel que f (α) = cos (θ) .
2
p
Lemme 13.6 Pour tout rationnel r = n avec (p, n) ∈ N2 , on a f (rα) =
2
cos (rθ) .
[2n x] pn 1
∀n ∈ N, rn = = n , sn = rn + n
2n 2 2
1
et on a 0 ≤ x − rn < pour tout n ∈ N, ce qui entraîne la convergence de ces
2n
suites vers x (développement dyadique). Avec la continuité des fonctions f et cos,
L’exponentielle complexe 363
on en déduit que :
# α$
θ
f (αx) = lim f (αrn ) = lim f pn n = lim cos pn n
n→+∞ n→+∞ 2 n→+∞ 2
= lim cos (rn θ) = cos (θx)
n→+∞
θ
Il en résulte que f (x) = cos x = cos (λx) .
α
Dans le cas où |f (α)| > 1, en écrivant que f (α) = ch (θ) avec θ > 0, on aboutit
à f (x) = ch (λx) .
Si on suppose la fonction f non identiquement nulle et deux fois dérivable sur
R, la résolution de l’équation fonctionnelle (13.4) est beaucoup plus simple. En
dérivant deux fois l’équation (13.4) par rapport à x, pour y réel fixé, on obtient
f (x + y) + f (x − y) = 2f (x) f (y) et pour x = 0, en tenant compte de la
parité de f, on a f (y) = f (0) f (y) avec f (0) = 1. D’autre part, en dérivant
par rapport à y et en faisant y = 0, on obtient 2f (x) f (0) = 0 pour tout réel
x, ce qui entraîne f (0) = 0 puisque f n’est pas la fonction nulle. En définitive,
f est solution de f = f (0) f avec f (0) = 1 et f (0) = 0, ce qui équivaut à
f (x) = cos (λx) pour f (0) = −λ2 ≤ 0 ou f (x) = ch (λx) pour f (0) = λ2 ≥ 0.
Lemme 13.7 Les seuls morphismes de groupes continus de (R, +) dans (Γ, ·) sont
les applications x → eiαx avec α ∈ R.
Preuve. Il est clair que pour tout α ∈ R l’application x → eiαx est un morphisme
de groupes continu de (R, +) dans (Γ, ·) . Réciproquement si f : R → Γ est un
morphisme de groupes, il existe alors un unique réel α ∈ [0, 2π[ tel que f (1) = eiα .
Par récurrence
on vérifie facilement que f (n)
= einα
pour tout n ∈ N, puis avec
n
1 1 1 α
eiα = f n = f on déduit que f = ei n pour tout n ≥ 1. Il
n n n
en résulte que f (r) = eirα pour tout r ∈ Q. Si de plus f est continue, avec la
densité de Q dans R, on déduit que f (x) = eiαx pour tout x ∈ R+ . Enfin avec
1 = f (x − x) = f (x) f (−x) (le neutre est transformé en neutre), on déduit que
1
f (−x) = = f (x) pour tout x ∈ R. Il en résulte que f (x) = eiαx pour tout
f (x)
x ∈ R.
Théorème 13.8.
Les seuls morphismes de groupes continus de (R, +) dans (C∗ , ·) sont les
applications x → eαx avec α ∈ C.
est alors un morphisme de groupes continu de (R, +) dans (Γ, ·) , il existe donc un
réel b tel que f (x) e−ax = eibx pour tout x ∈ R. On a donc f (x) = eαx pour tout
x ∈ R avec α = a + ib ∈ C. La réciproque est évidente.
∀x ∈ R+,∗ , Γ (x + 1) = xΓ (x)
Preuve. Une intégration par parties donne pour x > 0 et 0 < ε < R :
R R
6 7R
tx e−t dt = −tx e−t ε + x tx−1 e−t dt
ε ε
et le passage à la limite quand (ε, R) tend vers (0, +∞) donne le résultat.
+∞
Avec Γ (1) = e−t dt = 1, on déduit de cette équation fonctionnelle que
0
Γ (n + 1) = n! pour tout entier naturel n.
Une définition équivalente de la fonction gamma est donnée par le résultat
suivant.
n!nx
Lemme 13.9 (Euler) On a Γ (x) = lim pour tout x dans
n→+∞ x (x + 1) · · · (x + n)
R+,∗ .
Preuve. Pour x fixé dans R+,∗ , on désigne par (fn )n≥1 la suite de fonctions
définies sur ]0, +∞[ par :
⎧ n
⎪
⎨ 1− t tx−1 si t ∈ ]0, n[
fn (t) = n
⎪
⎩
0 si t ≥ n
la fonction f étant continue et intégrable sur ]0, +∞[ . On déduit alors du théorème
de convergence dominée que :
n n +∞
t
lim 1− tx−1 dt = e−t tx−1 dt = Γ (x)
n→+∞ 0 n 0
D’autre part, on a :
n n 1
t n
In (x) = 1− tx−1 dt = (1 − t) tx−1 nx dx = nx Jn (x)
0 n 0
n
n k+x−1 n k
n k t x n (−1)
In (x) = (−1) dt = n
0 k nk k k+x
k=0 k=0
0
2
Preuve. La fonction f : (x, t) → tx−1 e−t est indéfiniment dérivable sur (R+,∗ )
avec pour k ∈ N, [a, b] ⊂ R+,∗ (avec a < b) et x ∈ [a, b] :
k
∂kf k x−1 −t |ln (t)| ta−1 si 0 < t ≤ 1
(x, t) = |ln (t)| t e ≤ g k (t) =
|ln (t)| tb−1 e−t si t > 1
k
∂xk
a
la fonction gk étant intégrable R+,∗ (on a lim |ln (t)| t 2 = 0, donc pour t > 0
k
t→0
a a
assez petit on a |gk (t)| ≤ t 2 −1 , la fonction t 2 −1 étant intégrable sur ]0, 1[ et
t t t
lim |ln (t)| tb−1 e− 2 = 0, donc |gk (t)| ≤ e− 2 pour t assez grand, la fonction e− 2
k
t→+∞
étant intégrable sur ]1, +∞[). On en déduit alors que la fonction Γ est indéfiniment
dérivable sur R+,∗ et qu’on peut dériver sous le signe d’intégration.
366 Équations fonctionnelles
En faisant tendre n vers l’infini on déduit alors du lemme 13.9 que f (x) =
f (1) Γ (x) pour tout x ∈ ]0, 1] . En utilisant l’équation fonctionnelle f (x + 1) =
xf (x) vérifiée par les deux fonctions on déduit que f (x) = f (1) Γ (x) pour tout
x > 0.
e2 ∧ e3 = e1 , e1 ∧ e3 = −e2 , e1 ∧ e2 = e3
Avec le théorème qui suit nous résumons quelques propriétés du produit vecto-
riel qui nous seront utiles.
Théorème 13.10.
x | z y | z
4. Pour x, y, z, t dans E on a x ∧ y | z ∧ t = .
x | t y | t
2 2 2 2
5. Pour x, y dans E on a x ∧ y = x y − x | y . En particulier,
on a x ∧ y = x y si, et seulement si, x et y sont orthogonaux.
6. Si (f1 , f2 ) est un système orthonormé alors le système (f1 , f2 , f1 ∧ f2 )
est une base orthonormée directe de E.
7. Pour x, y, z dans E on a x ∧ (y ∧ z) = x | z y − x | y z (le produit
vectoriel n’est pas associatif).
8. Si x est un vecteur non nul dans E pour tout vecteur y ∈ E orthogonal
à x il existe un vecteur z ∈ E tel x ∧ z = y.
Preuve.
1. Se déduit des propriétés du déterminant.
2. Si le système (x, y) est lié il en de même de (x, y, ei ) pour i = 1, 2, 3 et
det (x, y, ei ) = 0 pour tout i, ce qui équivaut à x ∧ y = 0.
Si le système (x, y) est libre il se complète alors en une base (x, y, z) de E et
det (x, y, z) = x ∧ y | z = 0 entraîne x ∧ y = 0.
3. Avec x ∧ y | x = det (x, y, x) = 0, on déduit que x ∧ y est orthogonal à x.
Avec l’anti-symétrie du produit vectoriel on déduit que x ∧ y est également
orthogonal à y. Si x, y sont linéairement indépendants ils engendrent alors un
plan orthogonal à la droite engendrée par x ∧ y et le système (x, y, x ∧ y) est
une base de E.
4. Par 4-linéarité il suffit de vérifier la formule sur les vecteurs de base canonique,
ce qui ne pose pas de problème.
5. De la formule précédente, on déduit que :
2
2 x y | x 2 2 2
x ∧ y = 2 = x y − x | y
x | y y
6. f1 ∧ f2 est orthogonal à f1 et f2 et
2 2 2
det (f1 , f2 , f1 ∧ f2 ) = f1 ∧ f2 = f1 f2 = 1
7. Par 3-linéarité il suffit de vérifier la formule (de Grassmann) sur les vecteurs de
base canonique, ce qui ne pose pas de problème.
2 1
8. Si x | y = 0 alors x ∧ (y ∧ x) = x y et en posant z = 2 y ∧ x, on a
x
x ∧ z = y.
On rappelle qu’une application linéaire f : E → E est une rotation si, et
seulement si, f (x) | f (y) = x | y pour tous x, y dans E (f conserve le produit
scalaire) et det (f ) = 1. Il est encore équivalent de dire que f transforme une base
orthonormée directe en base orthonormée directe.
L’équation fonctionnelle f (x ∧ y) = f (x) ∧ f (y) sur R3 369
et du fait que f est un isomorphisme, cela peut s’écrire det (f (x) , f (y) , z) =
f (x ∧ y) | z pour tout z ∈ E. On a donc f (x ∧ y) = f (x) ∧ f (y) pour tous
vecteurs x, y dans E.
Dans ce qui suit nous allons montrer que les rotations sont les seules applications
non identiquement nulles de E dans E qui conservent le produit vectoriel.
Pour la suite de ce paragraphe, on se donne donc une application f : E → E
telle que :
∀ (x, y) ∈ E 2 , f (x ∧ y) = f (x) ∧ f (y) (13.5)
Avec f (0) = f (0) ∧ f (0) , on déduit que f (0) est orthogonal à lui même, donc
2
que f (0) = f (0) | f (0) = 0 et f (0) = 0.
Lemme 13.12 Si f s’annule en un vecteur x0 non nul, elle est alors identique-
ment nulle.
Lemme 13.13 Les vecteurs f (x) et f (y) sont liés si, et seulement si, les vecteurs
x et y le sont.
Preuve. On a :
Preuve. On sait déjà que les rotations sont solution de (13.5) et si f vérifie cette
équation fonctionnelle, elle est alors linéaire et transforme la base canonique en une
base orthonormée (les deux lemmes qui précèdent), f est donc un endomorphisme
orthogonal. Avec :
det (f ) = det (f (e1 ) , f (e2 ) , f (e3 )) = det (f (e1 ) , f (e2 ) , f (e1 ∧ e2 ))
2
= det (f (e1 ) , f (e2 ) , f (e1 ) ∧ f (e2 )) = f (e1 ) ∧ f (e2 ) > 0
on déduit que f est une rotation.
on constate que l’ensemble S des solutions de (13.6) est le noyau de ϕ, c’est donc
un sous-espace vectoriel de E. De plus le théorème de récurrence nous permet de
vérifier qu’un élément de S est uniquement déterminé par ces p premières valeurs
u0 , · · · , up−1 , soit plus précisément que l’application u → (u0 , · · · , up−1 ) réalise un
isomorphisme de S sur Cp . L’espace vectoriel S des solutions de (13.6) est donc
un espace vectoriel de dimension p.
On désigne par T l’opérateur linéaire de translation défini sur E par :
∀u ∈ E, T (u) : n → un+1
P (T ) ◦ Q (T ) = Q (T ) ◦ P (T ) = (P Q) (T )
p−1
En désignant par P (X) = X p − ak X k le polynôme caractéristique de (13.6) ,
k=0
on a ϕ = P (T ) .
Si λ1 , · · · , λr sont les racines deux à deux distinctes de multiplicités respectives
m1 , · · · , mr du polynôme P, on a alors :
⎧
⎪ 2r
⎪
⎨ P (X) =
m
(X − λk ) k
k=1
⎪ 2
r
⎪
⎩ ϕ = P (T ) =
m
(T − λk Id ) k
k=1
Lemme 13.18 (lemme des noyaux) Avec les notations qui précèdent, on a :
r
mk
S = ker (ϕ) = ker ((T − λk Id ) )
k=1
m
Preuve. On procède par récurrence sur r ≥ 2, en notant Pk (X) = (X − λk ) k
pour tout k compris entre 1 et r. Pour r = 2, les polynômes P1 et P2 sont premiers
entre eux et le théorème de Bézout dans C [X] nous dit qu’il existe deux polynômes
A et B tels que AP1 + BP2 = 1. On a alors A (T ) ◦ P1 (T ) + B (T ) ◦ P2 (T ) = Id
et pour tout y ∈ S = ker (ϕ) , on a :
avec :
Lemme 13.19 Pour tout entier naturel non nul m, le noyau de T m est formé des
suites nulles à partir du rang m.
Preuve. La suite u est dans ker (T m ) si, et seulement si, un+m = 0 pour tout
n ∈ N.
k
k−1
k i
avec (n + 1) − n = k
n , ce qui donne :
i=0
i
# $
k−1
k
(T − λId ) n k λn n∈N
=λ n i λn n∈N
i=0
i
k+1
# $
k−1
k
k
# $
(T − λId ) k n
n λ n∈N
=λ (T − λId ) n i λn n∈N
=0
i=0
i
On en déduit alors le résultat suivant.
Lemme 13.21 Soient λ un nombre complexe non nul et m un entier naturel non
m
nul. Le noyau de (T − λId ) est un espace vectoriel de dimension m engendré par
les suites u(k) : n → nk−1 λn (1 ≤ k ≤ m) .
374 Équations fonctionnelles
Preuve. Le lemme précédent nous dit que les suites u(k) , pour k compris entre 1 et
m
m, sont dans ker ((T − λId ) ) . De plus ces
suites sont linéairement
indépendantes.
m
m
En effet l’égalité αk u(k) = 0 équivaut à αk nk−1 λn = 0 pour tout n ∈ N,
k=1 k=1
m
ce qui équivaut à αk nk−1 = 0 puisque λ est non nul et tous les coefficients αk
k=1
m
sont nuls du fait que le polynôme αk X k−1 a une infinité de racines. L’espace
k=1
m
vectoriel ker ((T − λId ) ) étant de dimension m, le résultat en découle.
De ces lemmes on déduit en définitive le résultat suivant.
Théorème 13.12.
Avec les notations qui précèdent, les solutions de l’équation fonctionnelle
(13.6) , où le coefficient a0 est non nul (λ = 0 n’est pas racine du polynôme
r
caractéristique) sont les suites de la forme un = Qk (n) λnk où, pour
k=1
tout k compris entre 1 et r, Qk est une fonction polynomiale à coefficients
complexes de degré inférieur ou égal à mk − 1, ce qui revient à dire que
l’ensemble S des solutions de cette équation de récurrence est un C-espace
vectoriel de dimension p engendré par les suites :
n → nj λnk (1 ≤ k ≤ r, 0 ≤ j ≤ mk − 1)
Preuve. Le lemme des noyaux nous dit qu’une solution u ∈ S s’écrit de manière
%
p
unique u = u(k) , où pour tout k compris entre 1 et r, u(k) est dans le noyau de
k=1
m
(T − λk Id ) k . Le lemme précédent permet alors de conclure.
Dans le cas où les coefficients ak sont réels, les racines du polynôme caractéris-
tique sont stables par conjugaison complexe, c’est-à-dire que :
(
s
mk
(
t
mk mk
P (X) = (X − αk ) (X − λk ) X − λk
k=1 k=s+1
iθk
les αk étant réels et les λk = ρk e complexes non réels (dans le cas où il n’y a
pas de racines réelles [resp. complexes non réelles] le produit correspondant vaut
1) et on a le résultat suivant.
Théorème 13.13.
Les suites réelles solutions de l’équation récurrente (13.6) sont de la forme
s
t
t
un = Qk (n) αkn + Qk (n) ρnk cos (nθk ) + Rk (n) ρnk sin (nθk )
k=1 k=s+1 k=s+1
Preuve. En utilisant les formules d’Euler, on constate que les suites proposées
forment une base de l’espace des solutions complexes. Ces suites de base étant à
valeurs réelles, elles forment bien une base de l’espace des solutions réelles.
Cette méthode d’étude des équations récurrentes linéaires à coefficients constants
est analogue à celle utilisée pour la résolution d’équations différentielles linéaires
à coefficients constants d’ordre p (voir le chapitre 14).
13.12 Exercices
2
Solution. Avec f (x + y) = f (x) + f (y) pour tout (x, y) ∈ R on déduit que f
1
est impaire (et donc f (0) = 0) et avec f (x) f = 1 pour tout x ∈ R∗ que
x
f (x) = 0 pour tout x ∈ R∗ . Pour tout x ∈ R \ {0, 1} , on a :
1 1 1 1 1
f =f + =f +f
x (1 − x) x 1−x x 1−x
376 Équations fonctionnelles
Solution.
f (2x) + f (0)
1. L’équation (13.9) appliquée à (2x, 0) pour x ∈ R donne f (x) =
2
ou encore f (2x) = 2f (x) − f (0) .
2. Pour (x, y) ∈ R2 on a :
2x + 2y f (2x) + f (2y) g (2x) + g (2y)
g (x + y) = f − f (0) = − f (0) =
2 2 2
et pour x ∈ R on a g (2x) = f (2x) − f (0) = 2 (f (x) − f (0)) = 2g (x) . On a
donc g (x + y) = g (x) + g (y) .
3. Si f est monotone [resp. continue à droite en 0] il en est alors de même de g,
donc g (x) = ax et f (x) = ax + b avec b = f (0) .
2. Montrer que pour tout couple de réels (x, y) et tout couple d’entiers (n, k)
tels n ∈ N et 0 ≤ k ≤ 2n , on a :
k k
f x + n (y − x) = f (x) + n (f (y) − f (x))
2 2
Solution.
1. Pour (x, y) ∈ R2 on définit la suite (xn )n∈N par x2k = x et x2k+1 = y pour tout
k ∈ N. Avec :
2n
n
1 1
n−1
x+y
xk = x2k + x2k+1 =
2n 2n 2
k=1 k=1 k=0
2n+1
1 1
n
n
n (x + y) y
xk = x2k + x2k+1 = +
2n + 1 2n + 1 2n + 1 2n + 1
k=1 k=1 k=0
x+y
on déduit que cette suite converge au sens de Cesàro vers et donc la suite
2
x+y
(f (xn ))n∈N converge au sens de Cesàro vers f . On a donc :
2
2n
x+y 1 f (x) + f (y)
f = lim f (xk ) =
2 n→+∞ 2n 2
k=1
kn
f (zn ) = f (x) + (f (y) − f (x))
2n
on constate que cette suite converge au sens usuel et donc au sens de Cesàro
vers f (x) + λ (f (y) − f (x)) . Avec l’unicité de la limite, on peut donc conclure
que f (x + λ (y − x)) = f (x) + λ (f (y) − f (x)) . On a donc ainsi montré que
la fonction f est convexe sur R et en conséquence elle est continue (corollaire
8.2). En définitive f est continue et vérifie l’équation de Jensen, c’est donc une
fonction affine (exercice 13.3).
Solution.
∗ 2
1. Tout z ∈ C peut
s’écrire z= u2 avec u ∈ C∗ et f (z) = (f (u)) ≥ 0. De plus
1 1
avec 1 = f z = f (z) f , on déduit que f (z) > 0 pour tout z ∈ C∗ .
z z
2. La restriction g de f à R+,∗ est continue en 1 et vérifie l’équation fonctionnelle
g (xy) = g (x) g (y) , il en résulte que g est une fonction exponentielle, c’est-à-
dire qu’il existe un réel α tel que f (x) = xα pour tout x ∈ R+,∗ . Si de plus
Exercices 379
1
p−1
un+p = un+k (13.10)
p
k=0
Solution.
p−1
1. Le polynôme caractéristique de (13.10) est donné par P (X) = pX p − Xk.
k=0
On vérifie facilement que P (1) = 0 et P (1) = 0, c’est-à-dire que 1 est
racine simple de P. Si z = ρeiθ est une racine de P avec ρ > 0 (0 n’est
p−1
pas racine) et θ est dans [0, 2π[ , on a alors pρp eipθ = ρk eikθ , ou encore
k=0
p−1
p−1
1 − ρk−p ei(k−p)θ = 0 qui équivaut à 1 − ρk−p cos ((k − p) θ) = 0. Si
k=0 k=0
ρ > 1, on a alors ρk−p cos ((k − p) θ) ≤ ρk−p < 1 pour tout k compris entre 0 et
p − 1 et z = ρeiθ n’est pas racine de P. Si ρ = 1, l’équation P (z) = 0 équivaut
à 1 − cos ((k − p) θ) = 0 pour tout k compris entre 0 et p − 1 (tous les termes de
380 Équations fonctionnelles
p−1
p−1
p (p + 1)
v0 = lim vn = (k + 1) lim un+k = α (k + 1) = α
n→+∞ n→+∞ 2
k=0 k=0
2v0 2 p−1
et α = = (k + 1) ak .
p (p + 1) p (p + 1)
k=0
Chapitre 14
Équations différentielles
linéaires
Dans le cas où la fonction a est constante il est facile de montrer qu’une solution
définie sur R et non identiquement nulle de l’équation différentielle y = ay ne
s’annule jamais (exercice 14.1).
Théorème 14.1.
Les solutions sur l’intervalle I de l’équation différentielle y = ay sont
les fonctions définies par :
x
∀x ∈ I, y (x) = λ exp a (t) dt
x0
et y est solution de (14.2) sur I si, et seulement si, z (x) = 0 pour tout x ∈ J, ce
qui équivaut à dire que z est une fonction constante sur l’intervalle I. On a donc
z = λ ∈ R pour toute solution sur I de (14.2) et y = λeA .
Ce théorème peut s’exprimer en disant que l’ensemble des solutions de (14.2)
est un espace vectoriel de dimension 1 engendré par la solution particulière eA .
Ce théorème nous montre également que si y est une solution non identiquement
nulle de (14.2) , elle ne s’annule alors jamais sur I et en conséquence garde un
signe constant. De manière pratique la résolution de cette équation peut se faire
en écrivant :
y
y = ay ⇔ = a ⇔ (ln (|y|)) = a ⇔ y = λeA
y
où y est une solution non nulle.
Dans le cas particulier où a est une fonction constante sur I = R, les solutions
de l’équation y = ay sont les fonctions définies sur R par y (x) = λea(x−x0 ) = γeax .
Pour la résolution de l’équation avec second membre (14.1) , on dispose du
résultat suivant.
Théorème 14.2.
Les solutions sur l’intervalle I de l’équation différentielle y = ay +b sont
les fonctions définies par :
x
∀x ∈ I, y (x) = u (x) + λ exp a (t) dt
x0
Preuve. Si u est une solution particulière sur I de (14.1) , alors pour toute autre
solution y, la fonction v = y − u est solution de y = ay et le résultat se déduit du
théorème précédent.
Exemples 14.1
1. Dans le cas où la fonction a est constante et le second membre est de la forme
b (x) = P (x) eαx , la fonction P étant polynomiale de degré n ≥ 0 et α étant
une constante réelle (ou complexe), on cherche une solution particulière de la
forme u (x) = Q (x) eαx avec Q polynomiale. L’équation u = au + b est alors
équivalente à Q + (α − a) Q = P. Si α = a, on peut chercher Q de même degré
que P et les coefficients du polynôme Q (dans la base canonique de R [X]) sont
solutions d’un système triangulaire dont les coefficients diagonaux sont tous
égaux à α − a. Si α − a = 0 alors Q = P et Q est de degré deg (P ) + 1.
2. Dans le cas où la fonction a est constante et le second membre est de la forme
b (x) = P (x) eαx + Q (x) eβx (ou une somme de p ≥ 2 fonctions de la forme
P (x) eαx ), les fonctions P, Q étant polynomiales et α, β étant des constantes
réelles (ou complexes), on cherche une solution particulière à chacune des équa-
tions y = ay+P eαx et y = ay+Qeβx , puis en faisant la somme de ces solutions
on obtient une solution particulière de y = ay + b.
3. Soit à résoudre l’équation y −y = cos (x) . Les solutions de l’équation homogène
eix + e−ix
associée sont de la forme y (x) = λex . En écrivant que cos (x) = , on
2
±ix
e
cherche des solutions particulières pour chacune des équations y − y = ,
2
1
ce qui donne u (x) = qeix , (±i − 1) q = et on obtient la solution particulière
2
sin (x) − cos (x)
.
2
Dans le cas où une solution particulière de (14.1) ne peut être trouvée de manière
évidente, on peut utiliser la méthode de Lagrange dite de variation de la constante.
x
Le réel x0 étant fixé dans I, on dispose de la fonction v : x → exp a (t) dt
x0
qui est une solution particulière de l’équation homogène (14.2) et cette fonction
ne s’annule jamais sur I. On peut alors associer à toute fonction y dérivable sur I
y (x)
la fonction λ définie par λ (x) = . Cette fonction est dérivable sur I avec :
v (x)
v (x) y (x) − v (x) y (x) v (x) y (x) − a (x) v (x) y (x)
∀x ∈ I, λ (x) = 2
=
v (x) v 2 (x)
et y est solution de (14.1) sur I si, et seulement si, λ est solution sur I de :
v (x) (a (x) y (x) + b (x)) − a (x) v (x) y (x) b (x)
λ (x) = =
v 2 (x) v (x)
b
ce qui équivaut à dire que λ est une primitive de sur I, soit :
v
x
b (t)
∀x ∈ I, λ (x) = dt + μ = λ0 (x) + μ
x0 v (t)
384 Équations différentielles linéaires
Preuve. Une solution de (14.1) s’écrit y = u + λv, où u est une solution parti-
culière
de (14.1)et v la solution de l’équation homogène (14.2) définie par v (x) =
x
exp a (t) dt . La condition y (x0 ) = y0 est alors équivalente à λ = y0 −u (x0 ) ,
x0
ce qui définit parfaitement la fonction y.
Dans le cas d’une équation différentielle linéaire de la forme αy + βy + γ = 0
où α, β, γ sont des fonctions continues de I dans R (ou dans C), la fonction α
s’annulant sur l’intervalle I, le théorème 14.2 et le corollaire 14.1 ne s’appliquent
pas comme le montrent les exemples suivants.
Exemples 14.2
1. Considérons l’équation différentielle homogène x2 y − y = 0 sur R. Sur R+,∗
1
[resp. R−,∗ ] cette équation a pour solution particulière x → e− x , on en déduit
donc que si y est solution sur R de x2 y − y = 0, il existe alors deux constantes
λ, μ telles que : 1
λe− x si x > 0
y (x) = 1
μe− x si x < 0
1
Tenant compte de y (0) = 0 (déduit de x2 y − y = 0) et lim e− x = +∞, on
x→0−
déduit que la constante μ est nécessairement nulle. Réciproquement la fonction
définie sur R par : 1
λe− x si x ≥ 0
y (x) =
0 si x < 0
est dérivable et solution de l’équation différentielle et la valeur de y (x0 ) avec
x0 < 0 ne peut être imposée. Par exemple, il n’existe pas de solution telle que
y (−1) = 1.
Équations différentielles linéaires d’ordre 2 à coefficients constants 385
est bien dérivable pour n ≥ 2 (si n = 1 on a alors yg (0) = μ, yd (0) = λ et
y n’est pas dérivable en 0 si λ = μ) et solution de l’équation différentielle. En
définitive la solution générale sur R de cette équation différentielle s’écrit en
utilisant deux paramètres réels et la seule connaissance de y (x0 ) n’assure pas
l’unicité de la solution. Cette unicité est assurée par la donnée de deux valeurs
y (x0 ) et y (x1 ) où x0 , x1 sont non nuls et de signes contraires.
Lemme 14.1 Pour λ dans C, la fonction x → eλx est solution sur R de l’équation
différentielle (14.4) si, et seulement si, λ est solution de l’équation polynomiale :
aλ2 + bλ + c = 0 (14.5)
Preuve. Si pour λ ∈ C on note y la fonction définie sur R par y (x) = eλx , cette
fonction est alors indéfiniment dérivable et pour tout réel x, on a :
et y est solution sur R de (14.4) si, et seulement si, λ est solution de (14.5) .
Avec les notations qui précèdent on dit que l’équation (14.5) est l’équation
caractéristique de (14.4) ou que le polynôme P = aX 2 + bX + c est le polynôme
caractéristique de (14.4) . On note Δ = b2 − 4ac le discriminant de P.
Sur C l’équation (14.5) a au moins une solution λ et la fonction u : x → eλx
est une solution particulière de (14.4) qui ne s’annule jamais. On utilise alors la
méthode de variation de la constante pour en déduire toutes les solutions de (14.4) .
Pour ce faire, on associe à toute fonction y deux fois dérivable de R dans C, la
y (x)
fonction z définie par z (x) = = e−λx y (x) . Cette fonction z est deux fois
u (x)
dérivable sur R et on a pour tout réel x :
⎧
⎨ y (x) = z (x) eλx
y (x) = (z (x) + λz (x)) eλx
⎩
y (x) = z (x) + 2λz (x) + λ2 z (x) eλx
et :
ay (x) + by (x) + cy (x) = (az (x) + P (λ) z (x) + P (λ) z (x)) eλx
= (az (x) + P (λ) z (x)) eλx
est une autre constante complexe. Les solutions de (14.4) sont alors les fonctions
y définies sur R par y (x) = eλx z (x) = (α + βx) eλx .
Soit Δ = 0 et l’équation caractéristique (14.5) a deux racines complexes dis-
2aλ1 +b
tinctes λ1 , λ2 et le lemme utilisé avec λ = λ1 donne Z (x) = γe− a x . En
b 2aλ1 + b b
remarquant que − = λ1 + λ2 , on a = 2λ1 + = λ1 − λ2 et :
a a a
z (x) = γe(λ2 −λ1 )x
γ
z (x) = e(λ2 −λ1 )x + α = βe(λ2 −λ1 )x + α
λ2 − λ1
Ce théorème est un cas particulier d’un résultat plus général qui est le théorème
de Cauchy-Lipschitz pour les équations différentielles linéaires d’ordre n (à coef-
ficients non nécessairement constant). Précisément, le théorème précédent peut
aussi se traduire comme suit.
Corollaire 14.2. Soient a, b, c des constantes complexes avec a non nul.
L’ensemble des solutions définies sur R et à valeurs complexes de l’équation
différentielle ay + by + cy = 0 est un C-espace vectoriel de dimension 2.
Pour tous x0 ∈ R et y0 , z0 dans C, cette équation différentielle admet une
unique solution définie sur R et qui vérifie les conditions initiales y (x0 ) =
y0 , y (x0 ) = z0 .
est non nul (il vaut e(λ1 +λ2 )x0 (λ2 − λ1 ) dans le cas où Δ = 0 et e2λx0 dans le cas
où Δ = 0).
La méthode de variation de la constante peut être utilisée dans le cas d’une
équation différentielle linéaire d’ordre 2 à coefficients non constants, ay +by +cy =
0, la fonction a ne s’annulant pas sur un intervalle I. Si on dispose d’une solution
y
particulière u qui ne s’annule pas sur I, alors la dérivée z de la fonction z =
u
est solution d’une équation différentielle linéaire d’ordre 1, ce qui nous ramène à
des calculs de primitives.
Dans le cas où les coefficients a, b, c sont réels et où on s’intéresse aux solutions
à valeurs réelles, on a le résultat suivant.
Théorème 14.4.
Si les coefficients a, b, c de l’équation (14.4) sont réels, avec a non nul,
on a les trois possibilités suivantes.
Soit Δ est strictement positif et alors, en notant λ1 , λ2 les solutions réelles
(distinctes) de l’équation caractéristique (14.5) , les solutions définies sur
R et à valeurs réelles de l’équation différentielle (14.4) sont les fonctions
définies sur R par y (x) = αeλ1 x + βeλ2 x , où α, β sont deux constantes
réelles.
Soit Δ est nul et alors, en notant λ la racine double de (14.5) , les solutions
définies sur R et à valeurs réelles de (14.4) sont les fonctions définies sur
R par y (x) = (αx + β) eλx , où α, β sont deux constantes réelles.
Soit Δ est strictement négatif et alors, en notant λ = u + iv, λ = u − iv les
solutions complexes conjuguées de (14.5) avec (u, v) ∈ R × R∗ , les solutions
définies sur R et à valeurs réelles de (14.4) sont les fonctions définies sur
R par y (x) = (α cos (vx) + β sin (vx)) eux , où α, β sont deux constantes
réelles.
avec α, β réels.
Comme dans le cas complexe, en vérifiant que les fonctions qui interviennent
dans l’expression des solutions sont linéairement indépendantes, on déduit le ré-
sultat suivant.
Corollaire 14.3. Soient a, b, c des constantes réelles. L’ensemble des
solutions définies sur R et à valeurs réelles de l’équation différentielle
ay + by + cy = 0 est un R-espace vectoriel de dimension 2. Pour tous
x0 ∈ R et y0 , z0 dans R, cette équation différentielle admet une unique
solution définie sur R et qui vérifie les conditions initiales y (x0 ) = y0 ,
y (x0 ) = z0 .
On peut remarquer que si f est une telle solution, f (n) est alors combinaison
linéaire des f (k) avec k compris entre 0 et n − 1, ce qui entraîne que f (n) est
dérivable sur R. Par récurrence, on en déduit facilement que la fonction f est en
fait indéfiniment dérivable sur R.
En notant ϕ l’endomorphisme de l’espace vectoriel C ∞ (R, C) des fonctions in-
n
définiment dérivables de R dans C défini par ϕ (y) = ak y (k) , on constate que
k=0
l’ensemble S des solutions de (14.7) est le noyau de ϕ, c’est donc un sous-espace
vectoriel de C ∞ (R, C) .
390 Équations différentielles linéaires
Dans ce qui suit, on note D l’opérateur de dérivation qui associe à toute fonction
y ∈ C ∞ (R, C) sa dérivée. Cet opérateur est un endomorphisme de C ∞ (R, C) et on
peut définir ses itérés Dk par D0 = Id et Dk+1 = Dk ◦ D pour tout k ∈ N (pour
q
tout y ∈ C ∞ (R, C) , on a Dk (y) = y (k) ). À tout polynôme Q (X) = αk X k dans
k=0
%
q
C [X] on peut associer l’opérateur différentiel Q (D) = k
αk D et il est facile de
k=0
vérifier que si Q, R, sont deux polynômes alors Q (D) ◦ R (D) = R (D) ◦ Q (D) =
n
(QR) (D) . En particulier, on a ϕ = P (D) , où P (X) = ak X k est le polynôme
k=0
caractéristique de (14.7) . En notant λ1 , · · · , λp les racines deux à deux distinctes
de multiplicités respectives m1 , · · · , mp de ce polynôme P, on a :
⎧
⎪ 2
p
⎪
⎨ P (X) = an (X − λk ) k
m
k=1
⎪ 2
p
⎪
⎩ ϕ = P (D) = an
m
(D − λk Id ) k
k=1
Lemme 14.3 (Lemme des noyaux) Avec les notations qui précèdent, on a :
p
mk
S = ker (ϕ) = ker ((D − λk Id ) )
k=1
m
Preuve. On procède par récurrence sur p ≥ 2, en notant Pk (X) = (X − λk ) k
pour tout k compris entre 1 et p. Pour p = 2, les polynômes P1 et P2 sont premiers
entre eux et le théorème de Bézout dans C [X] nous dit qu’il existe deux polynômes
A et B tels que AP1 + BP2 = 1. On a alors A (D) ◦ P1 (D) + B (D) ◦ P2 (D) = Id
et pour tout y ∈ S = ker (ϕ) , on a :
avec y2 = (A (D) ◦ P1 (D)) (y) dans ker (P2 (D)) et y1 = (B (D) ◦ P2 (D)) (y) dans
ker (P1 (D)) (commutativité de C [D]). Donc S = ker (P1 (D)) + ker (P2 (D)) , l’in-
clusion ker (P1 (D))+ker (P2 (D)) ⊂ S étant évidente. De l’égalité (14.8) on déduit
immédiatement que ker (P1 (D)) ∩ ker#(P2 (D)) = {0} $ . On a donc bien la somme
m1 m2
directe, S = ker ((D − λ1 Id ) ) ⊕ ker (D − λ2 Id ) . On conclut par récurrence
sur p en considérant que si P1 est premier avec P2 , · · · , Pp il est alors premier avec
leur produit.
La détermination de S passe donc par celle des noyaux des endomorphismes
m
(D − λk Id ) k , ce qui revient à résoudre, pour tout scalaire λ et tout entier naturel
m
non nul m, l’équation différentielle (D − λId ) (y) = 0
Lemme 14.4 Soient λ un nombre complexe et m un entier naturel non nul. Les
m
solutions sur R de l’équation différentielle (D − λId ) (y) = 0 forment un espace
Équations différentielles linéaires d’ordre n à coefficients constants 391
yk : x → xk eλx (0 ≤ k ≤ m − 1)
m−1
x → y (x) = P (x) eλx = αk xk eλx
k=0
les αk étant des constantes complexes. Considérant que les fonction xk eλx , pour k
compris entre 0 et m − 1, sont linéairement indépendantes, on en déduit le résultat
annoncé.
On déduit de ces lemmes le résultat suivant.
Théorème 14.5.
Les solutions définies sur R et à valeurs complexes de l’équation diffé-
p
rentielle (14.7) sont de la forme x → y (x) = eλk x Pk (x) , où pour tout
k=1
k compris entre 1 et p, Pk est une fonction polynomiale à coefficients com-
plexes de degré inférieur ou égal à mk −1, ce qui revient à dire que l’ensemble
S des solutions de cette équation est un C-espace vectoriel de dimension n
engendré par les fonctions :
x → xj eλk x (1 ≤ k ≤ p, 0 ≤ j ≤ mk − 1)
Preuve. Le lemme des noyaux nous dit qu’une solution y ∈ S s’écrit de manière
p
unique y = yk , où pour tout k compris entre 1 et p, yk est solution de l’équation
k=1
m
différentielle (D − λk Id ) k (y) = 0. Le lemme précédent permet alors de conclure.
Dans le cas où les coefficients ak sont réels, les racines du polynôme caractéris-
tique sont stables par conjugaison complexe, c’est-à-dire que :
(
r
mk
(
s
mk mk
P (X) = an (X − αk ) (X − λk ) X − λk
k=1 k=r+1
les αk étant réels et les λk = βk + iγk complexes non réels avec βk , γk réels (dans
le cas où il n’y a pas de racines réelles [resp. complexes non réelles] le produit
correspondant vaut 1) et on a le résultat suivant qui généralise le théorème 14.4.
392 Équations différentielles linéaires
Théorème 14.6.
Les solutions définies sur R et à valeurs réelles de l’équation différentielle
(14.7) sont de la forme :
r
s
y (x) = eαk x Pk (x) + eβk x cos (γk x) Pk (x)
k=1 k=r+1
s
+ eβk x sin (γk x) Qk (x)
k=r+1
Preuve. En utilisant les formules d’Euler, on constate que les fonctions proposées
forment une base de l’espace des solutions complexes. Ces fonctions de base étant
à valeurs réelles elles forment bien une base de l’espace des solutions réelles.
L’étude de ces systèmes différentiels est faite en détail dans [21]. On y montre
en particulier le résultat suivant.
Théorème 14.7. Cauchy-Lipschitz linéaire
Si (y1 , · · · , yn ) est une base de l’espace vectoriel des solutions sur I de l’équa-
tion sans second membre associée à (14.9) et u une solution particulière de cette
%n
équation, alors toute solution de (14.9) est de la forme y = λk yk + u, où les
k=1
λk , pour k compris entre 0 et n sont des constantes réelles.
La recherche d’une solution particulière de (14.9) peut se faire en utilisant la
méthode de variation des constantes (ou méthode de Lagrange). À partir d’une
base (y1 , · · · , yn ) de l’espace vectoriel des solutions sur I de l’équation sans second
membre associée à (14.9) , on obtient une base (Y1 , · · · , Yn ) de l’espace vectoriel
des solutions sur I du système différentiel Y (x) = A (x) Y (x) (en utilisant les
notations du début de ce paragraphe) et la fonction vectorielle Y définie sur I par
n
Y (x) = λk (x) Yk (x) , où les λk sont des fonctions dérivables de I dans R, est
k=1
solution particulière sur I du système différentiel Y (x) = A (x) Y (x) + B (x) si,
et seulement si, pour tout x ∈ I, le vecteur (λ1 (x) , · · · , λn (x)) est solution du
n
système linéaire λk (x) Yk (x) = B (x) . On aura donc une solution particulière
k=1
394 Équations différentielles linéaires
%
n
et en posant y (x) = λk (x) yk (x) , les λk étant des primitives des λk .
k=1
Le déterminant de ce système linéaire est le wronskien :
y + ay + by = c (14.12)
∀t ∈ I ∩ ]x0 − η, x0 + η[ , f (t) = 0
Preuve. Comme les zéros de u sont isolés dans I, on peut parler de zéros consé-
cutifs.
Première démonstration – On suppose que u a au moins deux zéros dans I et
on note x1 < x2 deux zéros consécutifs de u. La fonction u n’étant pas la fonction
nulle, on a u (x1 ) = 0 et u (x2 ) = 0. On a u (x) = 0 pour tout x ∈ ]x1 , x2 [ et
quitte à changer u en −u, on peut supposer que u (x) > 0 pour tout x ∈ ]x1 , x2 [ .
Il en résulte que :
u (x) u (x)
u (x1 ) = x→x
lim > 0, u (x2 ) = x→x
lim <0
1
x>x1
x − x1 x<x2
1 x − x
2
avec u (x1 ) > 0 et u (x2 ) < 0, ce qui implique v (x1 ) < 0 et v (x2 ) > 0. Le
théorème des valeurs intermédiaires nous dit alors qu’il existe x3 ∈ ]x1 , x2 [ tel que
v (x3 ) = 0. Si v s’annule en un autre point x4 dans ]x1 , x2 [ , le raisonnement qui
précède nous dit alors que u doit s’annuler en un point strictement compris entre
x3 et x4 , ce qui contredit le fait que u ne s’annule pas sur ]x1 , x2 [ . En définitive,
v s’annule en un unique point de ]x1 , x2 [ .
Deuxième démonstration – Le wronskien w ne s’annulant pas sur I, on déduit
de w (xj ) = −u (xj ) v (xj ) pour j = 1 et j = 2, que v ne s’annule ni en x1 ni en x2 .
# u $ w (x)
On supposant que v ne s’annule pas sur ]x1 , x2 [ , avec (x) = − 2 = 0 et
v v (x)
Racines des solutions d’une équation différentielle linéaire d’ordre 2 397
u
la continuité de w et v, on déduit que est strictement monotone sur [x1 , x2 ] nulle
v
en x1 et x2 , elle est donc identiquement nulle sur cet intervalle et en conséquence
la fonction u est nulle sur tout I (en un point x ∈ ]x1 , x2 [ on a u (x) = u (x) = 0 et
u est solution d’une équation linéaire d’ordre 2), ce qui contredit le fait que (u, v)
est un système fondamental de solutions de (14.11) .
Le théorème précédent peut aussi se déduire du résultat plus général suivant.
Théorème 14.11.
Soient a, b, c des fonctions continues de I dans R telles que b (x) ≤ c (x)
pour tout x dans I, u une solution non identiquement nulle de l’équation
différentielle y + ay + by = 0 et v une solution non identiquement nulle
de l’équation différentielle y + ay + cy = 0. On suppose que u a au moins
deux zéros dans I. Si x1 < x2 sont deux zéros consécutifs de u dans I et si
les fonctions u et v ne sont pas proportionnelles dans ]x1 , x2 [ , alors v a au
moins un zéro dans ]x1 , x2 [ .
w = uv − u v = −aw + (b − c) uv
x
En définissant la fonction d par d (x) = exp a (t) dt , où x0 ∈ I, on a d = ad
x0
et dw + adw = d (b − x) uv, ce qui s’écrit (dw) = d (b − c) uv. Avec d (x) > 0,
u (x) > 0, v (x) > 0 et b (x) ≤ c (x) pour tout x dans ]x1 , x2 [ , on en déduit que la
fonction dw est continue décroissante sur ]x1 , x2 [ avec w (x1 ) ≥ 0 et w (x2 ) ≥ 0, ce
qui entraîne :
où on a noté :
⎛ ⎞
0 1 0 ··· 0 ⎛ ⎞
⎜ 0 ⎟ 0
⎜ 0 1 ··· 0 ⎟ ⎜ .. ⎟
⎜ .. .. ⎟ ⎜ ⎟
A0 = ⎜ . . . . . ⎟ ∈ Mp (C) , Bn = ⎜ . ⎟ ∈ Cp
⎜ ⎟ ⎝ 0 ⎠
⎝ 0 0 ··· 0 1 ⎠
bn
a0,0 a1,0 ··· ap−2,0 ap−1,0
400 Équations différentielles linéaires
l’espace vectoriel Cp étant muni d’une quelconque norme notée · et Mp (C) de
la norme subordonnée également notée · (pour simplifier).
Théorème 14.12.
Pour tout vecteur Y0 ∈ Cp , le problème de Cauchy :
Y (x) = A (x) Y (x) + B (x)
(14.14)
Y (0) = Y0
+∞
Preuve. Si une telle solution, Y : x ∈ ]−R, R[ → Y (x) = xn Cn ∈ Cn existe,
n=0
on a alors C0 = Y (0) = Y0 et pour tout x ∈ ]−R, R[ :
+∞
+∞
Y (x) = nxn−1 Cn = (n + 1) xn Cn+1
n=1 n=0
+∞
n
n
A (x) Y (x) = x Ak Cn−k
n=0 k=0
L’analyse du problème qui vient d’être faite nous conduit à introduire la suite
de vecteurs (Cn )n∈N définie par la relation de récurrence (14.15) et il s’agit de
montrer que la série entière xn Cn a un rayon de convergence au moins égal à
R, puis que sa somme est solution de (14.14) .
+∞
+∞
On se fixe r ∈ ]0, R[ et on note α (r) = An rn , β (r) = Bn rn (ces
n=0 n=0
réels sont bien définis puisque les séries rn An et rn Bn sont normalement
r (α (r) + β (r))
convergentes). Comme lim = 0, il existe un entier naturel n (r)
n→+∞ n+1
Équations différentielles linéaires à coefficients développables en série entière 401
tel que :
r (α (r) + β (r))
∀n > n (r) , ≤1
n+1
et on note M (r) = max max Ck rk , 1 . On vérifie alors,par récurrence sur
0≤k≤n(r)
n, que :
M (r)
∀n ≥ 0, Cn ≤
rn
ce qui prouvera que le rayon de convergence de la série xn Cn est au moins égal
à R (ce rayon de convergence est sup r ∈ R+ | (rn Cn )n∈N est bornée ).
Pour k compris entre 0 et n (r) , on a Ck rk ≤ M (r) par définition de M (r) .
En supposant le résultat acquis jusqu’au rang n ≥ n (r) , on a :
n
1
(n + 1) Cn+1 ≤ n Ak r Cn−k r
k n−k
+ Bn r n
r
k=0
1 n
≤ n M (r) Ak rk + Bn rn
r
k=0
1 M (r)
≤ n (M (r) α (r) + β (r)) ≤ (α (r) + β (r))
r rn
+∞
M (r) r (α (r) + β (r)) M (r)
soit Cn+1 ≤ ≤ . La fonction Y : x →
xn Cn est
rn+1 n+1 rn+1 n=0
donc bien définie sur ]−R, R[ et la définition des coefficients Cn nous assure que
cette fonction est solution de (14.14) . L’unicité d’une telle solution a été prouvée
avec l’analyse du problème.
a une unique solution qui est développable en série entière sur ]−R, R[ .
Exemple 14.2 On peut définir la fonction sin sur R comme la solution du pro-
blème de Cauchy :
y = −y
y (0) = 0, y (0) = 1
Le corollaire précédent nous dit qu’il existe une unique solution réelle qui est dé-
+∞
veloppable en série entière sur R. En notant y (x) = an xn cette solution, on a
n=0
+∞
y (x) = (n + 2) (n + 1) an+2 xn et la suite (an )n∈N est définie par la relation
n=0
de récurrence :
a0 = 0, a1 = 1
∀n ≥ 0, (n + 2) (n + 1) an+2 + an = 0
402 Équations différentielles linéaires
a2p−1
ce qui nous donne a2p = 0 pour tout p ≥ 0 et a2p+1 = − pour tout
(2p + 1) 2p
p
(−1)
p ≥ 1, ce qui est encore équivalent à a2p+1 = (vérification immédiate par
(2p + 1)!
récurrence). La solution cherchée est donc la fonction y définie sur R par y (x) =
+∞
n
(−1)
x2n+1 . C’est la fonction sin . La fonction cos est définie comme la
n=0
(2n + 1)!
dérivée de sin .
Les séries entières peuvent aussi être utilisées pour déterminer des solutions
d’équations différentielle linéaire à coefficients non constants, développables en
série entière au voisinage de 0, de la forme :
la fonction ap pouvant s’annuler en 0. Cette méthode est illustrée par les exercice
14.7 et 14.8.
Inversement, on peut trouver le développement en série entière d’une fonction
en écrivant cette fonction comme solution d’une équation différentielle (exercices
14.9, 14.10 et 14.11).
14.7 Exercices
Solution. Soit f une solution définie sur R et non identiquement nulle de l’équa-
tion différentielle y = y.
De f = f on déduit facilement que f est indéfiniment dérivable sur R avec
(n)
f = f pour tout n ∈ N. Si f n’est pas la fonction nulle il existe alors un réel
b tel que f (b) = 0. Supposons qu’il existe un réel a = b tel que f (a) = 0. On
a alors f (n) (a) = 0 pour n ∈ N et la formule de Taylor à l’ordre n entre a et b
f (n) (cn ) n
s’écrit f (b) = (b − a) où cn est un réel strictement compris entre a et b.
n!
f (cn )
Tenant compte de f (n) = f, on a f (b) =
n
(b − a) et en utilisant le fait que
n!
la fonction continue f est bornée sur le segment d’extrémités a, b, on déduit qu’il
n
|b − a|
existe une constante M > 0 telle que |f (b)| ≤ M pour tout n ∈ N. Faisant
n!
tendre n vers l’infini, on en déduit que f (b) = 0, ce qui contredit l’hypothèse de
départ. En définitive la fonction f ne s’annule jamais sur R.
Une autre solution, en ajoutant l’hypothèse y (0) = 1, consiste à utiliser la
fonction g définie sur R par g (x) = f (x) f (−x) . Cette fonction est dérivable
avec :
elle est donc constante non nulle si f (0) = 0 et f ne s’annule jamais sur R. Par
continuité, on peut préciser que f garde un signe constant.
Solution.
1. On a vu avec l’exemple 14.1 que la fonction f est définie par :
x
2 2
∀x ∈ R, f (x) = et −x dt
0
3 x2 + x y + (8x + 3) y + 2y = 0 (14.16)
Solution.
+∞
1. Supposons qu’il existe une série entière y (x) = an xn de rayon de conver-
n=0
gence R > 0 solution de (14.16) , on a alors, pour tout x ∈ ]−R, R[ :
+∞
+∞
y (x) = nan xn−1 , y (x) = n (n − 1) an xn−2
n=1 n=2
et (14.16) donne :
3n − 1
∀n ∈ N − {0} , an = − an−1
3n
soit :
2
n 1
(
n −k
n 3k − 1 k=1 3
∀n ∈ N − {0} , an = (−1) a0 = a0 .
3k n!
k=1
+∞
On considère donc la fonction f définie sur I = ]−1, 1[ par f (x) = an xn , où
n=0
2
n 1
−k
3
a0 = 1 et an = k=1 pour n ≥ 1 (le rayon de convergence de cette série
n!
an+1
entière est égal à 1 du fait que lim = 1) et on définit ainsi une fonction
n→+∞ an
de classe C ∞ sur I développable en série entière en 0 solution de (14.16) avec
an+1 xn+1 3n + 2 1 1
f (0) = 1. Pour x = −1 on a = = 1− +O . On en dé-
an x n 3n + 3 3n n2
λ
duit qu’il existe λ > 0 tel que an xn 1 (théorème de Raabe-Duhamel 11.12)
n3
(n
n 1 n
et la série diverge. Pour x = 1 on a an = (−1) 1− = (−1) αn .
3k
k=1
406 Équations différentielles linéaires
n
3n − 1 1
En remarquant que αn = αn−1 < αn−1 et ln (αn ) = ln 1 −
3n 3k
k=1
1 1
avec ln 1 − − , on déduit que lim ln (αn ) = −∞ c’est-à-dire que
3k 3k n→+∞
%
+∞
lim αn = 0 et la série alternée an est convergente. En définitive la fonc-
n→+∞ n=0
tion f est définie sur ]−1, 1] .
2. Le développement en série entière trouvé à la question précédente est celui de
13
− 23 1
la fonction (1 + x) , donc f (x) = 2 pour tout x ∈ ]−1, 1[ . On a
(1 + x)
ainsi une solution de (14.16) sur R − {−1} .
3. Sur chacun des intervalles I1 = ]−∞, −1[ , I2 = ]−1, 0[ et I2 = ]0, +∞[ on
peut utiliser le théorème de Cauchy-Lipschitz sur les équations différentielles
linéaires pour affirmer que l’ensemble des solutions réelles de (14.16) est un
espace vectoriel sur R de dimension 2.. On connaît déjà la solution f. Pour
déterminer une deuxième solution linéairement indépendante on peut utiliser
la méthode de variation de la constante. On cherche donc une solution de (14.16)
sur Ik (k = 1, 2, 3) la forme g = λf. Une telle fonction est solution de (14.16)
si, et seulement si :
Le système {f, g} étant libre on déduit que toute solution de (14.16) sur Ik
(k = 1, 2, 3) s’écrit y = (a + bλ) f avec a et b dans R.
+∞
2 4 cos (2nx)
Une solution particulière est y (x) = + et toute solution de
π π n=1 (4n2 − 1)2
l’équation différentielle est de la forme :
+∞
2 4 cos (2nx)
y (x) = λ cos (x) + μ sin (x) + +
π π n=1 (4n2 − 1)2
408 Équations différentielles linéaires
y + αy = ϕ (14.17)
Solution.
1. L’étude faite au paragraphe 14.1 nous sur R de (14.17) sont
dit que les solutions x
les fonctions définies y (x) = e−αx ϕ (t) eαt dt + μ , où μ est une constante
0
réelle.
2. Si lim ϕ (x) = , on peut alors trouver, pour tout réel ε > 0, un réel a > 0
x→+∞ x
tel que |ϕ (t) − | < ε pour tout t ≥ a et en posant g (x) = (ϕ (t) − ) eαt dt,
0
on a pour tout x ≥ a :
a x
|g (x)| ≤ |ϕ (t) − | eαt dt + |ϕ (t) − | eαt dt
0 a
ε αx ε
≤A+ (e − eαa ) ≤ A + eαx
α α
a
en notant A = |ϕ (t) − | eαt dt. On a alors pour tout x ≥ a :
0
x
−αx ε
e (ϕ (t) − ) eαt dt ≤ Ae−αx +
0 α
−αx
et avec lim e = 0, on déduit qu’il existe un réel b > a tel que :
x→+∞
x
ε
∀x ≥ b, e−αx (ϕ (t) − ) eαt dt ≤ ε +
0 α
x
ce qui signifie que lim e−αx (ϕ (t) − ) eαt dt = 0. En écrivant que :
x→+∞ 0
x x
e−αx ϕ (t) eαt dt = e−αx (ϕ (t) − ) eαt dt + 1 − e−αx
0 0 α
on en déduit que, pour toute solution y sur R de (14.17) , on a :
x
−αx
lim y (x) = lim e ϕ (t) eαt dt =
x→+∞ x→+∞ 0 α
Exercices 409
xy + (x − 2) y − 2y = 0 (14.18)
2x (1 + x) y + (5x + 3) y + y = 0 (14.19)
Solution.
1. Supposons qu’il existe une solution f de (14.18) non identiquement nulle et
développable en série entière sur un intervalle ] − R, R[ où R ∈ R+ est à dé-
+∞
terminer. Notons, pour tout x ∈ ]−R, R[ , f (x) = an xn . Sur ]−R, R[ , on
n=0
a: ⎧
⎪ %
+∞ %
+∞
⎪
⎪
nan xn−1 = (n + 1) an+1 xn
⎨ f (x) =
n=1 n=0
⎪
⎪ %
+∞ %
+∞
⎪
⎩ xf (x) = nan xn , xf (x) = n (n + 1) an+1 xn
n=1 n=1
410 Équations différentielles linéaires
ce qui est encore équivalent à dire que la suite (an )n∈N est solution de l’équation
de récurrence :
a1 + a 0 = 0
∀n ≥ 1, (n − 2) ((n + 1) an+1 + an ) = 0
ce qui est encore équivalent à dire que la suite (an )n∈N est solution de l’équation
de récurrence :
a0 + 3a1 = 0
∀n ≥ 1, (2n + 3) an+1 + (2n + 1) an = 0
x2 y + xy + x2 − p2 y = 0 (14.20)
Solution.
1. On a :
⎧ 1 √
⎪
⎨ g = 2√x f + xf
⎪
⎪
⎪ 1 1 1 1
⎩ g = 3 x2 f + xf − f = − 3 x2 − p2 + f
x2 4 x2 4
p2 − 14
c’est-à-dire que g est solution z + 1 − z = 0.
x2
412 Équations différentielles linéaires
2
et en notant Kp = x Jp + xJp 2
+ x −p 2
Jp , on a :
+∞
Kp (x) = (p + 2k) (p + 2k − 1) + (p + 2k) − p2 αk xp+2k
k=0
+∞
+ αk xp+2(k+1)
k=0
+∞
+∞
= 4k (p + k) αk xp+2k + αk xp+2(k+1)
k=1 k=0
+∞
= (4 (k + 1) (p + k + 1) αk+1 + αk ) xp+2(k+1) = 0
k=0
1
en utilisant αk+1 = − αk pour k ∈ N.
4 (k + 1) (p + k + 1)
α
Exercice 14.9. Soit f la fonction définie sur ]−1, 1[ par f (x) = (1 + x)
où α est un réel non entier naturel.
1. Montrer que f est l’unique solution sur ]−1, 1[ de l’équation différentielle
(1 + x) y − αy = 0 avec la condition initiale y (0) = 1.
2. Retrouver le développement en série entière de f ainsi que son rayon de
convergence.
Solution.
1. On a bien f (0) = 1 et pour tout x ∈ ]−1, 1[ :
(1 + x) f (x) − αf (x) = (1 + x) α (1 + x)
α−1 α
− α (1 + x) = 0
Le théorème de Cauchy-Lipschitz nous assure de l’unicité de cette solution.
2. Supposons qu’il existe une solution g de cette équation différentielle dévelop-
pable en série entière sur un intervalle ]−R, R[ où R ∈ R+ est à déterminer.
+∞
Notons, pour tout x ∈ ]−R, R[ , g (x) = an xn . On a :
n=0
⎧
⎪ %
+∞ %
+∞
⎪
⎪
nan xn−1 = (n + 1) an+1 xn
⎨ g (x) = n=1 n=0
⎪
⎪ %
+∞
⎪
⎩ xg (x) = nan xn
n=1
Exercices 413
α−n
encore équivalent à an+1 = an pour tout n ≥ 0, avec a0 = g (0) = 1, ce
n+1
qui donne par récurrence :
α (α − 1) · · · (α − n + 1)
∀n ≥ 1, an =
n!
+∞
α (α − 1) · · · (α − n + 1)
soit g (x) = 1+ xn . Le théorème de d’Alembert nous
n=1
n!
dit que le rayon de convergence de série entière est égal à 1. Enfin f = g du
fait de l’unicité de la solution d’un problème de Cauchy. On retrouve ainsi le
α
développement en série entière de (1 + x) sur ]−1, 1[ .
Exercice 14.10. Montrer que la fonction f définie sur ]−1, 1[ par f (x) =
arcsin (x)
√ est solution d’une équation différentielle linéaire du premier
1 − x2
ordre. En déduire le développement en série entière de cette fonction.
1
Solution. Les fonctions x → arcsin (x) et x → √ étant développable
1 − x2 √
en série entière sur ]−1, 1[ , il en est de même du produit f. De 1 − x2 f (x) =
arcsin (x) , on déduit par dérivation (les fonctions considérées sont C ∞ ) que :
x 1
−√ f (x) + 1 − x2 f (x) = √
1 − x2 1 − x2
ce qui se traduit en disant que f est solution sur ]−1, 1[ de l’équation différentielle
−xy + 1 − x2 y = 1 avec la condition initiale y (0) = 1. En écrivant, pour tout
+∞
x ∈ ]−1, 1[ , f (x) = an xn , on a :
n=0
⎧
⎪ %
+∞ %
+∞
⎪
⎪ xf (x) = a x n+1
= an−1 xn
⎪
⎪
n
⎪
⎪ n=0 n=1
⎪
⎨ %
+∞ %
+∞
f (x) = nan xn−1 = (n + 1) an+1 xn
⎪
⎪
⎪
⎪
n=1 n=0
⎪
⎪ %
+∞ %
+∞
⎪
⎪
⎩ x2 f (x) = nan xn+1 = (n − 1) an−1 xn
n=1 n=2
+∞
soit a1 + ((n + 1) an+1 − nan−1 ) xn = 1, ce qui donne :
n=1
a1 = 1
∀n ≥ 1, (n + 1) an+1 − nan−1 = 0
avec a0 = f (0) = 0. On a donc 2pa2p = (2p − 1) a2(p−1) pour tout p ≥ 1, avec
a0 = 0, ce donne a2p = 0 pour tout p ≥ 0 (récurrence immédiate) et :
∀n ≥ 1, (2p + 1) a2p+1 = 2pa2p−1
(2p) · (2p − 2) · · · · · 2
qui donne par récurrence a2p+1 = a1 avec a1 = 1, soit :
(2p + 1) · (2p − 1) · · · · · 3
2 2
((2p) · (2p − 2) · · · · · 2) 22p (p!)
a2p+1 = =
(2p + 1)! (2p + 1)!
pour tout p ≥ 0. Le développement en série entière de f sur ]−1, 1[ est donc :
+∞ 2n
2
2 (n!) 2n+1
f (x) = x
n=0
(2n + 1)!
Le fait que les coefficients a2n sont tous nuls était prévisible puisque la fonction f
est impaire.
+∞
En écrivant, pour tout x ∈ R, f (x) = an xn , on a a2n+1 = 0 pour tout n ≥ 0
n=0
+∞
puisque f est paire, donc f (x) = a2n x2n et :
n=0
+∞
f (4) (x) = (2n) (2n − 1) (2n − 2) (2n − 3) a2n x2n−4
n=2
+∞
= (2n + 4) (2n + 3) (2n + 2) (2n + 1) a2n+4 x2n
n=0
ce qui donne :
4
∀n ≥ 0, a2n+4 = − a2n (14.21)
(2n + 4) (2n + 3) (2n + 2) (2n + 1)
f (0)
Pour n = 2p + 1, avec p ≥ 0, on a a4p+6 = −αp a4p+2 avec a2 = = 0, ce qui
2
donne a4p+2 = 0 pour tout p ≥ 0 par une récurrence immédiate. Sachant déjà que
les a4p+1 et a4p+3 , sont tous nuls, il reste à déterminer les a4p pour tout p ≥ 0.
Notant bp = a4p , on a en prenant n = 2p dans (14.21) :
4
∀p ≥ 0, bp+1 = − bp
(4p + 4) (4p + 3) (4p + 2) (4p + 1)
p
(−1) 4p
avec b0 = a0 = 1, et par récurrence bp = pour tout p ≥ 0. Le développe-
(4p)!
+∞
n
(−1) 4n 4n
ment en série entière de f sur R est donc f (x) = x . On peut aussi
n=0
(4n)!
calculer les dérivées successives de f :
1 # $
f (n) (x) = (1 + i) e(1+i)x + (−1 + i) e(−1+i)x
n n
2
1 # $
= (1 + i) e(1+i)x + (−1) (1 − i) e(−1+i)x
n n n
2
f (n) (0)
ce qui donne an = avec :
n!
1
f (n) (0) =
n n n
((1 + i) + (−1) (1 − i) )
2
√ n √ n # π$
2 in π n −in−i π 2 n
= e 4 + (−1) e 4 = (1 + (−1) ) cos n
2 2 4
416 Équations différentielles linéaires
+∞
+∞
+∞
xn
(n + 1) an+1 xn = an xn
n=1 n=0
n + 1 n=0
1 an−k
n
ce qui donne an+1 = avec a0 = 1. Par récurrence, on voit que
n+1 k+1
k=0
0 < an ≤ 1, ce qui entraîne R ≥ 1. Les fonctions g et h étant solutions de la même
équation différentielle linéaire d’ordre 1 avec condition initiale, on déduit que g = h
et g est développable en série entière sur ]−1, 1[ . Si le rayon de convergence de g
est strictement supérieur à 1, la fonction g est C ∞ sur un voisinage ouvert de 1,
π2 g (x)
mais g = f g avec lim− g (x) = ef (1) = e 6 > 0 donne lim− f (x) = lim
x→1 x→1 x→1 g (x)
+∞
x n
ln (1 − x)
avec f (x) = =− qui n’a pas de limite quand x tend vers 1− .
n=0
n + 1 x
On aboutit donc à une impossibilité. Le rayon de convergence de cette série est
donc R = 1.
Chapitre 15
Polynômes orthogonaux
Preuve. On vérifie tout d’abord que E est un sous-espace vectoriel de l’espace des
1 2
fonctions continues par morceaux de I dans R. De l’inégalité |f g| ≤ f + g2 ,
2
b
on déduit que pour tous f, g dans E, on a |f (x)| |g (x)| π (x) dx < +∞ et il
b a
2
en résulte que (f (x) + λg (x)) π (x) dx < +∞ pour tout réel λ, ce qui signifie
a
que f + λg est dans E.
Des propriétés de l’intégrale sur un segment, on déduit que l’application · | ·
est bilinéaire, symétrique et positive sur E. Si f ∈ E est telle que f | f = 0, en
notant a1 < · · · < ap ses éventuels points de discontinuités dans ]a0 , ap+1 [ = ]a, b[ ,
on a : b p ak+1
2 2
0= (f (x)) dx = (f (x)) dx
a k=0 ak
ak+1
2
donc (f (x)) dx = 0 pour tout k compris entre 0 et p et f est nulle sur
ak
chaque intervalle Ik = ]ak , ak+1 [ puisque f 2 est continue positive sur Ik . On a
f a−
k + f ak
+
alors f a±k = lim f (x) = 0 et en conséquence, f (a k ) = = 0.
x→a±k
2
La fonction f est donc nulle sur I. En définitive, l’application · | · est définie et
c’est un produit scalaire sur E.
Muni de ce produit scalaire, l’espace préhilbertien E n’est pas un espace de
Hilbert (exercice 15.2).
Théorème 15.2.
Il existe une unique base orthonormée (Pn )n∈N de P (pour le produit
scalaire associé à la fonction poids π) telle que pour tout entier naturel n, Pn
est une fonction polynomiale de degré n de coefficient dominant strictement
positif.
1
Ces polynômes s’écrivent Pn = Qn , avec Q0 = e0 et pour tout n ∈ N∗ ,
Qn
n−1
Qn = e n − en | Pk Pk (théorème 3.7). Chaque polynôme Pn est donc de degré
k=0
égal à n et de terme dominant strictement positif. Ce système étant étagé en degrés,
il forme une base de P. Réciproquement si (Pn )n∈N est une telle base orthonormée
de P, les conditions deg (Pn ) = n pour tout entier naturel n entraînent que l’espace
vectoriel engendré par {P0 , · · · , Pn } est égal à l’espace engendré par {e0 , · · · , en }
Produit scalaire associé à une fonction poids et polynômes orthogonaux 419
n−1
1
et avec Pn = λn en + λk Pk , on déduit Pn | en = > 0 si le coefficient
λn
k=0
dominant de Pn est strictement positif, ce qui assure l’unicité d’une telle base.
Dans ce qui suit, (Pn )n∈N est une telle base orthonormée de P avec, pour tout
n
(n) (n)
entier naturel n, Pn (x) = αk xk , le coefficient dominant αn étant strictement
k=0
positif.
De la construction on déduit le résultat suivant qui nous sera souvent utile.
Théorème 15.3.
⊥
Pour tout entier naturel non nul n, on a Pn−1 = Vect {Pk | k ≥ n} (où
⊥
Pn−1 est l’orthogonal de Pn−1 dans P). En particulier un polynôme de
degré n est orthogonal à Pn−1 si, et seulement si, il est proportionnel à Pn .
∀k ≥ n, ∀P ∈ Pn−1 , P | Pk = 0
⊥
ce qui équivaut à Pn−1 = Vect {Pk | k ≥ n} .
Ce résultat nous permet de donner une propriété de parité des polynômes or-
thogonaux dans le cas où la fonction poids est paire sur un intervalle I = ]−c, c[
centré en 0.
Preuve. On note Qn le polynôme défini par Qn (x) = Pn (−x) . Pour tout po-
c
lynôme P dans Pn−1 on a Qn | P = Pn (−x) P (x) π (x) dx et le change-
−c
ment de variable t = c−x donne en tenant compte de la parité de la fonction
poids π, Qn | P = Pn (t) P (−t) π (t) dt = 0 puisque la fonction polynomiale
−c
t → P (−t) est dans Pn−1 . Le polynôme Qn est donc de degré n et orthogonal à
Pn−1 , en conséquence il est proportionnel à Pn . On a donc Pn (−x) = λn Pn (x) et
n
l’identification des coefficients de xn donne λn = (−1) , ce qui signifie que Pn est
de la parité de n.
Des propriétés d’orthogonalité, on déduit que, pour n ∈ N∗ , chaque polynôme
Pn est scindé à racines simples dans I.
Théorème 15.4.
Pour tout entier naturel non nul n, le polynôme Pn admet n racines
réelles simples dans l’intervalle ]a, b[ .
420 Polynômes orthogonaux
soit une impossibilité. On a donc montré que toutes les racines de Pn qui sont
dans ]a, b[ sont simples. Notons x1 , x2 , ..., xp ces racines. Si p < n, on peut alors
( p
écrire Pn (x) = (x − xk ) Qn−p (x) avec Qn−p ∈ Pn−p \ {0} de signe constant
k=1
dans ]a, b[ et on a :
, -
( p b (
p
2
0 = Pn | (x − xk ) = (x − xk ) Qn−p (x) π (x) dx = 0
k=1 a k=1
soit encore une impossibilité. On a donc p = n, c’est-à-dire que toutes les racines
de Pn sont dans ]a, b[ et simples.
Les propriétés d’orthogonalité nous permettent aussi d’obtenir des relations de
récurrence sur les polynômes orthogonaux.
Théorème 15.5.
La suite (Pn )n∈N vérifie la relation de récurrence :
⎧
⎪
⎨ P−1 (x) = 0, P0 (x) = α0(0) = 1
e0 (15.1)
⎪
⎩ b
n+1 Pn+1 (x) + an Pn (x) + bn Pn−1 (x) = xPn (x) (n ≥ 0)
(0) (0)
Preuve. De P0 = α0 e0 = 1 avec α0 > 0, on déduit que :
(0) 1 1
P0 = α0 = = &'
e0 b
a
π (t) dt
Pour n ∈ N, on a xPn ∈ Pn+1 = Vect {P0 , · · · , Pn+1 } , on peut donc écrire que
n+1
xPn = λk Pk , avec λk = xPn | Pk = Pn | xPk = 0 pour k + 1 < n (Pn est
k=0
⊥
dans Pn−1 ). Il reste donc xPn = λn+1 Pn+1 + λn Pn + λn−1 Pn−1 en posant P−1 = 0
et λ−1 = 0. En identifiant les coefficients de xn+1 et xn respectivement on obtient
Produit scalaire associé à une fonction poids et polynômes orthogonaux 421
En effet, pour n ∈ N, on a :
b b b
2 2 2
a= aPn (x) π (x) dx ≤ an = xPn (x) π (x) dt ≤ bPn (x) π (x) dx = b
a a a
∗
et en posant c = max (|a| , |b|) , on a pour n ∈ N :
b
0 < bn = Pn | xPn−1 = xPn−1 (x) Pn (x) π (x) dx
a
(n)
αn
où bn+1 = (n+1)
.
αn+1
Multipliant les deux membres de cette égalité par Pk (y) , avec y ∈ R, il vient :
xPk (x) Pk (y) = bk+1 Pk+1 (x) Pk (y) + ak Pk (x) Pk (y) + bk Pk−1 (x) Pk (y)
422 Polynômes orthogonaux
yPk (y) Pk (x) = bk+1 Pk+1 (y) Pk (x) + ak Pk (y) Pk (x) + bk Pk−1 (y) Pk (x)
1
n
Pn (x) Pn+1 (x) − Pn (x) Pn+1 (x) = Pk2 (x) > 0
bn+1
k=0
1
n
P02 (x)
Pn (x) Pn+1 (x) − Pn (x) Pn+1 (x) = Pk2 (x) ≥ >0
bn+1 bn+1
k=0
Pour tout entier naturel non nul n, on note x1,n < x2,n < · · · < xn,n les n
racines distinctes du polynôme Pn dans I.
Théorème 15.7.
Pour tout entier naturel non nul n et tout entier k compris entre 1 et
n, on a xk,n+1 < xk,n < xk+1,n+1 , ce qui signifie qu’entre deux racines
consécutives de Pn+1 il y a une racine de Pn .
Produit scalaire associé à une fonction poids et polynômes orthogonaux 423
et le théorème des valeurs intermédiaires nous dit que Pn a une racine dans
]xk,n+1 , xk+1,n+1 [ . On obtient ainsi n racines distinctes de Pn , c’est-à-dire toutes
ses racines.
L’utilisation des déterminants de Gram (paragraphe 3.6) nous permet d’obtenir
une expression explicite des polynômes orthogonaux associés à une fonction poids.
μ0 μ1 ··· μn
μ1 μ2 ··· μn+1
g (e0 , · · · , en ) = .. .. .. ..
. . . .
μn μn+1 ··· μ2n
1
1
Exemple 15.1 Pour π = 1 sur l’intervalle ]0, 1[ , on a μn = xn dx = et
0 n+1
3
2n
j!
j=0
g (e0 , · · · , en ) = 2
n (exemple 3.3).
(n + j)!
j=0
424 Polynômes orthogonaux
Lemme 15.2 Soit (θn )n∈N une suite de fonctions dans E et (ϕn )n∈N la suite de
fonctions définie sur I par ϕ0 (x) = θ0 (x) et pour n ≥ 1 :
θ0 | θ0 ··· θ0 | θn−1 θ0 (x)
θ1 | θ0 ··· θ1 | θn−1 θ1 (x)
ϕn (x) = .. .. .. ..
. . . .
θn | θ0 · · · θn | θn−1 θn (x)
Pour tout n ∈ N la fonction ϕn est dans E et pour n, m dans N, on a :
0 si n < m
θn | ϕm =
g (θ0 , · · · , θn ) si n = m
Preuve. En développant le déterminant ϕn (x) suivant la dernière colonne, on
voit que ϕn est combinaison linéaire des θk pour k compris entre 0 et n. On a donc
bien ϕn ∈ E. Pour n = m = 0, on a θ0 | ϕ0 = θ0 | θ0 = g (θ0 ) . Pour (m, n)
dans N∗ × N et x ∈ I, on a :
θ0 | θ0 ··· θ0 | θm−1 θ0 (x) θn (x) π (x)
θ1 | θ0 ··· θ1 | θm−1 θ1 (x) θn (x) π (x)
ϕm (x) θn (x) π (x) = .. .. .. ..
. . . .
θm | θ0 · · · θm | θm−1 θm (x) θn (x) π (x)
et le développement de ce déterminant suivant la dernière colonne donne :
θ0 | θ0 ··· θ0 | θm−1 θ0 | θn
θ1 | θ0 ··· θ1 | θm−1 θ1 | θn
θn | ϕm = .. .. .. ..
. . . .
θm | θ0 · · · θm | θm−1 θm | θn
Pour n < m les colonne n + 1 et m + 1 de cette matrice sont identiques, donc le
déterminant est nul et pour n = m, on a θn | ϕn = g (θ0 , · · · , θn ) .
En développant le déterminant ϕn (x) suivant la dernière colonne, on a :
n−1
ϕn (x) = αk θk (x) + g (θ0 , · · · , θn−1 ) θn (x)
k=0
μ0 μ1 ··· μn−1
μ1 μ2 ··· μn
λ(n)
n = .. .. .. .. = g (e0 , · · · , en−1 ) > 0
. . . .
μn−1 μn ··· μ2n−2
∀f ∈ C 2 (I, R) , L (f ) = Af + Bf
Cet opérateur laissant stable chaque sous-espace Pn , on note pour tout entier
naturel n, Ln la restriction de L à cet espace, ce qui définit un endomorphisme
de Pn . La matrice de Ln dans la base canonique (ei )0≤i≤n de Pn est triangulaire
supérieure de termes diagonaux :
λk = k ((k − 1) a2 + b1 ) (0 ≤ k ≤ n)
Lemme 15.3 En supposant que ka2 + b1 = 0 pour tout k ∈ N, pour tout entier
naturel n l’endomorphisme Ln de Pn a n + 1 valeurs propres distinctes données
par :
λk = k ((k − 1) a2 + b1 ) (0 ≤ k ≤ n)
Il est diagonalisable et pour tout entier k compris entre 0 et n, l’espace propre
associé à la valeur propre λk est de dimension égale à 1 engendré par un polynôme
Lk de degré égal à k.
Lemme 15.5 L’opérateur L est symétrique pour le produit scalaire défini sur P
par la fonction poids π, ce qui signifie que :
∀ (P, Q) ∈ P 2 , L (P ) | Q = P | L (Q)
Preuve. Pour toute fonction polynomiale Q, une intégration par parties nous
donne, compte tenu du lemme précédent et de la condition (iii) :
b b
L (P ) | Q = (πAP ) (x) Q (x) dx = − A (x) P (x) Q (x) π (x) dx
a a
Théorème 15.8.
La famille (Ln )n∈N des vecteurs propres de L est une base orthogonale
de P pour le produit scalaire défini par la fonction poids π sur I.
Preuve. Nous avons vu avec la démonstration du lemme 15.6 que ϕn = πAn−1 Q,
où Q = Qn,1 = B + (n − 1) A est polynomiale de degré 1, ce qui nous donne
Aϕn = πAn Q = ϕn Q. Dérivant n + 1 fois cette relation, la formule de dérivation
de Leibniz nous donne :
n (n + 1) (n)
Aϕ(n+2)
n + (n + 1) A ϕ(n+1)
n + A ϕn = Qϕ(n+1)
n + (n + 1) Q ϕ(n)
n
2
# n $
(n+2) (n+1) (n)
soit Aϕn + ((n + 1) A − Q) ϕn = (n + 1) Q − A ϕn avec :
2
n #n $
(n + 1) A − Q = 2A − B et Q − A = B + − 1 A = b1 + (n − 2) a2
2 2
428 Polynômes orthogonaux
Pour tout entier naturel n, il existe une constante non nulle αn telle que
αn (n)
Pn = (πAn ) ((Pn )n∈N étant la suite de polynômes orthogonaux du
π
théorème 15.2).
Preuve. Il nous suffit de montrer que chaque polynôme (non nul) Qn est vecteur
propre de L pour la valeur propre λn .
Le lemme 15.4 nous dit que, pour tout n ∈ N, on a πL (Qn ) = (πAQn ) . Avec
(n) (n+1)
πQn = ϕn , on déduit que π Qn + πQn = ϕn , donc :
πAQn = Aϕ(n+1)
n − π AQn = Aϕ(n+1)
n − (B − A ) πQn = Aϕ(n+1)
n − (B − A ) ϕ(n)
n
(n−1)
avec lim+ ϕn (x) P (x) = lim+ π (x) A (x) Qn,n−1 (x) P (x) = 0, la situation
x→a x→a
étant la même au voisinage de b. Au bout de n intégrations par parties, on aboutit
b
ϕn (x) P (n) (x) dx.
n
donc à Qn | P = (−1)
a
Du lemme précédent, on déduit que Qn | P = 0 pour tout P ∈ Pn−1 , donc
Qn est orthogonal à Pn−1 et étant de degré n, il est colinéaire à Pn (théorème
15.3).
Polynômes orthogonaux classiques, formules de Rodrigues 429
ce qui donne z (t) = αn cos (nt) + βn sin (nt) , où αn et βn sont deux constantes
réelles. L’application t → cos (t) réalisant un C ∞ -difféomorphisme de ]0, π[ sur
]−1, 1[ , on en déduit que Tn (x) = αn cos (n arccos (x)) + βn sin (n arccos (x)) .
Comme la fonction poids π est paire, Tn est de la parité de n. En particulier,
Tn est impaire pour n = 2p + 1, donc :
# π$ # π$ p
0 = T2p+1 (0) = α2p+1 cos (2p + 1) + β2p+1 sin (2p + 1) = β2p+1 (−1)
2 2
soit β2p+1 = 0. Pour n = 2p ≥ 2, Tn est paire, donc Tn est impaire avec
T0 (x) 1
et P0 (x) = = √ . La relation de récurrence :
T0 π
nous donne la relation Tn+1 (x) + Tn−1 (x) = 2xTn (x) de laquelle on déduit que
le coefficient dominant de Tn est 2n−1 pour n ∈ N∗ . Les polynômes Pn vérifient
1
la même relation de récurrence avec P−1 = 0 et P0 = √ .
π
3. Les polynômes de Laguerre correspondent au choix de A (x) = x et B (x) =
α + 1 − x sur R+,∗ , où α est un réel strictement plus grand que −1. L’opérateur
différentiel associé est défini par :
∀f ∈ C 2 R+,∗ , R , L (f ) = xf + (α + 1 − x) f
k−1
n (
n
n n−k
Ln,α (x) = (−1) x + n
(−1) (n + α − i) xn−k
k i=0
k=1
n
donc le coefficient dominant de Ln,α est cn = (−1) ) et sa norme est donnée
par : +∞
2
xn+α e−x dx = n!Γ (n + α + 1)
n
Ln,α = (−1) n!cn
0
d’où l’expression des polynômes de Laguerre normalisés :
n
(−1) (n)
∀n ∈ N, Pn (x) = x−α ex xα+n e−x
n!Γ (n + α + 1)
1 (n) −n (n + α)
αn(n) = et αn−1 = = −n (n + α) αn(n)
n!Γ (n + α + 1) n!Γ (n + α + 1)
∀f ∈ C 2 R+,∗ , R , L (f ) = f − 2xf
(−1)
n
2
# $
2 (n)
∀n ∈ N, Pn (x) = 1√ ex e−x
π 4 2n n!
La fonction poids π étant paire sur R, chaque polynôme Pn est de la parité
de n. Ces polynômes sont aussi définis par la relation de récurrence 15.1 où
(n−1) 5
αn−1 n 1
bn = (n)
= et an = 0, soit P−1 (x) = 0, P0 (x) = 1 et :
αn 2 π4
√ √ √
n + 1Pn+1 (x) + nPn−1 (x) = 2xPn (x) (n ≥ 0)
1 n (−1)n−k (2k)!
= n x2k−n
2 n! n k (2k − n)!
2 ≤k≤n
1 n−k n 2k 2k−n
= n (−1) x
2 n k n
2 ≤k≤n
Cette expression
nous permet de retrouver le coefficient dominant de Ln , soit
p
1 2n (−1) 2p
αn = n . On en déduit aussi que L2p (0) = 2p pour tout p ∈ N.
2 n 2 p
Des relations de récurrence vérifiées par les polynômes Pn , on déduit le résultat
suivant, en posant L−1 = 0.
Théorème 15.10.
Pour tout n ∈ N et tous réels x, y on a : :
x−y
n
(2k + 1) Lk (x) Lk (y) = Ln+1 (x) Ln (y) − Ln (x) Ln+1 (y)
n+1
k=0
(formule de Darboux-Christoffel).
2
soit en écrivant que 4n2 −1 = (2n − 1) (2n + 1) , 4 (n + 1) −1 = (2n + 1) (2n + 3) :
n+1 n √
√ Ln+1 (x) + √ Ln−1 (x) = x 2n + 1Ln (x)
2n + 1 2n + 1
434 Polynômes orthogonaux
c’est-à-dire (15.4) . Cette relation étant encore valable pour n = 0 en posant L−1 =
0 (on a L0 (x) = 1 et L1 (x) = x).
n+1
Pour n ∈ N∗ , on a x2 − 1 Ln ∈ Pn+1 , donc x2 − 1 Ln = βk Lk avec
1
k=0
2
βn Ln = x2 − 1 Ln (x) Ln (x) dx = 0 par imparité et :
−1
1
2 3 2
4
βk Lk = x −1 Ln | Lk = x2 − 1 Lk (x) Ln (x) dx
−1
1
6 71
= x2 − 1 Lk (x) Ln (x) −1 − x2 − 1 Lk (x) + 2xLk (x) Ln (x) dx
−1
3 4
= − Ln | x2 − 1 Lk + 2xLk = 0
pour k + 1 < n. Il reste donc x2 − 1 Ln = βn+1 Ln+1 + βn−1 Ln−1 . L’évaluation
en 1 donne βn−1 = −βn+1 et l’identification des coefficients de xn+1 nous donne
nαn n+1
βn+1 = =n . On a donc la relation de récurrence :
αn+1 2n + 1
soit :
n
(x − y) (2k + 1) Lk (x) Lk (y) = (n + 1) (Ln+1 (x) Ln (y) − Ln (x) Ln+1 (y))
k=0
Les polynômes de Legendre peuvent s’exprimer par des formules intégrales qui
seront intéressantes pour obtenir certaines propriétés de ces polynômes.
Pour (x, r) ∈ [−1, 1] × R+,∗ , on note γx,r le lacet défini par γx,r (t) = x + reit
pour tout t ∈ [0, 2π] (cercle de centre x et de rayon r).
Théorème 15.11. Formules intégrales de Schläffi et de Laplace
sur [−1, 1] comme Ln , il s’en suit que l’égalité précédente est encore valable pour
x = ±1 par continuité.
Le théorème précédent peut aussi se montrer sans référence aux fonctions ho-
lomorphes (exercice 15.4).
En utilisant la formule intégrale de Laplace, on retrouve que pour tout n ∈ N,
n
on a Ln (±1) = (±1) .
Cette formule nous permet également de calculer Ln ∞ = sup |Ln (x)| .
x∈[−1,1]
Pour ce faire, on remarque que pour tout (t, x) ∈ [0, π] × [−1, 1] :
2
x+i 1 − x2 cos (t) = x2 + 1 − x2 cos2 (t) ≤ x2 + 1 − x2 = 1
dt
puis effectuant le changement de variable x = tan (t) (invariance de
1 + α2 cos2 (t)
par t → π + t), on obtient :
+∞ +∞
dx 2 dx
I (α) = 2 2 2
= 2 2
0 α +1+x α +1 0 1 + α2x+1
+∞
2 dt π
=√ 2
=√
2
α +1 0 1+t 2
α +1
438 Polynômes orthogonaux
Théorème 15.12.
Pour tout (x, y) ∈ [−1, 1] × ]−1, 1[ , on a :
+∞
+∞
1 1
= Ln (x) y n et = Tn (x) y n
y 2 − 2xy + 1 n=0
y 2 − 2xy + 1 n=0
n
(
kπ
où T0 (x) = 1 et Tn (x) = 2 n
x − cos pour tout n ∈ N∗
n+1
k=1
√
Preuve. Notant ϕ (x, t) = x + i 1 − x2 cos (t) , on a pour (t, x) ∈ ]0, π[ × ]−1, 1[ :
2
|ϕ (x, t)| = x2 + 1 − x2 cos2 (t) < x2 + 1 − x2 = 1
avec 1 − xy > 0 et :
√
π π
dt 1 y 1 − x2
f (t, x, y) dt = √ = I
0
2
0 1 − xy − iy 1 − x cos (t) 1 − xy 1 − xy
1 π π
= & 2 =
1 − xy y (1−x ) + 1
2
y 2 − 2xy + 1
(1−xy)2
+∞
1
ce qui nous donne = Ln (x) y n , cette formule étant encore
y 2 − 2xy + 1 n=0
n
valable pour x = ±1 (puisque Ln (±1) = (±1) ).
Pour x fixé dans [−1, 1] , on a le produit de Cauchy des séries entières :
+∞ 2 +∞
1
n
= Ln (x) y = Tn (x) y n (15.6)
y 2 − 2xy + 1 n=0 n=0
Les polynômes de Legendre 439
n
pour y ∈ ]−1, 1[ , avec Tn (x) = Lk (x) Ln−k (x) ∈ Pn pour tout n ∈ N. Le
n
k=0
1 2k 2 (n − k)
n
coefficient de x dans Tn étant n ∈ R+,∗ , ce polynôme est
2 k n−k
k=0
de degré n. Chaque Lk étant de la parité de k, le polynôme Tn est de la parité de
n.
+∞
La relation (15.6) s’écrit y 2 − 2xy + 1 Tn (x) y n = 1, soit :
n=0
+∞
+∞
+∞
Tn (x) y n+2 − 2x Tn (x) y n+1 + Tn (x) y n = 1
n=0 n=0 n=0
ou encore :
+∞
(Tn−1 (x) − 2xTn (x) + Tn+1 (x)) y n+1 + T0 (x) + (T1 (x) − 2xT0 (x)) y = 1
n=1
sin (θ) Tn+1 (cos (θ)) = 2 cos (θ) sin ((n + 1) θ) − sin (nθ)
= 2 cos (θ) (sin (nθ) cos (θ) + cos (nθ) sin (θ)) − sin (nθ)
= 2 cos2 (θ) − 1 sin (nθ) + cos (nθ) sin (2θ)
= cos (2θ) sin (nθ) + cos (nθ) sin (2θ) = sin ((n + 2) θ)
∗ kπ kπ
Pour n ∈ N et 1 ≤ k ≤ n, on a sin Tn cos = sin (kπ) = 0,
n+1 n+1
kπ
donc est une racine de Tn , ce qui nous donne n racines distinctes de ce
n+1
(n
kπ
polynôme de degré n et en conséquence, Tn (x) = 2 n
x − cos .
n+1
k=1
440 Polynômes orthogonaux
+∞
2 2
on a l’inégalité de Bessel, (cn (f )) ≤ f qui implique que lim cn (f ) = 0
n→+∞
n=0
(théorèmes 3.8, 3.11 et 3.12).
Les opérateurs Sn : E → Pn sont des opérateurs à noyau comme les opérateurs
de Fourier trigonométriques.
Théorème 15.13.
Pour toute fonction f ∈ E et pour tout entier n ∈ N on a :
b
∀x ∈ ]a, b[ , Sn (f ) (x) = Kn (t, x) f (t) π (t) dt
a
(n)
αn
avec bn+1 = (n+1)
.
αn+1
n b
n
Sn (f ) (x) = ck (f ) Pk (x) = Pk (t) Pk (x) f (t) π (t) dt
k=0 a k=0
b
= Kn (t, x) f (t) π (t) dt
a
442 Polynômes orthogonaux
Lemme 15.10 Pour I borné, l’espace vectoriel C 0 ([a, b] , R) des fonctions conti-
nues de [a, b] dans R est dense dans (E , ·) .
Preuve. On note a0 = a, ap+1 = b et a < a1 < · · · < ap < b les points de discon-
tinuités de f ∈ E . Pour tout réel δ strictement positif tel que [ak − δ, ak + δ] ⊂ I,
on note fδ la fonction définie sur [a, b] par :
⎧
⎪ ?p
⎨ f (x) si x ∈ / [ak − δ, ak + δ]
fδ (x) = k=1
⎪
⎩
f (ak − δ) ak +δ−x
2δ + f (ak + δ) x−(a2δk −δ) si x ∈ [ak − δ, ak + δ]
Cette fonction est continue sur [a, b] (sur [ak − δ, ak + δ] elle est affine et coïncide
avec f en ak − δ et ak + δ) et on a :
p
ak +δ
2 2
f − fδ = (f (t) − fδ (t)) π (t) dt
k=1 ak −δ
Pour tout réel ε strictement positif, on peut choisir δ > 0 tel que 8pM 2 M δ < ε2
et la fonction fδ dans C 0 ([a, b] , R) est telle que f − fδ < ε. Ce qui prouve la
densité de C 0 ([a, b] , R) dans (E , ·) .
Développement en série de polynômes orthogonaux 443
Théorème 15.14.
Pour I borné, la famille orthonormée (Pn )n∈N est totale dans (E , · | ·) .
Théorème 15.15.
Dans le cas où l’intervalle I est borné, si x ∈ ]a, b[ est tel que la suite
(Pn (x))n∈N soit bornée et f ∈ E admet une dérivée à droite et à gauche en
+∞
x, on a alors f (x) = cn (f ) Pn (x) .
n=0
f (t) − f (x)
Kn (t, x) (f (t) − f (x)) = bn+1 (Pn (x) Pn+1 (t) − Pn+1 (x) Pn (t))
t−x
444 Polynômes orthogonaux
Sn (f ) (x) − f (x)
b b
= bn+1 Pn (x) ϕx (t) Pn+1 (t) π (t) dt − Pn+1 (x) ϕx (t) Pn (t) π (t) dt
a a
avec 0 < bn ≤ c = max (|a| , |b|) pour n ∈ N∗ (voir le paragraphe 15.1), ce qui nous
donne la majoration :
|Sn (f ) (x) − f (x)| ≤ c (|Pn (x)| |cn+1 (ϕx )| + |Pn+1 (x)| |cn (ϕx )|)
avec lim cn (ϕx ) = 0. Dans le cas où la suite (Pn (x))n∈N est bornée, on en
n→+∞
+∞
déduit que lim Sn (f ) (x) = f (x) , ce qui signifie que f (x) = cn (f ) Pn (x) .
n→+∞
n=0
Exemples 15.2
1. Polynômes de Tchébychev. On se place sur ]−1, 1[ avec la fonction poids π
1 1
définie par π (x) = √ . Les polynômes Pn sont définis par P0 (x) = √
1−x 2 π
et : 5
2
∀n ∈ N∗ , ∀x ∈ [−1, 1] , Pn (x) = cos (n arccos (x))
π
1 1
et les coefficients bn sont donnés par b0 = 0, b1 = √ et bn = pour n ≥ 2.
2 2 5
2
Pour tout x ∈ [−1, 1] et tout entier naturel n on a la majoration |Pn (x)| ≤ .
π
On déduit alors que pour f ∈ E et x ∈ ]−1, 1[ où f admet une dérivée à droite
et à gauche, on a :
5 +∞
c0 (f ) 2
f (x) = √ + cn (f ) cos (n arccos (x))
π π n=1
Développement en série de polynômes orthogonaux 445
1
1 f (t)
avec c0 (f ) = √ √ dt et :
2
π −1 1 − t
5 1
∗ 2 f (t) cos (n arccos (t))
∀n ∈ N , cn (f ) = √ dt
π −1 1 − t2
En posant x = cos (θ) avec θ dans [0, π] , on obtient :
+∞
a0 (f )
f (cos (θ)) = + an (f ) cos (nθ)
2 n=1
avec : π
1
∀n ≥ 0, an (f ) = f (cos (θ)) cos (nθ) dθ
π −π
On retrouve ainsi le développement en série de Fourier trigonométrique de la
fonction paire θ → f (cos (θ)) .
2. Polynômes de Legendre. On se place sur ]−1, 1[ avec la fonction poids π = 1.
Les polynômes Pn sont définis par :
5
1 2n + 1 # 2 $
n (n)
∀n ∈ N, Pn (x) = n x −1
2 n! 2
√
∗ π
Pour tout x ∈ ]−1, 1[ et tout n ∈ N , on a la majoration |Pn (x)| ≤ √
1 − x2
(corollaire 15.2). On déduit alors que pour f ∈ E et x ∈ ]−1, 1[ où f admet
+∞
une dérivée à droite et à gauche, on a f (x) = cn (f ) Pn (x) , où cn (f ) =
5 n=0
1 2n + 1 1 n (n)
f (t) t2 − 1 dt.
2n n! 2 −1
Théorème 15.16.
Si l’intervalle I est borné et si pour tout x dans I la suite (Pn (x))n∈N est
bornée, alors pour toute fonction f ∈ E vérifiant une condition de Hölder
+ 1
de constante λ ∈ R et d’exposant α ∈ , 1 sur I, on a :
2
+∞
∀x ∈ ]a, b[ , f (x) = cn (f ) Pn (x)
n=0
Preuve. On a :
∀ (t, x) ∈ I 2 , |f (t) − f (x)| ≤ λ |t − x| .
α
ce qui donne :
x+η
Kn (t, x) (f (t) − f (x)) π (t) dt
x−η
x+η
x+η
π (t) dt π (t) dt
≤ λcMx |Pn+1 (t)| 1−α + |Pn (t)| 1−α ,
x−η |t − x| x−η |t − x|
les intégrales du membre de droite de cette inégalité étant convergents du fait que
1 − α < 1. En utilisant l’inégalité de Cauchy-Schwarz, on a :
x+η
x+η x+η
π (t) dt π (t) dt
|Pn (t)| 1−α ≤ |Pn2 (t)| π (t) dt 2(1−α)
x−η |t − x| x−η x−η |t − x|
1
(la dernière intégrale étant convergente du fait que 2 (1 − α) < 1 si α ∈ , 1 ),
2
puis avec :
x+η b
2 2
Pn (t) π (t) dt ≤ Pn2 (t) π (t) dt = Pn = 1,
x−η a
on obtient :
x+η x+η
π (t) dt π (t) dt
|Pn (t)| 1−α ≤ 2(1−α)
,
x−η |t − x| x−η |t − x|
x+η
π (t) dt 1
avec lim = 0 pour α ∈ , 1 . Pour tout réel ε > 0 on peut
η→0 x−η |t − x|2(1−α) 2
donc choisir, à x fixé dans ]a, b[ , un réel η > 0 assez petit de sorte que :
x+η
π (t) dt
∀n ∈ N, |Pn (t)| 1−α < ε.
x−η |t − x|
On en déduit alors que la suite (Sn (f ) (x))n∈N converge vers f (x) .
15.5 Exercices
Exercice 15.2. Soit I = [a, b] un intervalle réel fermé borné avec a < b.
Montrer
&' que l’espace vectoriel C 0 (I, R) muni de la norme f → f =
b 2
a
|f (x)| dx n’est pas complet (ce n’est pas un espace de Hilbert).
ce qui entraîne que cette suite est de Cauchy dans (E, ·) . D’autre part la suite
de fonctions (fn )n≥2 converge simplement vers la fonction continue par morceaux
1 1
f définie sur [0, 1] par f (x) = 1 si 0 ≤ x ≤ et f (x) = 0 si < x ≤ 1. Si
2 2
(fn )n≥2 converge dans C 0 (I, R) , · vers une fonction g, on peut alors écrire que
2
2 ' 12 + n1 2 1 1 1
f − g ≤ f − fn +fn − g avec f − fn = 1 n + − x dx =
2 2 n 3n
et en passant à la limite quand n tend vers l’infini on déduit
que f − g = 0. Par
1 1
continuité on déduit alors que f = g sur [0, 1] \ avec f discontinue en
2 2
et g continue en ce point, ce qui est impossible. On a donc ainsi montré que
C 0 (I, R) , · n’est pas complet.
Solution. On vérifie par récurrence que la suite (xn )n∈N∗ est strictement crois-
1 x
sante. On a L1 (x) = x, L2 (x) = 3x2 − 1 et L3 (x) = 5x2 − 3 , donc
√ 2 2
1 3
x1 = 0 < x2 = √ < x3 = √ . Supposons que 0 < x1 < · · · < xn−1 < xn pour
3 5
n ≥ 3. Si xn+1 = xn , la relation de récurrence (15.4) nous donne Ln−1 (xn ) = 0
avec xn > xn−1 = max xn−1,k , ce qui n’est pas possible. Si xn+1 < xn , on a
1≤k≤n−1
alors α = max (xn−1 , xn+1 ) < xn et pour tout x > α :
(puisque les coefficients dominants des Lk sont strictement positifs), ce qui est in-
compatible avec xn > α et Ln (xn ) = 0. On a donc xn < xn+1 . La suite (xn )n∈N∗
est donc croissante majorée par 1 (les xn sont dans ]0, 1[) et en conséquence conver-
gente vers un réel ∈ ]0, 1] .
n
z2 − 1
2. En déduire que n+1 dz = 2iπ2n Ln (x) .
γx,r (z − x)
Solution.
1. Pour tout entier k compris entre 0 et n, on a :
2π 2k 2π
z 2k x + reit i 2k −int
n+1 dz = n+1 ireit dt = x + reit e dt
γr,x (z − x) 0 (reit ) rn 0
2k
2π
i 2k j 2k−j i(2k−j)t −int
= n x r e e dt
r 0 j=0
j
2k
i 2k j 2k−j 2π i(2k−j−n)t
= n x r e dt
r j=0
j 0
2π
n
avec eimt dt = 0 pour tout entier relatif non nul m. Pour 0 ≤ k < , on a
0 2
n
2k − j − n < 0 pour tout j ≥ 0 et pour ≤ k ≤ n, il ne reste dans la somme
2
Exercices 449
2. Il en résulte que :
n
z2 − 1 n−k 2k n 2k−n
n+1 dz = 2iπ (−1) x = 2iπ2n Ln (x)
γx,r (z − x) n n k
2 ≤k≤n
Solution. Pour cet exercice, les fonctions sont définies sur le segment [−1, 1] et
par intégration par parties, on vérifie facilement que l’on a L (f ) | g = f | L (g)
pour toutes fonctions f, g dans C 2 ([−1, 1] , R) (on a L (f ) = x2 − 1 f ).
1. On sait déjà que Σ contient Σ = {λn = n (n + 1) | n ∈ N} (exemples 15.1) et
il nous reste à vérifier que pour réel λ ∈ R \ Σ , on a Eλ = {0} . Pour f ∈ Eλ
et n ∈ N, on a λ f | Ln = L (f ) | Ln = f | L (Ln ) = n (n + 1) f | Ln
avec λ = n (n + 1) , donc f | Ln = 0. Comme (Ln )n∈N est une base de P,
on en déduit f | Q = 0 pour toute fonction polynomiale Q. Par ailleurs, le
théorème de Weierstrass nous dit qu’il existe une suite (Qn )n∈N de fonctions
polynomiales qui converge uniformément vers f sur [−1, 1] (f est continue),
donc la suite
(f Qn )n∈N converge uniformément vers f 2 sur [−1, 1] (puisque
f Qn − f 2 ≤ f Qn − f ) et on a :
∞ ∞ ∞
1 1
2
f = f 2 (x) dx = lim f (x) Qn (x) dx = lim f | Qn = 0
−1 n→+∞ −1 n→+∞
wn (0)
soit x2 − 1 wn (x) = 0 et en conséquence, wn (x) = avec wn (0) = 0
1 − x2
fn
(sans quoi wn = 0 et = 0 en dehors des racines de Ln et fn = αLn , ce
Ln
qui n’est pas, ou de manière générale le wronskien d’une base de solution est
non nul). Il en résulte alors que :
lim |wn (x)| = lim |Ln (x) fn (x) − fn (x) Ln (x)| = +∞
|x|→1 |x|→1
et fn n’est pas dans Eλn . Donc Eλn est de dimension 1 engendré par Ln .
3. Pour u (t, x) = a (t) b (x) , notre équation aux dérivées partielles devient :
a (t) b (x) = −a (t) x2 − 1 b (x) + 2xb (x) = −a (t) L (b) (x)
Pour u non identiquement nulle, il existe t0 ∈ R tel que a (t0 ) = 0 et b est non
a (t0 )
identiquement nulle telle que L (b) = λb avec λ = − , il existe donc un
a (t0 )
entier n ∈ N tel que λ = n (n + 1) et b = αLn . Pour x = 1 et t ∈ [−1, 1] , on a
a (t) Ln (1) = −2Ln (1) a (t) avec Ln (1) = 1 et 2Ln (1) = n (n + 1) (qui résulte
de x2 − 1 Ln (x) + 2xLn (x) = n (n + 1)#Ln (x)), soit a$ (t) = −n # (n + 1) a (t)
$
et a (t) = β + γt pour n = 0, a (t) = β cos n (n + 1)t + γ sin n (n + 1)t
pour n ≥ 1. Les solutions
# cherchées
# sont donc
$ les fonctions
# de la forme
$$ u (t, x) =
a + bt ou u (t, x) = a cos n (n + 1)t + b sin n (n + 1)t Ln (x) avec
n ∈ N∗ .
Exercice 15.6. On désigne par (Pn )n∈N la suite des polynômes de Le-
gendre normalisés sur l’intervalle I = ]−1, 1[ et pour tout entier naturel n,
on définit la fonction ϕn par :
2 1 − x2 # 2
$
∀x ∈ I, ϕn (x) = (Pn (x)) + (Pn (x))
n (n + 1)
2
2x (Pn (x))
1. Montrer que ϕn (x) = .
n (n + 1)
Exercices 451
5
2n + 1
2. En déduire que sup |Pn (x)| = .
x∈[−1,1] 2
Solution.
1. On a pour tout x ∈ R :
2Pn (x)
ϕn (x) = n (n + 1) Pn (x) − xPn (x) + 1 − x2 Pn (x)
n (n + 1)
2
2x (Pn (x))
=
n (n + 1)
2. On en déduit que ϕn (x) ≥ 0 sur [0, 1] et la fonction ϕn est croissante sur
l’intervalle [0, 1] . Il en résulte que :
2 2
∀x ∈ [0, 1] , 0 ≤ (Pn (x)) ≤ ϕn (x) ≤ ϕn (1) = (Pn (1))
5
2n + 1
et |Pn (x)| ≤ |Pn (1)| = . Par parité ce résultat est encore valable sur
2 5
2n + 1
[−1, 1]. On peut donc conclure que sup |Pn (x)| = .
x∈[−1,1] 2
Exercice 15.7. (Ln )n∈N est la suite des polynômes de Legendre norma-
lisés par les conditions Ln (1) = 1 (paragraphe 15.3).
1. Montrer que l’on a pour tout n ∈ N∗ :
Solution.
1. Pour tout n ∈ N∗ , on a XLn − Ln−1 ∈ Rn [X] = Vect {L0 , · · · , Ln } , donc
n
XLn − Ln−1 = αk Lk avec :
k=0
2 3 4 3 4
αk Lk = XLn − Ln−1 | Lk = Ln | XLk − Ln−1 | Lk
1 3 4 1
= [xLn (x) Lk (x)]−1 − Ln | (XLk ) − [Ln−1 (x) Lk (x)]−1 + Ln−1 | Lk
3 # $
4
+ Ln−1 | Lk
n+k n−1+k
= 1 + (−1) − Ln | (XLk ) − 1 − (−1)
3 4
= Ln−1 | Lk − Ln | (XLk )
= Ln−1 | Lk − Ln | Lk − Ln | XLk = 0
pour k ≤ n − 1 et XLn − Ln−1 = αn Ln . Les coeeficients de X n dans cette
égalité donnent αn = n. La relation (15.5) nous donne par dérivation :
n (n + 1) Ln+1 − Ln−1 = (2n + 1) L (Ln ) = (2n + 1) n (n + 1) Ln
soit Ln+1 − Ln−1 = (2n + 1) Ln . De ces deux égalités, on déduit que :
Ln+1 = Ln−1 + (2n + 1) Ln = XLn − nLn + (2n + 1) Ln = XLn + (n + 1) Ln
1
2. Les coefficients de Fourier-Legendre de f sont les cn (f ) = Pn (x) dx. Pour
α
1−α
n = 0, on a c0 (f ) = √ . Pour n ≥ 1, l’égalité :
2
1 1 1
Pn = √ √ Pn+1 −√ Pn−1
2n + 1 2n + 3 2n − 1
1 Pn+1 (1) − Pn+1 (α) Pn−1 (1) − Pn−1 (α)
nous donne cn (f ) = √ √ − √
5 2n + 1 2n + 3 2n − 1
2k + 1 1 1
avec Pk (1) = , donc √ Pn+1 (1) − √ Pn−1 (1) = 0 et
2 2n + 3 2n − 1
1 Pn−1 (α) Pn+1 (α)
cn (f ) = √ √ − √ .
2n + 1 2n − 1 2n + 3
3. La fonction f étant lipschitzienne, on a pour tout x ∈ ]−1, 1[ :
+∞
1−α 1 Pn−1 (α) Pn+1 (α)
f (x) = √ P0 (x) + √ √ − √ Pn (x)
2 n=1
2n + 1 2n − 1 2n + 3
√
2
En utilisant les polynômes Lk = √ Pk , cela s’écrit :
2k + 1
+∞
1−α 1
f (x) = + (Ln−1 (α) − Ln+1 (α)) Ln (x)
2 2 n=1
+∞
1 − α 1 1
Pour x = α, on obtient, + (Ln−1 (α) − Ln+1 (α)) Ln (α) = , ce qui
2 2 n=1 2
peut se vérifier directement (somme télescopique).
Bibliographie
455
456 Index
séparable, 5
série de Fourier, 60
Schläffi, 435
Schwarz, 276
semi-norme, 25
Simpson, 272
sous-groupe discret, 114
Taylor, 288
Taylor-Lagrange, 289
Taylor-Lagrange (formule de), 287
Taylor-Lagrange (inégalité), 287
Taylor-Young, 291, 292, 309
Tchebychev (polynômes de), 430, 444
topologie induite, 2
E N S E I G N E M E N T S U P M AT H
A g r é g at io n – M as ter
Jean-Étienne Rombaldi
ISBN : 978-2-7598-2339-0