Vous êtes sur la page 1sur 374

Recueil de notes

pour le cours MAT 2100 : Analyse 3

M. C. Delfour
Département de mathématiques et de statistique
Université de Montréal
C.P. 6128, succ. Centre-ville
Montréal, Canada H3C 3J7

delfour@dms.umontreal.ca
http://www.dms.umontreal.ca/˜delfour/

Version 9.0

Montréal, le 15 avril 2017


ii
Table des matières

Préface xi
Orientation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi

1 Des entiers naturels aux réels 1


1 Nombres entiers naturels N (+, ·, <) . . . . . . . . . . . . . . . . . . . 1
2 Nombres entiers Z (+, ·, <) . . . . . . . . . . . . . . . . . . . . . . . . 2
3 Nombres rationnels Q (+, ·, <) . . . . . . . . . . . . . . . . . . . . . . 3
4 Nombres réels R(+, ·, <) . . . . . . . . . . . . . . . . . . . . . . . . . 5
4.1 Des fissures dans l’ensemble Q des rationnels . . . . . . . . . 5
4.2 ◮ Construction de R : les coupures de Dedekind . . . . . . . 7
4.2.1 Définition des coupures . . . . . . . . . . . . . . . . 8
4.2.2 Relation d’ordre, addition et multiplication . . . . . 8
4.2.3 Propriété P7 de complétude . . . . . . . . . . . . . 10
4.2.4 Réels étendus R . . . . . . . . . . . . . . . . . . . . 12
4.3 Bornitudes, infimum et supremum . . . . . . . . . . . . . . . 13
4.4 Densité des rationnels et des irrationnels dans R . . . . . . . 15
4.5 Valeur absolue . . . . . . . . . . . . . . . . . . . . . . . . . . 16
4.6 Représentation décimale des nombres réels . . . . . . . . . . . 18
5 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

2 Quelques notions ensemblistes et algébriques 23


1 Relation, application et fonction . . . . . . . . . . . . . . . . . . . . 23
1.1 Application et fonction . . . . . . . . . . . . . . . . . . . . . 23
1.2 Relation binaire et relation d’équivalence . . . . . . . . . . . 25
2 Cardinal et dénombrabilité . . . . . . . . . . . . . . . . . . . . . . . 27
2.1 Définitions et exemples . . . . . . . . . . . . . . . . . . . . . 27
2.2 Quelques résultats généraux . . . . . . . . . . . . . . . . . . . 30
2.3 R n’est pas dénombrable . . . . . . . . . . . . . . . . . . . . . 32
2.4 ◮ Cardinalité du continu c et cardinaux transfinis . . . . . . 33
2.5 ◮ ℵ0 , ℵ1 , ℵ2 , ℵ3 , · · · , hypothèse du continu, et axiome du choix 34
3 Corps, ensemble ordonné et corps ordonné . . . . . . . . . . . . . . . 34
3.1 Corps et corps commutatif . . . . . . . . . . . . . . . . . . . 34
3.2 Ensemble ordonné . . . . . . . . . . . . . . . . . . . . . . . . 36
3.3 Corps ordonné . . . . . . . . . . . . . . . . . . . . . . . . . . 39

iii
iv Table des matières

4 Nombres complexes et hypercomplexes . . . . . . . . . . . . . . . . . 40


4.1 Nombres complexes . . . . . . . . . . . . . . . . . . . . . . . 40
4.2 ◮ Nombres hypercomplexes . . . . . . . . . . . . . . . . . . . 42
5 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

3 Topologie et suites dans les espaces métriques 47


1 Espace vectoriel, norme, produit scalaire . . . . . . . . . . . . . . . . 47
1.1 L’espace Rn , n ≥ 1 . . . . . . . . . . . . . . . . . . . . . . . . 47
1.2 Espace vectoriel . . . . . . . . . . . . . . . . . . . . . . . . . 48
1.3 Norme et espace vectoriel normé . . . . . . . . . . . . . . . . 49
1.4 Produit scalaire . . . . . . . . . . . . . . . . . . . . . . . . . . 54
2 Métrique et espace métrique . . . . . . . . . . . . . . . . . . . . . . . 55
2.1 Définition et exemples . . . . . . . . . . . . . . . . . . . . . . 55
2.2 Quelques propriétés . . . . . . . . . . . . . . . . . . . . . . . 58
3 Ensemble ouvert et ensemble fermé . . . . . . . . . . . . . . . . . . . 59
3.1 Boule ouverte et boule trouée . . . . . . . . . . . . . . . . . . 59
3.2 Ensemble ouvert et intérieur d’un ensemble . . . . . . . . . . 60
3.3 Ensemble fermés et adhérence d’un ensemble . . . . . . . . . 64
3.4 Frontière d’un ensemble . . . . . . . . . . . . . . . . . . . . . 70
4 Ensembles compacts . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
5 Caractérisation de la compacité dans Rk . . . . . . . . . . . . . . . . 75
6 Suites de Cauchy, complétude et complété . . . . . . . . . . . . . . . 79
6.1 Suites de Cauchy . . . . . . . . . . . . . . . . . . . . . . . . . 79
6.2 Espace métrique complet . . . . . . . . . . . . . . . . . . . . 84
6.3 Complété d’un espace métrique . . . . . . . . . . . . . . . . . 86
7 Compacité et compacité séquentielle . . . . . . . . . . . . . . . . . . 89
8 Ensembles parfaits . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
9 Ensembles connexes et ensembles convexes . . . . . . . . . . . . . . . 96
9.1 Ensembles connexes . . . . . . . . . . . . . . . . . . . . . . . 96
9.2 Ensembles convexes, sous-ensembles linéaire et affine . . . . . 100
10 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

4 Fonctions, limites et continuités 107


1 Rappels sur les applications et les fonctions . . . . . . . . . . . . . . 107
2 Limite d’une fonction . . . . . . . . . . . . . . . . . . . . . . . . . . 109
2.1 Limite d’une fonction en un point d’accumulation . . . . . . 109
2.2 Limite d’une fonction d’une variable réelle aux infinis . . . . 113
2.3 Limite inférieure et limite supérieure d’une fonction à valeurs
réelles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
3 Fonctions continues . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
3.1 Définitions et propriétés . . . . . . . . . . . . . . . . . . . . . 115
3.2 Application ouverte ou fermée, homéomorphisme . . . . . . . 120
3.3 Métriques équivalentes . . . . . . . . . . . . . . . . . . . . . . 122
3.4 Prolongement continu . . . . . . . . . . . . . . . . . . . . . . 127
4 Continuité et compacité . . . . . . . . . . . . . . . . . . . . . . . . . 134
5 Continuité et connexité . . . . . . . . . . . . . . . . . . . . . . . . . 136
Table des matières v

6 Fonctions uniformément continues . . . . . . . . . . . . . . . . . . . 138


6.1 Définitions et propriétés . . . . . . . . . . . . . . . . . . . . . 138
6.2 Prolongement uniformément continu . . . . . . . . . . . . . . 141
7 Fonctions lipschitziennes . . . . . . . . . . . . . . . . . . . . . . . . . 142
7.1 Définitions et propriétés . . . . . . . . . . . . . . . . . . . . . 142
7.2 Prolongement lipschitzien . . . . . . . . . . . . . . . . . . . . 144
8 Application contractante et théorème du point fixe . . . . . . . . . . 145
9 Fonctions d’une variable réelle . . . . . . . . . . . . . . . . . . . . . . 146
9.1 Limites à gauche, limites à droite, discontinuités . . . . . . . 146
9.2 Fonction monotone . . . . . . . . . . . . . . . . . . . . . . . . 148
9.3 ◮ Fonction à variation bornée, fonction absolument continue 150
10 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151

5 Espaces vectoriels, convergences et applications linéaires 155


1 Rappels : espace vectoriel, norme, et espace de Banach . . . . . . . . 155
2 Suites, espaces et séries de fonctions . . . . . . . . . . . . . . . . . . 157
2.1 Convergences des suites de fonctions . . . . . . . . . . . . . . 157
2.2 Espaces de Banach de fonctions bornées/continues . . . . . . 161
2.3 Espace de fonctions lipschitziennes . . . . . . . . . . . . . . . 164
2.4 Séries de fonctions . . . . . . . . . . . . . . . . . . . . . . . . 166
3 ◮ Espaces de Banach de fonctions différentiables . . . . . . . . . . . 167
4 Produit scalaire et espaces de Hilbert . . . . . . . . . . . . . . . . . . 169
5 Applications linéaires et linéaires continues . . . . . . . . . . . . . . 172
6 Espaces vectoriels de dimension finie . . . . . . . . . . . . . . . . . . 177
6.1 Espace euclidien . . . . . . . . . . . . . . . . . . . . . . . . . 177
6.2 L’espace des applications linéaires . . . . . . . . . . . . . . . 178
6.3 Orthogonalité et transposition . . . . . . . . . . . . . . . . . 181
7 Groupe général linéaire : métriques et complétude . . . . . . . . . . 185
7.1 Rappels sur la notion de groupe . . . . . . . . . . . . . . . . 185
7.2 Définition et propriétés . . . . . . . . . . . . . . . . . . . . . 186
7.3 Une première métrique sur GL (n) . . . . . . . . . . . . . . . 188
7.4 ◮ Une seconde métrique sur GL (n) invariante à droite . . . . 189
8 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194

6 Dérivée, dérivées directionnelles et différentielles 199


1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199
2 Fonctions numériques d’une variable réelle . . . . . . . . . . . . . . . 200
2.1 Continuité et différentiabilité . . . . . . . . . . . . . . . . . . 202
2.2 Théorème de la moyenne ou des accroissements finis . . . . . 204
2.3 Propriété de la dérivée d’une fonction dérivable partout . . . 206
2.4 Théorème de Taylor . . . . . . . . . . . . . . . . . . . . . . . 206
3 Fonctions de plusieurs variables réelles . . . . . . . . . . . . . . . . . 208
3.1 Dérivée directionelle et différentielle au sens de Gateaux . . . 208
3.1.1 Définitions et propriétés . . . . . . . . . . . . . . . . 208
3.1.2 Opérations algébriques et premiers exemples . . . . 209
3.1.3 Gateaux différentiabilité n’entraı̂ne pas continuité . 212
vi Table des matières

3.1.4 Dérivées partielles, gradient, application et matrice


jacobiennes . . . . . . . . . . . . . . . . . . . . . . . 214
3.2 Approche géométrique à la différentielle . . . . . . . . . . . . 216
3.3 Dérivée directionnelle et différentielle au sens de Hadamard . 220
3.3.1 Formulation équivalente à l’approche de Hadamard 220
3.3.2 Définitions . . . . . . . . . . . . . . . . . . . . . . . 223
3.3.3 Continuité des fonctions Hadamard directionnelle-
ment dérivables . . . . . . . . . . . . . . . . . . . . 227
3.3.4 Opérations algébriques sur les dérivées directionnelles
et les différentielles . . . . . . . . . . . . . . . . . . 228
3.3.5 Dérivation et différentiation en chaı̂ne des fonctions
composées . . . . . . . . . . . . . . . . . . . . . . . 229
3.4 Différentielle de Fréchet . . . . . . . . . . . . . . . . . . . . . 233
3.5 Fonctions lipschitziennes et différentiabilité . . . . . . . . . . 236
3.5.1 Définitions . . . . . . . . . . . . . . . . . . . . . . . 236
3.5.2 Gateaux dérivabilité et Lipschitzité donnent Hada-
mard dérivabilité . . . . . . . . . . . . . . . . . . . . 237
3.6 Théorème de la moyenne pour les fonctions vectorielles . . . . 238
3.7 Fonctions de classes C (p) , p ≥ 0, et matrice hessienne . . . . . 241
3.7.1 Classes C (0) et C (1) . . . . . . . . . . . . . . . . . . 241
3.7.2 Classe C (2) , matrice hessienne et classe C (p) . . . . 244
3.8 Généralisation et perspectives : les semi-différentielles . . . . 248
3.9 Tableau des notions de dérivabilité et de différentiabilité . . . 249
4 Fonctions convexes et optimisation . . . . . . . . . . . . . . . . . . . 249
4.1 Fonctions convexes . . . . . . . . . . . . . . . . . . . . . . . . 249
4.2 Fonctions convexes directionnellement dérivables . . . . . . . 251
4.3 Optimisation convexe : condition nécessaire et suffisante . . . 254
4.4 Optimisation différentiable sans contraintes : conditions
nécessaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . 256
5 Théorèmes de la fonction inverse, de la fonction implicite et du rang 260
5.1 Théorème de la fonction inverse . . . . . . . . . . . . . . . . . 260
5.2 Théorème de la fonction implicite . . . . . . . . . . . . . . . . 264
5.3 Théorèmes du rang et des multiplicateurs de Lagrange . . . . 266
6 ◮ Déterminants et formules de changement de variable . . . . . . . . 275
6.1 Formule de Leibniz . . . . . . . . . . . . . . . . . . . . . . . . 275
6.2 Formule de Laplace ou formule de récurrence . . . . . . . . . 282
6.3 Comatrice ou matrice des cofacteurs et calcul de l’inverse . . 285
6.4 Aire, volume et leur généralisation en dimension n > 3 . . . . 286
6.5 Formule de changement de variable pour l’intégrale de volume 288
6.6 Intégrale de ligne, de surface et de sous-variétés de dimension
supérieure . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 289
7 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 291

Annexe A. Corrigés des exercices 297


1 Exercices du Chapitre 1 . . . . . . . . . . . . . . . . . . . . . . . . . 297
2 Exercices du Chapitre 2 . . . . . . . . . . . . . . . . . . . . . . . . . 297
Table des matières vii

3 Exercices du Chapitre 3 . . . . . . . . . . . . . . . . . . . . . . . . . 299


4 Exercices du Chapitre 4 . . . . . . . . . . . . . . . . . . . . . . . . . 312
5 Exercices du Chapitre 5 . . . . . . . . . . . . . . . . . . . . . . . . . 322
6 Exercices du Chapitre 6 . . . . . . . . . . . . . . . . . . . . . . . . . 335

Éléments de bibliographie 357


viii Table des matières
Table des figures

1.1 Richard Dedekind (1831-1916). . . . . . . . . . . . . . . . . . . . . . 7

2.1 Georg Cantor (1845–1918). . . . . . . . . . . . . . . . . . . . . . . . 27


2.2 William Rowan Hamilton (1805–1865). . . . . . . . . . . . . . . . . . 43
2.3 Plaque commémorative de la naissance des quaternions sur le pont de
Broom (Dublin). ≪Ici, le 16 octobre 1843, alors qu’il se promenait, Sir
William Rowan Hamilton découvrit dans un éclair de génie la formule
fondamentale sur la multiplication des quaternions i2 = j 2 = k 2 =
ijk = −1 et la grava sur une pierre du pont. ≫ . . . . . . . . . . . . 44

3.1 Maurice René Fréchet (1878–1973). . . . . . . . . . . . . . . . . . . . 55


3.2 Felix Hausdorff (1868–1942). . . . . . . . . . . . . . . . . . . . . . . 57
3.3 Augustus De Morgan (1806–1871). . . . . . . . . . . . . . . . . . . . 68
3.4 Heinrich Eduard Heine (1821–1881). . . . . . . . . . . . . . . . . . . 78
3.5 Félix Edouard Justin Émile Borel (1871–1956). . . . . . . . . . . . . 78
3.6 Bernard Placidus Johann Nepomuk Bolzano (1781–1848). . . . . . . 79
3.7 Karl Theodor Wilhelm Weierstrass (1815–1897) et Sofia Kovalevskaı̈a
(1850–1891). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
3.8 Augustin Louis Cauchy (1789–1857). . . . . . . . . . . . . . . . . . . 80
3.9 L’ensemble de Cantor . . . . . . . . . . . . . . . . . . . . . . . . . . 95

4.1 Exemples de fonctions f . Pour E = R, la limite y de f (x) en a existe


pour les seconde et troisième fonctions, mais pas pour la première. . 110
4.2 Johann Peter Gustav Lejeune Dirichlet (1805–1859). . . . . . . . . . 111
4.3 Limite de sin(1/x) en a = 0 ? . . . . . . . . . . . . . . . . . . . . . . 112
4.4 Heinrich Franz Friedrich Tietze (1880–1964). . . . . . . . . . . . . . 128
4.5 Construction de l’escalier de Cantor . . . . . . . . . . . . . . . . . . 151

6.1 Exemples de dérivées à droite et à gauche. . . . . . . . . . . . . . . . 202


6.2 Exemples 3.2 et 3.10. . . . . . . . . . . . . . . . . . . . . . . . . . . . 212
6.3 Exemple 3.3 (échelle logarithmique) . . . . . . . . . . . . . . . . . . 213
6.4 Exemple 3.4. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215
6.5 Fonction convexe et fonction concave . . . . . . . . . . . . . . . . . . 250
6.6 Tangence du convexe U à l’ensemble de niveau de f passant par x ∈ U .254

ix
x Table des figures

6.7 Tangence du sous-espace affine A ou linéaire S à un ensemble de


niveau de f . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 256
6.8 Demi-tangente dh(0; +1) au chemin h(t) dans U au point h(0) = x. . 270
6.9 Fonction de l’Exercice 7.3. . . . . . . . . . . . . . . . . . . . . . . . . 291
Préface

Orientation
Ce recueil de notes de cours s’appuie principalement sur les chapitres 1, 2, 4,
7 et 9 du livre de W. Rudin [1] qui est un grand classique dans le domaine en
Amérique du Nord. On présume que les notions fondamentales en dimension un
(topologie, suites, séries, dérivées, intégrale de Riemann, etc.) ont été acquises dans
un premier cours d’analyse (par exemple, MAT 1000). Il n’est pas possible dans le
cadre d’un cours d’une session d’inclure l’intégrale de Lebesgue.
La partie sur les espaces métriques est considérablement augmentée pour aller
au delà des principales définitions et résultats et en entrevoir les applications et les
retombées. C’est le cadre le plus général dans lequel tout peut se faire via la notion
de suite sans imposer de structure algébrique. La notion de métrique déjà très
présente en géométrie se retrouve de nos jours un peu partout comme, par exemple,
en intelligence artificielle, en théorie du codage (métrique de Hamming), en théorie
des graphes, en analyse des données, en statistique et en imagerie. On a choisi
de donner un traitement exhaustif de la compacité, de la compacité séquentielle,
du complété et de la complétude. On fleurte un peu avec la topologie générale et
l’analyse fonctionnelle.
Un des objectifs importants est d’appuyer les notions abstraites par des cons-
tructions et des exemples concrets d’espaces métriques. La partie sur la continuité
et la convergence uniforme donnent l’occasion de construire les premiers espaces
métriques de fonctions. À l’aide de la fonction caractéristique et de la fonction
distance on construit aussi des métriques sur l’ensemble des sous-ensembles d’un
ensemble arbitraire. On retrouve entre autres la métrique de Pompéiu-Hausdorff.
On donne aussi deux exemples de métriques complètes sur le groupe général linéaire
dont l’une est invariante à droite.
La partie sur la différentiabilité a été considérablement développée pour bien
mettre en lumière le passage de la notion de dérivée en dimension un à celle
de différentielle à partir de la dimension deux. Ces notions se prolongent quasi-
intégralement aux espaces vectoriels de dimension infinie menant naturellement au
Calcul des variations et de ses rejetons, mais aussi au calcul différentiel sur des sous-
variétés régulières de l’espace euclidien. On ne peut malheureusement dans le cadre
d’un cours d’une session aller au delà de quelques applications en optimisation et

xi
xii Préface

de l’obtention des gros théorèmes de la fonction inverse, de la fonction implicite et


de quelques formes du théorème du rang.
Il y a plusieurs directions pour la suite de ce cours, mais l’intégration est
prioritaire. L’intégration de Riemann, de Riemann-Stieljes et de Lebesgue sont des
sujets incontournables. Le livre suivant (au moins la première moitié qui serait
l’équivalent d’une session au DMS) est fortement recommandé :
R.L. Wheeden and A. Zygmund Measure and integral, Marcel Dek-
ker, New York and Basel, 1977.
Avec l’intégrale de Lebesgue, on obtient l’exemple d’un espace de Hilbert de fonc-
tions. Avec la théorie des distributions, on obtient les espaces de Sobolev qui sont
fondamentaux en équations aux dérivées partielles. Un autre sujet est la géométrie
différentielle. Voir, par exemple, le livre suivant :
M. Berger et B. Gostiaux Géométrie différentielle : variétés, courbes
et surfaces, 2-eme éd., Presses Universitaire de France, Paris, 1992. (tra-
duction anglaise, Differential geometry : Manifolds, curves and surfaces,
Springer-Verlag, New York, 1988.
Un autre est l’optimisation avec les idées de semicontinuité et de semi-différentielles
qui prolongent et complètent les notions correspondantes vues dans le cours :
M. Delfour, Introduction à l’optimisation et au calcul semi-différentiel,
Collection Sciences Sup., Mathématiques appliqués pour le Master/SMAI,
Dunod, Paris 2012.
La version anglaise de ce livre
M. Delfour, Introduction to optimization and semidifferential calcu-
lus, SIAM-MOS series, Society for Industrial and Applied Mathematics,
Philadelphia, USA, 2012.
existe aussi sous forme électronique. Elle peut s’obtenir gratuitement (chapitre par
chapitre) à partir d’une machine du réseau de l’Université de Montréal à l’adresse
suivante :
http ://epubs.siam.org/doi/book/10.1137/1.9781611972153

Michel Delfour

Montréal, le 1 janvier 2017


Chapitre 1
Des entiers naturels
aux réels

1 Nombres entiers naturels N (+, ·, <)


On prend comme point de départ l’ensemble des entiers naturels

déf
N = {1, 2, 3, . . .}

sur lequel on définit une addition et une multiplication.


L’ addition + : N × N → N

∀x, y ∈ N, x+y ∈N

qui a comme propriétés :

P1 (commutativité) x+y = y+x


P2 (associativité) (x + y) + z = x + (y + z).

La multiplication · : N × N → N

∀x, y ∈ N, x·y ∈N

qui a comme propriétés :

P1 (commutativité) x·y =y·x


P2 (associativité) (x · y) · z = x · (y · z).
P4 (élément neutre multiplicatif) ∃ 1 ∈ N tel que ∀x ∈ N, x · 1 = x.

Enfin, on a une propriété de la multiplication par rapport à l’addition :

P3 (distributivité) x · (y + z) = x · y + x · z.

On a aussi les deux relations d’ordre (< et ≤) suivantes :

1
2 Chapitre 1. Des entiers naturels aux réels

- Première relation d’ordre (strict) sur N (<)

x<y si il existe n ∈ N tel que y = x + n

qui est transitive, c’est-à-dire si p < q et q < r, alors p < r.


- Seconde relation d’ordre sur N (≤)

x≤y si x = y ou x < y

qui est aussi transitive, c’est-à-dire si p ≤ q et q ≤ r, alors p ≤ r.

2 Nombres entiers Z (+, ·, <)


Comme il n’est pas toujours possible pour deux entiers a et b dans N de trouver
x ∈ N tel que (ou résoudre l’équation)

a + x = b,

on enrichie les entiers naturels en introduisant les notions d’élément neutre et d’in-
verse additifs :
- existence de l’élément neutre 0 pour l’addition :

P4 (élément neutre additif)


∃ 0 tel que ∀x ∈ N, x+0=x

- existence d’un inverse pour l’addition :

P5 (existence d’un inverse additif)


∀x ∈ N, ∃ (−x) tel que x + (−x) = 0.

On peut alors définir l’opération − : Z × Z → Z


déf
∀x, y ∈ Z, x − y = x + (−y).

On a ainsi construit les nombres entiers


déf
Z = {. . . , −3, −2, −1, 0, 1, 2, 3, . . .} .

Les définitions d’ordre demeurent les mêmes.


- Première relation d’ordre (strict) sur Z (<) :

x<y si il existe n ∈ N tel que y = x + n

- Seconde relation d’ordre sur Z (≤) :

x≤y si x = y ou x < y
3. Nombres rationnels Q (+, ·, <) 3

On résume les propriétés sur Z.


P1 (commutativité) x + y = y + x et x · y = y · x
P2 (associativité) (x + y) + z = x + (y + z) et
(x · y) · z = x · (y · z)
P3 (distributivité) x · (y + z) = x · y + x · z
P4 (élément neutre) - additif ∃ 0 tel que ∀x ∈ Z, 0+x=x
- multiplicatif ∃ 1 tel que ∀x ∈ Z, 1·x = x
P5 (∃ un inverse additif) ∀x ∈ Z, ∃ − x tel que x + (−x) = 0


 a) ∀x, y ∈ Z tel que x > 0 et y > 0



 x+y >0

P6 (relation d’ordre) b) ∀x ∈ Z



 une seule propriété est vraie :



x > 0, x = 0, ou 0 > x.

3 Nombres rationnels Q (+, ·, <)


Ici encore, il n’est pas toujours possible de trouver x ∈ Z tel que (ou résoudre
l’équation)

q·x =p (3.1)

pour toute paire d’entiers p et q dans Z. Il suffit de prendre par exemple q = 2 et


p = 1.
On ajoute à Z les nombres de la forme p/q avec p, q ∈ Z, q 6= 0. La paire (p, q)
n’est cependant pas unique car toutes les paires (np, nq), 0 6= n ∈ Z, sont aussi
solution de l’équation (3.1).
On forme alors les classes d’équivalence
déf
[p/q] = {p′ /q ′ : pq ′ = p′ q}

et on obtient ainsi l’ensemble des nombres rationnels


déf
Q = {[p/q] : ∀p ∈ Z et ∀q ∈ Z tel que q 6= 0}

qui par définition contient les ééments de Z de la forme [p/1], p ∈ Z. Il y a donc


plusieurs représentants dans chaque classe d’équivalence ou plusieurs façons d’écrire
un nombre rationnel donné.
Il peut être utile ou souhaitable de choisir ou construire un représentant dans
chaque classe. Par ce faire on introduit la notion de plus grand commun facteur
(diviseur) de deux entiers positifs p et q non nuls que l’on écrira

(p, q).

On peut maintenant procéder de la façon suivante :


4 Chapitre 1. Des entiers naturels aux réels

a) si p = 0, on écrit 0/1
b) si p 6= 0,
i) on choisit d’abord le signe + ou −
ii) on se ramène à p/q, pour p, q ∈ N
iii) on simplifie la fraction autant que possible en divisant p et q par leur
plus grand commun facteur (diviseur) (p, q).
Ce représentant unique est appelé forme réduite.
La structure (+, ·, <) sur Q subsiste. On peut vérifier que l’addition, la mul-
tiplication et les relations d’ordre sont bien définies :
- l’addition
déf
[p1 /q1 ] + [p2 /q2 ] = [(p1 · q2 + p2 · q1 )/q1 q2 ],
- la multiplication
déf
[p1 /q1 ] · [p2 /q2 ] = [p1 · p2 /q1 · q2 ],

- la relation d’ordre
(
p1 · q2 − p2 · q1 < 0 lorsque q1 · q2 > 0
[p1 /q1 ] < [p2 /q2 ] si
p1 · q2 − p2 · q1 > 0 lorsque q1 · q2 < 0

qui est toujours transitive, c’est-à-dire,


p1 p2 p2 p3 p1 p3
< et < , ⇒ < .
q1 q2 q2 q3 q1 q3

On résume les propriétés sur Q.

P1 (commutativité) x + y = y + x et x · y = y · x
(
(x + y) + z = x + (y + z)
P2 (associativité)
et (x · y) · z = x · (y · z)
P3 (distributivité) x · (y + z) = x · y + x · z
(
(additif) ∃ 0 ∈ Q tel que ∀x ∈ Q, 0 + x = x
P4 (éléments neutres)
(multiplicatif) ∃ 1 ∈ Q tel que ∀x ∈ Q, x · 1 = x

 (additif) ∀x ∈ Q, ∃ − x ∈ Q tel que x + (−x) = 0

P5 (existence d’inverses) (multiplicatif) ∀x ∈ Q, x 6= 0, ∃x−1 ∈ Q


tel que x · x−1 = 1

 a) ∀x, y ∈ Q tel que x > 0 et y > 0, on a


 x + y > 0 et x · y > 0
P6 (relation d’ordre)
 b) ∀x ∈ Q, une seule propriété est vraie :



x > 0, x = 0, ou 0 > x.
4. Nombres réels R(+, ·, <) 5

La relation d’ordre < possède la propriété que pour tout x et y dans Q, on a

x = y, x < y, ou x < y.

Elle demeure transitive, c’est-à-dire,

x < y et y < z ⇒ x < z.

Enfin, on peut définir l’opération de division ÷ : Z × Z \{0} → Q

déf
∀x, y ∈ Z, y 6= 0, x ÷ y = [x/y].

4 Nombres réels R(+, ·, <)


4.1 Des fissures dans l’ensemble Q des rationnels
Si l’on prend le point de vue intuitif que les ensembles N et Z sont des points
le long d’une droite orientée, il y a des trous constitués d’intervalles de longueur un
entre deux éléments consécutifs distincts de N ou de Z : par exemple, entre 1 et 2.
Ce n’est pas le cas de l’ensemble Q des nombres rationnels.

Théorème 4.1. Soient a et b dans Q tel que a < b. Alors il existe c ∈ Q tel que
a < c < b.

Démonstration. On prend c = (a + b)/2 qui appartient bien à Q. Alors, il est facile


de vérifier à partir de la définition que a + b < 2b et 2a < a + b. De là en divisant
par 2, a < (a + b)/2 < b.

Comme il n’y a pas de trous entre deux nombres rationnels distincts, ce premier
résultat inciterait à croire que Q formerait un continuum. Ce n’est cependant pas le
cas et c’est ce qui va motiver √ la construction du continuum des nombres réels. En
effet, on verra plus loin que 2 peut être approché par en dessus et par en dessous
par des rationnels sans jamais l’atteindre :

1< 2<2

1.4 < 2 < 1.5

1.41 < 2 < 1.42
...

1.414 213 562 4 < 2 < 1.414 213 562 5

Il n’y a pas de trous dans l’ensemble Q, mais plutôt des fissures.

Théorème 4.2. Il n’existe pas de x ∈ Q tel que x2 = 2 ou de façon équivalente

∀x ∈ Q, x2 6= 2.
6 Chapitre 1. Des entiers naturels aux réels

Démonstration. On note d’abord que si m ∈ Z est pair, alors m2 est pair. Si m ∈ Z


est impair, alors m = 2k + 1 pour un k ∈ Z et

m2 = (2k + 1)2 = 4 · (k 2 + k) + 1

est impair. Ceci implique que m ∈ Z est impair (resp. pair) si et seulement si m2
est impair (resp. pair).
On raisonne par l’absurde. Supposons qu’il existe x ∈ Q tel que x2 = 2. Alors
x est de la forme m/n pour m et n dans Z, n 6= 0. On prend maintenant x sous sa
forme réduite m/n où le plus grand commun diviseur (m, n) de m et n est 1. On
obtient alors m2 = 2 · n2 ce qui entraı̂ne que m est pair.
Il existe donc r ∈ Z tel que m = 2r. De l’équation (m/n)2 = 2, il vient

4 r 2 = 2 n2 ⇒ 2 r 2 = n2

et on en conclut que n2 et a fortiori n sont pair. Comme m est aussi pair, le plus
grand commun diviseur (m, n) ≥ 2 et cela contredit le choix initial d’une forme
réduite pour x = m/n telle que (m, n) = 1.

Ceci met en lumière le phénomène suivant.

Théorème 4.3. (i) Il n’existe pas de plus grand nombre rationnel positif de
carré inférieur ou égal à 2.
(ii) Il n’existe pas de plus petit nombre rationnel positif de carré supérieur ou
égal à 2.
√ √
En particulier, pour tout r ∈ Q tel que r2 ≤ 2, on a − 2 < r < 2.

Démonstration. (i) Soient Q+ = {x ∈ Q : x ≥ 0} et A = {p ∈ Q+ : p2 ≤ 2}. Du


Théorème 4.2 on sait que A = {p ∈ Q+ : p2 < 2}. Prenons p ∈ A et montrons que
nous pouvons toujours lui associer un nombre q ∈ A tel que p < q, ce qui montrerait
qu’il n’y a pas de plus grand élément dans A.
Associons à p ∈ A le nombre rationnel
déf p2 − 2 2 − p2
q = p− =p+ >p
p+2 p+2
puisque p2 − 2 < 0 et p + 2 > 0.
Pour conclure, il faut maintenant montrer que q ∈ A. On estime la différence
 2  2
p2 − 2 2p + 2 q∈A
q2 − 2 = p− −2= −2
p+2 p+2
⇒ et
4p2 + 8p + 4 − 2(p2 + 4p + 4) 2(p2 − 2)
= = < 0. p < q.
(p + 2)2 (p + 2)2

Il n’y a donc pas de plus grand élément dans A.


(ii) La démonstration est la même en commençant avec l’ensemble B = {p ∈
Q+ : p2 ≥ 2}.
4. Nombres réels R(+, ·, <) 7

Il y a cependant des nombres rationnels M ∈ Q (borne supérieure) tel que

∀p ∈ A = {p ∈ Q+ : p2 < 2}, p≤M

et des nombres rationnels m ∈ Q (borne inférieure) tel que

∀p ∈ B = {p ∈ Q+ : p2 > 2}, p ≥ m.

Il suffit de prendre par exemple M = 2 et m = 1. En effet, s’il existait un p ∈ A tel


que p > 2, cela entraı̂nerait p2 > 4 ce qui contredit la condition p2 ≤ 2.
Ces nombres M et m sont respectivement une borne supérieure de A et une
borne inférieure de B. Ceci va nous amener naturellement à parler d’ensembles
bornés supérieurement (resp. inférieurement) et pour ce type d’ensembles de plus pe-
tite borne supérieure (resp. plus grande borne inférieure). Malheureusement, comme
l’indique le Théorème 4.3, ces dernières bornes ne se trouvent pas nécessairement
dans Q.

4.2 ◮ Construction de R : les coupures de Dedekind

Figure 1.1. Richard Dedekind (1831-1916).

Nous allons maintenant décrire rapidement la construction faite en 1872 par


Richard Dedekind 1 qui va nous permettre de remplir les trous dans l’ensemble Q des
rationnels et construire les nombres réels en suivant, par exemple, la présentation
de W. Rudin [1, Annexe, pages 17–20] ou de E. G. H. Landau [1]. Dedekind
reçut son doctorat en 1852 à Göttingen et il fut le dernier élève de Gauss.

1. R. Dedekind [1].
8 Chapitre 1. Des entiers naturels aux réels

4.2.1 Définition des coupures


L’idée de base est de mettre en correspondance les nombres rationnels avec
des coupures dans Q comme suit :
déf
r ←→ r∗ = {p ∈ Q : p < r}.
∈Q coupure
Pour construire les nombres manquants, on étend la notion de coupure. C’est une
construction purement algébrique.

Définition 4.1.
Un ensemble α de nombres rationnels est appelé une coupure si
i) α contient au moins un rationnel mais pas tous les rationnels, c’est-à-dire,
∅ 6= α $ Q,
ii) si on a p ∈ α et q ∈ Q tel que q < p, alors q ∈ α,
iii) α ne contient pas de plus grand rationnel.
On notera par R l’ensemble de toutes les coupures de Q.

Nous pouvons identifier chaque rationnel r ∈ Q à une coupure particulière.


déf
Théorème 4.4. Soient r ∈ Q et α = {p ∈ Q : p < r}. Alors α est une coupure.

Définition 4.2.
On dira que la coupure {p ∈ Q : p < r} associée à r ∈ Q est une coupure rationnelle
et on la notera r∗ .

Il y a donc un plongement naturel de Q dans R. Mais il y a aussi d’autres


coupures qui correspondent intuitivement à des nombres irrationnels. On vérifiera
aisément que l’ensemble
déf 
α = x ∈ Q+ : x2 < 2 ∪ {Q \ Q+ }

est une coupure
√ √qui correspondra à la racine carrée 2. De la même façon on
peut définir 3, 5, etc. Ces coupures irrationnelles vont contribuer à boucher des
fissures de Q. Mais l’ensemble des coupures contient aussi des nombres qui ne s’ex-
priment pas à l’aide de radicaux comme π = 3, 14159 . . . et e = 2, 7182818284 . . . .

4.2.2 Relation d’ordre, addition et multiplication


On a la propriété suivante.

Théorème 4.5. Soient α une coupure et p et q dans Q tel que p ∈ α et q ∈


/ α.
Alors p < q.

On peut définir une relation d’ordre pour les coupures.

Définition 4.3.
Soient α et β deux coupures.
4. Nombres réels R(+, ·, <) 9

i) On écrira α < β (ou β > α) si

∃p ∈ Q tel que p ∈ β et p ∈
/ α.

ii) On écrira α ≤ β si α = β ou α < β.

Définition 4.4.
Soient α et β deux coupures de Q.
i) L’addition est définie comme l’addition des deux ensembles
déf
α + β = {s + t : s ∈ α et t ∈ β} .

ii) L’élément additif neutre


déf
0∗ = {p ∈ Q : p < 0}.

iii) L’inverse additif


déf
−α = {r ∈ Q : ∃s > 0 tel que − r − s ∈
/ α} .

iv) La valeur absolue d’une coupure α est l’ensemble


(
déf α, si α ≥ 0∗
|α| =
−α, si α < 0∗ .

Définition 4.5.
Soient α et β deux coupures de Q.
i) La multiplication de deux coupures α ≥ 0∗ et β ≥ 0∗ est définie comme
déf 
α·β = s · t : s ∈ α ∩ Q+ et t ∈ β ∩ Q+ ∪ (Q \ Q+ ).

et celle de deux coupures arbitraires α et β comme



 α · β, si α ≥ 0∗ , β ≥ 0∗ ,


 (−α) · (−β), si α < 0∗ , β < 0∗ ,
déf
α·β =

 − [(−α) · β] si α < 0∗ , β ≥ 0∗ ,


− [α · (−β)], si α ≥ 0∗ , β < 0∗ .

ii) L’ élément multiplicatif neutre


déf
1∗ = {p ∈ Q : p < 1}.
10 Chapitre 1. Des entiers naturels aux réels

On peut alors démontrer que l’on a conservé toutes les propriétés sur Q.

P1 (commutativité) x + y = y + x et x · y = y · x
(
(x + y) + z = x + (y + z)
P2 (associativité)
et (x · y) · z = x · (y · z)
P3 (distributivité) x · (y + z) = x · y + x · z
(
(additif) ∃0∗ tel que ∀x ∈ R, 0∗ + x = x
P4 (éléments neutres)
(multiplicatif) ∃1∗ tel que ∀x ∈ R, x · 1∗ = x
 ∗
 (additif) ∀x ∈ R, ∃ − x tel que x + (−x) = 0

P5 (existence d’inverses) (multiplicatif) ∀x ∈ R, x 6= 0∗ , ∃x−1 ∈ R


tel que x · x−1 = 1∗

 a) ∀x, y ∈ R tel que x > 0∗ et y > 0∗ on a


 x + y > 0∗ et x · y > 0∗
P6 (relation d’ordre)

 b) ∀x ∈ R une seule propriété est vraie :


x > 0∗ , x = 0∗ , ou 0∗ > x.

On a la propriété suivante.
Théorème 4.6. Si α et β sont deux coupures tel que α ≤ β, alors α ⊂ β.
Démonstration. Si α ≤ β, ou bien α = β et il n’y a rien à démontrer ou bien

∃p ∈ Q tel que p ∈
/ α et p ∈ β.

Dans le second cas, on raisonne par l’absurde. S’il existe p ∈ α tel que p ∈/ β, alors,
par définition de <, on aurait la contradiction β < α par la propriété P6 b).

4.2.3 Propriété P7 de complétude


Mais, comme nous avons beaucoup travaillé, nous obtenons une propriété de
plus qui découle du théorème dit de complétude de Dedekind.
Théorème 4.7 (Théorème de complétude de Dedekind). Soit A et B deux sous-
ensembles de R tel que
a) A ∪ B = R
b) A ∩ B = ∅
c) A 6= ∅ et B 6= ∅
d) si α ∈ A et β ∈ B, alors α < β.
Alors il existe un et un seul γ ∈ R tel que

∀α ∈ A, α ≤ γ et ∀β ∈ B, γ ≤ β.

De ce théorème on tire le corollaire suivant.


4. Nombres réels R(+, ·, <) 11

Corollaire 1. Sous les hypothèses du Théorème 4.7, ou bien A contient un plus


grand élément ou B contient un plus petit élément.
La dernière étape est d’établir les propriétés de complétude P7 et P7*. On
aura besoin des notions suivantes.

Définition 4.6.
Soit E ⊂ R.
a) On dit que E est borné supérieurement si

∃M ∈ R tel que ∀x ∈ E, x ≤ M.

Un tel nombre M est appelé une borne supérieure de E.


b) On dit que E est borné inférieurement si

∃m ∈ R tel que ∀x ∈ E, m ≤ x.

Un tel nombre m est appelé une borne inférieure de E.


c) Si E est borné supérieurement et inférieurement, on dit que E est borné.

Définition 4.7. a) Soit E ⊂ R un ensemble borné supérieurement. On dit


que b0 ∈ R est est la plus petite borne supérieure de E si
i) b0 est une borne supérieure de E,
ii) pour toute autre borne supérieure M 6= b0 de E, on a b0 < M .
La plus petite borne supérieure b0 de E est unique et sera notée sup E.
b) Soit E ⊂ R un ensemble borné inférieurement. On dit que b0 ∈ R est est
la plus grande borne inférieure de E si
i) b0 est une borne inférieure de E,
ii) pour toute autre borne inférieure m 6= b0 de E, on a b0 > m.
La plus grande borne inférieure b0 de E est unique et sera notée inf E.

On peut maintenant donner la dernière propriété de R.


Théorème 4.8 (Propriété P7 de complétude). Tout sous-ensemble E, ∅ 6= E ⊂ R,
borné supérieurement possède une plus petite borne supérieure sup E ∈ R
On a évidemment la propriété duale suivante.
Théorème 4.9 (Propriété P7* de complétude). Tout sous-ensemble E, ∅ 6= E ⊂
R, borné inférieurement possède une plus grande borne inférieure inf E ∈ R.
Démonstration de P7. On fait appel au Théorème de complétude de Dedekind 4.7
en construisant les ensembles A et B à partir de E de la façon suivante :
déf déf
A = {α ∈ R : ∃x ∈ E tel que α < x} et B = R \A.
12 Chapitre 1. Des entiers naturels aux réels

Par définition, aucun élément de A n’est une borne supérieure de E et tous les
éléments de B sont des bornes supérieures de E. Pour montrer que sup E ∈ R, il
suffit de montrer que B possède un plus petit élément.
On voit que les hypothèses a) et b) du Théorème de complétude de Dedekind
sont vérifiées. Il reste à vérifier
c) A 6= ∅ et B 6= ∅
d) si α ∈ A et β ∈ B, alors α < β.
Comme E 6= ∅, prenons x ∈ E. Alors A 6= ∅ car il contient tous les α ∈ R tel que
α < x. D’autre part, puisque E est borné supérieurement, il existe y ∈ R tel que
x ≤ y pour tout x ∈ E. Par définition, y ∈ B, B 6= ∅, et c) est vérifiée.
Enfin, si α ∈ A, il existe x0 ∈ E tel que α < x0 . Si β ∈ B, il n’existe pas de
x ∈ E tel que β < x. Donc pour tout x ∈ E, on a β ≥ x. Finalement, α < x0 ≤ β,
α < β, et d) est vérifiée. Les hypothèses a), b), c), et d) sont donc vérifiées.
Par le Théorème de complétude de Dedekind, il existe un et un seul γ ∈ R tel
que
∀α ∈ A, α ≤ γ et ∀β ∈ B, γ ≤ β.
De là, γ est une borne supérieure de A, et, ou bien γ ∈ A ou bien γ ∈ B. Par
définition, aucun élément de A n’est une borne supérieure de E et tous les éléments
de B sont des bornes supérieures de E.
On montre enfin que γ ∈ / A ce qui entraı̂ne que γ ∈ B est la plus petite borne
supérieure de E. Si γ ∈ A, alors il existerait x ∈ E tel que γ < x. On pourrait alors
choisir α ∈ R tel que γ < α < x. Comme α < x, on aurait par définition α ∈ A et
γ ne serait pas une borne supérieure de A. Donc γ ∈ B.

Démonstration de P7*. Par hypothèse, il existe une borne b ∈ R tel que pour tout
x ∈ E, on a b ≤ x. Donc pour tout x ∈ E, on a −x ≤ −b et −b est une borne
déf
supérieure de l’ensemble −E = {−x : x ∈ E}. Par la propriété P7 de complétude,
il existe une plus petite borne supérieure

b0 = sup −E ∈ R

de −E et b0 ≤ −b. On a donc

∀x ∈ E, −x ≤ b0 ⇒ ∀x ∈ E, −b0 ≤ x

et −b0 est une borne inférieure de E. Mais on a montré que pour toute borne
inférieure b de E, on a b0 ≤ −b ou de façon équivalente b ≤ −b0 . Donc −b0 est la
plus grande borne inférieure de E et inf E = −b0 ∈ R.

4.2.4 Réels étendus R


On peut introduire les points ±∞ en éliminant la condition i),

∅ 6= α $ Q,

de la Définition 4.1 de coupure. Ce faisant on introduit deux nouvelles coupures.


4. Nombres réels R(+, ·, <) 13

Définition 4.8.
Un ensemble α ⊂ Q de nombres rationnels est appelé une coupure étendue si
ii) si on a p ∈ α et q ∈ Q tel que q < p, alors q ∈ α,
iii) α ne contient pas de plus grand rationnel.
On notera par R l’ensemble de toutes les coupures étendues de Q.

Avec cette nouvelle définition Q et ∅ sont des coupures étendues que l’on notera

déf déf
−∞ = ∅ et + ∞ = Q.

Pour toute autre coupure étendue α, on a ∅ 6= α $ Q et l’on retombe sur la notion


de coupure de la Définition 4.1. On obtient donc

R = R ∪{±∞}

et, de la Définition 4.3 d’ordre, on a, pour tout α tel que ∅ 6= α $ Q,

−∞ = ∅ < α < Q = +∞.

4.3 Bornitudes, infimum et supremum


Maintenant que la construction de l’ensemble des réels a été esquissée, on
revient à sa forme plus intuitive comme par exemple celle d’une droite orientée sur
laquelle on a fixé une origine 0.
On répète donc les définitions de bornitude, d’infimum et de supremum du
paragraphe précédents dans ce contexte.

Définition 4.9 (Définition 4.6).


Soit E ⊂ R.
a) On dit que E est borné supérieurement si

∃M ∈ R tel que ∀x ∈ E, x ≤ M.

Un tel nombre M est appelé une borne supérieure de E.


b) On dit que E est borné inférieurement si

∃m ∈ R tel que ∀x ∈ E, m ≤ x.

Un tel nombre m est appelé une borne inférieure de E.


c) Si E est borné supérieurement et borné inférieurement, on dit que E est
borné.
déf
Exemple 4.1. 1) Soit E = {1, 2, 3}. Alors 0 est une borne inférieure de E et
π une borne supérieure. E est borné.
déf
2) Soit E = {1/n : n ∈ N}. Alors 0 est une borne inférieure de E et 1 une
borne supérieure. E est borné.
14 Chapitre 1. Des entiers naturels aux réels

déf
3) Soit E = {p : p > 0}. Alors 0 est une borne inférieure de E et E n’est pas
borné supérieurement.
déf
4) Soit E = {p : p2 < 2}. Alors −2 est une borne inférieure de E et 3/2 une
borne supérieure.

Définition 4.10 (Définition 3.5).

a) Soit E ⊂ R un ensemble borné supérieurement. On dit que b0 ∈ R est est


la plus petite borne supérieure de E si
i) b0 est une borne supérieure de E,
ii) pour toute autre borne supérieure M 6= b0 de E, on a b0 < M .
La plus petite borne supérieure b0 de E est unique et sera notée sup E.
b) Soit E ⊂ R un ensemble borné inférieurement. On dit que b0 ∈ R est est
la plus grande borne inférieure de E si
i) b0 est une borne inférieure de E,
ii) pour toute autre borne inférieure m 6= b0 de E, on a b0 > m.
La plus grande borne inférieure b0 de E est unique et sera notée inf E.
c) Lorsque E 6= ∅ n’est pas borné supérieurement, on posera sup E = +∞.
Lorsque E 6= ∅ n’est pas borné inférieurement, on posera inf E = −∞.

Remarque 4.1.
Si E 6= ∅, alors −∞ ≤ inf E ≤ sup E ≤ +∞. Si E = ∅, alors par convention on
posera inf ∅ = +∞ et sup ∅ = −∞.

Théorème 4.10 (Propriétés de complétude). Soit E, ∅ 6= E ⊂ R.


(i) Propriétés P7. E borné supérieurement ⇒ sup E ∈ R
(i) Propriétés P7*. E borné inférieurement ⇒ inf E ∈ R

Exemple 4.2.
déf
Soit E = {1, 2, 3}. Alors inf E = 1 ∈ E et sup E = 3 ∈ E.

Lorsque E est un ensemble fini, inf E ∈ E et sup E ∈ E. Lorsque E n’est pas


un ensemble fini et que par exemple inf E ∈/ E, il peut être intéressant de construite
une suite d’éléments de E qui converge vers inf E. Dans ce cas, on peut utiliser les
conditions équivalentes suivantes.
Théorème 4.11. Soit E ⊂ R.
a) b0 est la plus petite borne supérieure de E si et seulement si
i) b0 est une borne supérieure de E,
ii’) pour tout M tel que b0 > M , il existe x0 ∈ E tel que b0 ≥ x0 > M .
b) b0 est la plus grande borne inférieure de E si et seulement si
i) b0 est une borne inférieure de E,
4. Nombres réels R(+, ·, <) 15

ii’) pour tout m tel que b0 < m, il existe x0 ∈ E tel que b0 ≤ x0 < m.

Exemple 4.3.
Par exemple si b0 = sup E est finie et b0 ∈
/ E, on construit pour chaque n ∈ N, xn ∈
E tel que b0 ≥ xn > b0 −1/n. Cette suite comporte un nombre infini d’éléments.

Démonstration du Théorème 4.11. On démontre seulement a). Le cas b) est sem-


blable. Il est aussi suffisant de démontrer l’équivalence des conditions ii) et ii’)
puisque la condition i) est commune.
ii) ⇒ ii’) De i), on sait que b0 est une borne supérieure de E. Pour M tel que
0
b > M , on sait de ii) que M n’est pas une borne supérieure de E car dans ce cas
on aurait b0 ≤ M . Il existe donc x0 ∈ E tel que x0 > M . Comme b0 est une borne
supérieure de E, par i), on a aussi b0 ≥ x0 et finalement b0 ≥ x0 > M .
ii) ⇐ ii’) De i), on sait que b0 est une borne supérieure de E. Supposons que
M soit une borne supérieure de E tel que b0 > M . Alors de ii’), il existe x0 ∈ E
tel que b0 ≥ x0 > M . Ceci contredit le fait que M est une borne supérieure de E.
Donc b0 ≤ M .

Exemple 4.4 (Exemple 1.30 page 19).


déf
Calculer le b0 = sup E de
déf 
E = x ∈ R : x2 < 4 .

Comme 0 ∈ E, l’ensemble E est non-vide.


déf
b0 = sup E est possiblement +∞ si E n’est pas borné supérieurement.
Si b0 > 2 , alors

∃x ∈ E tel que b0 ≥ x > 2 ⇒ x2 > 4 ⇒ x∈


/ E (d’où contradiction).

Il reste donc les cas b0 ≤ 2. Comme 0 ∈ E, b0 ≥ 0 et donc 0 ≤ b0 ≤ 2.


Si b0 < 2, on pose

déf b0 + 2
x = ⇒ 0 ≤ b0 < |x < 2 ⇒ x2 < 4}
{z ⇒ x∈E
2
puisque x≥0

ce qui contredit le fait que b0 = sup E.


Il ne reste donc plus que le cas b0 = 2. On en conclut que sup E = 2.

4.4 Densité des rationnels et des irrationnels dans R


On a déjà démontré le Théorème 4.1 qui dit qu’entre deux rationnels on
peut toujours trouver un rationnel différent des deux premiers. On va donner deux
résultats analogues pour les réels.
Théorème 4.12. Soient a et b dans R tel que a < b.
i) (densité des nombres rationnels)
Il existe r ∈ Q tel que a < r < b.
16 Chapitre 1. Des entiers naturels aux réels

ii) (densité des nombres irrationnels)


Il existe s ∈ R \ Q tel que a < s < b.

Corollaire 1. Soient a et b dans R tel que a < b.


i) Il existe une infinité de nombres rationnels entre a et b.
ii) Il existe une infinité de nombres irrationnels entre a et b.

Démonstration du Théorème 4.12. i) Puisque b − a > 0 et que R est archimédien,


il existe n ∈ N tel que n (b − a) > 1, d’où b > a + 1/n. Comme na ∈ R, il existe
m ∈ Z tel que m − 1 ≤ na < m, d’où na < m ≤ na + 1. En divisant par n, il vient
m 1
a< ≤ a + < b.
n n
On prend r = m/n ∈ Q. √ √
ii) √ √ on a a − 2 < b − 2 et√de la partie i) il existe r ∈√Q tel
Puisque a < b,
que a − 2 < r < b − 2 ce qui entraı̂ne a < r + 2 < b. On prend s = r + 2 qui
est bien un irrationnel.

Démonstration du Corollaire 1. i) On sait qu’il en existe au moins un. Supposons


qu’il en existe un nombre fini n ≥ 1, c’est-à-dire {ri }ni=1 ⊂ Q tel que a < r1 < r2 <
· · · < rn < b. On applique alors le Théorème 4.12 (i) au couple a < r1 . Il existe
r0 ∈ Q tel que a < r0 < r1 . On a donc construit un autre rationnel entre a et b ce
qui contredit notre hypothèse.
ii) Même procédé pour les irrationnels.

4.5 Valeur absolue


On sait maintenant comment additionner, multiplier, et comparer les nombres
réels. Il nous manque une moyen de mesurer l’écart ou la distance entre deux
nombres.

Définition 4.11.
La valeur absolue de x ∈ R que l’on désigne par |x| est définie par
(
déf x, si x ≥ 0
|x| =
−x, si x < 0.

On a immédiatement les résultats suivants.

Lemme 4.1. Pour tout x ∈ R,


(i) | − x| = |x|,
(ii) −|x| ≤ x ≤ |x|.
(iii) Pour tout b ≥ 0, |x| ≤ b ⇐⇒ −b ≤ x ≤ b.
4. Nombres réels R(+, ·, <) 17

Démonstration. (i) Par définition.


(ii) Si x ≥ 0, |x| = x ≥ 0 et −|x| ≤ 0 ≤ x = |x| ≤ |x|. Si x < 0, alors −x > 0 et
donc
−| − x| ≤ −x ≤ | − x|.

Mais de (i) | − x| = |x| entraı̂ne

−|x| ≤ −x ≤ |x| ⇒ −|x| ≤ x ≤ |x|.

(iii) Si x ≥ 0, alors −b ≤ 0 ≤ x = |x| ≤ b. Si x < 0, alors −b ≤ 0 ≤ −x = |x| ≤ b ce


qui entraı̂ne
−b ≤ −x ≤ b ⇒ −b ≤ x ≤ b.

On a les propriétés fondamentales suivantes. On verra plus loin qu’elles ca-


ractérisent une norme.

Théorème 4.13. Pour tout x et y dans R :


(i) |x| ≥ 0 ;
(ii) |x| = 0 ⇐⇒ x = 0 ;
(iii) |xy| = |x||y| ;
(iv) (inégalité du triangle) |x + y| ≤ |x| + |y|.

Démonstration. (i) Par définition, si x ≥ 0, |x| = x ≥ 0. Si x < 0, |x| = −x > 0 ≥ 0.


(ii) (⇐) Comme de (i) 0 = |0| ≥ 0, on a |0| = 0. (⇒) On démontre l’implication
inverse par contradiction : x 6= 0 ⇒ |x| > 0. Comme x 6= 0, alors ou bien x > 0 ou
bien x < 0. Dans le premier cas, |x| = x > 0 ; dans le second cas, |x| = −x > 0.
Donc, pour tout x 6= 0, on a |x| 6= 0.
(iii) Il y a quatre cas.
1. (x ≥ 0 et y ≥ 0) Alors |x| = x, |y| = y et xy = |x||y| ≥ 0. Donc, par
défintion de la valeur absolue, |xy| = xy et |xy| = |x||y|
2. (x ≥ 0 et y < 0) Alors |x| = x, |y| = −y et −xy = −yx = (−y)x = x(−y) =
|x||y| ≥ 0 par la propriété P1 (multiplication). Donc, par définition de la
valeur absolue, |xy| = −xy = |x||y|.

3. (x < 0 et y ≥ 0) On interchange les rôles de x et y du cas 2.

4. (x ≤ 0 et y ≤ 0) On prend l’opposé des rôles de x et y du cas 1.


(iv) On a de (iii) du Lemme, −|x| ≤ x ≤ |x| et −|y| ≤ y ≤ |y|. En additionnant,
−|x| − |y| = −(|x| + |y|) ≤ x + y≤ |x| + |y|. Le résultat suit du Lemme (iii) : |x +
y| ≤ ||x| + |y|| = |x| + |y|.
18 Chapitre 1. Des entiers naturels aux réels

4.6 Représentation décimale des nombres réels


Il est pratique d’exprimer les nombres et plus particulièrement les rationnels
sous une forme compacte. On le fait en introduisant une base. La plus commune est
la base 10. Par l’intermédiaire de la division on a par exemple
5
= 2.5 = 2.5 0000 . . .
2
1 1 4 2 8 5 7
= 0.142857 142857 · · · = 0 + 1 + 2 + 3 + 4 + 5 + 5 + . . .
7 10 10 10 10 10 10
142857 142857
= + + ...
106 1012
 
4 3 3 3
− = −1.333 · · · = −1 − + + + . . .
3 101 102 103
Ce sont trois exemples de nombres rationnels. On remarquera qu’à partir d’un
certain rang il y a périodicité des décimales. Ce n’est
√ cependant pas toujours le
cas. Considérons par exemple le nombre irrationnel 2 dont on peut construire les
décimales par encadrements successifs. En effet

12 < 2 < 22 = 4 ⇒ 1 < 2 < 2.

En subdivisant l’intervalle [1, 2] en 10 parties de longueur 1/10, on trouve que



1.4 < 2 < 1.5

Considérons par exemple le nombre irrationnel 2 dont on peut construire les
décimales par encadrements successifs. En effet

12 < 2 < 22 = 4 ⇒ 1 < 2 < 2.

En subdivisant l’intervalle [1, 2] en 10 parties de longueur 1/10, on trouve que



(1.4)2 = 1.96 < 2 < 2.25 = (1.5)2 ⇒ 1.4 < 2 < 1.5

En subdivisant l’intervalle [1.4, 1.5] en 10 parties de longueur 1/100, on trouve que



(1.41)2 = 1.9881 < 2 < 2.0164 = (1.42)2 ⇒ 1.41 < 2 < 1.42

En continuant le procédé on trouve, par exemple, que



1.414 213 562 4 < 2 < 1.414 213 562 5

On dit que 1.414 213 562 4 . . . est un développement décimal de 2. Par ce procédé,
on n’entrevoit pas de périodicité, mais cela ne démontre rien.
Un autre phénomène observable est que certains nombres ont deux développements
décimaux distincts comme le montre l’exemple suivant
217 1 7
=2+ + = 2.17 = 2.17 000000 . . ..
100 10 100
4. Nombres réels R(+, ·, <) 19

Considérons maintenant le développement périodique x = 2.169 999 . . . . Alors

100x = 216.999 . . . et 1000x = 2169.999 . . . ⇒ 900x = 2169 − 216 = 1953

En simplifiant par 9 on obtient x = 1953/900 = 217/100. Il y a donc deux dévelop-


pements décimaux pour le même rationnel. Lorsqu’il y a périodicité des décimales
à partir d’un certain rang on écrira les décimales qui se répètent surmontés d’un
barre comme suit
1
7 | {z } 142857
= 0. 142857 | {z } · · · = 0.142857
4 217
− = −1.333 · · · = −1.3 = 2.17 = 2.169
3 100
En particulier, x = 0.999 . . ., 10x = 9.999 . . ., 9x = 9 . . ., et

1 = 0.999 999 · · · = 0.9.

possède deux représentations décimales.


Théorème 4.14. Soient deux nombres réels x et y dans R de développements
décimaux
x = 0, a1 a2 a3 . . .
y = 0, b1 b2 b3 . . .

Si on suppose que

1) ∃ n tel que an 6= bn et
2) ni l’un ni l’autre ne se termine par une suite infinie de 9

alors x 6= y en tant que nombres réels.


Corollaire 1. Si un nombre réel possède deux développements décimaux distincts,
alors l’un deux se termine par des 9 et l’autre est fini.
Démonstration du Théorème. On peut supposer sans perte de généralité que an >
bn . Donc

a1 = b1 , a2 = b2 , . . . , an−1 = bn−1 , an > bn .

On multiplie chaque nombre par 10n−1 et on enlève sa partie entière. Comme an >
bn , on a an ≥ bn + 1 et Il vient

0, an an+1 an+2 . . . ≥ 0, an 00 · · · ≥ 0, bn 00 · · · + 0, 100 . . .


≥ 0, an 00 · · · ≥ 0, bn 00 · · · + 0, 099 . . . = 0, bn 99 . . .
> 0, bn bn+1 bn+2 . . .
⇒ 0, an an+1 an+2 · · · > 0, bn bn+1 bn+2 . . .

d’où x > y.
20 Chapitre 1. Des entiers naturels aux réels

Corollaire 2. Si un nombre réel possède deux développements décimaux distincts,


alors l’un deux se termine par des 9 et l’autre est fini.
Démonstration du Corollaire. Il suffit de considérer un nombre réel 0 ≤ x ≤ 1. Par
le Théorème l’un des deux développements se termine par une suite infinie de 9,
c’est-à-dire
x = 0, a1 . . . am 999 . . .
= 0, a1 . . . am 000 · · · + 0, 0 . . . 0999 . . .
= 0, a1 . . . am 000 · · · + 0, 0 . . . 1000 . . .
= 0, a1 . . . (am + 1)000 . . .

et le développement est fini.

Définition 4.12.
Un développement décimal de la forme

n0 , a1 a2 . . . an b 1 b 2 . . . b m b 1 b 2 . . . b m . . .
| {z } | {z } | {z }
n≥0 m≥1 m≥1

où la partie b1 b2 . . . bm se répète à l’infini est dit périodique :


1. périodique pur si n = 0
2. périodique mixte (ou éventuellement périodique) si n ≥ 1.

Exemple 4.5.
Le rationnel 1/7 est périodique pur avec n = 0 et
1
= 0, 142857 | {z } . . . = 0, 142857
| {z } 142857
7
m=6 m=6

Le rationnel 33/100 possède deux développements :


33
= 0, |{z}
33 |{z}
0 |{z}
0 . . . = 0.330
100
n=2 m=1 m=1
33
= 0, |{z} 9 |{z}
32 |{z} 9 . . . = 0.329
100
n=2 m=1 m=1

Théorème 4.15. x ∈ R admet un développement décimal périodique ⇐⇒ x ∈ Q.


Démonstration. Il suffit de considérer les x > 0.
(⇒) Soit un nombre réel x ∈ R avec le développement décimal périodique
suivant

x = n0 , a1 a2 . . . an b 1 b 2 . . . b m b 1 b 2 . . . b m . . .
| {z } | {z } | {z }
n≥0 m≥1 m≥1
4. Nombres réels R(+, ·, <) 21

On a
10n x = n0 a1 a2 . . . an , b 1 b 2 . . . b m b 1 b 2 . . . b m . . .
| {z } | {z } | {z }
n≥0 m≥1 m≥1
n+m
10 x = n0 a1 a2 . . . an b 1 b 2 . . . b m , b 1 b 2 . . . b m b 1 b 2 . . . b m . . .
| {z } | {z } | {z } | {z }
n≥0 m≥1 m≥1 m≥1
D’où
déf
(10n+m − 10n )x = N0 = n0 a1 a2 . . . an b1 b2 . . . bm − n0 a1 a2 . . . an ∈ N ∪{0}
N0
⇒ x= n m ∈ Q.
10 (10 − 1)

Démonstration. (suite) (⇐) On considère un nombre x ∈ Q, x > 0 de forme réduite


p/q, q > 0 et p > 0, et de développement décimal
p
x= = n0 , k1 k2 k3 . . .
q
S’il existe i0 tel que pour tout i ≥ i0 , ki = 9, alors le développement décimal de x
est périodique par définition. Sinon, on procède comme suit :
p
0≤ − n0 = 0, k1 k2 k3 . . . < 1.
q
En multipliant par q > 0, on ne change pas les inégalités et on obtient un entier

0 ≤ p − n0 q = q · {0, k1 k2 k3 . . .} < q.
| {z }
∈N ∪{0}

On recommence en multipliant par 10.


   
p p
0 ≤ 10 − n0 = k1 , k2 k3 k4 . . . ⇒ 0 ≤ 10 − n0 − k1 = 0, k2 k3 k4 · · · < 1
q q
En multipliant par q > 0, on ne change pas les inégalités et on obtient un nouvel
entier en regroupant les parties entières

0 ≤ 10(p − n0 q) − qk1 = q · {0, k2 k3 k4 . . .} < q


| {z }
∈N ∪{0}

On poursuit ainsi en multipliant successivement par 102 , 103 , etc. On obtient ainsi
(par exemple, par induction mathématique) :

∀i ≥ 1, 0 ≤ q · {0, ki ki+1 ki+2 . . .} < q


⇒ ∀i ≥ 1, q · {0, ki ki+1 ki+2 . . .} ∈ {0, 1, . . . , q − 1}.

Comme {0, 1, . . . , q − 1} est fini, Il existe un couple (i, j), 1 ≤ i < j, tel que

q · {0, ki ki+1 ki+2 . . .} = q · {0, kj kj+1 kj+2 . . .}


22 Chapitre 1. Des entiers naturels aux réels

Il existe un couple (i, j), 1 ≤ i < j, tel que

q · {0, ki ki+1 ki+2 . . .} = q · {0, kj kj+1 kj+2 . . .}


⇒ ∀ℓ ≥ 0, ki+ℓ = kj+ℓ = ki+ℓ+(j−i) ,
⇒ ∀ℓ ≥ 0, ki+ℓ = ki+ℓ+(j−i) = kj+ℓ+(j−i) = ki+ℓ+2(j−i) ,
⇒ ∀N ≥ 0, ∀ℓ ≥ 0, ki+ℓ+N (j−i) = ki+ℓ
⇒ ∀N ≥ 0, ∀ℓ, 0 ≤ ℓ < j − i, ki+ℓ+N (j−i) = ki+ℓ .

Le développement est donc éventuellement périodique de période j − i de la forme


p
x= = n0 , k1 k2 . . . ki−1 ki ki+1 . . . ki+(j−i)−1 kj kj+1 . . . kj+(j−i)−1 . . .
q | {z }| {z }| {z }
n=i−1 m=j−i≥1 m=j−i≥1

puisque

kj = ki , kj+1 = ki+1 , . . . , kj+(j−i)−1 = ki+(j−i)−1 = kj−1 .

5 Exercices
Exercice 5.1 (W. Rudin [1, exercice 1, p. 21]).
Montrer que si r ∈ Q et s ∈ R \ Q, alors r + s ∈ R \ Q et rs ∈ R \ Q ∪{0}.

Exercice 5.2 (W. Rudin [1, exercice 5, p. 21]).


Soit A, ∅ 6= A ⊂ R et
déf
−A = {−a : a ∈ A} .

Montrer que inf A = − sup(−A).


Chapitre 2
Quelques notions
ensemblistes et
algébriques

1 Relation, application et fonction


1.1 Application et fonction
La définition usuelle en mathématiques d’une fonction est ensembliste et pré-
suppose essentiellement celle de couple et de produit cartésien.

Définition 1.1. (i) Une relation ou graphe fonctionnel est un triplet (E, F, Y )
tel que
F ⊂ E × Y.
Le domaine 1 de F est
déf
X = {x ∈ E : ∃y ∈ Y tel que (x, y) ∈ F }
et l’image de x ∈ X
déf
Im (x) = {y ∈ Y : tel que (x, y) ∈ F }.
(ii) On associe à chaque x ∈ X le sous-ensemble unique Im (x) de Y
déf
x 7→ f (x) = Im (x) : X → P(Y ),
où P(Y ) dénote l’ensemble des sous-ensembles de Y . On appellera f l’ap-
plication multivoque 2 associée au triplet (E, F, Y ) parce qu’elle fait corres-
pondre à chaque point du domaine X plusieurs points de Y .
1. La notation usuelle est DF plutôt que X.
2. Set-valued analysis ou multivalued analysis en anglais. La pratique de permette à une
fonction en mathématiques de signifier aussi une fonction multivoque a été oubliée dans la
première moitié du XXe s‘ecle. On peut en apprécier l’évolution dans les différentes versions de
G. H. Hardy [1] commençant en 1921. Cette théorie fut systématiquement développée pour la
première fois C. Berge [1] en 1959. On en palpe les retombées avec les équations différentielles
multivoques et la théorie de la viabilité dans J. P. Aubin et A. Cellina [1] en 1984. Cette analyse
devient aussi centrale en théorie de l’optimisation avec l’introduction de la notion de sous-gradient
en analyse convexe. On peut trouver un traitement fort complet de l’analyse multivoque dans
J. P. Aubin et H. Frankowska [1].

23
24 Chapitre 2. Quelques notions ensemblistes et algébriques

(iii) On définit l’image d’un sous-ensemble A de X par


déf
f (A) = {y ∈ Y : ∃x ∈ A tel que (x, y) ∈ F } . (1.1)

L’association à chaque A ⊂ X de l’image f (A) de A

A 7→ f (A) : P(X) → P(Y ), (1.2)

où P(X) dénote l’ensemble des sous-ensembles de X, est appelée applica-


tion induite que l’on désignera par la même notation f . On définit aussi
l’application inverse induite :
déf
B 7→ f −1 (B) = {x ∈ X : ∃y ∈ B tel que (x, y) ∈ F } : P(Y ) → P(X).
(1.3)

(iv) Lorsque pour chaque x ∈ X, Im (x) est un singleton, on associe à chaque


x ∈ X le seul point {f (x)} = Im (x) ∈ Y :

x 7→ f (x) : X → Y. (1.4)

On dira que f est une application ou fonction de X dans Y .

Une application ou fonction f est donc


(i) la donnée de deux ensembles,
• l’ensemble de départ X et
• l’ensemble d’arrivée Y ,
(ii) et d’une relation associant à chaque élément x de l’ensemble de départ X
un et un seul élément de l’ensemble d’arrivée Y , que l’on appelle image de
x par f et que l’on note f (x)

x 7→ f (x).
∈X ∈Y

On dit alors que f est une application de X dans Y

(notée f : X → Y ),

ou encore une application à arguments dans X et à valeurs dans Y .

Définition 1.2. (i) L’image d’une application f : X → Y est la collection des


f (x) pour x parcourant X ; c’est le sous-ensemble de Y :
déf
Im (f ) = {f (x) : x ∈ X} ⊂ Y.

(ii) Le graphe d’une application f : X → Y est le sous-ensemble du produit


cartésien X × Y constitué des couples (x, f (x)) pour x variant dans X
déf
G(f ) = {(x, f (x)) : x ∈ X} ⊂ X × Y.
1. Relation, application et fonction 25

Définition 1.3.
Soit f : X → Y une application.
(i) f est injective si

∀x1 , x2 ∈ X tel que f (x1 ) = f (x2 ), on a x1 = x2 .

(ii) f est surjective si

∀y ∈ Y, ∃x ∈ X tel que f (x) = y.

(iii) f est bijective si f est à la fois injective et surjective.


Lorsque f est bijective l’application inverse ou réciproque

f −1 : Y → X

est bien définie.

Le terme fonction est souvent utilisé pour les applications à valeurs numériques,
réelles ou complexes, c’est-à-dire lorsque l’ensemble d’arrivée est R ou C. On parle
alors de fonction réelle ou de fonction complexe.
La notion de fonction en tant que correspondance entre deux types d’objet
est relativement ancienne. Mais le terme n’apparait qu’à la fin du XVIIe siècle
sous la plume de Leibniz en 1694, il s’agit alors de fonction associée à une courbe
géométrique : Leibniz dit ainsi que l’abscisse, l’ordonnée ou le rayon de courbure
d’une courbe en un point M est une fonction du point M .
À la même époque, Newton parle de fluente pour des quantités dépendant
d’une variable qu’il appelle le temps (tout en précisant que le rôle joué par le temps,
peut l’être par une autre quantité).
La notation sous la forme f ne s’est pas mise en place tout de suite. Jean Ber-
noulli propose d’appeler X la fonction de x, Leibniz invente une notation permettant
de travailler sur plusieurs fonctions différentes : x|1 et x|2 sont ainsi deux fonctions
dépendant de x. La notation f x apparait chez Euler en 1734. Les fonctions sont
alors toujours à valeurs numériques (réelles ou complexes) et possèdent en outre
des propriétés restrictives (liées à une équation algébrique, continuité eulérienne,
développable en série entière...).
En pratique, la communauté mathématique dans son ensemble continue à uti-
liser ces deux termes dans leur sens historique, le terme fonction étant utilisé comme
synonyme du terme application dans le cas particulier où l’ensemble d’arrivée est
R ou C (l’ensemble de départ étant systématiquement pris égal au domaine de
définition).

1.2 Relation binaire et relation d’équivalence


Une relation binaire R dans un ensemble A est, intuitivement, une proposition
tel que pour chaque couple ordonné (a, b) d’éléments de A, on puisse déterminer si
a R b (a est en relation R avec b) est ou n’est pas vrai. On exprime ceci formellement
en langage ensembliste.
26 Chapitre 2. Quelques notions ensemblistes et algébriques

Définition 1.4. (i) Une relation binaire R dans un ensemble A est un sous-
ensemble R de A × A. La notation a R b signifiera que (a, b) ∈ R.
(ii) Une relation binaire R dans A est appelée une relation d’équivalence si :
(1) (réflexivité) ∀a ∈ A, a R a ;
(2) (symétrie) aRb ⇒ bRa;
(3) (transitivité) a R b et b R c ⇒ a R c.
Pour une relation d’équivalence R on dira que a et b sont équivalents si
a R b.
(iii) Soit R une relation d’équivalence dans A. Le sous-ensemble
déf
Ra = {b ∈ A : b R a} (1.5)

est appelé R-classe d’équivalence de a.


(iv) Soit R une relation d’équivalence dans A. L’ensemble {Ra : a ∈ A} dont
les éléments sont les R-classes d’équivalence est appelé espace quotient de
A par R et sera noté A/R. L’application
déf
a 7→ pA (a) = Ra : A → A/R (1.6)

est appelée projection de A sur A/R.

Exemple 1.1.
Les relations binaires suivantes sont des relations d’équivalence :
- ≪ est égal à≫ pour les nombres réels ;
- ≪ a la même date de naissance que≫ sur l’ensemble des humains ;
- ≪ est semblable à≫ sur l’ensemble des triangles ;
- ≪ x = y mod n ≫ sur les nombres entiers ;
- ≪ a la même valeur absolue que ≫ pour les nombres réels ;
- ≪ a le même cosinus que ≫ pour l’ensemble des angles.

Lemme 1.1. Soit R une relation d’équivalence dans A.


(i) ∪a∈A Ra = A.
(ii) Si a R b, alors Ra = Rb.
(iii) Si a R b n’est pas vraie, alors Ra ∩ Rb = ∅.

Démonstration. (i) Comme R est réflexive, pour tout a ∈ A on a a ∈ Ra, et donc


A = ∪a∈A {a} ⊂ ∪a∈A Ra ⊂ A.
(ii) Soit x ∈ Ra. En utilisant la transitivité de R,

x R a et a R b ⇒ x R b
2. Cardinal et dénombrabilité 27

ce qui montre que Ra ⊂ Rb. Dans l’autre sens, comme R est symétrique, b R a
et, par le même raisonnement x R b ⇒ x R a par transitivité, ce qui démontre que
Rb ⊂ Ra.
(iii) On suppose que Ra ∩ Rb 6= ∅. En choisissant ξ ∈ Ra ∩ Rb, il vient
ξ R a et ξ R b. Donc par symétrie et transitivité a R b en contradiction avec notre
hypothèse.

Théorème 1.1. Soit R une relation d’équivalence dans A. La collection des classes
d’équivalence distinctes de A partitionne A en sous-ensembles mutuellement dis-
joints, appelés classes de R-équivalence, tel que pour toute paire a, b ∈ A

∃α tel que a ∈ Aα et b ∈ Aα ⇐⇒ a R b.

Démonstration. Soit {Aα : α ∈ A} la collection des classes de R-équivalence. Pour


chaque Aα il existe a ∈ A tel que Aα = Ra et par Lemme 1.1 (i) ∪a∈A Ra = A.
Si Ra ∩ Rb 6= ∅, il existe c ∈ A tel que c R a et c R b soient vraies. Par symétrie
a R c est vraie et par transitivité a R b est vraie. Par le Lemme 1.1 (ii), Ra = Rb.
Enfin, par le Lemme 1.1 (ii) : si a R b, alors Ra = Rb. Réciproquement, si a ∈ Aα
et b ∈ Aα , alors il existe c ∈ A tel que Aα = Rc et donc a R c et b R c sont vraies ce
qui entraı̂ne a R b vraie par symétrie et transitivité.

2 Cardinal et dénombrabilité
2.1 Définitions et exemples
En mathématiques, les nombres cardinaux, sont une généralisation des entiers
naturels N, utilisés pour mesurer la cardinalité (taille) des ensembles. La cardinalité
d’un ensemble fini est un entier naturel, le nombre d’éléments dans l’ensemble. Les
nombres cardinaux transfinis décrivent les tailles des ensembles infinis. La cardi-
nalité est définie en terme de bijections. Deux ensembles ont le même cardinal s’il
existe une bijection entre eux. Dans le cas des ensembles finis, ceci coı̈ncide avec
la notion intuitive de taille. Dans le cas des ensembles infinis, le comportement est
plus complexe.

Figure 2.1. Georg Cantor (1845–1918).


28 Chapitre 2. Quelques notions ensemblistes et algébriques

La notion de cardinalité, comme on la comprend de nos jours, fut formulée


par Georg Cantor, qui est à l’origine de la théorie des ensembles, entre 1874 et
1884. Cantor a été confronté à la résistance de la part des mathématiciens de son
époque, en particulier Kronecker. Poincaré, bien qu’il connût et appréciât les travaux
de Cantor, avait de profondes réserves sur son maniement de l’infini en tant que
totalité achevée.
Si l’on considère des ensembles finis de nombres comme

{1, 2, 3, 4} et {10, 20, 25, 60}

on voit facilement qu’ils contiennent chacun le même nombre d’éléments.


Si on considère maintenant les ensembles N, Z, Q, ou R, ils contiennent tous
un nombre infini d’éléments bien que les inclusions sucessives N ⊂ Z ⊂ Q ⊂ R
soient strictes. Y-a-t-il plus de nombres dans le dernier que dans le premier ?

Définition 2.1. (i) On dira que deux ensembles A et B ont le même cardinal 3
ou sont équipotents s’il existe une bijection entre A et B.
(ii) A est fini s’il est vide ou s’il existe n ∈ N tel que A soit équipotent à
{1, 2, . . . , n}. Sinon, on dira que A est infini.
(iii) A est dénombrable s’il a le même cardinal que N.
(iv) A est au plus dénombrable s’il est fini ou dénombrable.
(v) A est non-dénombrable s’il n’est ni fini ni dénombrable.

Si A et B sont finis, cela revient à dire qu’ils ont le même nombre d’éléments.
L’avantage c’est que maintenant on va pouvoir aussi comparer des ensembles infinis.

Exemple 2.1.
(i) N et 2 N (nombres pairs) ont le même cardinal. Il suffit de choisir la bijection
déf
x 7→ f (x) = 2x : N → 2 N, x 7→ f −1 (x) = x/2 : 2 N → N .

(ii) N et Z ont le même cardinal et donc Z est dénombrable. On choisit la


bijection x

 , si est pair
déf 2
f : N → Z, x 7→ f (x) =
1−x
 , si x est impair
2
dont l’inverse est
(
−1 −1 2y, si y ∈ N
f : Z → N, y 7→ f (y) =
1 − 2y, si y ∈ Z \ N .

On remarque que construire une bijection entre N et un ensemble A revient


à énumérer les éléments de A les uns à la suite des autres en commençant par un
3. Notes sur les cardinaux, http : //en.wikipedia.org/wiki/Cardinaln umber http :
//f r.wikipedia.org/wiki/N ombrec ardinal.
2. Cardinal et dénombrabilité 29

premier élément, puis un autre, etc, et de façon à ne pas en oublier et à ne pas faire
de répétitions :
1 2 3 4 5 ....
l l l l l l
f (1) = 0 f (2) = 1 f (3) = −1 f (4) = 2 f (5) = −2 . . . .
On forme ainsi une suite ordonnée a1 , a2 , a3 , . . ..

Exemple 2.2.
N × N est dénombrable. Le processus ci-dessous énumère en fait toutes les paires de
(p, q) ∈ N × N. On compose le tableau suivant et on le parcourt dans le sens des
flèches.
(1, 1) → (2, 1) (3, 1) → (4, 1) (5, 1) → (6, 1) (7, 1) . . .
ւ ր ւ ր ւ ր
(1, 2) (2, 2) (3, 2) (4, 2) (5, 2) (6, 2) (7, 2) . . .
↓ ր ւ ր ւ ր ւ
(1, 3) (2, 3) (3, 3) (4, 3) (5, 3) (6, 3) (7, 3) . . .
ւ ր ւ ր ւ ր
(1, 4) (2, 4) (3, 4) (4, 4) (5, 4) (6, 4) (7, 4) . . .
↓ ր ւ ր ւ ր ւ
(1, 5) (2, 5) (3, 5) (4, 5) (5, 5) (6, 5) (7, 5) . . .
ւ ր ւ ր ւ ր
(1, 6) (2, 6) (3, 6) (4, 6) (5, 6) (6, 6) (7, 6) . . .
↓ ր ւ ր ւ ր ւ
.. .. .. .. .. .. ..
. . . . . . .

Exemple 2.3.
Q est dénombrable. On commence d’abord par énumérer Q+ , les rationnels positifs.
1/1 → 2/1 3/1 → 4/1 5/1 → 6/1 7/1 . . .
ւ ր ւ ր ւ ր
1/2 2/2 3/2 4/2 5/2 6/2 7/2 . . .
↓ ր ւ ր ւ ր ւ
1/3 2/3 3/3 4/3 5/3 6/3 7/3 . . .
ւ ր ւ ր ւ ր
1/4 2/4 3/4 4/4 5/4 6/4 7/4 . . .
↓ ր ւ ր ւ ր ւ
1/5 2/5 3/5 4/5 5/5 6/5 7/5 . . .
ւ ր ւ ր ւ ր
1/6 2/6 3/6 4/6 5/6 6/6 7/6 . . .
↓ ր ւ ր ւ ր ւ
.. .. .. .. .. .. ..
. . . . . . .
Le processus ci-dessus énumère toutes les paires de (p, q) ∈ N × N. Si chaque paire
représente un rationnel p/q, il y a donc des répétitions.
30 Chapitre 2. Quelques notions ensemblistes et algébriques

Exemple 2.4.
Si chaque paire représente un rationnel p/q, il y a donc des répétitions. Il suffit donc
de sauter un nombre déjà rencontré.

1/1 → 2/1 3/1 → 4/1 5/1 → 6/1 7/1 . . .


ւ ր ւ ր ւ ր
1/2 2/2 3/2 4/2 5/2 6/2 7/2 . . .
↓ ր ւ ր ւ ր ւ
1/3 2/3 3/3 4/3 5/3 6/3 7/3 . . .
ւ ր ւ ր ւ ր
1/4 2/4 3/4 4/4 5/4 6/4 7/4 . . .
↓ ր ւ ր ւ ր ւ
1/5 2/5 3/5 4/5 5/5 6/5 7/5 . . .
ւ ր ւ ր ւ ր
1/6 2/6 3/6 4/6 5/6 6/6 7/6 . . .
↓ ր ւ ր ւ ր ւ
.. .. .. .. .. .. ..
. . . . . . .

Exemple 2.5.
On peut ensuite énumérer Q− de la même manière, puis ensuite combiner Q+ , Q−
et {0} comme suit

0, 1, −1, 2, −2, 1/2, −1/2, 1/3, −1/3, 3, −3, 4, −4, . . .

2.2 Quelques résultats généraux


Théorème 2.1. Tout sous-ensemble infini d’un ensemble dénombrable est lui-même
dénombrable.

Démonstration. Soit E un sous-ensemble infini d’un ensemble dénombrable A. on


peut donc ranger les éléments de A dans une suite {xn } d’éléments disctincts. On
construit alors par récurrence la suite {nk } de la manière suivante :
- n1 est le premier entier tel que xn1 ∈ E
- une fois déterminé les éléments n1 , n2 , . . . , nk−1 , avec k ≥ 2, nk est le plus
petit entier strictement plus grand que nk−1 tel que xnk ∈ E.
On définit ensuite la bijection k 7→ f (k) = xnk : N → E.

Remarque 2.1.
Donc, aucun ensemble non-dénombrable ne peut être contenu dans un ensemble
dénombrable.
2. Cardinal et dénombrabilité 31

Définition 2.2.
Soit E un ensemble arbitraire. Si, à chaque élément α d’un ensemble quelconque A,
on associe un sous-ensemble Eα de E, on dit que l’on a défini une collection ou une
famille {Eα : α ∈ A} de sous-ensembles de E, que l’on écrira simplement {Eα }.

On adopte aussi les notations suivantes.

Définition 2.3. (i) ∪α∈A Eα = {x ∈ E : ∃α tel que x ∈ Eα }.


(ii) ∩α∈A Eα = {x ∈ E : ∀α, x ∈ Eα }.
(iii) ∪ni=1 Ei = E1 ∪ · · · ∪ En et ∩ni=1 Ei = E1 ∩ · · · ∩ En .
(iv) ∪∞ ∞
i=1 Ei = E1 ∪ E2 ∪ . . . et ∩i=1 Ei = E1 ∩ E2 ∩ . . . . Le symbole ∞ indique
que l’on considère une famille dénombrable étiquetée 1, 2, 3, . . . .

On a la commutativité, l’associativité et la distributivité des opérations ∪ et ∩.


Théorème 2.2. Soit {En }, n = 1, 2. . . . , une suite d’ensemble dénombrables. Alors
leur réunion
déf
E = ∪∞
n=1 En

est également dénombrable.


Démonstration. Comme chaque En est dénombrable, ses éléments peuvent être
rangés comme une suite {xn,k }, k = 1, 2, 3, . . . . On forme alors le tableau constitué
d’une infinité de lignes et de colonne suivant

E1 E2 E3 E4 E5 E6 E7 ...

x1,1 → x2,1 x3,1 → x4,1 x5,1 → x6,1 x7,1 ...


ւ ր ւ ր ւ ր
x1,2 x2,2 x3,2 x4,2 x5,2 x6,2 x7,2 ...
↓ ր ւ ր ւ ր ւ
x1,3 x2,3 x3,3 x4,3 x5,3 x6,3 x7,3 ...
ւ ր ւ ր ւ ր
x1,4 x2,4 x3,4 x4,4 x5,4 x6,4 x7,4 ...
↓ ր ւ ր ւ ր ւ
x1,5 x2,5 x3,5 x4,5 x5,5 x6,5 x7,5 ...
ւ ր ւ ր ւ ր
x1,6 x2,6 x3,6 x4,6 x5,6 x6,6 x7,6 ...
↓ ր ւ ր ւ ր ւ
.. .. .. .. .. .. ..
. . . . . . .

dont la nième colonne est constituée des éléments de la suite {xn,k } associée à En .
En suivant les flèches, les éléments du tableau sont rangés en une suite où chaque
élément de l’union apparait au moins une fois. On en déduit que E est au plus
dénombrable. Enfin, comme E1 ⊂ E et que E1 est dénombrable, E est dénombrable.
32 Chapitre 2. Quelques notions ensemblistes et algébriques

Corollaire 1. Si l’ensemble I est au plus dénombrable et, si pour tout i ∈ I,


l’ensemble Ei l’est aussi, alors la réunion ∪i∈I Ei est au plus dénombrable.
Théorème 2.3. Soit A un ensemble dénombrable et An l’ensemble des suites de
longueur n ≥ 1
déf
(a1 , . . . , an ) ∈ An = A × · · · × A. (2.1)
| {z }
n fois

Alors An est dénombrable.


Démonstration. Par récurrence. Pour n = 1, A1 = A est dénombrable. Supposons
que pour A1 jusqu’à An−1 le soient. On a alors une bijection

(a1 , . . . , an ) 7→ ((a1 , . . . , an−1 ), an ) : An → An−1 × A.

An peut alors être identifié à la réunion ∪a∈A An−1 qui est une réunion dénombrable
d’ensembles dénombrables. An est alors dénombrable par le Théorème 2.2.
En passant des suites finies au suite infinies, le Théorème 2.3 n’est plus vrai.
Théorème 2.4. Soit A = {0, 1} et l’ensemble
déf
E = {(a1 , a2 , . . . ) : ai ∈ A} (c’est-à-dire, E = A × A × . . . ) (2.2)

des suites d’éléments de A. Alors, E n’est pas dénombrable.


Démonstration. Supposons que E soit dénombrable. Alors, on peut ranger ses éléments
dans le tableau suivant :
x1 = (a11 , a12 , a13 , a14 , a15 , . . . )
x2 = (a21 , a22 , a23 , a24 , a25 , . . . )
x3 = (a31 , a32 , a33 , a34 , a35 , . . . )
..
.

À partir de cette liste, on construit une nouvelle suite y = (b1 , b2 , b3 , b4 , b5 , . . . ), où


(
déf 1, si ann = 0
bn =
0, si ann = 1.
Comme cette nouvelle suite diffère de chaque suite xn dans E par au moins un
élément, elle n’appartient pas à E ce qui contredit la définition de E.

2.3 R n’est pas dénombrable


Cantor montra que les ensembles des nombres entiers, des nombres rationnels,
et des nombres algébriques sont tous dénombrables, mais l’ensemble des nombres
réels ne l’est pas.
Théorème 2.5. R n’est pas dénombrable.
2. Cardinal et dénombrabilité 33

Démonstration diagonale de Georg Cantor. On raisonne par l’absurde. On fait l’hy-


pothèse que R est dénombrable. On peut alors trouver une façon d’écrire les éléments
de R les uns à la suite des autres sans oubli ni répétition. On a la liste suivante sous
forme de développements décimaux :
a1 = n1 , a11 a12 a13 a14 a15 . . .
a2 = n2 , a21 a22 a23 a24 a25 . . .
a3 = n3 , a31 a32 a33 a34 a35 . . .
..
.
où ni représente la partie entière du i-ième nombre ai de la liste et les aij sont les
chiffres du développement décimal de ai .
À partir de cette liste, on construit
( le réel b = 0, b1 b2 b3 b4 b5 . . . où
déf 5, si aii 6= 5
bi =
4, si aii = 5.
On constate que ce b ∈ R n’apparait nulle part dans la liste ! En effet, par construc-
tion, pour chaque i on a bi 6= aii et donc b 6= ai . Ceci contredit notre hypothèse que
la liste des éléments de R était complète. R n’est donc pas dénombrable.

Exemple 2.6 (Exercice 5.2). (i) L’ensemble des irrationnels R \ Q n’est pas
dénombrable.
(ii) Le segment ]a, b[ et le segment ]c, d[ ont le même cardinal.
(iii) Le segment ]0, 1[ et R ont le même cardinal.

2.4 ◮ Cardinalité du continu c et cardinaux transfinis


Cantor comprit que le fait qu’il y ait une bijection entre deux ensembles est la
bonne façon de dire que deux ensembles ont la même taille, appelée cardinalité dans
le cas des ensembles finis. Il appliqua cette notion aux ensembles infinis comme par
exemple les entiers naturels N.
Il appela tous les ensembles ayant la même cardinalité que N des ensembles
dénombrables et introduisit la notation ℵ0 : un ensemble dénombrable est un en-
semble qui peut être mis en bijection avec les nombres entiers, c’est-à-dire que
l’on peut, d’un certaine façon, numéroter tous ses éléments par des entiers (sans
répétition mais ce n’est pas essentiel). Il montre que les ensembles des nombres
entiers relatifs, des nombres rationnels, et des nombres algébriques sont tous dé-
nombrables. Il est aussi possible pour un sous-ensembles strict d’un ensemble infini
d’avoir la même cardinalité que l’ensemble d’origine, ce qui ne peut arriver avec les
sous-ensembles stricts d’ensembles finis.
Dans son article de 1874, Cantor démontre qu’il existe des cardinaux d’ordre
plus élevé (les cardinaux transfinis) en montrant que la cardinalité de R est plus
grande que la cardinalité de N. Sa première présentation fait appel à une démons-
tration compliquée, mais dans un article en 1891 il démontre le même résultat en
utilisant l’ingénieux et simple argument diagonal (voir démonstration du Théorème
2.5). Le nouveau cardinal, appelé cardinalité du continu fut appelé c (en écriture
gothique) par Cantor.
34 Chapitre 2. Quelques notions ensemblistes et algébriques

2.5 ◮ ℵ0 , ℵ1 , ℵ2 , ℵ3 , · · · , hypothèse du continu, et axiome du


choix
Cantor développa aussi une large portion de la théorie générale des cardinaux ;
il démontra qu’il y a un plus petit transfini (ℵ0 ) et que pour chaque cardinal, il y
a un cardinal suivant plus grand (ℵ1 , ℵ2 , ℵ3 , · · · ). Son hypothèse du continu est la
proposition que c est ℵ1 , mais on s’est aperçu que ceci est indépendant des axiomes
habituels de la théorie des ensembles ; on ne peut ni le démontrer, ni le nier sous
ces hypothèses (voir théorie des ensembles de Zermelo-Fraenkel, axiome du choix,
et axiome de fondation de Frege).
Il y a donc une suite transfinie de nombres cardinaux :

0, 1, 2, 3, · · · , n, · · · ; ℵ0 , ℵ1 , ℵ2 , · · · , ℵα , · · · .

La suite commence avec les entiers naturels (cardinaux finis), qui sont suivis par les
nombres aleph (les cardinaux infinis d’ensembles bien ordonnés). Les nombres aleph
sont indicés par des (nombres) ordinaux. Sous l’hypothèse de l’axiome du choix,
”Étant donné un ensemble X d’ensembles non vides, il existe une
fonction définie sur X, appelée fonction de choix, qui à chacun d’entre
eux associe un de ses éléments”,
la suite des nombres transfinis inclut tous les nombres cardinaux. Si l’on rejette
cette hypothèse, la situation devient plus compliquée, avec des nombres cardinaux
infinis qui ne sont pas des alephs. La cardinalité est étudiée en elle-même comme
une partie de la théorie des ensembles.

3 Corps, ensemble ordonné et corps ordonné


3.1 Corps et corps commutatif
Un corps est une structure algébrique dans laquelle sont possibles les addi-
tions, soustractions, multiplications et calculs d’inverses multiplicatifs. C’est une
généralisation de la structure de R. Il faut signaler une différence entre la définition
de la version anglaise de W. Rudin [1] qui est celle d’un corps commutatif et la
définition française de corps qui ne suppose pas que la multiplication soit commu-
tative (voir le traduction française de son livre).
Des exemples de corps commutatifs sont le corps des nombres rationnels Q, le
corps des nombres réels R, et le corps des nombres complexes C. L’exemple le plus
célèbre de corps non commutatif est celui des quaternions introduits par William
Rowan Hamilton en 1843.
3. Corps, ensemble ordonné et corps ordonné 35

Définition 3.1. (i) Un corps 4 est un ensemble K muni de deux opérations,


appelées addition et multiplication, satisfaisant les axiomes suivants :
(A) Axiomes de l’addition
(A1) ∀x, y ∈ K, x + y ∈ K
(A2) commutativité : ∀x, y ∈ K, x + y = y + x
(A3) associativité : ∀x, y, z ∈ K, (x + y) + z = x + (y + z)
(A4) élément neutre : ∃ 0 ∈ K tel que ∀x ∈ K, 0 + x = x
(A5) inverse additif : ∀x ∈ K, ∃ − x ∈ K tel que x + (−x) = 0.
(M) Axiomes de la multiplication
(M1) ∀x, y ∈ K, x y ∈ K
(M3) associativité : ∀x, y, z ∈ K, (x y) z = x (y z)
(M4) élément neutre : ∃ 1 ∈ K, 1 6= 0, tel que ∀x ∈ K, 1 x = x
(M5) inverse multiplicatif : ∀x ∈ K, x 6= 0, ∃ x−1 ∈ K tel que x x−1 = 1.
(D) Axiomes de distributivité
∀x, y, z ∈ K, x (y + z) = x y + x z.
(ii) K est un corps commutatif si, en plus,
(M) Axiomes de la multiplication
(M2) commutativité : ∀x, y ∈ K, x y = y x.

Les propriétés P1 à P5 font de Q et R des corps commutatifs.


P1 (commutativité) x + y = y + x et x · y = y · x
(
(x + y) + z = x + (y + z)
P2 (associativité)
et (x · y) · z = x · (y · z)
P3 (distributivité) x · (y + z) = x · y + x · z
(
(additif) ∃0∗ tel que ∀x ∈ R, 0∗ + x = x
P4 (éléments neutres)
(multiplicatif) ∃1∗ tel que ∀x ∈ R, x · 1∗ = x
 ∗
 (additif) ∀x ∈ R, ∃ − x tel que x + (−x) = 0

P5 (existence d’inverses) (multiplicatif) ∀x ∈ R, x 6= 0∗ , ∃x−1 ∈ R


tel que x · x−1 = 1∗

 a) ∀x, y ∈ R tel que x > 0∗ et y > 0∗ on a


 x + y > 0∗ et x · y > 0∗
P6 (relation d’ordre)

 b) ∀x ∈ R une seule propriété est vraie :


x > 0∗ , x = 0∗ , ou 0∗ > x.

P7 (complétude)
∀E, ∅ 6= E ⊂ R, borné supérieurement, on a sup E ∈ R.
4. Le vocabulaire actuel vient de R. Dedekind qui définit un corps (Körper en allemand,
c’est la raison pour laquelle un corps quelconque est souvent nommé K) comme un sous-ensemble
de nombres réels ou complexes stable par addition, soustraction, multiplication et division.
36 Chapitre 2. Quelques notions ensemblistes et algébriques

Proposition 3.1. Dans tout corps, l’addition vérifie les quatre propriétés sui-
vantes :
(a) x + y = x + z ⇒ y=z
(b) x + y = x ⇒ y=0
(c) x + y = 0 ⇒ y = −x
(d) −(−x) = x.

Proposition 3.2. Dans tout corps, la multiplication vérifie les quatre propriétés
suivantes :
(a) x 6= 0 et xy = xz ⇒ y=z
(b) x 6= 0 et xy = x ⇒ y=1
(c) x 6= 0 et xy = 1 ⇒ y = x−1
(d) x 6= 0 et (x−1 )−1 = x.
Proposition 3.3. Dans tout corps, on a les quatre propriétés suivantes : pour tout
x, y ∈ K
(a) 0 x = 0
(b) x 6= 0 et y 6= 0 ⇒ xy 6= 0
(c) (−x)y = −(xy) = x(−y)
(d) (−x)(−y) = xy.

3.2 Ensemble ordonné


On a vu que, en plus d’engendrer la notion de corps, l’ensemble R des nombres
réels possède aussi la relation d’ordre P6. Cette notion d’ordre a elle aussi une
axiomatisation pour un ensemble arbitraire.

Définition 3.2.
Soit E un ensemble.
(i) Un ordre sur E est une relation, notée ≤, ayant les propriétés suivantes.
(a) ∀x ∈ E, x ≤ x.
(b) ∀x, y ∈ E, x ≤ y et y ≤ x ⇒ x = y.
(c) ∀x, y, z ∈ E, x ≤ y et y ≤ z ⇒ x ≤ z.
(ii) On a un ordre total si, en outre, on a la propriété supplémentaire :
(d) ∀x, y ∈ E, x ≤ y ou y ≤ x.
(iii) On dira que x est strictement inférieur à y et on écrira x < y si x ≤ y et
x 6= y.

Définition 3.3.
Un ensemble ordonné est un ensemble sur lequel un ordre a été défini.

N, Z, Q et R sont des ensembles ordonnés munis d’un ordre total.


3. Corps, ensemble ordonné et corps ordonné 37

Exemple 3.1.
Soit Rk l’ensemble des suites finies x = (x1 , . . . , xk ) et pour x et y dans Rk l’ordre
x≤y si ∀i, 1 ≤ i ≤ k, xi ≤ yi .
C’est un ordre mais pas un ordre total.

Exemple 3.2.
La relation A ⊂ B sur l’ensemble des sous-ensembles de N est un ordre mais pas un
ordre total car pour A = {1, 2, 3} et B = {5, 6, 7}, on n’a ni A ⊂ B ni B ⊂ A.

Définition 3.4.
Soit E un ensemble ordonné et A, ∅ 6= A ⊂ E.
(i) On dit que A est borné supérieurement (majoré) dans E si
∃α ∈ E tel que ∀x ∈ A, x ≤ α
et que α est une borne supérieure (majorant) de A dans E.
(ii) On dit que A est borné inférieurement (minoré) dans E si
∃β ∈ E tel que ∀x ∈ A, x ≥ β
et que β est une borne inférieure (minorant) de A dans E.

Définition 3.5 (W. Rudin [1, Définition 1.8, p. 3]).


Soit E un ensemble ordonné et A, ∅ 6= A ⊂ E.
(a) Si A est borné supérieurement (majoré), on dit que A possède une plus
petite borne supérieure (plus petit majorant), s’il existe α ∈ E tel que
(i) α est une borne supérieure (majorant) de A et
(ii) ∀β < α, β n’est pas borne supérieure (majorant) de A.
On l’écrira sup A.
(b) Si A est borné inférieurement (minoré), on dit que A possède une plus
grande borne inférieure (plus grand minorant), s’il existe α ∈ E tel que
(i) α est une borne inférieure (minorant) de A et
(ii) ∀β > α, β n’est pas une borne inférieure (minorant) de A.
On l’écrira inf A.

Définition 3.6.
Soit E un ensemble ordonné.
(i) E a la propriété de la borne supérieure si
∀A, ∅ 6= A ⊂ E, bornée supérieurement (majorée), sup A ∈ E. (3.1)

(ii) E a la propriété de la borne inférieure si


∀A, ∅ 6= A ⊂ E, bornée inférieurement (minorée), inf A ∈ E. (3.2)
38 Chapitre 2. Quelques notions ensemblistes et algébriques

N, Z et R ont la propriété de la borne supérieure (propriété (P7)) et celle de borne


inférieure de la Définition 3.6, mais pas Q.
En fait les deux propriétés sont équivalentes et il suffit de retenir la première.

Théorème 3.1. Un ensemble ordonné E a la propriété de la borne supérieure si


et seulement si il a la propriété de la borne inférieure.

Démonstration. Supposons la propriété de la borne supérieure pour E. Soit A ⊂ E


un minoré (borné inférieurement) non vide. Soit M l’ensemble (non vide) de tous
les minorants (bornes inférieures) de A

déf
M = {y ∈ E : ∀x ∈ A, y ≤ x} ⇒ ∀x ∈ A, ∀y ∈ M, y ≤ x.

Donc, tout x ∈ A est un majorant (borne supérieure) de M , M est majoré (borné


supérieurement), et sup M ∈ E. Par définition de la plus petite borne supérieure de
M,

∀x ∈ A, sup M ≤ x ⇒ sup M ∈ M,

c’est-à-dire, sup M est aussi une borne inférieure de A. Est-ce que c’est la plus
grande borne inférieure de A ? S’il existait une borne inférieure z de A tel que
z > sup M , on aurait z ∈ / M et, par définition de M , z ne serait pas une borne
inférieure de A. De cette contradiction, on conclut que inf A = sup M et E a la
propriété de la borne inférieure. La réciproque de démontre de façon analogue.

On utilisera souvent les caractérisations suivantes des deux notions de la


Définition 3.5 du Chapitre 1. Elles sont la généralisation des équivalences du Théorème
4.11 du Chapitre 1 pour le corps des réels R.

Théorème 3.2. Soit E un ensemble ordonné et A, ∅ 6= A ⊂ E.


- Les conditions suivantes sont équivalentes.
(a) b0 est la plus petite borne supérieure de A
(b) (i) b0 est une borne supérieure de A,
(ii’) pour tout M tel que b0 > M , il existe x0 ∈ A tel que b0 ≥ x0 > M .
(c) (i) b0 est une borne supérieure de A,
(ii”) pour toute borne supérieure M de A tel que b0 6= M , on a M > b0 .
- Les conditions suivantes sont équivalentes.
(a) b0 est la plus grande borne inférieure de A
(b) (i) b0 est une borne inférieure de A,
(ii’) pour tout m tel que b0 < m, il existe x0 ∈ A tel que b0 ≤ x0 < m.
(c) (i) b0 est une borne inférieure de A,
(ii”) pour toute borne inférieure m de A tel que b0 6= m, on a b0 < m.
3. Corps, ensemble ordonné et corps ordonné 39

Démonstration. Il suffit de démontrer les équivalences pour la borne supérieure.


(a) ⇒ (b). Soit M tel que b0 > M . Alors de (ii), M n’est pas une borne
supérieure. Il existe donc x0 ∈ A tel que x0 > M et, comme b0 est une borne
supérieure de A, b0 ≥ x0 > M .
(b) ⇒ (c). Pour toute borne supérieure M de A tel que b0 6= M , on aurait de
(ii’) une contradiction si M < b0 . Donc M ≥ b0 et comme M 6= b0 , on a M > b0 .
(c) ⇒ (a). Soit M < b0 . Comme M 6= b0 , si M était une borne supérieure, on
aurait par (ii”) la contradiction M > b0 . Donc M n’est pas une borne supérieure
de A.

Exemple 3.3.
Soit l’ensemble ordonné E = {x ∈ R : x > 0}. Supposons que A, ∅ 6= A ⊂ E, soit
borné supérieurement dans E. Comme A est aussi borné supérieurement en tant
que sous-ensemble de R, on sait par la propriété P7 que sup A ∈ R. Il vient alors

∀x ∈ A, 0 < x ≤ sup A ⇒ sup A ∈ E.

Donc, E a la propriété de la borne supérieure.


Maintenant, supposons que A soit borné inférieurement dans E, c’est-à-dire,
il existe un m ∈ E tel que 0 < m ≤ x pour tout x ∈ A. Comme A ⊂ R et que m
est aussi une borne inférieure de A dans R, on a par la propriété P7* du Théorème
4.10 du Chapitre 1 que inf A ∈ R et inf A ≥ m > 0. Donc, inf A ∈ E et E a la
propriété de la borne inférieure.

3.3 Corps ordonné


Dans le cas d’un corps, il faut faire attention car W. Rudin [1] ajoute quelques
propriétés à celles de la Définition 3.3 d’un ensemble ordonné qui serait un corps.

Définition 3.7.
Un corps ordonné est un corps K muni d’un ordre total ≤ tel que :

(i) ∀x, y, z ∈ K, y<z ⇒ x+y <x+z

(ii) ∀x, x > 0, ∀y, y > 0, xy > 0.

Proposition 3.4. On a dans tout corps ordonné :

(a) Si x 6= 0, x et −x sont de signe contraire.

(b) x > 0 et y < z ⇒ xy < xz

(c) x < 0 et y < z ⇒ xy > xz

(d) Si x 6= 0, alors x2 > 0. En particulier 1 > 0

(e) Si 0 < x < y, alors 0 < y −1 < x−1 .


40 Chapitre 2. Quelques notions ensemblistes et algébriques

4 Nombres complexes et hypercomplexes


4.1 Nombres complexes
Une des motivations pour étendre le corps des nombres réels aux nombres
complexes est l’impossibilité de trouver une solution

x ∈ R tel que x2 = −1.

Comme dans les cas précédents de N par rapport à Z ou de Q par rapport à R, on


est amené à construire un ensemble plus gros dans lequel cette équation trouvera
une solution.
On considère le produit cartésien R2 = R × R des paires ordonnées (x1 , x2 ).
On peut définir une addition et la multiplication par un scalaire, c’est-à-dire, par
un élément de R : pour x = (x1 , x2 ), y = (y1 , y2 ) et α ∈ R
déf
x + y = (x1 , x2 ) + (y1 , y2 ) = (x1 + y1 , x2 + y2 ), (4.1)
déf
α x = α (x1 , x2 ) = (α x1 , α x2 ). (4.2)

On peut aussi y ajouter un produit scalaire et une norme : pour x = (x1 , x2 ),


y = (y1 , y2 )
q
déf déf √
x · y = x1 y1 + x2 y2 , kxk = x · x = x21 + x22 (4.3)

et la base canonique orthonormale


déf déf
e1 = (1, 0), e2 = (0, 1). (4.4)

Tout x = (x1 , x2 ) peut s’écrire sous la forme

x = (x1 , x2 ) = x1 (1, 0) + x2 (0, 1).

On identifie R avec le sous-ensemble R ×{0} de R2 via l’injection

x 7→ (x, 0) : R → R2

où l’addition et la multiplication deviennent

(x1 , 0) + (x2 , 0) = (x1 + x2 , 0) et (x1 , 0) ⊙ (x2 , 0) = (x1 x2 , 0).

On cherche maintenant un prolongement de la multiplication dans R ×{0} à une


multiplication ⊙ de deux éléments de R2 . On voudrait que cette multiplication ⊙
donne l’existence de (x1 , x2 ) ∈ R2 tel que

(x1 , x2 ) ⊙ (x1 , x2 ) = (−1, 0). (4.5)

Afin de rendre convivial le calcul qui en résulte, on introduit la notation


déf déf
1 = (1, 0) et i = (0, 1). (4.6)
4. Nombres complexes et hypercomplexes 41

pour les deux éléments de la base. Tout x = (x1 , x2 ) peut s’écrire sous la forme
x = (x1 , x2 ) = x1 (1, 0) + x2 (0, 1) = x1 + i x2
en omettant le 1.
On introduit maintenant la table de multiplication 2.1 des éléments de base 1
et i de façon à vérifier l’équation (4.5). Par définition, on a bien

Table 2.1. Table de multiplication

⊙ 1 i
1 1 i
i i −1

(0, 1) ⊙ (0, 1) = −1 (1, 0). (4.7)


| {z } | {z } | {z }
i i −1

En utilisant les règles de l’addition et de la multiplication dans R, la table de


multiplication 2.1 et le fait que ces multiplications soient commutatives (i⊙1 = 1⊙i),
on obtient
(x1 + i x2 ) (y1 + i y2 ) = x1 y1 + i2 x2 y2 + i (x1 y2 +x2 y1 )
= (x1 y1 − x2 y2 ) + i (x1 y2 +x2 y1 ).
Ceci mène à la définition suivante de la multiplication ⊙ sur R2 :
déf
(x1 , x2 ) ⊙ (y1 , y2 ) = (x1 y1 − x2 y2 , x1 y2 +x2 y1 ). (4.8)
déf
Théorème 4.1. Muni de l’addition + et de la multiplication ⊙, C = (R2 , +, ⊙)
est un corps commutatif. Le produit scalaire et la norme dans R2 sont donnés par
x · y = x ⊙ ȳ et kxk = |x|, (4.9)
où
déf déf √
x̄ = (x1 , −x2 ) et |x| = x ⊙ x̄. (4.10)
x̄ est appelé le conjugué de x et |x| le module de x.
Le module héritera donc de toutes les propriétés de la norme dans R2 .
C = (R2 , +, ⊙) est appelé le corps des complexes et pour x = x1 + i x2 ,
déf déf
Re x = x1 et Im x = x2
sont dénommés partie réelle et partie imaginaire de x. R est un sous-corps de C via
l’injection x 7→ x : R → C. On peut maintenant trouver une ou des solutions dans
C de l’équation x2 = a pour a < 0.
On résume les propriétés des nombres complexes.
42 Chapitre 2. Quelques notions ensemblistes et algébriques

Théorème 4.2. Pour tout x, y ∈ C,


(a) x + y = x̄ + ȳ ;
(b) x y = x̄ ȳ ;
(c) x + x̄ = 2 Re (x) et x − x̄ = 2 Im (x) ;
(d) x x̄ ∈ R et x x̄ > 0 si x 6= 0.

Théorème 4.3. Pour tout x, y ∈ C,


(a) |0| = 0 et x 6= 0 ⇒ |x| > 0 ;
(b) |x̄| = |x| ;
(c) |x y| = |x| |y| ;
(d) |Re (x)| ≤ |x| et |Im (x)| ≤ |x|
(e) |x + x̄| ≤ |x| + |x̄|.

Comme pour les suites de réels, on adoptera la notation


n
X déf
xj = x1 + · · · + xn (4.11)
j=1

pour la somme de n nombres complexes x1 , . . . , xn . On obtient aussi l’inégalité de


Cauchy-Schwarz à partir de celle dans R2 .

Théorème 4.4. Soient a1 , . . . , an et b1 , . . . , bn des nombres complexes. Alors


 1/2  1/2
n
X Xn Xn
aj b̄j ≤ |aj |2   |bj |2  .
j=1 j=1 j=1

4.2 ◮ Nombres hypercomplexes


Peut-on définir une multiplication dans Rn pour n > 2 ? C’est le cas de R4 .
Un quaternion est un type de nombre hypercomplexe. L’ensemble des quaternions,
noté H, constitue une extension de l’ensemble des nombres complexes, extension
similaire à celle qui avait conduit de l’ensemble des nombres réels R à celui des
nombres complexes C.
Les quaternions furent mis en forme au XIXe siècle par Hamilton 5 qui cher-
chait à construire un ensemble de nombres ayant, dans l’espace, des propriétés
analogues à celles que possèdent les nombres complexes dans le plan. Il les présente
comme des quadruplets de réels, le premier élément étant un ≪scalaire ≫, et les trois
éléments restants formant un ≪vecteur ≫, ou ≪imaginaire pur ≫. Il put ainsi définir
une multiplication avec les bonnes propriétés. L’ensemble des quaternions peut être
muni d’une addition et d’une multiplication qui font de lui un des premiers exemples
de corps non commutatif.
5. William Rowan Hamilton (1805–1865). Voir W. R. Hamilton [1].
4. Nombres complexes et hypercomplexes 43

Figure 2.2. William Rowan Hamilton (1805–1865).

Tout quaternion (a, b, c, d) ∈ R4 est une combinaison linéaire des quatre qua-
ternions ≪unités ≫ : 1 = (1, 0, 0, 0), i = (0, 1, 0, 0), j = (0, 0, 1, 0), et k = (0, 0, 0, 1) :

∀(a, b, c, d) ∈ R4 , (a, b, c, d) = a 1 + b i + c j + d k.

Ces quaternions unités ne sont autres que les quatre éléments de la base orthonor-
male dans R4 . La définition de la multiplication s’obtient à partir de la Table de
multiplication 2.2.

Table 2.2. Table de multiplication

⊙ 1 i j k
1 1 i j k
i i −1 k −j
j j −k −1 i
k k j −i −1

Une plaque commémorative rappelant cette découverte se trouve à Dublin.


La relation qui existe entre les quaternions et les rotations en dimension 3 fait de
l’ensemble des quaternions un outil utile pour le traitement de l’espace comme en
infographie ou en théorie de la commande.
La théorie a été généralisée aux octonions qui sont une extension non-asso-
ciative des quaternions qui étaient eux-même une extension non-commutative des
complexes. Ils ont été découverts en 1843 par John T. Graves, un ami de William
Hamilton, qui les appela octaves.
Les complexes, les quaternions et les octonions correspondent aux espaces
euclidiens R2 , R4 et R8 de dimensions paires. Peut-on définir une multiplication sur
44 Chapitre 2. Quelques notions ensemblistes et algébriques

Figure 2.3. Plaque commémorative de la naissance des quaternions sur


le pont de Broom (Dublin). ≪Ici, le 16 octobre 1843, alors qu’il se promenait, Sir
William Rowan Hamilton découvrit dans un éclair de génie la formule fondamentale
sur la multiplication des quaternions i2 = j 2 = k 2 = ijk = −1 et la grava sur une
pierre du pont. ≫

les espaces euclidiens de dimensions impaires comme R3 ou R5 ? Oui dans R3 , on


a le produit vectoriel utilisé en électromagnétisme. Étant donné deux vecteurs x =
(x1 , x2 , x3 ) et y = (y1 , y2 , y3 ), on définit le produit suivant qui n’est pas commutatif :
déf
x × y = (x2 y3 − x3 y2 , x3 y1 − x1 y3 , x1 y2 − x2 y1 ). (4.12)

En introduisant la base orthonormale e1 = (1, 0, 0), e2 = (0, 1, 0), e3 = (0, 0, 1), on


obtient la table de multiplication suivante :

Table 2.3. Table de multiplication pour le produit vectoriel dans R3

× e1 e2 e3
e1 0 e3 −e2
e2 −e3 0 e1
e3 e2 −e1 0

Ici. il ne s’agit pas d’un corps puisque qu’il n’y a pas d’élément neutre (axiome
(M4)) et pas d’inverse (axiome (M5)) multiplicatif. Il n’y a pas non plus de com-
mutativité (axiome (M2)).

5 Exercices
Exercice 5.1 (W. Rudin [1, exercice 8, p. 21]).
Montrer qu’il est impossible de définir sur l’ensemble des nombres complexes C un
ordre total qui lui confère une structure de corps ordonné. (Indication : −1 est un
carré.
5. Exercices 45

Exercice 5.2.
Démontrer les résultats suivants.
(i) L’ensemble des irrationnels R \ Q n’est pas dénombrable.
(ii) Le segment ]a, b[ et le segment ]c, d[ ont le même cardinal.
(iii) Le segment ]0, 1[ et R ont le même cardinal.
46 Chapitre 2. Quelques notions ensemblistes et algébriques
Chapitre 3
Topologie et suites
dans les
espaces métriques

1 Espace vectoriel, norme, produit scalaire


1.1 L’espace Rn , n ≥ 1
Soient R l’ensemble des nombres réels et |x| la valeur absolue de x. Les nota-
tions suivantes seront utilisées pour les réels positifs et les réels strictement positifs
déf déf
R+ = {x ∈ R : x ≥ 0} et R+ = {x ∈ R : x > 0}

et la notation R = R ∪{±∞} pour l’ensemble étendu des réels (droite réelle achevée).
Pour un entier n ≥ 1, on considère maintenant les suites ordonnées x =
(x1 , . . . , xn ) de nombres réels xi . On appelle produit cartésien l’ensemble de toutes
ces suites
déf
Rn = R × . . . × R. (1.1)
| {z }
n fois

On définit sur Rn une l’addition et une multiplication par un scalaire :


déf
∀x, y ∈ Rn , x + y = (x1 + y1 , . . . , xn + yn )
déf
∀α ∈ R, x ∈ Rn , α x = (αx1 , . . . , αxn ).

L’élément neutre additif est 0 = (0, . . . , 0).


On associe à Rn la base (algébrique) suivante.

Définition 1.1.
La base canonique orthonormale de Rn est l’ensemble {eni ∈ Rn : 1 ≤ i ≤ n} des
éléments de Rn définis par
(
n déf déf 1, si i = j
(ei )j = δij , δij =
0, si i 6= j,

47
48 Chapitre 3. Topologie et suites dans les espaces métriques

où la fonction de deux variables δij est appelée symbole de Kronecker. Explicitement,

en1 = (1, 0, 0, . . . , 0, 0), en2 = (0, 1, 0, . . . , 0, 0), ..., enn = (0, 0, 0, . . . , 0, 1).

Lorsque le contexte est clair, on écrira simplement {ei } sans l’indice n.

1.2 Espace vectoriel


On peut aussi considérer les éléments x = (x1 , . . . , xn ) de Rn comme des
vecteurs et parler de Rn comme d’un espace vectoriel sur R de dimension n. Ceci
mène à la formalisation suivante.

Définition 1.2.
Soit E un ensemble non vide. On dit que (E, +, ×) est un espace vectoriel sur R
muni d’une addition
x, y 7→ x + y : E × E → E
et d’une multiplication par un scalaire

α, x 7→ α × x : R ×E → E

si (E, +) est un groupe commutatif et pour tout α et β dans R et x et y dans E

α × (x + y) = α × x + α × y,
(α + β) × x = α × x + β × x,
α × (βx) = (αβ) × x,
1 × x = x.

Exemple 1.1.
Les suites infinies x = (x1 , x2 , . . . ) ∈ R × R × . . . de réels avec les opérations
déf déf
x + y = (x1 + y1 , x2 + y2 , . . . ) et α x = (α x1 , α x3 , . . . )

forment un espace vectoriel de dimension infinie.

Exemple 1.2.
L’ensemble des fonctions f : [0, 1] → R est un espace vectoriel pour l’addition et la
multiplication par un scalaire suivantes :
déf déf
(f + g)(x) = f (x) + g(x) et (α f )(x) = α f (x).

En particulier, l’ensemble C[0, 1] des fonctions continues f : [0, 1] → R est un espace


vectoriel pour ces deux opérations. De même, l’ensemble des polynômes P k [0, 1] de
degré inférieur ou égal à k (k ≥ 0, un entier) définis dans l’intervalle [0, 1] est un
espace vectoriel.
1. Espace vectoriel, norme, produit scalaire 49

1.3 Norme et espace vectoriel normé


On introduit les définitions suivantes qui étendent celles de valeur absolue et
de multiplication dans R.

Définition 1.3. (i) La norme euclidienne sur Rn


" n #1/2
déf
X 2
kxkRn = |xi | (1.2)
i=1

que l’on écrira simplement kxk lorsque le contexte le permet.


(ii) Le produit scalaire sur Rn
n
X
déf
x·y = xi yi (1.3)
i=1


pour lequel kxkRn = x · x.

Pour n = 1, kxkR1 coı̈ncide avec la valeur absolue |x| et x · y avec le produit x y.


On parle de norme euclidienne parce qu’elle donne la longueur de la droite
entre deux points x = (x1 , . . . , xn ) et y = (y1 , . . . , yn ) de Rn
" n #1/2
X 2
kx − ykRn = |xi − yi | ,
i=1

c’est-à-dire, la plus petite distance entre les deux points comme en géométrie eucli-
dienne.
On peut vérifier les propriétés suivantes pour la norme euclidienne.

Théorème 1.1. Pour tous x, y, z ∈ Rn et α ∈ R


(a) kxkRn ≥ 0 ;
(b) kxkRn = 0 ⇐⇒ x = 0;
(c) kαxkRn = |α| kxkRn ;
(d) |x · y| ≤ kxkRn kykRn (inégalité de Cauchy-Schwarz 1 ) ;
(e) kx + ykRn ≤ kxkRn + kykRn (inégalité du triangle) ;
(f) kx − zkRn ≤ kx − ykRn + ky − zkRn .
1. Cette inégalité fut démontrée par Augustin Louis Cauchy en 1821 pour l’espace euclidien.
En 1859 Viktor Yakovlevich Bunyakovsky, étudiant de Cauchy, nota qu’en prenant les limites on
peut obtenir une forme intégrale de l’inégalité de Cauchy. Le résultat général pour un espace vecto-
riel muni d’un produit scalaire fut obtenu par Hermann Amandus Schwarz en 1885. Bunyakovsky
a donc obtenu le premier exemple de cette inégalité en dimension infinie de nombreuses années
avant Schwarz.
50 Chapitre 3. Topologie et suites dans les espaces métriques

Démonstration. Les propriétés (a), (b) et (c) sont faciles à vérifier et la propriété
(f) est une conséquence de (e) : kx − zk = k(x − y) + (y − z)k.
(d) Le polynôme quadratique
n
X n
X n
X n
X
0≤ (xi + λ yi )2 = x2i + 2 λ xi yi + λ2 yi2
1=1 1=1 1=1 1=1

est positif quelque soit λ. On sait que, lorsque a ≥ 0, la condition a λ2 + b λ + c ≥ 0


pour tout λ, enraı̂ne b2 − 4 a c ≤ 0, c’est-à-dire,

n
!2 n
! n
!
X X X
xi yi − x2i yi2 ≤0
1=1 1=1 1=1

ce qui donne l’inégalité (d) de Cauchy-Schwarz avec des carrés.


Pour (e), on utilise Cauchy-Schwarz pour le terme croisé
n
X n
X n
X n
X
2 2
kx + yk = (xi + yi ) = x2i +2 xi yi + yi2
1=1 1=1 1=1 1=1
2
≤ kxk2 + 2 kxk kyk + kyk2 = (kxk + kyk) .

En prenant la racine carré positive de chaque membre, on obtient (e).

On formalise la notion de norme sur un espace vectoriel.

Définition 1.4. (i) Une norme sur un espace vectoriel V est une application

déf
p : V → R+ = {x ∈ R : x ≥ 0}

vérifiant les propriétés suivantes


(N1) ∀λ ∈ R, ∀v ∈ V, p(λv) = |λ|p(v) ;
(N2) ∀u, v ∈ V, p(u + v) ≤ p(u) + p(v) ;
(N3) v ∈ V et p(v) = 0 ⇒ v = 0.
(ii) On dira que V est un espace vectoriel normé si V est un espace vectoriel
muni d’une norme.

Il y a d’autres choix de norme sur Rn comme


" n #1/p
déf
X p déf
kxkp = |xi | , 1 ≤ p < ∞, et kxk∞ = max |xi | .
1≤i≤n
i=1

Pour p = 2, la boule de centre 0 et de rayon r > 0,


déf 
Br (0) = y ∈ R2 : kykR2 < r ,
1. Espace vectoriel, norme, produit scalaire 51

est bien un disque de rayon r dans le plan donné par l’inégalité y12 + y22 < r2 . Pour
p = 1, la “boule”
déf 
Br (0) = y ∈ R2 : kyk1 < r

est un losange donné par l’inégalité |y1 | + |y2 | < r, et, pour p = ∞, la “boule”

déf 
Br (0) = y ∈ R2 : kyk∞ < r

est un carré donné par l’inégalité max{|y1 |, |y2 |} < r.


Les propriétés (a), (c), (e) et (b) du Théorème 1.1 sont indépendantes de p.

Théorème 1.2. Soit p, 1 ≤ p ≤ ∞, x = (x1 , . . . , xn ) ∈ Rn . La fonction


( n
)1/p
déf
X
x 7→ kxkp = |xi |p : Rn → R+ , 1 ≤ p < ∞,
i=1 (1.4)
déf
x 7→ kxk∞ = max |xi | : Rn → R+ , p = ∞,
1≤i≤n

possède les propriétés suivantes :


(i) kxkp = 0 ⇐⇒ x = 0 ;
(ii) kαxkp = |α| kxkp ;
(iii) (inégalité de Hölder) 2 pour 1 ≤ p < ∞ et q tel que 1/p + 1/q = 1,

n n
!1/p n
!1/q
X X X
p q
|xi yi | ≤ |xi | |yi | = kxkp kykq , 1 < p < ∞,
i=1 i=1 i=1
Xn n
X
|xi yi | ≤ |xi | max |yj | = kxk1 kyk∞ , p = 1;
1≤j≤n
i=1 i=1

(iv) (inégalité de Minkowski) 3

n
!1/p n
!1/p n
!1/p
X X X
|xi + yi |p ≤ |xi |p + |yi |p , 1 ≤ p < ∞,
i=1 i=1 i=1
max |xi + yi | ≤ max |xi | + max |yi |, p = ∞.
1≤i≤n 1≤i≤n 1≤i≤n

(v) La fonction kxkp est une norme sur Rn .

Démonstration. Les parties (i) et (ii) sont évidentes. Le cas p = 1 est immédiat.
2. Otto Ludwig Hölder (1859–1937). C’est la généralisation de l’inégalité de Cauchy-Schwarz
qui correspond à p = 2.
3. Hermann Minkowski (1864–1909). Voir aussi la démonstration plus directe de la Remarque
3.3 du Chapitre 4 page 123.
52 Chapitre 3. Topologie et suites dans les espaces métriques

On passe donc au cas 1 < p < ∞. Soit α > 0 et β > 0 tel que α + β = 1. On a
besoin de l’ inégalité arithmético-géométrique pondérée suivante : pour tous u > 0
et v > 0, on a

uα v β ≤ α u + β v ou uα v 1−α ≤ α u + (1 − α) v. (1.5)

En effet, pour t > 0, la fonction t 7→ tα : R+ = ]0, ∞[ → R est concave puisque,


pour 0 < α < 1, sa dérivée seconde α (α − 1) tα−2 est négative pour t > 0. Cette
courbe se trouve donc en dessous de sa tangente au point t = 1, c-à-d.,

tα ≤ 1 + α (t − 1) ⇒ tα ≤ α t + β. (1.6)

En substituant t = u/v et en multipliant chaque membre de (1.6) par v, on obtient


(1.5).
(iii) Inégalité de Hölder. Soit 1 < p < ∞ et q tel que 1/p + 1/q = 1. Soit
x = (x1 , . . . , xn ) et y = (y1 , . . . , yn ). On applique (1.5) avec
|xi |p |yi |q 1 1 1
ui = Pn p
, vi = Pn q
, α= , β =1−α=1− = .
j=1 |xj | j=1 |yj | p p q

On obtient
!1/p !1/q
|x |p |y |q 1 |x |p 1 |yi |q
Pn i p
Pn i q
≤ Pn i + P n
j=1 |xj | j=1 |yj | p j=1 |xj |p q j=1 |yj |
q

|xi | |y | 1 |x |p 1 |yi |q
Pn p 1/p
Pn i q 1/q ≤ Pn i p
+ Pn q
( j=1 |xj | ) ( j=1 |yj | ) p j=1 |xj | q j=1 |yj |
|xi | |yi | 1 |xi |p 1 |yi |q
Pn P n ≤ P n + P n .
( j=1 |xj |p )1/p ( j=1 |yj |q )1/q p j=1 |xj |p q j=1 |yj |
q

Puis on somme par rapport à i


Pn Pn p
Pn
i=1 |xP
i | |yi | 1 i=1 |xi | 1 |y |q 1 1
Pn n ≤ P n + Pni=1 i q = + = 1
p 1/p
( j=1 |xj | ) ( j=1 |yj | ) q 1/q p j=1 |xj |p q j=1 |yj | p q
 1/p  1/q
X n n
X n
X Xn
xi yi ≤ |xi yi | ≤  |xj |p   |yj |q  .
i=1 i=1 j=1 j=1

Pour p = 1, q = ∞ et
n n n n
!
X X X X
xi yi ≤ |xi yi | ≤ |xi | |yi | ≤ |xi | max |yj |.
1≤j≤n
i=1 i=1 i=1 i=1

(iv) Inégalité de Minkowski. Pour 1 < p < ∞


n
X n
X n
X
|xi + yi |p = |xi + yi |p−1 |xi + yi | ≤ |xi + yi |p−1 (|xi | + |yi |).
i=1 i=1 i=1
1. Espace vectoriel, norme, produit scalaire 53

En utilisant l’inégalité de Hölder,


 1/q  1/p
Xn n
X n
X
|xi + yi |p−1 |xi | ≤  |xi + yi |(p−1)q   |xj |p 
i=1 j=1 j=1
 1−1/p  1/p
n
X n
X
≤ |xi + yi |p   |xj |p 
j=1 j=1

puisque (p − 1)q = p et par le même argument


 1−1/p  1/p
Xn n
X n
X
|xi + yi |p−1 |yi | ≤  |xi + yi |p   |yj |p  .
i=1 j=1 j=1

En additionnant
 1−1/p  1/p  1/p 
n
X n
X n n
X X 
|xi + yi |p ≤  |xi + yi |p   |xj |p  +  |yj |p  
i=1 j=1 j=1 j=1

" n #1/p  1/p  1/p


X Xn Xn
⇒ |xi + yi | p
≤ |xj |p  +  |yj |p  .
i=1 j=1 j=1

Enfin, pour p = 1
n
X n
X n
X n
X
|xi + yi | ≤ |xi | + |yi | = |xi | + |yi |;
i=1 i=1 i=1 i=1
pour p = ∞
|xi + yi | ≤ |xi | + |yi | ≤ max |xi | + max |yi |
1≤i≤n 1≤i≤n

⇒ max |xi + yi | ≤ max |xi | + max |yi |.


1≤i≤n 1≤i≤n 1≤i≤n

Exemple 1.3.
On revient à l’exemple 1.2 de l’espace vectoriel C[0, 1] des fonctions continues f :
[0, 1] → R. Les fonctions
Z 1
f 7→ max |f (x)| et f 7→ |f (x)| dx
x∈[0,1] 0

sont des normes sur C[0, 1]. On verra plus loin que pour un sous-ensemble borné
fermé K ⊂ Rn , l’espace des fonctions continues sur K,
déf déf
C(K) = {f : K → R | f est continue sur K} , kf kC(K) = sup |f (x)|
x∈K

est un espace vectoriel normé pour la norme kf kC(K).


54 Chapitre 3. Topologie et suites dans les espaces métriques

Exemple 1.4.
Si l’on passe à des espaces de suites infinies comme
( ∞
)
déf
X
ℓp = x = (x1 , x2 , . . . ) : xi ∈ R et |xi |p < ∞ , 1 ≤ p < ∞,
i=1

on peut encore montrer que ℓp est un espace vectoriel, mais il n’est plus de dimension
finie. On peut aussi vérifier que la fonction


!1/p
déf
X p
kxkℓp = |xi |
i=1

est une norme sur ℓp .

1.4 Produit scalaire


La notion de produit scalaire sur Rn de la Définition 1.3 s’axiomatise.

Définition 1.5.
Soit V un espace vectoriel sur R. Un produit scalaire sur V est une application

(x, y) 7→ x · y : V × V → R (1.7)

dotée des propriétés suivantes :


(PS1) x · x ≥ 0 pour tout x ∈ V ;
(PS2) x · x = 0 si et seulement si x = 0 ;
(PS3) x · y = y · x pour tout x, y ∈ V ;
(PS4) (λx + µy, z) = λ x · z + µ y · z pour tout λ, µ ∈ R et x, y, z ∈ V .

On peut vérifier que le produit scalaire induit la norme suivante sur V :



kxk = x · x. (1.8)

Exemple 1.5.
On revient à l’exemple 1.2 de l’espace vectoriel C[0, 1] des fonctions continues f :
[0, 1] → R. La fonction
Z 1
déf
f, g 7→ f · g = f (x) g(x) dx
0

est un produit scalaire ce qui fait que


Z 1/2
p 1
2
f ·f = f (x) dx
0

est une autre norme sur C[0, 1].


2. Métrique et espace métrique 55

2 Métrique et espace métrique


2.1 Définition et exemples
La notion de norme permet de définir la distance d(x, y) = ky − xk entre deux
points x et y d’un espace vectoriel V . On peut cependant se passer de la structure
algébrique d’espace vectoriel et même de toute structure algébrique en introdui-
sant une notion axiomatique fort simple de distance d(x, y) entre deux points x et
y pour un ensemble arbitraire. D’après J.-L. Verley [1], c’est par l’analyse des
principales propriétés de la distance usuelle que Fréchet introduisit la notion d’es-
pace métrique, développée ensuite par Hausdorff. Elle sera suffisante pour parler de

Figure 3.1. Maurice René Fréchet (1878–1973).

topologie, de convergence et de continuité et pour démontrer de nombreux résultats


fondamentaux pour une multitude d’espaces rencontrés en analyse classique et en
analyse fonctionnelle.

Définition 2.1. (i) Une métrique sur un ensemble X est une fonction

déf
(x, y) 7→ d(x, y) : X × X → R+ , R+ = {x ∈ R : x ≥ 0}

qui satisfait les trois axiomes suivants :


(M1) d(x, y) = 0 ⇐⇒ x = y;
(M2) (symétrie) d(x, y) = d(y, x) ;
(M3) (inégalité du triangle) d(x, y) ≤ d(x, z) + d(z, y).
On appelle aussi d(x, y) la distance entre x et y.
(ii) Un ensemble X doté d’une métrique d est appelé espace métrique. On
l’écrira X, (X, d) ou (X, dX ) selon le degré de précision désiré.

Il est important d’insister sur le fait que l’on n’a supposé aucune structure algébrique
sur X comme le montre l’exemple suivant.
56 Chapitre 3. Topologie et suites dans les espaces métriques

Exemple 2.1 (Exercice 10.12).


Si X est un ensemble infini, on pose pour tout x, y ∈ X
(
1, si x 6= y
d(x, y) =
0, si x = y.

L’espace (X, d) est un espace métrique. En effet, d(x, y) ≥ 0 pour tous x, y ∈ X.


On a, par définition de d, d(x, y) = 0 ⇐⇒ x = y et d(x, y) = d(y, x). Pour
(M3), si x = y, alors d(x, y) = 0 ≤ d(x, z) + d(z, y). Pour x 6= y, d(x, y) = 1 et
ou bien x 6= z ou y 6= z. Ceci implique que d(x, z) = 1 ou d(y, z) = 1 et donc
d(x, y) = 1 ≤ d(x, z) + d(z, y).

Si X est un espace vectoriel normé, alors il est facile de vérifier que

d(x, y) = kx − yk

est une métrique sur X à partir des propriétés (N1), (N2) et (N3) de la Définition
1.4 du Chapitre 2 (voir l’Exercice 10.5). Les espaces R, Rn , ℓp et C(K) sont donc
des espaces métriques.
On termine par l’exemple de la métrique de Hausdorff.

Exemple 2.2 (Métrique de Hausdorff 4 et fonction distance).


L’espace des parties fermées A d’un borné fermé K ⊂ Rn
déf
F (K) = {A : ∅ 6= A ⊂ K et A fermé}

n’est pas un espace vectoriel. On peut cependant y définir une métrique.


On introduit la fonction distance dA pour A, ∅ 6= A ⊂ Rn ,
déf
x 7→ dA (x) = inf kx − akRn : Rn → R,
a∈A

qui est une fonction continue dans Rn et l’ensemble


déf
Cd (K) = {dA : ∅ 6= A ⊂ K et A fermé} .

On met chaque partie A en correspondance avec la fonction distance dA

A ←→ dA
∈F (K) ∈Cd (K)

ce qui permet d’identifier Cd (K) à F (K). Comme l’espace des fonctions continues
C(K) est un espace normé pour la norme du sup sur K, cela induit la métrique
suivante sur F (K) :
déf
d(A, B) = kdA − dB kC(K) = sup |dA (x) − dB (x)|.
x∈K
2. Métrique et espace métrique 57

Figure 3.2. Felix Hausdorff (1868–1942).

Cette métrique n’est autre que la métrique de Hausdorff 5


déf
d(A, B) = max{sup dB (x), sup dA (y)}
x∈A y∈B

qui est généralement définie sur les sous-ensembles compacts de Rn plutôt que
sur les sous-ensembles compacts d’un compact K. L’avantage de cette dernière
construction est de pouvoir dans un second temps définir une métrique sur tous
les sous-ensembles fermés de Rn bornés ou non-bornés (voir M. C. Delfour et
J.-P. Zolésio [1, pp. 268–275].
En effet, pour x ∈ K, xA ∈ A, et xB ∈ B

|x − xA | ≤ |x − xB | + |xB − xA |
⇒ dA (x) ≤ |x − xB | + dA (xB ) ≤ |x − xB | + sup dA (y)
y∈B

⇒ dA (x) ≤ dB (x) + sup dA (y) ⇒ dA (x) − dB (x) ≤ sup dA (y).


y∈B y∈B

En interchangeant les rôles de A et de B


 
∀x ∈ K, |dA (x) − dB (x)| ≤ max sup dA (z), sup dB (y)
z∈B y∈A
 
⇒ sup |dA (x) − dB (x)| ≤ max sup dA (z), sup dB (y) .
x∈K z∈B y∈A

4. L’écart mutuel entre deux ensembles fut introduit par D. Pompéiu [1] dans sa thèse
présentée à Paris en mars 1905. C’est le premier exemple d’une métrique entre deux ensembles. Elle
fut étudiée avec plus de détails par F. Hausdorff [2, “Quellenangaben”, p. 280, and Chap. VIII,
sect. 6] en 1914.
5. Felix Hausdorff (1868–1942) est considéré comme l’un des fondateurs de la topologie mo-
derne.
58 Chapitre 3. Topologie et suites dans les espaces métriques

Dans l’autre sens comme A ⊂ K et B ⊂ K,

sup |dA (x) − dB (x)| ≥ sup |dA (x) − dB (x)| = sup dB (x)
x∈K x∈A x∈A
sup |dA (x) − dB (x)| ≥ sup |dA (x) − dB (x)| = sup dA (x)
x∈K x∈B x∈B
 
⇒ sup |dA (x) − dB (x)| ≥ max sup dB (x), sup dA (x) .
x∈K x∈A x∈B

Ces quelques exemples illustrent la richesse de la structure d’espace métrique,


mais tous les espaces de fonctions ne sont cependant pas métriques ou métrisables.

2.2 Quelques propriétés


On peut vérifier les propriétés suivantes qui découlent de la définition et des
opérations sur R+ (voir les Exercices 10.3 et 10.4).
(i) Pour tout espace métrique (X, d) et pour toute constante α > 0, la fonction
déf
(x, y) 7→ (αd)(x, y) = α d(x, y)

est une métrique sur X.


(ii) Si d1 et d2 sont deux métriques sur X, la fonction
déf
(x, y) 7→ (d! + d2 )(x, y) = d1 (x, y) + d2 (x, y)

est une métrique sur X.


(iii) Pour tout espace métrique (X, d), la fonction

déf d(x, y)
(x, y) 7→ d(x, y) =
1 + d(x, y)
est une métrique sur X.
(iv) Soit {dn : n ≥ 1} une suite de fonctions dn : X × X → R+ tel que pour
tout entier n ≥ 1 6

∀x, y ∈ X, dn (x, y) = dn (y, x) (2.1)


∀x, y, z ∈ X, dn (x, z) ≤ dn (x, y) + dn (y, z) (2.2)
x = y ⇒ dn (x, y) = 0 (2.3)

et, en plus,

d1 (x, y) = 0 ⇒ x = y. (2.4)
6. Une application d : X × X → R+ vérifiant les conditions (2.1) à (2.3) est applelée pseu-
dométrique ou écart. En introduisant la relation déquivalence x R y si d(x, y) = 0 et en posant
déf
d∗ (Rx, Ry) = d(x, y) on obtient une métrique sur l’espace quotient X ∗ = X/R.
3. Ensemble ouvert et ensemble fermé 59

La fonction
X∞
déf 1 dn (x, y)
(x, y) 7→ d∞ (x, y) = n 1 + d (x, y)
n=1
2 n

est bien définie et est une métrique sur X.


(v) Soient (Xi , di ), 1 ≤ i ≤ n, des espaces métriques 7
déf
X1 × · · · × Xn = {(x1 , . . . , xn ) : xi ∈ Xi } (2.5)

l’espace produit des Xi . Alors la fonction


déf
(x, y) = ((x1 , . . . , xn ), (y1 , . . . , yn )) 7→ d∞ (x, y) = max di (xi , yi )
1≤i≤n (2.6)
: (X1 × · · · × Xn ) × (X1 × · · · × Xn ) → R+

est une métrique sur X1 × · · · × Xn . De la même façon, pour tout p,


1 ≤ p < ∞, la fonction
( n
)1/p
déf
X
p
dp (x, y) = di (xi , yi ) (2.7)
i=1

est une métrique sur X1 × · · · × Xn .

3 Ensemble ouvert et ensemble fermé


3.1 Boule ouverte et boule trouée
Dans un espace métrique (X, d) les notions d’ensemble ouvert et d’ensemble
fermé peuvent être introduites à l’aide de deux types de boules.
- Boule ouverte centrée en x ∈ X de rayon r > 0 :
déf
Br (x) = {y ∈ X : d(x, y) < r}.

- Boule ouverte trouée centrée en x ∈ X de rayon r > 0 :


déf
Br′ (x) = {y ∈ X : 0 < d(x, y) < r}.

Remarque 3.1.
Attention à la terminologie boule ouverte et à sa notation, car elles peuvent être
trompeuses. Soit R2 muni de la métrique usuelle
déf p
d((x2 , y2 ), (x1 , y1 )) = |y2 − y1 |2 + |x2 − x1 |2 .
7. Certains auteurs associent un nom aux métriques dp : Manhattan pour p = 1 parce que
c’est la plus petite distance entre deux points parcourue par un taxi lorsqu’il se déplace dans une
ville américaine où les rues sont agencées selon un réseau ou quadrillage, Euclide pour p = 2,
Minkowski pour 1 < p < ∞, et Tchebychev ou distance de l’échiquier pour p = ∞.
60 Chapitre 3. Topologie et suites dans les espaces métriques

La boule ouverte de rayon un en (0, 0) dans (R2 , d),


n p o
déf
B1 (0, 0) = (x, y) ∈ R × R : x2 + y 2 < 1 ,

correspond bien à l’intuition que l’on se fait d’une boule. Cependant, si l’on prend
X = Q2 , l’ensemble des points de R2 de coordonnées rationnelles, avec la métrique
d, la boule ouverte de rayon un en (0, 0) dans (Q2 , d) est
n p o
déf
B1 (0, 0) = (x, y) ∈ Q × Q : x2 + y 2 < 1 .

Si l’on prend X = {(x, 0) : x ∈ Q} avec la métrique d, la boule ouverte de rayon un


en (0, 0) dans (X, d) est

déf
B1 (0, 0) = {(x, 0) : x ∈ Q et |x| < 1} ⊂ Q × Q.

Pour être précis, il faudrait ajouter l’indice X et utiliser la notation B1X (0, 0)
pour bien la distinguer de celle de la boule ouverte de rayon un en (0, 0) dans R2 .
Comme l’espace X est en général fixé, on choisit de laisser tomber l’indice X pour
alléger la notation.

3.2 Ensemble ouvert et intérieur d’un ensemble


Définition 3.1.
Soit E une partie d’un espace métrique (X, d).
(i) a ∈ X est un point intérieur de E s’il existe r > 0 tel que Br (a) ⊂ E.
(ii) L’intérieur de E est l’ensemble de tous les points intérieurs de E que l’on

désignera par int E ou E. Par définition int E ⊂ E.
(iii) V (x) est un voisinage de x s’il existe r > 0 tel que Br (x) ⊂ V (x).
(iv) E est ouvert si chaque point de E est un point intérieur de E.

Les notions de boule ouverte, de point intérieur et d’intérieur ne sont pas


intrinsèques car elle dépendent non seulement de E mais aussi du choix de l’espace
ambiant X comme le montre l’exemple suivant.

Exemple 3.1.
Soient R muni de la métrique d(x, y) = |x− y| et Y = {x ∈ R : x ≥ 0}. On considère
pour b > 0 le sous-ensemble E = {x ∈ R : 0 ≤ x < b} pour lequel E ⊂ Y ⊂ R. Le
point 0 n’est pas un point intérieur de E dans (R, d) puisque pour tout r, 0 < r < b,

BrR (0) = {x : −r < x < r} 6⊂ {x ∈ R : 0 ≤ x < b} = E.

Le point 0 est cependant un point intérieur de E dans (Y, d) puisque

BbY (0) = {y ∈ Y : |y − 0| < b} = {y ∈ R : 0 ≤ y < b} = E.


3. Ensemble ouvert et ensemble fermé 61

De même, tout point x, 0 < x < b, est un point intérieur car pour r = min{x, b−x} >
0, on a x ≥ r, b − x ≥ r et

BrY (x) = {y ∈ Y : |y − x| < r} = {y ∈ R : x − r < y < x + r} ⊂ E.

Donc, E est ouvert dans (Y, d) mais pas dans (R, d).

On justifie maintenant la terminologie initiale de boule ouverte.


Théorème 3.1. Soit (X, d) un espace métrique.
(i) La boule Br (x) est un ensemble ouvert.
(ii) Pour tout E ⊂ X, int E est ouvert.
(iii) E est ouvert si et seulement si E = int E.
(iv) L’ensemble vide ∅ et tout l’espace X sont des ouverts.
(v) L’ intersection ∩m
i=1 Gi d’une famille finie {Gi : 1 ≤ i ≤ m} d’ouverts est
un ensemble ouvert.
(vi) L’ union ∪α∈A Gα d’une famille arbitraire {Gα : α ∈ A} d’ouverts est un
ensemble ouvert.
Démonstration. (i) Soit y ∈ Br (x). Par définition, d(y, x) < r et h = r −d(y, x) > 0.
Par l’inégalité du triangle

∀z ∈ Bh (y), d(z, x) ≤ d(z, y) + d(y, x) < h + d(y, x) = r ⇒ z ∈ Br (x)

et y ∈ int Br (x). Donc tout point de Br (x) est un point intérieur et Br (x) est un
ensemble ouvert.
(ii) Pour chaque x ∈ int E, il existe r > 0 tel que Br (x) ⊂ E. Donc, pour tout
y ∈ Br (x), on a 0 < d(y, x) < r. Soit ρ = r − d(y, x) > 0. On a

∀z ∈ Bρ (y), d(z, x) ≤ d(z, y) + d(y, x) < r − d(y, x) + d(y, x) = r


⇒ Bρ (y) ⊂ Br (x) ⊂ E ⇒ y ∈ int E.

On en conclut que Br (x) ⊂ int E et que x est un point intérieur de int E. Donc
int E est ouvert. On a aussi montré que int E ⊂ int (int E).
(iii) De la partie (ii), int E est ouvert. Si E = int E, alors E est ouvert.
Réciproquement, par définition, int E ⊂ E. Si E est ouvert, alors pour chaque
x ∈ E, il existe r > 0 tel que Br (x) ⊂ E et x ∈ int E. Donc E ⊂ int E et E = int E.
(iv) De la partie (iii). Comme il n’y a pas de points dans ∅, l’ensemble de ses
points intérieurs est vide : int ∅ = ∅. Par définition de Br (x), pour tout x ∈ X et
tout r > 0, on a toujours Br (x) ⊂ X et donc X ⊂ int X ⊂ X. Donc X = int X et
X est un ouvert.
(v) Si ∩m m
i=1 Gi = ∅, le résultat est vrai. Sinon, soit x ∈ ∩i=1 Gi . Comme pour
chaque i, x ∈ Gi et que Gi est ouvert, il existe ri > 0 tel que Bri (x) ⊂ Gi . On
prend r = min{ri : 1 ≤ i ≤ m} > 0 qui est strictement positif. Donc

∀i, 1 ≤ i ≤ m, Br (x) ⊂ Gi ⇒ Br (x) ⊂ ∩m


i=1 Gi .
62 Chapitre 3. Topologie et suites dans les espaces métriques

(vi) Si tous les Gα sont vides, l’union est vide et il n’y a rien à démontrer.
Sinon, pour chaque x ∈ ∪α∈A Gα , il existe α ∈ A tel que x ∈ Gα . Comme Gα est
ouvert, il existe r > 0 tel que

Br (x) ⊂ Gα ⊂ ∪α∈A Gα

et x est un point intérieur de ∪α∈A Gα .

Définition 3.2.
Soit (X, d) un espace métrique.
(i) La famille T de tous les ouverts dans X est appelée la topologie 8 de X
générée par la métrique d.
(ii) On dit qu’une famille d’ouverts {Oα } est une base de (X, d) si tout ouvert
de X est la réunion d’ouverts de cette famille.

Théorème 3.2. Soit (X, d) un espace métrique. La famille de toutes les boules
ouvertes {Br (x) : x ∈ X, r > 0} plus l’ensemble vide ∅ est une base de (X, d).
Démonstration. Par le Théorème 3.1 (iii), lorsque ∅ 6= E ⊂ X est ouvert, il coı̈ncide
avec son intérieur int E. Si x ∈ int E, il existe rx > 0 tel que Brx (x) ⊂ E. Donc

E ⊂ ∪x∈E Brx (x) ⊂ E ⇒ E = ∪x∈E Brx (x).

On revient à l’Exemple 3.1. Si (X, d) est un espace métrique, alors pour toute
partie Y ⊂ X, (Y, d) est aussi un espace métrique avec ses ouverts. Il est donc
important de bien comprendre l’utilisation de la notation ambigue Br (x) pour la
boule ouverte. En effet la boule ouverte de centre a ∈ X et de rayon r > 0 dans
(X, d) est définie comme
déf
BrX (a) = {z ∈ X : d(x, a) < r},

alors que la boule ouverte de centre b ∈ Y et de rayon r > 0 dans (Y, d) est définie
comme
déf
BrY (b) = {z ∈ Y : d(y, b) < r}.

Si a ∈ Y ⊂ X, on a alors

BrY (a) = Y ∩ BrX (a).


8. Soit X un ensemble. Une topologie T sur X est une collection de parties de X vérifiant
les axiomes suivants :
(O 1) toute union d’ensembles de T est dans T ,
(O 2) toute intersection finie d’ensembles de T est dans T ,
(O 3) ∅ ∈ T et X ∈ T .
3. Ensemble ouvert et ensemble fermé 63

Pour simplifier on laisse tomber les indices X et Y lorsque le contexte le permet,


mais il ne faut pas perdre de vue les différences.
On introduit la terminologie suivante qui n’ajoute rien de plus à ce que l’on a
dit jusqu’ici.

Définition 3.3.
Soient (X, d) un espace métrique et Y ⊂ X. Un ensemble G ⊂ Y est ouvert relati-
vement à Y si G est ouvert dans (Y, d), c’est-à-dire, pour chaque x ∈ G
∃r > 0 tel que BrY (x) ⊂ G, (3.1)

où BrY (x) est la boule dans Y :


déf
BrY (x) = {y ∈ Y : d(y, x) < r} .
L’ensemble de tous les ouverts par rapport à (Y, d) forme la topologie relative de
(Y, d) par rapport à la topologie de (X, d).

Un ouvert relativement à X est ouvert relativement à Y , mais, comme on l’a vu


précédemment dans l’Exemple 3.1, si X 6= Y , alors un ouvert relativement à Y n’est
pas nécessairement ouvert relativement à X.
Théorème 3.3. Soient (X, d) un espace métrique et Y ⊂ X. E ⊂ Y est ouvert
relativement à (Y, d) si et seulement si il existe un ouvert O relativement à (X, d)
tel que E = O ∩ Y .
Démonstration du Théorème 3.3. Si E est ouvert relativement à (Y, d), pour chaque
x ∈ E il existe rx > 0 tel que
{z ∈ Y : d(z, x) < rx } ⊂ E ⇒ Y ∩ {z ∈ X : d(z, x) < rx } ⊂ Y ∩ E = E.
Soit
déf
O = ∪x∈E {z ∈ X : d(z, x) < rx }.
C’est un ouvert relativement à X en tant qu’union de boules ouvertes dans X et
O ∩ Y = ∪x∈E {z ∈ Y : d(z, x) < rx }.
Mais comme E est ouvert relativement à Y ,
∪x∈E {z ∈ Y : d(z, x) < rx } ⊂ E = ∪x∈E {x} ⊂ ∪x∈E {z ∈ Y : d(z, x) < rx }
⇒ E = ∪x∈E {z ∈ Y : d(z, x) < rx } = O ∩ Y.
Réciproquement, si O est un ouvert dans X tel que E = O ∩ Y , alors tout point
x ∈ E ⊂ O est un point intérieur de O dans X. Donc, il existe rx > 0 tel que
{z ∈ X : d(z, x) < rx } ⊂ O et
{z ∈ Y : d(z, x) < rx } = {z ∈ X : d(z, x) < rx } ∩ Y ⊂ O ∩ Y = E.
De là, par définition, x est un point intérieur de E relativement à Y et E est ouvert
relativement à Y .
64 Chapitre 3. Topologie et suites dans les espaces métriques

3.3 Ensemble fermés et adhérence d’un ensemble


Les notions d’ensemble fermé et de point d’adhérence peuvent être amenées
de plusieurs façons. On commence ici par les notions de point d’accumulation et de
point isolé. La notion de point d’accumulation sera nécessaire plus tard pour définir
la notion de limite d’une fonction en un point.

Définition 3.4.
Soit E une partie d’un espace métrique (X, d).
(i) a ∈ E est un point isolé de E si

∃r > 0 tel que Br′ (a) ∩ E = ∅.

(ii) a ∈ X est un point d’accumulation de E si

∀r > 0, Br′ (a) ∩ E 6= ∅.

On désignera par E ′ l’ensemble des points d’accumulation de E.

Remarque 3.2.
De cette définition, on constate que les points isolés de E sont donnés par
déf
/ E′}
E\E ′ = {x ∈ E : x ∈ (3.2)

(voir Définition 3.6 du complémentaire en page 65.)

Il faut être prudent en présence de définitions aussi générales même dans R.

Exemple 3.2.
Soit R avec la métrique d(x, y) = |x − y|. On se donne les sous-ensembles

F = {x ∈ R : x > 0} et E = {x ∈ R : 0 < x ≤ b}, 0 < b,

pour lesquels E ⊂ F ⊂ R. Équipé de la même métrique d, (F, d) et (E, d) sont aussi


des espaces métriques.
On s’intéresse maintenant aux point d’accumulation du sous-ensemble E par
rapport à (R, d), (F, d) et (E, d). On applique donc la définition avec X égal à R,
F et E.
(i) Dans (R, d), int E = {x ∈ R : 0 < x < b} et E ′ = [0, b] = E ∪ {0}.
(ii) Dans (F, d), int E = {x ∈ R : 0 < x < b} et E ′ = (0, b] = E.
(iii) Dans (E, d), int E = {x ∈ R : 0 < x ≤ b} et E ′ = (0, b] = E.
On voit que dans les deux derniers cas, le point 0 n’est pas un point d’accumulation
ce qui est contraire à notre intuition qui a tendance à voir l’ensemble E dans le
contexte de R où 0 est un point d’accumulation.

Théorème 3.4. Soit E une partie de (X, d).


(i) Si x ∈ X est un point d’accumulation de E, alors tout voisinage de x
contient une infinité de points de E.
3. Ensemble ouvert et ensemble fermé 65

(ii) Si E ne contient qu’un nombre fini de points, alors tous ses points sont
des points isolés.

Démonstration. (i) Il suffit de démontrer pour toute boule ouverte Br (x) contient
une infinité de points de E. Supposons donc qu’il existe r > 0 tel que Br (x) ne
contienne qu’un nombre fini de points x1 , . . . xn de E distincts de x. Soit
déf
r = min{d(xi , x) : 1 ≤ i ≤ n}.

Le rayon r > 0 puisqu’il n’y a qu’un nombre fini de points distincts de x et en


conséquence la boule trouée est vide : Br′ (x) = ∅. Par définition, x serait un point
isolé de E ce qui contredit l’hypothèse de départ.
(ii) C’est un corollaire de (i).

On passe maintenant à la notion tout aussi délicate d’ensemble fermé.

Définition 3.5.
Soit E une partie d’un espace métrique (X, d). E est un ensemble fermé s’il contient
tous ses points d’accumulation, c’est-à-dire, si E ′ ⊂ E.

Encore une fois, il faut être prudent en présence de définitions aussi générales.

Exemple 3.3 (Exemple 3.2).


Soit R avec la métrique d(x, y) = |x − y|. On se donne les sous-ensembles

F = {x ∈ R : x > 0} et E = {x ∈ R : 0 < x ≤ b}, 0 < b,

pour lesquels E ⊂ F ⊂ R. Équipé de la même métrique d, (F, d) et (E, d) sont aussi


des espaces métriques.
On applique donc la définition d’un fermé à E avec X égal à R, F et E.
(i) Dans (R, d), E ′ = [0, b] et 0 ∈
/E ⇒ E n’est pas fermé dans (R, d).

(ii) Dans (F, d), E = (0, b] = E ⇒ E est fermé dans (F, d).

(iii) Dans (E, d), E = (0, b] = E ⇒ E est fermé dans (E, d).
Comme pour la notion de point d’accumulation, on voit qu’être fermé n’est pas une
propriété intrinsèque de E.

On introduit maintenant la notion de complémentaire qui permettra d’établir


un lien direct entre les ouverts et les fermés et de déduire plusieurs propriétés des
fermés de celles des ouverts et vice-versa.

Définition 3.6.
Soient A et B deux parties d’un ensemble X.
(i) L’ensemble {x ∈ A : x ∈
/ B} est le complément de B par rapport à A. On
écrira A\B ou ∁A B.
(ii) Lorsque A = X on écrira ∁B ou X\B et on dira que ∁B est le complément
de B par rapport à X.
66 Chapitre 3. Topologie et suites dans les espaces métriques

De retour aux fermés et aux ouverts, on a le résultat suivant.

Théorème 3.5. Soit E une partie d’un espace métrique (X, d).
(i) E est ouvert si et seulement si X\E est fermé. En particulier, X et ∅ sont
à la fois ouverts et fermés dans (X, d).
(ii) E est fermé dans (X, d) si et seulement si X\E est ouvert dans (X, d).

Démonstration. (i) (⇒) Par l’absurde : si X\E n’est pas fermé, alors il existe un
point d’accumulation x ∈ (X\E)′ qui n’appartient pas à X\E. Donc x ∈ E. Comme
E est ouvert, il existe r > 0 tel que Br (x) ⊂ E et donc

∃r > 0 tel que Br (x) ∩ (X\E) = ∅ ⇒ ∃r > 0 tel que Br′ (x) ∩ (X\E) = ∅

/ X\E. Mais ceci contredit le fait que x ∈ (X\E)′ .


puisque x ∈
(⇐) Comme X\E est fermé, (X\E)′ ⊂ X\E. Pour tout x ∈ E on a donc
x∈/ (X\E)′ ce qui veut dire que

∃r > 0 tel que Br′ (x) ∩ (X\E) = ∅

et comme x ∈
/ (X\E)

∃r > 0 tel que Br (x) ∩ (X\E) = ∅ ⇒ Br (x) ⊂ E ⇒ x ∈ int E.

Comme tous les points de E sont des points intérieurs, E est ouvert par définition.
(ii) On applique la partie (i) à X\E : E = X\(X\E) est fermé si et seulement
X\E est ouvert.

On complète maintenant la liste des propriétés des fermés en introduisant la


notion de point d’adhérence qui englobe à la fois celles de point d’accumulation et
de point isolé.

Définition 3.7.
Soit E une partie d’un espace métrique (X, d).
(i) a ∈ X est un point d’adhérence de E si pour tout r > 0 on a Br (a)∩E 6= ∅.
(ii) L’adhérence de E est l’ensemble de tous les points d’adhérence de E. On
la notera E.

6 ∅. On a
On voit que E ⊂ E puisque, pour tout r > 0, Br (x) ∩ E ∋ {x} =
aussi pour tout point d’accumulation x ∈ E ′

∀r > 0, Br′ (x) ∩ E 6= ∅ ⇒ Br x) ∩ E 6= ∅ ⇒ E ′ ⊂ E.

Lemme 3.1. Soit E une partie d’un espace métrique (X, d).
(i) E = E ∪ E ′ et

E= E′ ∪ E\E ′ .
points d’accumulation points isolés de E
de E
3. Ensemble ouvert et ensemble fermé 67

(ii) int (X\E) = X\E et int E = X\(X\E).

Démonstration. (i) On a déjà montré que E ∪ E ′ ⊂ E. Dans l’autre sens, pour tout
point d’adhérence x ∈ E et toute boule ouverte Br (x), on a Br (x) ∩ E 6= ∅. Si pour
tout r > 0, Br′ (x) ∩ E 6= ∅, alors x est un point d’accumulation de E. S’il existe
r > 0 tel que Br′ (x) ∩ E = ∅, alors comme {x} = Br (x) ∩ E 6= ∅, on a x ∈ E. Par
définition, c’est un point isolé de E. Donc E ⊂ E ∪ E ′ .
/ E = E ′ ∪ E, c’est-à-dire x ∈
(ii) Soit x ∈ X\E. Alors, de la partie (i), x ∈ / E′

et x ∈ / E. Donc, il existe r > 0 tel que Br (x) ∩ E = ∅. Comme x ∈ / E on a
Br (x) ∩ E = ∅ et Br (x) ⊂ X\E. Par définition x ∈ int X\E ce qui montre que
X\E ⊂ int (X\E).
Dans l’autre sens, si x ∈ int (X\E), il existe r > 0 tel que Br (x) ⊂ X\E ce
qui implique que Br (x) ∩ E = ∅. Donc, x ∈ / E et, de là, x ∈ X\E. Pour la seconde
identité voir l’Exercice 10.10 (a).

On montre maintenant que l’adhérence de E est un fermé ce explique la termi-


nologie largement utilisée fermeture de E pour l’adhérence de E. Comme le montre
l’Exercice 10.8, on aurait pu démontrer ce résultat directement sans passer par le
complémentaire et le Théorème 3.5.

Théorème 3.6. Soit E une partie d’un espace métrique (X, d). L’adhérence E de
E est fermée dans (X, d).

Démonstration. Par le Théorème 3.1 (ii), int (X\E) est ouvert. Par le Lemme 3.1
(ii), int (X\E) = X\E. Par le Théorème 3.5 (i), son complement E = X\(int (X\E))
est fermé.

On complète maintenant la liste des propriétés de l’adhérence.

Théorème 3.7. Soit E une partie d’un espace métrique (X, d).
(i) x ∈ X est un point d’adhérence de E si et seulement si, pour tout voisinage
V (x) de x, V (x) ∩ E 6= ∅.
(ii) E est fermé si et seulement si E = E.
(iii) Pour toutes parties A et B de X tel que A ⊂ B, on a A ⊂ B. Si B est
fermé, alors A ⊂ B. En particulier A = A.

Démonstration. (i) Comme les boules en x sont des voisinages de x, la condition


implique que pour tout r > 0, Br (x) ∩ E 6= ∅. Réciproquement, comme pour tout
voisinage V (x) de x, il existe r > 0 tel que Br (x) ⊂ V (x), on a V (x) ∩ E ⊃
Br (x) ∩ E 6= ∅.
(ii) Comme du Théorème 3.6 E est fermée, E = E entraı̂ne que E est fermé.
Réciproquement, si E est fermé, il contient tous ses points d’accumulation, c’est-à-
dire, E ′ ⊂ E. Par le Lemme 3.1 (i), E = E ′ ∪E et trivialement E ⊂ E = E ′ ∪E ⊂ E.
De là, E = E.
(iii) Pour x ∈ A, on a Br (x) ∩ A 6= ∅ pour tout r > 0. Comme A ⊂ B,
Br (x) ∩ B 6= ∅ pour tout r > 0 et x ∈ B. Donc A ⊂ B. Si, en plus B est fermé,
alors B = B et A ⊂ B = B.
68 Chapitre 3. Topologie et suites dans les espaces métriques

Comme A ⊂ A, on a A ⊂ A et comme A ⊂ A et que A est fermé, on a A ⊂ A


et A = A.
Théorème 3.8. Soit E ⊂ R non-vide et borné supérieurement dans R. Alors
sup E ∈ E et, si E est fermé, sup E ∈ E.
Corollaire 1. Soit E ⊂ R non-vide et borné inférieurement dans R. Alors inf E ∈
E et, si E est fermé, inf E ∈ E.
Démonstration. Si sup E ∈ E, alors sup E ∈ E ⊂ E. Sinon, sup E ∈
/ E. Si, en plus,
sup E ∈
/ E, il existe r > 0 tel que

Br (sup E) ∩ E = ∅
⇒ ∀x ∈ E, sup E + r ≤ x ou x ≤ sup E − r

Dans le premier cas, comme sup E est une borne supérieure de E, on a x ≤ sup E
pour tout x ∈ E et cela impliquerait sup E + r ≤ x ≤ sup E et r ≤ 0 une contra-
diction. Comme le premier a été exclus, il ne reste donc que le second cas

∀x ∈ E, x ≤ sup E − r.

Cependant, par définition du sup E, on sait qu’il existe x0 ∈ E tel que

sup E − r < x0 ≤ sup E

ce qui contredit ce qui précède.

Figure 3.3. Augustus De Morgan (1806–1871).

Pour obtenir les propriétés des ensembles fermés à partir de celles des ouverts,
on utilise la propriété du complémentaire et les règles de De Morgan. 9
Théorème 3.9. Pour toute famille {Xα : α ∈ A} de parties d’un ensemble X

∁(∪α∈A Xα ) = ∩α∈A ∁Xα et ∁(∩α∈A Xα ) = ∪α∈A ∁Xα . (3.3)


9. Augustus De Morgan (1806–1871) est un mathématicien et logicien britannique.
3. Ensemble ouvert et ensemble fermé 69

Démonstration. On a les équivalences suivantes : x ∈ ∁(∪α∈A Xα ) ⇐⇒ x ∈ /


∪α∈A Xα ⇐⇒ ∀α ∈ A, x ∈ / Xα ⇐⇒ ∀α ∈ A, x ∈ ∁Xα ⇐⇒ x ∈ ∩α∈A ∁Xα .
Pour la seconde relation, on applique la première à la famille {∁Xα : α ∈ A}
et on prend le complément des deux membres
∁(∪α∈A ∁Xα ) = ∩α∈A ∁∁Xα = ∩α∈A Xα (3.4)
⇒ ∪α∈A ∁Xα = ∁∁(∪α∈A ∁Xα ) = ∁ (∩α∈A Xα ) . (3.5)

Théorème 3.10. Soit (X, d) un espace métrique.


(i) L’ union d’une famille finie {Fi : 1 ≤ i ≤ m} de fermés est un ensemble
fermé.
(ii) Pour toutes parties A et B de X, A ∪ B = A ∪ B et A ∩ B ⊂ A ∩ B.
(iii) L’ intersection d’une famille arbitraire {Fα : α ∈ A} de fermés est un
ensemble fermé.
(iv) E = ∩{F : F fermé et E ⊂ F }.
Démonstration. (i) Par les règles de De Morgan via le complémentaire et le Théorème
3.5 en utilisant le fait que l’intersection d’une famille finie d’ouverts est ouverte.
(ii) Comme A et B sont fermés, de la partie (i) leur union A ∪ B est fermée.
Donc A ∪ B ⊂ A ∪ B entraı̂ne A ∪ B ⊂ A ∪ B. Dans l’autre sens A ⊂ A ∪ B et
B ⊂ A ∪ B entraı̂nent A ∪ B ⊂ A ∪ B. De là, A ∪ B = A ∪ B.
Pour l’intersection, A ∩ B ⊂ A et A ∩ B ⊂ B entraı̂nent A ∩ B ⊂ A par le
Théorème 3.7 (iii) et A ∩ B ⊂ B, d’où le résultat.
(iii) Par les règles de De Morgan via le complémentaire et le Théorème 3.5.
(iv) On pose A = ∩{F : F fermé et E ⊂ F }. Par définition de A, E ⊂ A
et A est fermé comme intersection de fermés. Du Théorème 3.7 (iv), E ⊂ A. Mais
comme E est fermé et E ⊂ E, il vient
E ⊂ ∩{F : F fermé et E ⊂ F } ⊂ {E : E fermé et E ⊂ E} = E

et E = A.

Remarque 3.3.
En général, on n’a que A ∩ B ⊂ A ∩ B. Il suffit de prendre A = (0, 1) et B = (1, 2)
dans R. On a A ∩ B = ∅ mais A = [0, 1], B = [1, 2] et A ∩ B = {1}.

Remarque 3.4 (Exercice 10.6).


L’identité A ∪ B = A ∪ B se généralise à une famille finie A1 , A2 , . . . de sous-
ensembles d’un espace métrique :
∪ni=1 Ai = ∪ni=1 Ai .
Mais, pour une famille dénombrable, on a seulement

∪∞
i=1 Ai ⊃ ∪i=1 Ai .
70 Chapitre 3. Topologie et suites dans les espaces métriques

3.4 Frontière d’un ensemble


Enfin, on donne la définition et quelques propriétés de la frontière d’un en-
semble.

Définition 3.8.
Soit E une partie d’un espace métrique (X, d). La frontière de E est définie comme
E ∩ X\E. On la notera ∂E.

La boule ouverte Br (x) dans R2 a pour frontière le cercle de rayon r. Cela correspond
bien à notre intuition d’une frontière ou du bord d’un objet géométrique. Il y a
cependant des frontières que l’on pourrait qualifier d’épaisses.

Exemple 3.4.
On considère le sous-ensemble E = Br (x) ∩ (Q × Q) de X = R × R des points à
coordonnées rationnelles dans le disque Br (x). Par densité des rationnels et des
irrationnels dans R,

E = Br (x), ∁E = R × R ⇒ ∂E = Br (x).

On peut donc dire que la frontière de E est épaisse.

Théorème 3.11. Soit E une partie d’un espace métrique (X, d). Alors,

∂(X\E) = ∂E (3.6)
E = int E ∪ ∂E et ∂E = E\int E (3.7)
X\E = int (X\E) ∪ ∂E et ∂E = X\E\int (X\E). (3.8)

Démonstration. Par définition, ∂E = E ∩ X\E et ∂(X\E) = X\E ∩ E. Donc


∂E = ∂(X\E). On a vu que int E ⊂ E ⊂ E. On peut donc écrire

E = int E ∪ (E\int E).

Du Lemme 3.1, int (X\E) = X\E et, en l’applicant au complément X\E,

int E = X\(X\E) ⇒ X\int E = (X\E)


⇒ E\int E = E ∩ (X\int E) = E ∩ (X\E) = ∂E

et E = int E ∪ ∂E. De plus,

∅ = int E ∩ (E\int E) = int E ∩ ∂E ⇒ ∂E = E\int E.

De la même façon, comme ∂E = E ∩ X\E = ∂(X\E),

X\E = int (X\E) ∪ ∂(X\E) = int (X\E) ∪ ∂E,

int (X\E) ∩ ∂E = ∅ et ∂E = X\E\int (X\E).


4. Ensembles compacts 71

4 Ensembles compacts
La compacité est une propriété topologique importante qui se définit en topo-
logie générale, à partir de la notion de recouvrement ouvert. Toutefois dans le cadre
des espaces métriques (comprenant notamment les espaces vectoriels normés), il
est possible d’en donner une caractérisation en termes de suites. Il est fréquent de
faire prendre à cette dernière le rôle d’une définition. La notion de compacité ainsi
présentée est appelée compacité séquentielle. On la verra un peu plus loin.

Définition 4.1.
Soit E une partie d’un espace métrique (X, d).
(i) Une famille d’ouverts {Gα : α ∈ A} est un recouvrement ouvert de E si
E ⊂ ∪α∈A Gα .

(ii) E est compacte si de tout recouvrement ouvert {Gα : α ∈ A} de E on peut


extraire un sous-recouvrement fini, c’est-à-dire,
∃α1 , . . . , αn ∈ A tel que E ⊂ ∪ni=1 Gαi .

Remarque 4.1.
De ces définitions, tout ensemble fini est compact. L’ensemble vide ∅ est compact.
En effet, si X = ∅, le seul recouvrement ouvert de ∅ n’a qu’un seul élément ∅ et la
définition est vérifiée. Si X 6= ∅, alors de tout recouvrement ouvert {Gα : α ∈ A}
de ∅, on a un sous-recouvrement par n’importe quel Gα : ∅ ⊂ Gα .

On a vu que les notions d’ensembles ouvert ou fermé dépendent du sous-


espace métrique par rapport auquel elles sont définies. Il n’en est pas de même pour
la notion d’ensemble compacte qui est une notion intrinsèque.
Théorème 4.1. Soit un espace métrique (X, d), Y ⊂ X et E ⊂ Y . E est compact
relativement à (Y, d) si et seulement si il est compact relativement à (X, d).
Démonstration. Soit E compact relativement à X. On considère un recouvrement
ouvert {Gα : α ∈ A} dans Y de E. Du Théorème 3.3 pour chaque ouvert Gα par
rapport à Y , il existe un ouvert Oα par rapport à X tel que Gα = Oα ∩ Y . La
famille d’ouverts {Oα : α ∈ A} dans X est donc un recouvrement ouvert de E et,
comme E est compact relativement à X, il existe un sous-recouvrement fini :
∃α1 , . . . , αn ∈ A tel que E ⊂ ∪ni=1 Oαi
⇒ ∃α1 , . . . , αn ∈ A tel que E = E ∩ Y ⊂ ∪ni=1 Oαi ∩ Y = ∪ni=1 Gαi .
Par définition, E est compact relativement à Y .
Réciproquement, on considère un recouvrement ouvert {Oα : α ∈ A} de E
dans X. Du Théorème 3.3, Gα = Oα ∩ Y est ouvert par rapport à Y . Comme
E⊂Y
E = E ∩ Y ⊂ ∪α∈A Oα ∩ Y = ∪α∈A Gα
72 Chapitre 3. Topologie et suites dans les espaces métriques

et {Gα : α ∈ A} est un recouvrement ouvert de E dans Y . Comme E est compact


relativement à Y , il existe un sous-recouvrement fini puisque de E :

E ⊂ ∪ni=1 Gαi .

Enfin, comme Gα ⊂ Oα ,

E ⊂ ∪ni=1 Gαi ⊂ ∪ni=1 Oαi

ce qui donne la compacité de E par rapport à X.

Remarque 4.2.
En particulier, si Y = E, la compacité relativement à (E, d) signifie que les ouverts
du recouvrement {Gα : α ∈ A} de E relativement à (E, d) sont des sous-ensembles
de E et non de X :

E = ∪α∈A Gα .

E est donc égal à l’union d’un nombre fini de Gα . La notion de compacité de E ne


dépend pas du cadre ambient (X, d), mais seulement de E et de la métrique d.

Définition 4.2.
Soit E une partie d’un espace métrique (X, d). (E, d) est borné si E = ∅ ou s’il
existe x ∈ X et r > 0 tel que E ⊂ Br (x).

Remarque 4.3.
Comme la compacité, la bornitude est une notion intrinsèque. En effet, pour ∅ 6=
E ⊂ Y ⊂ X, on a

E borné dans (X, d) ⇐⇒ E borné dans (Y, d) ⇐⇒ E borné dans (E, d).

Si E est borné dans (X, d), il existe x ∈ X et r > 0 tel que E ⊂ BrX (x). On choisit
un point a ∈ E :
X
∀y ∈ E, d(y, a) ≤ d(y, x) + d(x, a) < r + d(x, a) ⇒ E ⊂ Br+d(x,a) (a)
X X Y
⇒ E ⊂ Br+d(x,a) (a) ∩ E ⊂ Br+d(x,a) (a) ∩ Y = Br+d(x,a) (a)

et E est borné non seulement dans (Y, d) mais aussi dans (E, d). Enfin, si E est
borné dans (E, d), il existe x ∈ E et r > 0 tel que E ⊂ BrE (x) ⊂ BrX (x) et E est
borné dans (X, d).

Théorème 4.2. Toute partie compacte d’un espace métrique (X, d) est bornée et
fermée.

En général, la réciproque de ce théorème n’est pas vraie comme le montre l’Exemple


4.1 en dimension un plus bas et l’Exemple 7.1 page 92 en dimension infinie que l’on
verra plus tard. Cependant, elle l’est pour l’espace euclidien E = Rk ou tout fermé
E ⊂ Rk avec la métrique d(x, y) = kx − yk comme on le verra au Théorème 5.4.
4. Ensembles compacts 73

Exemple 4.1.
On considère l’espace métrique R+ = {x ∈ R : x > 0}, le sous-ensemble E = ]0, 1]
est borné et fermé dans R+ . Il n’est cependant pas compact dans R+ car s’il l’était,
par le Théorème 4.1, il devrait aussi être compact dans R, où il n’est pas fermé car
0 est un point d’accumulation de E dans R qui n’appartient pas à E.

Démonstration du Théorème 4.2. Soit K un compact dans (X, d).


(i) Si K = ∅, il est borné par convention. Sinon, soit x ∈ K. Comme X =
∪∞n=1 n (x), la famille de boules ouvertes {Bn (x) : n ≥ 1} est un recouvrement
B
ouvert de K et il existe un sous-recouvrement fini {Bni (x) : 1 ≤ i ≤ m} de K. Donc
K ⊂ Br (x) pour r = max{ni : 1 ≤ i ≤ m} et K est bornée.
(ii) On montre que ∁K est ouvert ce qui impliquera que K est fermé par le
Théorème 3.5. Si K = X ou K = ∅, alors ∁K est ouvert. Sinon, ∅ 6= K $ X et
∁K n’est pas vide. Soit x ∈ ∁K. Pour tout y ∈ K, d(y, x) > 0. On associe à chaque
y ∈ K, un rayon ry tel que 0 < ry < d(y, x)/2 et les boules
déf déf
Bry (x) = {z ∈ X : d(z, x) < ry } et Bry (y) = {z ∈ X : d(z, y) < ry }
⇒ Bry (y) ∩ Bry (y) = ∅ ⇒ Bry (y) ⊂ ∁Bry (x)

puisque l’intersection est vide par choix du rayon ry . La famille de boules {Bry (y) :
y ∈ K} est un recouvrement ouvert de K. Par compacité, il existe un sous-
recouvrement {Bryi (yi ) : 1 ≤ i ≤ n} de K tel que

K ⊂ ∪ni=1 Bryi (yi )


⇒ K ⊂ ∪ni=1 Bryi (yi ) ⊂ ∪ni=1 ∁Bryi (x) = ∁ ∩ni=1 Bryi (x)

par les règles de de Morgan. On choisit r = min{ryi ; 1 ≤ i ≤ n} > 0 Donc,

Br (x) = Bmin{ryi ;1≤i≤n} (x) = ∩ni=1 Bryi (x)


⇒ K ⊂ ∁Br (x) ⇒ Br (x) ⊂ ∁K.

Comme il existe r > 0 tel que Br (x) ⊂ ∁K, x est un point intérieur de ∁K et ∁K
est ouvert.
Théorème 4.3. Soit K un compact dans un espace métrique (X, d). Toute partie
fermée E de K est compacte.
Démonstration. Soit {Gα : α ∈ A} un recouvrement ouvert de E dans X. Comme
E est fermé, ∁E est ouvert et la famille {Gα : α ∈ A} plus ∁E est un recouvrement
ouvert de K :

K ⊂ E ∪ ∁E ⊂ ∪α∈A Gα ∪ ∁E.

Par compacité. il existe un recouvrement fini

K ⊂ ∪ni=1 Gαi ∪ ∁E ⇒ E ⊂ K ⊂ ∪ni=1 Gαi ∪ ∁E ⇒ E ⊂ ∪ni=1 Gαi

et E est compact.
74 Chapitre 3. Topologie et suites dans les espaces métriques

Corollaire 1. Si E est fermée et K est compacte, alors E ∩ K est compacte.


Démonstration. Comme K est compacte, elle est fermée et K ∩ E est fermée. Enfin,
comme K ∩ E ⊂ K, l’intersection K ∩ E est compacte par le théorème.
Théorème 4.4. Soit {Kα : α ∈ A} une famille de compacts dans un espace
métrique (X, d) vérifiant la propriété d’intersection finie non-vide, c’est-à-dire,

∀α1 , . . . , αn ∈ A, ∩ni=1 Kαi 6= ∅. (4.1)

Alors

∩α∈A Kα 6= ∅. (4.2)

Démonstration. De la propriété (4.1), pour chaque α, Kα 6= ∅. Supposons ∩α∈A Kα =


∅ et fixons un indice β ∈ A. On peut alors écrire en utilisant la règle de De Morgan
   
Kβ ∩ ∩α∈A Kα = ∅ ⇒ Kβ ⊂ ∁ ∩α∈A Kα = ∪α∈A ∁Kα .
α6=β α6=β α6=β

Comme chaque ∁Kα est ouvert, on a un recouvrement ouvert du compact Kβ . Par


définition de la compacité, il existe un sous-recouvrement

Kβ ⊂ ∪ni=1 ∁Kαi = ∁ [∩ni=1 Kαi ] ⇒ Kβ ∩ [∩ni=1 Kαi ] = ∅


⇒ Kβ ∩ Kα1 ∩ · · · ∩ Kαn = ∅

ce qui contredit la propriété d’intersection finie non-vide.


Corollaire 1. Si {Kn : n ∈ N} est une suite décroissante de compacts non-vides
dans (X, d), alors ∩∞
n=1 Kn 6= ∅.

Démonstration. En effet, comme la suite est décroissante, on a pour toute sous-


famille finie {Kni : 1 ≤ i ≤ m},

∩m
i=1 Kni = Kmax{ni :1≤i≤m} 6= ∅.

et donc la propriété d’intersection finie non-vide.


Théorème 4.5. Si K est compact, alors tout sous-ensemble infini E de K possède
au moins un point d’accumulation, c’est-à-dire, E ′ ∩ K 6= ∅.

Remarque 4.4.
La réciproque de ce théorème est vraie, mais sa démonstration nécessite quelques
résultats préliminaires non-triviaux. On peut y arriver en regardant la question du
point de vue de la topologie générale et en considérant les espaces métriques comme
un cas particulier. Cela conduirait à l’introduction de notions trop générales pour
ces notes. L’approche privilégiée sera donc de passer par les suites et les sous-suites
qui sont de toutes façons une partie incontournable des espaces métriques. Cette
réciproque sera démontrée plus loin au paragraphe 7 en page 89 où l’on introduira
aussi la notion de compacité séquentielle.
5. Caractérisation de la compacité dans Rk 75

Démonstration du Théorème 4.5. Par l’absurde. Si E ′ ∩ K = ∅, alors pour tout


y ∈ K, il existe ry > 0 tel que

E ∩ Br′ y (y) = ∅.

La famille {Bry (y) : y ∈ Y } est un recouvrement ouvert de K. Comme K est


compact, il existe un recouvrement fini, c-à-d., y1 , . . . , yn dans K tel que
n
[
E⊂K ⊂ Bryi (yi )
i=1
n
[ [n n
[
⇒ E=E∩ Bryi (yi ) = E ∩ Bryi (yi ) ⊂ {yi }.
i=1 i=1 i=1

On en conclut que E ne possède qu’un nombre fini de points ce qui contredit l’hy-
pothèse que E est infini.

5 Caractérisation de la compacité dans Rk


Un segment I est un sous-ensemble de R de la forme
déf
[a, b] = {x ∈ R : a ≤ x ≤ b} (5.1)

pour un couple de réels a < b. La notion de segment s’étend à Rk , k ≥ 2. Un pavé


P de dimension k est un sous-ensemble de Rk de la forme
déf
P = {x = (x1 , . . . , xk ) : ai ≤ xi ≤ bi , 1 ≤ i ≤ k} (5.2)

pour des paires de réels ai < bi , 1 ≤ i ≤ k. On rappelle que l’espace vectoriel Rk


muni d’une des normes d(x, y) = kx − ykp , 1 ≤ p ≤ ∞, est un espace métrique. Les
résultats de ce paragraphe sont indépendants du choix de p.
En préparation du théorème principal, on démontre trois résultats intermé-
diaires (voir aussi l’Exemple 10.16) qui établissent que le segment et le pavé sont
compacts. Si on l’avait su du début, on aurait obtenu les deux prochains théorèmes
à partir du Corollaire 1 au Théorème 4.4.
Théorème 5.1. Pour toute suite décroissante de segments {In } dans R, c’est-à-
dire,

∀n ≥ 1, In+1 ⊂ In ,

on a ∩∞
n=1 In 6= ∅.

Démonstration. Chaque In est de la forme [an , bn ] pour an < bn . Comme l’ensemble


E = {an : n ≥ 1} est borné supérieurement par b1 , sup E = supn≥1 an ∈ R.
Appelons ce point x. Pour tout n ≥ 1 et m ≥ 1, on a

an ≤ an+m < bn+m ≤ bm ⇒ ∀m ≥ 1, x = sup an ≤ bm .


n≥1
76 Chapitre 3. Topologie et suites dans les espaces métriques

On a donc x ≤ bm pour tout m ≥ 1 et comme x est une borne supérieure de E on


a aussi am ≤ x pout tout m ≥ 1. Donc, x ∈ Im = [am , bm ] pour tout m ≥ 1 et
∩∞
m=1 Im ⊃ {x} 6= ∅.

Théorème 5.2. Pour toute suite décroissante de pavés {Pn } dans Rk , c’est-à-dire,
∀n ≥ 1, Pn+1 ⊂ Pn ,
on a ∩∞
n=1 Pn 6= ∅.

Démonstration. Pour chaque n, y = (y1 , . . . , yk ) ∈ Pn si


déf
∀i, 1 ≤ i ≤ k, yi ∈ Ini = [ani , bni ], ani < bni .
Comme la suite de pavés (non-vide) {Pn } est décroissante, pour chaque i la suite
des segments (non-vide) {Ini } est décroissante. Par le Théorème 5.1, ∩∞ n=1 Ini 6= ∅
et il existe xi ∈ ∩∞ I
n=1 ni . De là, il existe x = (x1 , . . . , xk ) ∈ ∩∞
P
n=1 n .
Théorème 5.3. Tout pavé de dimension k est compact dans Rk .
Démonstration. Soit le pavé
déf
P = {x = (x1 , . . . , xk ) : ai ≤ xi ≤ bi , 1 ≤ i ≤ k} (5.3)
pour des paires de réels ai < bi , 1 ≤ i ≤ k. On introduit aussi les points a =
(a1 , . . . , ak ) et b = (b1 , . . . , bk ) de Rk . Pour tout x, y ∈ P
∀i, ai − bi ≤ xi − yi ≤ bi − ai et bi − ai > 0
⇒ ∀i, |xi − yi | ≤ bi − ai = |bi − ai |
⇒ ∀x, y ∈ P, kx − yk ≤ kb − ak.

Si P n’est pas compact, alors il existe un recouvrement ouvert {Gα : α ∈ A} de P


qui n’a pas de sous-recouvrement fini. On procède à la construction suivante. On
divise chaque arête de P en deux en introduisant le point milieu ci = (ai + bi )/2.
k
Ceci crée 2k pavés {Pj0 : 1 ≤ j ≤ 2k } tel que ∪2j=1 Pj0 = P et
1
∀x, y ∈ Pj0 , kx − yk ≤ kb − ak.
2
Comme il n’y a pas de recouvrement fini de P par la famille d’ouverts {Gα : α ∈ A},
il existe un pavé P 0 = Pj00 qui ne peut pas être recouvert par sous-recouvrement
fini. On divise chaque arête de P 0 en deux en introduisant le point milieu. Ceci cée
k
2k pavés {Pj1 : 1 ≤ j ≤ 2k } tel que ∪2j=1 Pj1 = P 0 et
1
∀x, y ∈ Pj1 , kx − yk ≤ kb − ak.
22
Comme il n’y a pas de recouvrement fini de P 1 par la famille d’ouverts {Gα : α ∈ A},
il existe un pavé P 2 = Pj11 qui ne peut pas être recouvert par sous-recouvrement
fini. On répète alors la construction ce qui donne une suite décroissante {P n } de
pavés tel que
5. Caractérisation de la compacité dans Rk 77

(a) P 0 ⊃ P 1 ⊃ P 2 ⊃ · · · ⊃ P n ⊃ . . . ,
(b) P n ne peu être recouvert par un nombre fini de Gα ,
(c) pour tout x, y ∈ P n , kx − yk ≤ kb − ak/2n .
k
De (a) par le Théorème 5.2, ∩∞ n
n=1 P 6= ∅ et il existe x ∈ R tel que x ∈ P pour
n

tout n ≥ 1. Comme x ∈ P , il existe un Gα tel que x ∈ Gα et, comme Gα est ouvert,


il existe une boule de rayon r > 0 tel que Br (x) ⊂ Gα . Il existe un entier N tel que
pour tout n > N

kb − ak
∀n > N, < r.
2n
Par la propriété (c), pour tout n > N , P n ⊂ Br (x) ⊂ Gα ce qui contredit (b).

Pour le résultat général suivant, on utilise une forme équivalente de la Définition


4.2 d’un borné pour l’espace métrique E = Rk muni de la métrique d(x, y) = kx−yk
via la boule Br (0) puisque 0 ∈ Rk .

Définition 5.1.
Un sous-ensemble E de Rk est borné si E = ∅ ou

∃r > 0 tel que kxk ≤ r pour tout x ∈ E, (5.4)

où k k est une norme sur Rk .

Théorème 5.4. Pour un sous-ensemble E de Rk , les trois propriétés suivantes sont


équivalentes :
(i) E est fermé et borné ;
(ii) E est compact ;
(iii) tout sous-ensemble infini de E possède un point d’accumulation dans E.
L’équivalence de (i) et (ii) est connue sous le nom de théorème de Heine-Borel. 10 11

10. Heine est surtout connu pour le théorème de Heine-Borel en 1872 dont l’historique débute
au XIXème siècle avec la recherche de bases solides pour l’anayse réelle. L’élément central de la
théorie était la notion de continuité uniforme et le théorème qui dit que toute fonction continue sur
un intervalle fermé est uniformément continue. Dirichlet fut le premier à le démontrer en utilisant
implicitement l’existence d’un sous-recouvrement fini d’un recouvrement ouvert d’un intervalle
fermé dans sa démonstration. Il utilisa cette démonstration dans ses conférences de 1862 (qui
furent publiées seulement en 1904) avant que Heine ne le démontre en 1872. Plus tard, Eduard
Heine, Karl Weierstrass et Salvatore Pincherle utilisèrent des techniques semblables. Émile Borel
en 1895 fut le premier à formuler et à démontrer une forme de ce qui est maintenant appelé le
théorème de Heine-Borel. Sa formulation était limitée à des recouvrements dénombrables. Lebesgue
(1898) et Schoenflies (1900) le généralisèrent à des recouvrements arbitraires.
11. Professeur à la Faculté des sciences de Paris, spécialiste de la théorie des fonctions et des
probabilités, membre de l’Académie des sciences, a été aussi un homme politique français, député,
et ministre. Avec René Baire et Henri Lebesgue, il était parmi les pionniers de la théorie de la
mesure et de son application à la théorie des probabilités. Le concept de tribu borélienne est nommé
78 Chapitre 3. Topologie et suites dans les espaces métriques

Figure 3.4. Heinrich Eduard Heine (1821–1881).

Figure 3.5. Félix Edouard Justin Émile Borel (1871–1956).

Démonstration. (i) ⇒ (ii). Comme E est borné, il existe un pavé P tel que E ⊂ P .
Comme P est fermé et que P est compact, alors E est compact par le Théorème
4.3.
(ii) ⇒ (iii). Par le Théorème 4.5.
(iii) ⇒ (i). Par l’absurde. Si E n’était pas borné, pour chaque n ≥ 1, il
existerait xn ∈ E tel que kxn k > n. Le sous-ensemble de S = {xn : n ≥ 1} de E
est infini. Si S avait un point d’accumulation x, alors, par le Théorème 3.4 (i), pour
tout r > 0 la boule Br (x) contiendrait un nombre infini de points de S. Mais ceci
n’est pas possible car, si x ∈ S ′ , alors

∀n ≥ 1, kxn − xk ≥ kxn k − kxk > n − kxk


⇒ ∀n > r + kxk, kxn − xk > r,

et la boule Br (x) ne contiendrait qu’un nombre fini de points de S.


Si E n’est pas fermé, il ne contient pas tous ses points d’accumulation. Soit

x0 ∈/ E un point d’accumulation de E. Comme, pour tout n ≥ 1, B1/n (x0 ) ∩ E 6= ∅,
il existe xn ∈ E tel que xn 6= x et kxn − x0 k < 1/n. L’ensemble F = {xn } de ces
points est infini. Par (iii), F ⊂ E possède au moins un point d’accumulation y ∈ E

en son honneur. Dans l’un de ses livres sur les probabilités, il présente l’amusante expérience de
pensée connue sous le nom paradoxe du singe savant ou analogues. Il a également édité un certain
nombre d’articles de recherche sur la théorie des jeux ainsi qu’un véritable monument sur le jeu
de bridge. Il a créé en 1928, avec le soutien financier des Rockefeller et des Rothschild, le Centre
Mathématique qu’il a nommé Institut Henri-Poincaré (où se trouve maintenant le Centre Émile
Borel), et qu’il a dirigé pendant plus de trente ans.
6. Suites de Cauchy, complétude et complété 79

et, comme x0 n’est pas un point d’accumulation, y 6= x0 . Par construction de {xn },


il existe N tel que pour n > N , kxn − x0 k < ky − x0 k/2. Donc pour n > N
ky − x0 k ky − x0 k
ky − xn k ≥ ky − x0 k − kx0 − xn k > ky − x0 k − = > 0.
2 2
On en conclut que la boule Bky−x0 k/2 (y) contient au plus un nombre fini de points
de F . Ceci contredit le fait que y soit un point d’accumulation de F , car, dans ce
cas, on aurait un nombre infini de point de F dans Bky−x0 k/2 (y) par le Théorème
3.4 (i). E est donc fermé.

Figure 3.6. Bernard Placidus Johann Nepomuk Bolzano (1781–1848).

On déduit de ce dernier théorème.


Théorème 5.5 (Théorème de Bolzano-Weierstrass 12 13 ). Tout sous-ensemble infini
E borné dans Rk admet au moins un point d’accumulation dans Rk .
Démonstration. Comme E est borné, il est contenu dans un pavé P qui est compact
par le Théorème 5.3. Donc, E admet au moins un point d’accumulation dans P par
le Théorème 5.4.

6 Suites de Cauchy, complétude et complété


6.1 Suites de Cauchy
On peut généraliser la notion de suite et de suite de Cauchy 14 dans R à celle
de suite dans un espace métrique (X, d).
12. Bolzano est connu pour le théorème de Bolzano, ainsi que pour le théorème de Bolzano-
Weierstrass, développé conjointement avec Karl Weierstrass.
13. Souvent cité comme le père de l’analyse moderne, Weierstrass consolida des travaux de
Cauchy sur les nombres irrationnels et leur amena une nouvelle compréhension. Il eut comme
étudiants Sofia Kovalevskaı̈a (1850–1891) et Georg Cantor. Ne pouvant s’inscrire à l’université du
fait de son sexe, Kovalevskaı̈a suit les cours privés de Karl Weierstrass et de Hermann Ludwig von
Helmholtz. Elle est la première femme au monde à obtenir un doctorat de mathématiques, en 1874
à l’université de Göttingen. À titre de repère, Marie Sklodowska-Curie est née en 1867.
14. Augustin Louis, baron Cauchy, est un mathématicien français, membre de l’Académie des
sciences et professeur à l’École polytechnique. Il fut l’un des mathématiciens les plus prolifiques,
80 Chapitre 3. Topologie et suites dans les espaces métriques

Figure 3.7. Karl Theodor Wilhelm Weierstrass (1815–1897) et Sofia Ko-


valevskaı̈a (1850–1891).

Figure 3.8. Augustin Louis Cauchy (1789–1857).

Définition 6.1.
Soit un espace métrique (X, d).
(i) Une suite dans (X, d) est une application x : N → (X, d). On utilisera la
notation xn = x(n) pour ses éléments et {xn } pour désigner la suite.
(ii) Une suite {xn } est dite d-Cauchy si
∀ε > 0, ∃N > 0 tel que ∀n, m > N, d(xn , xm ) < ε. (6.1)

(iii) Une suite {xn } est dite d-convergente si


∃x ∈ X, ∀ε > 0, ∃N > 0 tel que ∀n > N, d(xn , x) < ε. (6.2)
On écrira xn → x.
derrière Leonhard Euler, avec près de 800 parutions et sept ouvrages ; sa recherche couvre l’en-
semble des domaines mathématiques de l’époque. On lui doit notamment en analyse l’introduction
des fonctions holomorphes et des critères de convergence des séries et des séries entières. Ses tra-
vaux sur les permutations furent précurseurs de la théorie des groupes. En optique, on lui doit
des travaux sur la propagation des ondes électromagnétiques. Son œuvre a fortement influencé le
développement des mathématiques au XIXe siècle.
6. Suites de Cauchy, complétude et complété 81

(iv) Une suite {xn } est d-divergente si elle n’est pas d-convergente :
∀x ∈ X, ∃ε > 0, ∀N, ∃n > N, d(xn , x) ≥ ε.

On peut vérifier que la notion de suite d-Cauchy est intrinsèque alors que celle de
suite convergente ne l’est pas. En effet, la suite xn = 1/n est Cauchy dans R, R+
et R+ . Elle est convergente vers 0 dans R et R+ mais pas dans R+ puisque 0 ∈ / R+ .
La notion de suite d-Cauchy dépend de la métrique d. La même suite peut
être d-Cauchy pour une métrique et ne pas l’être pour une autre métrique.

Exemple 6.1 (Exercice 10.15).


Soit X = R muni de la métrique d(x, y) = |x − y|. On peut vérifier que
déf x y
dϕ (x, y) = − (6.3)
1 + |x| 1 + |y|
est aussi une métrique sur R. Cette seconde métrique est reliée à la première par
l’intermédiaire de la bijection
déf x
x 7→ ϕ(x) = : R → ] − 1, 1[ (6.4)
1 + |x|
puisque dϕ (x, y) = d(ϕ(x), ϕ(y)). On peut vérifier que la suite {n}, n ≥ 1, est
dϕ -Cauchy, mais pas d-Cauchy puisque n → +∞.

Toute suite d-convergente dans (X, d) est une suite d-Cauchy, mais la réciproque
n’est pas nécessairement vraie car il n’est pas toujours possible de trouver un point
dans X. On résume quelques propriétés.
Théorème 6.1. Soit un espace métrique (X, d) et {xn } une suite d’éléments de X.
(a) xn → x si et seulement si pour tout r > 0, Br (x) ∩ {xn } contient tous les
éléments de la suite sauf au plus un nombre fini de ses éléments.
(b) Si {xn } converge, elle converge vers un point unique dans X que l’on ap-
pelera la limite de la suite.
(c) Toute suite de Cauchy est bornée.
(d) Toute suite convergente est de Cauchy. En particulier de (c), si {xn }
converge, elle est bornée.
(e) Si x ∈ X est un point d’accumulation de E ⊂ X, alors il existe une suite
{xn } ⊂ E qui converge vers x.
Démonstration. (a) Par définition, pour tout r > 0, il existe N > 0 tel que pour
tout n > N , xn ∈ Br (x) et Br (x) contient tous les points de {xn } sauf au plus les
N premiers. Réciproquement, pour r = ε > 0, soit N le plus grand indice tel que
xN ∈/ Bε (x). Alors, ∀n > N , xn ∈ Bε (x) et d(xn , x) < ε.
(b) Si la suite admettait deux limites distinctes x et x′ , pour ε > 0, aurait
N > 0 et N ′ > 0 tels que
déf
∀n > N = max{N, N ′ }, d(xn , x) < ε et d(xn , x′ ) < ε.
82 Chapitre 3. Topologie et suites dans les espaces métriques

Il vient donc par l’inégalité du triangle

∀n > N , d(x, x′ ) ≤ d(x, xn ) + d(xn , x′ ) < 2ε ⇒ ∀ε > 0, d(x, x′ ) < 2ε.

En laissant ε tendre vers 0, on a d(x, x′ ) et, par définition d’une métrique, x′ = x.


(c) Par définition, il existe N > 0 tel que, pour tout m, n > N , d(xm , xn ) < 1
et donc

∀n > N, d(xn , xN +1 ) < 1


∀1 ≤ n ≤ N, d(xn , xN +1 ) ≤ max d(xj , xN +1 ) + 1
1≤j≤N
déf
⇒ ∀n ≥ 1, d(xn , xN +1 ) ≤ r = max d(xj , xN +1 ) + 1 ⇒ {xn } ⊂ Br (xN +1 ).
1≤j≤N

La suite est donc bornée.


(d) Si xn → x, pour tout ε > 0, il existe N tel que

∀n > N, d(xn , x) < ε/2


⇒ ∀n, m > N, d(xn , xm ) ≤ d(xn , x) + d(x, xm ) < ε/2 + ε/2 = ε

et {xn } est Cauchy.


(e) Si x ∈ X est un point d’accumulation de E, alors pour tout r > 0, Br′ (x) ∩
E 6= ∅. En prenant r = 1/n, n ≥ 1, il existe xn ∈ E, xn 6= x, tel que d(xn , x) < 1/n.
On en conclut que xn → x.

Définition 6.2.
Soient un espace métrique (X, d) et une suite {xn } dans X.
(i) Étant donnée une suite d’entiers naturels {nk } ⊂ N telle que

n1 < n2 < n3 < · · · < nk < nk+1 < . . . ,

la suite {xnk } est appelée sous-suite de la suite {xn }.


(ii) Si une sous-suite {xnk } converge vers un point x ∈ X, alors x est appelé
valeur d’adhérence de la suite {xn }.

Remarque 6.1.
Pour tout k ≥ 1, nk ≥ k et nk → +∞ lorsque k → +∞.

Exemple 6.2.
Les suites {1/k 2 }, {1/(2k)}, {1/3k } sont des sous-suites de {1/n} avec

{1/k 2}, nk = k 2 , {1/(2k)}, nk = 2k, {1/3k }, nk = 3k .

Elles convergent toutes vers la même limite 0.


La suite {1, 1/2, 1/8, 1/4, 1/16. . . .} n’est pas une sous-suite de {1/n}.
La suite {(−1)n } diverge, mais les sous-suites

{(−1)2k }, nk = 2k, et {(−1)2k+1 }, nk = 2k + 1,

convergent vers les valeurs d’adhérence 1 et −1.


6. Suites de Cauchy, complétude et complété 83

Théorème 6.2. Soit (X, d) un espace métrique.


(a) {xn } converge vers x si et seulement si toute sous-suite {xnk } de {xn }
converge vers x.
(b) Si tout sous-ensemble infini F de K possède au moins un point d’accumu-
lation dans K, c’est-à-dire, F ′ ∩ K 6= ∅, alors pour toute suite {xn } ⊂ K,
il existe une sous-suite {xnk } et x ∈ K tel que xnk → x. En particulier,
ceci est vrai de toute suite {xn } dans un compact K.
(c) De toute suite bornée dans Rk , on peut extraire une sous-suite convergente.
(d) L’ensemble A = A({xn }) des valeurs d’adhérence d’une suite {xn } est
fermé.
Démonstration. (a) La démonstration est laissée au lecteur.
(b) Par le Théorème 4.5, si K est compact, alors, tout sous-ensemble infini F
de K a un point d’accumulation dans K. C’est un cas particulier du cas général.
Soit S = ∪∞ n=1 {xn } l’ensemble des éléments de la suite {xn }. Si S est fini,
alors S = {s1 , . . . , sm }. Alors,

∃si ∈ S, ∀k ≥ 1, ∃nk ≥ k tel que xnk = si .

Sinon,

∀i, ∃k i , ∀n ≥ ki , xn 6= si
déf
⇒ ∀i, ∀n ≥ N = max{k1 , . . . , km }, xn 6= si
⇒ ∀n ≥ N , ∀i, 1 ≤ i ≤ m, xn 6= si ⇒ ∀n ≥ N , xn ∈
/ S.

Ceci contredit le fait que {xn : n ≥ 1} = S. On peut donc extraire de la suite {xnk }
une sous-suite de {xn } telle que nk > nk−1 pour tout k ≥ 2.
Si S est infini dans K, alors S possède un point d’accumulation x ∈ K : pour

tout k ≥ 1, B1/k (x) ∩ S 6= ∅. On construit une sous-suite de {xn } qui converge
vers x ∈ K comme suit. Pour k = 1, on prend un point arbitraire xn1 ∈ B1′ (x) ∩ S.

Pour k = 2, on peut trouver un point xn2 ∈ B1/2 (x) ∩ S tel que n2 > n1 puisque

B1/2 (x)∩S contient un nombre infini de points de S. On continue ainsi. À l’étape k,
′ ′
on peut trouver un point xnK ∈ B1/k (x) ∩ S tel que nk > nk−1 puisque B1/k (x) ∩ S
contient un nombre infini de points de S. On a ainsi construit une sous-suite {xnk }
de telle que d(xnk , x) < 1/k. Donc, il existe x ∈ K et une sous-suite {xnk } de {xn }
telle que xnk → x.
(c) Comme {xn } est bornée dans Rk , il existe r > 0 tel que {xn } ⊂ Br (0) ⊂
Br (0). Puisque Br (0) est bornée et compacte, on applique la partie (b).
(d) Soit A l’ensemble des valeurs d’adhérence de {xn } et soit x ∈ X un point
d’accumulation de A, c-à-d., x ∈ A′ . Pour tout r > 0, Br′ (x) ∩ A 6= ∅. Pour
r = 1/(2k), k ≥ 1, il existe x∗k ∈ A tel que d(x∗k , x) < 1/(2k). Pour k = 1, il existe
une sous-suite de {xn } qui converge vers x∗1 . On choisit dans cette sous-suite un
point xn1 tel que d (xn1 , x∗1 ) < 1/2 ce qui donne

d (xn1 , x) ≤ d (xn1 , x∗1 ) + d (x∗1 , x) < 1/2 + 1/2 = 1.


84 Chapitre 3. Topologie et suites dans les espaces métriques

Pour k = 2, il existe une sous-suite de {xn } qui converge vers x∗2 . On choisit dans
cette sous-suite un point xn2 tel que n2 > n1 et d (xn2 , x∗2 ) < 1/4 ce qui donne

d (xn2 , x) ≤ d (xn2 , x∗2 ) + d (x∗2 , x) < 1/4 + 1/4 = 1/2.

À l’étape k, il existe une sous-suite de {xn } qui converge vers x∗k . On choisit dans
cette sous-suite un point xnk tel que nk > nk−1 et d (xnk , x∗k ) < 1/(2k) ce qui donne

d (xnk , x) ≤ d (xnk , x∗k ) + d (x∗k , x) < 1/(2k) + 1/(2k) = 1/k.

On a donc construit une sous-suite {xnk } de {xn } qui converge vers x. Par définition,
x ∈ A et A est fermé.

6.2 Espace métrique complet


Définition 6.3.
Un espace métrique (X, d) est complet si toutes ses suites de Cauchy convergent
(dans X).

Rk et C sont des espaces métriques complets, mais Q ne l’est pas.


On démontre maintenant que toute suite de Cauchy dans un compacte K
(resp., l’espace euclidien Rk ) est convergente dans K (resp., Rk ). On aura besoin
de la notion de diamètre.

Définition 6.4.
Soit (X, d) un espace métrique. On associe à tout sous-ensemble E
déf
diam (E) = sup d(x, y)
x,y∈E

que l’on appellera le diamètre de E. Lorsque E est vide, on a


diam ∅ = supx,y∈∅ d(x, y) = −∞ par la convention adoptée pour le sup.

On peut associer à une suite {xn } les ensembles EN = {xn : n > N }, N ≥ 1. Il est
facile de vérifier à partir des définitions que

{xn } Cauchy ⇐⇒ lim diam EN = 0.


N →∞

Théorème 6.3. Soit (X, d) un espace métrique.


(a) Pour tout E ⊂ X, diam E = diam E.
(b) Si {Kn } est une suite décroissante de compacts non-vides de X et que

lim diam Kn = 0,
n→∞

alors ∩∞
n=1 Kn est un singleton.

Démonstration. (a) Si E = ∅, E = ∅ et supx,y∈E d(x, y) = −∞ = supx,y∈E d(x, y).


Pour E 6= ∅, comme E ⊂ E, on a diam E ≤ diam E. Soit deux points x, y ∈ E.
6. Suites de Cauchy, complétude et complété 85

Pour tout ε > 0, il existe x′ , y ′ ∈ E tel que

d(x, x′ ) < ε et d(y, y ′ ) < ε


⇒ d(x, y) ≤ d(x, x′ ) + d(x′ , y ′ ) + d(y ′ , y) < d(x′ , y ′ ) + 2ε ≤ diam E + 2ε
⇒ diam E = sup d(x, y) ≤ diam E + 2ε.
x,y∈E

En laissant tendre ε vers zéro, diam E ≤ diam E et, en combinant avec la première
inégalité, diam E = diam E .
(b) Par le Corollaire au Théorème 4.4, K = ∩∞
n=1 Kn 6= ∅. Si K n’est pas un
singleton, diam K > 0 et comme K ⊂ Kn :

∀n ≥ 1, diam Kn ≥ diam K > 0,

ce qui contredirait l’hypothèse que diam Kn → 0.

Théorème 6.4. (i) Soit (X, d) un espace métrique compact. Toute suite de
Cauchy dans X converge vers un point de X. Donc (X, d) est complet.
(ii) Toute suite de Cauchy dans Rk est convergente dans Rk . Donc Rk est
complet.

Démonstration. (i) Soit {xn } une suite de Cauchy dans X. On a vu que

déf
lim diam EN = 0, EN = {xn : n > N }.
N →∞

Par le Théorème 6.3 (a), diam EN = diam EN et

lim diam EN = 0. (6.5)


N →∞

Comme, EN +1 ⊂ EN ⊂ X, on a EN +1 ⊂ EN ⊂ X, puisque le compact X est fermé.


De plus, chaque EN est compact comme sous-ensemble fermé du compact X. On
obtient une suite décroissante {EN } de sous-ensembles compacts non vides de X.
Par le Théorème 6.3 (b), X ⊃ ∩∞ N =1 EN = {x} est un singleton. Par construction
x ∈ X est le candidat pour la limite de la suite de Cauchy {xn }. Pour tout ε > 0,
il existe N0 tel que, pour tout N > N0 , diam EN < ε. Comme x ∈ EN ,

∀y ∈ EN , d(y, x) ≤ diam EN < ε ⇒ ∀N > N0 +1, d(xN , x) < ε.

Ceci implique que xN → x ∈ X.


(ii) Soit {xn } une suite de Cauchy dans Rk . Du Théorème 6.1 (c), elle est
bornée : il existe x0 ∈ Rk et r > 0 tel que {xn } ⊂ Br (x0 ). Comme Br (x0 ) est
borné et fermé dans Rk , il est compact par le Thérorème 5.4. On se retrouve alors
dans les condition de la partie (i) et la suite de Cauchy converge vers un point
x ∈ Br (x0 ) ⊂ Rk .
86 Chapitre 3. Topologie et suites dans les espaces métriques

6.3 Complété d’un espace métrique


Maintenant que l’on a introduit les suites de Cauchy et la notion d’espace
complet, on peut revenir sur la construction des réels par G. Cantor [1] en 1872. 15
C’est un cas particulier de la construction générale du complété d’un espace métrique
(E, d) qui fait l’objet de l’exercice 24 de W. Rudin [1, p. 76].
Comme on peut parler de suite de Cauchy {xn } dans (X, d) sans qu’il existe
un point x ∈ X vers lequel la suite converge, on peut donc plonger l’espace X dans
l’ensemble S de toutes les suites de Cauchy {xn } ⊂ X. Cependant, ce plongement
est multivoque car il y a plusieurs suites de Cauchy qui convergent vers un point
de X. Il est donc nécessaire d’introduire une notion de suites équivalentes via une
relation d’équivalence et de considérer l’ensemble des classes d’équivalence (voir le
paragraphe 1.2 du Chapitre 2) en page 25.

Lemme 6.1. Si {xn } et {yn } sont deux suites de Cauchy dans X, alors la suite
{d(xn , yn )} est Cauchy.

Démonstration. Pour tout ε > 0,

∃Nx tel que ∀m, n > Nx , d(xn , xm ) < ε/2


∃Ny tel que ∀m, n > Ny , d(yn , ym ) < ε/2.

Donc, pour tout m, n > N = max{Nx , Ny },

d(xn , yn ) ≤ d(xn , xm ) + d(xm , ym ) + d(ym , yn ) < d(xm , ym ) + ε


⇒ |d(xn , yn ) − d(xm , ym )| < ε.

La suite {d(xn , yn )} est Cauchy.

On définit la relation binaire suivante entre deux suites de Cauchy {xn } et


{yn } de S (S, l’ensemble de toutes les suites de Cauchy {xn } dans X).

Définition 6.5.
Soit (X, d) un espace métrique. Étant données deux suites de Cauchy {xn } et {yn }
dans X : {xn } R {yn } si

lim d(xn , yn ) = 0.
n→∞

Lemme 6.2. Soit (X, d) un espace métrique. Alors R de la Définition 6.5 est une
relation d’équivalence dans S au sens de la Définition 1.4 du Chapitre 2.

Démonstration. La relation R est réflexive car

0 = d(xn , xn ) → 0.

15. Même date que pour la construction de Dedekind.


6. Suites de Cauchy, complétude et complété 87

Elle est symétrique car d(xn , yn ) = d(yn , xn ). Elle est transitive car pour trois suites
{xn }, {yn } et {zn } dans S telles que {xn } R {yn } et {yn } R {zn }

d(xn , zn ) ≤ d(xn , yn ) + d( yn , zn )
⇒ 0 ≤ lim d(xn , zn ) ≤ lim d(xn , yn ) + lim d(xn , yn ) = 0 + 0 = 0.
n→∞ n→∞ n→∞

Donc, {xn } R {zn }.

Notation 6.1.
b = S/R l’ensemble de toutes les classes d’équivalence de suites de
On notera X
Cauchy dans X. Ces classes définissent un partition de l’ensemble S des suites de
Cauchy dans X.

Pour A et B dans X, b on considère les suites de Cauchy {xn } et {x′n } dans A



et {yn } et {yn } dans B :

d(xn , yn ) ≤ d(xn , x′n ) + d(x′n , yn′ ) + d(yn′ , yn )


⇒ lim d(xn , yn ) ≤ lim d(xn , x′n ) + lim d(x′n , yn′ ) + lim d(yn′ , yn )
n→∞ n→∞ n→∞ n→∞
′ ′
= lim d(xn , yn ).
n→∞

Par symétrie de d,

lim d(x′n , yn′ ) ≤ lim d(xn , yn ) ⇒ lim d(x′n , yn′ ) = lim d(xn , yn ).
n→∞ n→∞ n→∞ n→∞

Comme la limite est indépendante du choix du représentant dans chaque classe A


et B, la fonction

ˆ B) déf
(A, B) 7→ d(A, b ×X
= lim d(xn , yn ) : X b → R+ (6.6)
n→∞

est bien définie.


b d)
Lemme 6.3. Soit un espace métrique (X, d). Alors (X, ˆ est un espace métrique.

ˆ B) = 0, il existe {xn } ∈ A et {yn } ∈ B tel que


Démonstration. (M1). Si d(A,
ˆ B) = 0.
lim d(xn , yn ) = d(A,
n→∞

Par définition {xn } R {yn } et, par le Lemme 1.1 du Chapitre 2, A = B. Récipro-
quement, si A = B, pour tout {xn } ∈ A et {yn } ∈ B, {xn } ∈ B, {xn } R {yn },
ˆ B) = lim d(xn , yn ) = 0.
lim d(xn , yn ) = 0 et d(A,
n→∞ n→∞

(M2). dˆ est symétrique par symétrie de d.


(M3). Pour tout {xn } ∈ A, {yn } ∈ B et {zn } ∈ C,

d(xn , zn ) ≤ d(xn , yn ) + d(yn , zn )


88 Chapitre 3. Topologie et suites dans les espaces métriques

et, comme chaque suite converge dans R,


lim d(xn , zn ) ≤ lim d(xn , yn ) + lim d(yn , zn )
n→∞ n→∞ n→∞
ˆ C) ≤ d(A,
⇒ d(A, ˆ B) + d(B,
ˆ C).

b d)
On a vérifié les trois axiomes d’une métrique et (X, ˆ est un espace métrique.

Tout élément x ∈ X pourra alors être identifié à la classe d’équivalence de la


suite constante {x} que l’on notera R{x}. La classe R{x} contient non seulement la
suite constante, mais aussi toutes les suites de Cauchy {xn } dans X qui convergent
vers x puisque
ˆ
d(R{xn }, R {x}) = lim d(xn , x) = 0.
n→∞

On définit l’applicarion
déf b
x 7→ ϕ(x) = R{x} : X → X. (6.7)

On désignera par X0 l’image ϕ(X) de X par ϕ dans X. b Par construction, X0


contient toutes les classes d’équivalence des suites convergentes dans X et seulement
ces suites.
ˆ
On vérifie que, par définition de d,
∀x, y ∈ X, ˆ
d(ϕ(x), ϕ(y)) = lim d(x, y) = d(x, y).
n→∞

On dit que ϕ est une isométrie de X dans le sous-ensemble X0 de X. b L’application


ˆ
ϕ est injective car d(ϕ(x), ϕ(y)) = 0 entraı̂ne d(x, y) = 0 et x = y. On peut donc
identifier X au sous-espace X0 de X. b Dans cette optique, dˆ peut être considérée
comme un prolongement de la métrique d dans X au plus gros espace X. b
On introduit maintenant la notion de densité.

Définition 6.6.
Soit (X, d) un espace métrique. E ⊂ X est dense dans X si tout point de X est un
point d’adhérence de E (ou encore E = X).
b d)
Théorème 6.5. Soit (X, d) un espace métrique. L’espace (X, ˆ est un espace
b
métrique complet et X0 = ϕ(X) est dense dans X.
Démonstration. (i) (X0 est dense dans (X,b d).)
ˆ Soit A ∈ X b et {xn } ∈ A. À chaque
xn ∈ X, on associe la suite constante et sa classe d’équivalence ϕ(xn ) ∈ X0 . Alors,
b d).
la suite ϕ(xn ) converge vers A dans (X, ˆ En effet, pour tout n ≥ 1,
ˆ
d(ϕ(xn ), A) = lim d(xn , xm )
m→∞

et, comme {xn } est Cauchy, pour tout ε > 0 il existe N tel que
∀m, n > N, d(xn , xm ) < ε
ˆ
⇒ ∀n > N, d(ϕ(x n ), A) = lim d(xn , xm ) < ε
m→∞
7. Compacité et compacité séquentielle 89

et A ∈ X b est la limite de la suite {ϕ(xn )} ⊂ X0 .


b d)
(ii) ((X, b d).
ˆ est complet.) Soit {An } une suite de Cauchy dans (X, ˆ Par
b
densité de X0 dans X, pour chaque n, il existe yn ∈ X tel que
ˆ
d(ϕ(y n ), An ) < 2
−n
.

La nouvelle suite {yn } ⊂ X est Cauchy :


ˆ
d(yn , ym ) = d(ϕ(y ˆ ˆ ˆ
n ), ϕ(ym )) ≤ d(ϕ(yn ), An ) + d(An , Am ) + d(Am , ϕ(ym ))
ˆ n , Am ) + 2−m .
≤ 2−n + d(A

Comme {An } est Cauchy, pour tout ε > 0, il existe N1 tel que

∀n, m > N1 , ˆ n , Am ) < ε/3


d(A

et il existe N2 tel que pour tout n > N2 , 2−n < ε/3. Donc, pour tout n, m >
max{N1 , N2 }, d(yn , ym ) < ε et la suite {yn } est bien Cauchy. Il existe donc B ∈ Xb
tel que {yn } ∈ B. Il reste à montrer que B est la limite de la suite {An }. En effet,
ˆ An ) ≤ d(B,
d(B, ˆ ϕ(yn )) + d(ϕ(y
ˆ n ), An ) ≤ lim d(ym , yn ) + 2
−n
.
m→∞

Comme {yn } est Cauchy le premier terme du membre de droite tend vers zéro
lorsque n tend vers l’infini. De même pour 2−n . On a donc bien construit un point
B∈X b tel que An → B.

Remarque 6.2.
La construction de Cantor correspond à X = Q et à la métrique
déf
(x, y) 7→ d(x, y) = |x − y| : Q × Q → Q+ = {x ∈ Q : x ≥ 0}.

Bien que la Definition 2.1 de la métrique comme une application (x, y) 7→ d(x, y) :
X × X → R+ présuppose que R ait déjà été construit, la métrique définie plus
haut dans Q reste un rationnel positif ou nul. On n’a donc pas besoin de R. On
peut donc construire Q, b l’ensemble des classes d’équivalence des suites de Cauchy
dans Q. Cependant, dans notre construction, la définition (6.6) de la métrique dˆ
b nécessite la connaissance de R. Il faudrait voir comment G. Cantor [2] a
sur Q
contourné cette difficulté et comment il obtient la propriété (P7) s’il l’obtient.

7 Compacité et compacité séquentielle


Comme on l’a indiqué au début du paragraphe 4, il est possible de donner une
caractérisation de la compacité dans un espace métrique en termes de suites.

Définition 7.1.
Un sous-ensemble E d’un espace métrique (X, d) est séquentiellement compact si
E = ∅ ou toute suite {xn } dans E possède une sous-suite {xnk } qui converge vers
un élément x ∈ E.
90 Chapitre 3. Topologie et suites dans les espaces métriques

Pour les espaces topologiques généraux, la compacité entraı̂ne la compacité séquen-


tielle, mais la réciproque est fausse. Cependant, pour les espaces métriques et seule-
ment dans ce cas, la compacité peut être caractérisée par les suites.

Définition 7.2.
Soit (X, d) un espace métrique. Un sous-ensemble E de X est précompact si E = ∅
ou si, pour chaque r > 0, il existe un nombre fini {x1 , x2 , . . . , xnr } de points de E
tel que

E ⊂ ∪ni=1
r
Br (xi ) (7.1)

ou, de façon équivalente, si, pour tout r > 0, on peut recouvrir E par un nombre
fini de parties de E de diamètre inférieur à r.

Théorème 7.1. Soit E un sous-ensemble d’un espace métrique (X, d). E est sé-
quentiellement compact si et seulement si E est précompact et complet.
Démonstration. Si E = ∅, il n’y a rien à démontrer. On suppose donc que E 6= ∅.
(⇒) (E précompact.) Par l’absurde. On suppose que, pour un certain r > 0,
aucune union finie de boules de rayon r ne recouvre E. On construit la suite {xn }
de points de E suivante. On prend x1 ∈ E et

∀n ≥ 1, / ∪nk=1 Br (xk ) .
xn+1 ∈ E tel que xn+1 ∈

On a donc une suite de points mutuellement distants d’au moins r > 0 :

∀m 6= n ≥ 1, d(xm , xn ) ≥ r.

Cette suite ne peut donc pas avoir de sous-suite convergente, ce qui contredit l’hy-
pothèse de compacité séquentielle de E.
(E complet.) Si {xn } est une suite de Cauchy dans E, il existe x ∈ E et une
sous-suite qui converge vers x. Comme la suite est de Cauchy toute la suite converge
vers x ∈ E et E est complet.
(⇐) Soit une suite {xn } ⊂ E et S = ∪∞ n=1 {xn } l’ensemble des points de la
suite. Si S = {s1 , . . . , sm } est fini, alors il existe si ∈ S et une sous-suite constante
xnk = si tel que xnk → si lorsque k → ∞ (même démonstration que pour le
Théorème 6.2 (b)).
Considérons le cas S infini. Comme E est précompact, pour tout r > 0, il existe
un ensemble fini de points de E tel que E soit recouvert par les boules ouvertes de
rayon r centrées en ces points. Une de ces boules contient donc un nombre infini de
points de S. On procède alors à la construction suivante :
déf
r = 1/2, ∃y1 ∈ E tel que S1 = B1/2 (y1 ) ∩ S infini
déf
r = 1/22 , ∃y2 ∈ E tel que S2 = B1/22 (y2 ) ∩ S1 infini
...
déf
r = 1/2k , ∃yk ∈ E tel que Sk = B1/2k (yk ) ∩ Sk−1 infini.
7. Compacité et compacité séquentielle 91

On a ainsi construit une suite décroissante S ⊃ S1 ⊃ S2 ⊃ . . . de diamètre


diam (Sk ) < 1/2k−1 . Comme Sk est infini, pour chaque k ≥ 1, il existe xnk ∈ Sk tel
que nk > nk−1 et {xnk } est une sous-suite de {xn }. Comme xnk+1 ∈ Sk+1 ⊂ Sk ⊂
B1/2k (yk ) et xnk ∈ Sk ⊂ B1/2k (yk ),

1 1 1
d(xnk , xnk+1 ) ≤ d(xnk , yk ) + d(yk , xnk+1 ) < k
+ k = k−1 .
2 2 2
Cette sous-suite est de Cauchy. En effet, pour k ′ > k,
′ ′
kX −1 kX −1
1 1
d(xnk′ , xnk ) ≤ d(xni+1 , xni ) ≤ < k−2 .
2i−1 2
i=k i=k

Donc pour tout ε > 0, il existe K tel que, pour tout k, k ′ > K, d(xnk′ , xnk ) < ε.
Comme E est complet cette sous-suite {xnk } de {xn } converge vers un point x ∈ E
et E est bien séquentiellement compact.

Théorème 7.2. Soit un espace métrique (X, d) et un sous-ensemble séquentielle-


ment compact E de X. Si {Gα }α∈A est un recouvrement ouvert de E, alors

∃r > 0, ∀x ∈ E, ∃α ∈ A, Br (x) ⊂ Gα .

Les rayons r > 0 qui jouissent de cette propriété sont appellés les nombres de
Lebesgue du recouvrement ouvert {Gα }α∈A .

Démonstration. On procède par l’absurde. On suppose que

∀r > 0, ∃xr ∈ E, ∀α ∈ A, Br (xr ) 6⊂ Gα .

En particulier, on construit une suite de points de E comme suit

∀n ≥ 1, ∃xn ∈ E, ∀α ∈ A, B1/n (xn ) 6⊂ Gα . (7.2)

Comme, par hypothèse, E est séquentiellement compact, il existe une sous-suite


{xnk } de (xn ) convergeant vers un point x ∈ E. Puisque les {Gα } recouvrent E,
il existe αx ∈ A tel que x ∈ Gαx . Comme Gαx est ouvert, il existe ε > 0 tel que
Bε (x) ⊂ Gαx . Finalement,

1
∀y ∈ B1/nk (xnk ), d(y, x) ≤ d(y, xnk ) + d(xnk , x) < + d(xnk , x)
nk
∀ε > 0, ∃K1 tel que ∀k > K1 , d(xnk , x) < ε/2
1
∃K > K1 tel que < ε/2
nK
⇒ ∀y ∈ B1/nK (xnK ), d(y, x) ≤ d(y, xnK ) + d(xnK , x) < ε
⇒ B1/nK (xnK ) ⊂ Bε (x) ⊂ Gαx

ce qui contredit la construction (7.2).


92 Chapitre 3. Topologie et suites dans les espaces métriques

Théorème 7.3 (Bolzano-Weierstrass). Soit un espace métrique (X, d) et un sous-


ensemble E de X. Les propriétés suivantes sont équivalentes.
(i) E est compact.
(ii) E est séquentiellement compact.
(iii) Tout sous-ensemble infini F de E possède (au moins) un point d’accumu-
lation dans E, c’est-à-dire, F ′ ∩ E 6= ∅.
(iv) E est précompact et complet.

Remarque 7.1.
L’implication (iii) ⇒ (i) est la réciproque du Theorem 4.5 page 74.

Démonstration. (i) ⇒ (iii) du Théorème 4.5 et


(iii) ⇒ (ii). Soit {xn } une suite dans E. Par le Théorème 6.2 (b), il existe
x ∈ E et une sous-suite {xn′k } converge vers x. Par définition, E est séquentiellement
compact.
(ii) ⇒ (i). Soit E séquentiellement compact. On considère un recouvrement
ouvert {Gα } de E. D’après le Théorème 7.2,

∃r > 0, ∀x ∈ E, ∃α(x) ∈ A, Br (x) ⊂ Gα(x) .

D’après le Théorème 7.1, E est recouvert par un nombre fini de boules de rayon r,
c’est-à-dire, il existe une partie finie {x1 , x2 , . . . , xn } ⊂ E telle que E ⊂ ∪ni=1 Br (xi )
ce qui donne

E ⊂ ∪ni=1 Br (xi ) ⊂ ∪ni=1 Gα(xi ) .



Comme Gα(xi ) : 1 ≤ i ≤ n est un sous-recouvrement fini de E, E est compact.
(ii) ⇔ (iv) par le Théorèm 7.1.

Exemple 7.1.
En général, un sous-ensemble borné et fermé d’un espace métrique n’est ni séquen-
tiellement compact ni compact. L’exemple classique est celui de l’espace métrique
ℓ2 des suites x = (x1 , x2 , . . . ) : xi ∈ R, i ≥ 1, de carré sommable :
( ∞
) "∞ #1/2
déf
X X
ℓ2 = x = (x1 , x2 , . . . ) : |xi |2 < ∞ , d(x, y) = |xi − y i |2 .
i=1 i=1

2
On considère la sphère de rayon un et de centre 0 dans ℓ
déf
E = {x ∈ ℓ2 : d(x, 0) = 1}

et la suite {xn } ⊂ E telle que (xn )k = δnk . Par définition, E ⊂ B2 (0) et E est borné.
Pour montrer que E est fermé, on montre que son complément est ouvert. En effet,
pour tout x ∈ ℓ2 tel que d(0, x) 6= 1, ou bien d(0, x) < 1 et on a B1−d(0,x) (x) ⊂ ∁E ;
ou bien d(0, x) > 1 et on a Bd(0,x)−1 (x) ⊂ ∁E. On vérifie que

∀m 6= n, d(xm , xn ) = 2
8. Ensembles parfaits 93

et il n’y a pas de sous-suites convergentes. E n’est donc pas séquentiellement com-


pact et, a fortiori, pas compact.

Définition 7.3.
Soit (X, d) un espace métrique. (X, d) est séparable s’il contient un sous-ensemble
dense dénombrable.

L’espace Rk est séparable (voir Exercice 10.17).

Théorème 7.4. Un espace métrique (X, d) compact est séparable.

Démonstration. Cf. Exercices 10.19 et 10.20.

8 Ensembles parfaits
Définition 8.1.
Soit (X, d) un espace métrique. Un sous-ensemble E de X est parfait si E est fermé
et ne contient aucun point isolé.

Remarque 8.1.
Comme pour tout fermé on a E = E = E ′ ∪ E\E ′ et qu’il n’y a pas de points isolés,
il vient E = E = E ′ et E = E ′ . Réciproquement, si E = E ′ , alors E est parfait
puisque E ′ est un ensemble fermé (voir Exercice 10.8) et que l’ensemble des points
isolés E\E ′ est vide.

Théorème 8.1. Tout sous-ensemble parfait non-vide de (Rk , dp ) 16 , 1 ≤ p ≤ ∞,


est non-dénombrable.

Démonstration. Soit E un ensemble parfait non-vide. Il est fermé, non vide et ne


contient que des points d’accumulations. C’est donc un ensemble infini. Si on le
suppose dénombrable, on peut ordonner ses points en une suite ordonnée {sn }.
On prend le premier point x1 = s1 de la suite {sn } et un rayon r1 > 0
quelconque. Soit B1 = Br1 (x1 ). Comme x1 est un point d’accumulation de E,
Br′ 1 (x1 ) ∩ E 6= ∅ et il existe des points de E dans la boule trouée. On saute dans
l’ordre en commençant par s2 tous les points de la suite {sn } qui ne sont pas dans
Br′ 1 (x1 ). Soit x2 = sn2 le premier point de la suite {sn } qui se trouve dans Br′ 1 (x1 ).
En particulier, x2 6= x1 On choisit le rayon

1 d(x2 , x1 ) ≥ 2r2
r2 = min {d(x2 , x1 ), r1 − d(x2 , x1 )} > 0 ⇒
2 0 < d(x2 , x1 ) ≤ r1 − 2r2 .

Ce choix de r2 entraı̂ne Br2 (x2 ) ⊂ Br1 (x1 ) et s1 , . . . , sn2 ∈


/ Br2 (x2 ) puisque

∀y ∈ Br2 (x2 ), d(y, x1 ) ≤ d(y, x2 ) + d(x2 , x1 ) ≤ r2 + d(x2 , x1 ) < r1 − r2 < r1


d(x1 , x2 ) ≥ 2r2 > r2 .

16. dp , 1 ≤ p ≤ ∞, est la métrique associée aux normes définies au Théorème 1.2 page 51.
94 Chapitre 3. Topologie et suites dans les espaces métriques

Comme x2 est un point d’accumulation de E, Br′ 2 (x2 )∩E 6= ∅ et il existe des points
de E dans la boule trouée. On saute dans l’ordre en commençant par sn2 +1 tous les
points de la suite {sn } qui ne sont pas dans Br′ 2 (x2 ). Soit x3 = sn3 le premier point
de la suite {sn } qui se trouve dans Br′ 2 (x2 ). En particulier, x3 6= x2 . On choisit le
rayon

1 d(x3 , x2 ) ≥ 2r3
r3 = min {d(x3 , x2 ), r2 − d(x3 , x2 )} > 0 ⇒
2 0 < d(x3 , x2 ) ≤ r2 − 2r3 .

Ce choix de r3 entraı̂ne Br3 (x3 ) ⊂ Br2 (x2 ) et x2 ∈


/ Br3 (x3 ) puisque

∀y ∈ Br3 (x3 ), d(y, x2 ) ≤ d(y, x3 ) + d(x3 , x2 ) ≤ r3 + d(x3 , x2 ) < r2


d(x2 , x3 ) ≥ 2r3 > r3 .

À l’étape k, on a construit la suite de boules Bk = Brk (xk ) tel que


(i) Brk+1 (xk+1 ) ⊂ Brk (xk )
(ii) s1 , s2 , . . . , snk ∈
/ Brk+1 (xk+1 )
(iii) Br′ nk+1 (xk+1 ) ∩ E 6= ∅.
On pose Kk = Bk ∩ E. La boule Bk est bornée et fermée et donc compacte.
Comme E est fermé, l’intersection Kk = Bk ∩ E est fermée et donc compacte
comme sous-ensemble fermé du compact Bk . De plus, puisque xk+1 est un point
d’accumulation de E,

Kk = Bk ∩ E ⊃ Br′ k+1 (xk+1 ) ∩ E 6= ∅.

On a donc une suite décroissante {Kk } de compacts non-vides. Par le Corollaire 1


au Théorème 4.4,

∅ 6= K = ∩∞
k=1 Kk ⊂ E.

Par construction de la suite décroissante de boules Bk = Brk (xk ), on a successive-


ment éliminé tous les points de la suite {sn }, c-à-d., E ∩ [∩∞
k=1 Brk (xk )] = ∅. On
obtient alors la contradiction
h i
∅ 6= K ⊂ ∩∞ k=2 E ∩ B rk (xk )
 ∞  ∞
⊂ E ∩ ∩k=2 Brk−1 (xk−1 ) = E ∩ [∩k=1 Brk (xk )] = ∅,

car ∩∞
k=1 Brk (xk ) ne contient aucun point de E.

Corollaire 1. Tout intervalle de R et, en particulier, R est non-dénombrable.


Les ouverts dans R ont une structure bien particulière.
Théorème 8.2. Tout sous-ensemble ouvert G de R peut s’écrire comme la réunion
au plus dénombrable d’intervalles ouverts disjoints {Ii } (Ii ∩ Ij = ∅ si i 6= j),
c’est-à-dire, [
G= Ii .
8. Ensembles parfaits 95

Démonstration. W. Rudin [1, exercice 29 p. 42]. Comme G est ouvert, à chaque


x ∈ G on peut associer le plus grand intervalle ouvert Ix contenant x et contenu
dans G. Il suffit de prendre
déf
[ [
Ix = J ⇒ G= Ix .
J intervalle ouvert x∈G
contenant x

Si x et x′ sont deux points de G tels que x 6= x′ , alors Ix ∩ Ix′ = ∅ ou Ix = Ix′ .


En effet, si Ix ∩ Ix′ 6= ∅, l’union Ix ∪ Ix′ est un intervalle ouvert contenant x et
x′ . Comme, par définition, Ix est le plus grand intervalle dans G contenant x, on
a x ∈ Ix ∪ Ix′ ⊂ Ix et x′ ∈ Ix ∪ Ix′ ⊂ Ix′ . Ceci entraı̂ne Ix = Ix ∪ Ix′ = Ix′ .
Maintenant, dans tout intervalle ouvert Ix , il existe un rationnel r ∈ Q ∩Ix . Comme
r ∈ Ix ∩ Ir 6= ∅ on a nécessairement Ix = Ir et
[ [ [
G= Ix ⊂ Ir ⇒ G = Ir .
x∈G r∈Q ∩G r∈Q ∩G

Le nombre d’intervalles distincts dans l’union est donc au plus dénombrable. Enfin,
comme on sait que si r 6= r′ sont deux points de G ∩ Q on a Ir ∩ Ir′ = ∅ ou Ir = Ir′ ,
il suffit de retenir les indices correspondant à des intervalles disjoints.
Contrairement à ce que l’on pourrait penser, un fermé n’est pas la réunion
d’une famille au plus dénombrable d’intervalles fermés. L’ensemble de Cantor est
un sous-ensemble parfait de l’intervalle [0, 1]. C’est donc un fermé qui n’est pas la
réunion dénombrable d’une famille d’intervalles fermés disjoints (ici des intervalles
triviaux ne contenant qu’un point).

Exemple 8.1 (Ensemble triadique de Cantor).


Soit E0 = [0, 1]. Comme il est borné et fermé, E0 est compact. On enlève l’intervalle

0 1/3 2/3 1

Figure 3.9. L’ensemble de Cantor

ouvert médian de E0
 
1 2
,
3 3
pour obtenir le nouveau fermé
   
déf déf 1 déf 2 1
E1 = I11 ∪ I12 ⊂ E0 , I11 = 0, et I12 = ,1 , |I1,k | =
3 3 3
96 Chapitre 3. Topologie et suites dans les espaces métriques

qui lui aussi est compact. Ensuite, on enlève les intervalles ouverts médians de I11
et I12 . Chacun laisse deux nouveaux intervalles fermés de longueur 3−2
       
déf 1 déf 2 3 déf 6 7 déf 8
I21 = 0, , I22 = , , I23 = , et I24 = ,1
9 9 9 9 9 9
pour obtenir le nouveau fermé
déf 1
E2 = I21 ∪ I22 ∪ I23 ∪ I24 ⊂ E1 , |I2,k | =
32
qui lui aussi est compact. À l’étape n, on enlève encore l’ouvert médian de chaque
intervalle I(n−1)k , 1 ≤ k ≤ 2n−1 , ce qui laisse deux nouveaux intervalles fermés de
longueur 3−n pour obtenir le nouveau fermé
2n
[
déf 1
En = Ink ⊂ En−1 , |Ink | = n
3
k=1

comme union finie des intervalles fermés Ink . En est donc compact. L’ensemble

\
déf
C = En
n=1

est l’ensemble triadique de Cantor. L’intersection ∩∞ n=1 En est fermée et non-vide et


compact comme intersection d’une famille décroissante de compacts non-vides. Par
construction, on observe que les deux extrémités de chaque intervalle Ink vont se
retrouver dans E.
Pour que C soit parfait, il ne faut pas qu’il y ait de point isolé. On considère
un point x ∈ C. Pour chaque n ≥ 1, il existe k, 1 ≤ k ≤ 2n , tel que x ∈ Ink . Soit
xn l’une des extrémités de Ink différente de x. La suite {xn }, xn 6= x, converge vers
x puisque |xn − x| ≤ 1/3n. Le point x est donc un point d’accumulation de C.
Enfin, comme la somme des longueurs des intervalles de l’ensemble En est
2n (1/3n ) = (2/3)n , elle tend vers 0 lorsque n tend vers l’infini. Cependant, comme C
est parfait, on sait que C infini et non-dénombrable par le Théorème 8.1. On observe
aussi que le complément [0, 1]\C est un ouvert qui est bien l’union dénombrable des
intervalles ouverts disjoints enlevés à chaque étape de la construction de C.

9 Ensembles connexes et ensembles convexes


9.1 Ensembles connexes
Définition 9.1.
Soit (X, d) un espace métrique.
(i) Deux sous-ensembles A et B de X sont séparés dans X si A ∩ B = ∅ et
A ∩ B = ∅.
(ii) Le sous-ensemble E ⊂ X est connexe s’il n’est pas la réunion de deux
ensembles séparés non-vides.
Dans cette définition les adhérences sont prises par rapport à (X, d).
9. Ensembles connexes et ensembles convexes 97

Par définition de deux ensembles séparés,

A∩B ⊂A∩B = ∅ ⇒ A∩B =∅

et A et B sont disjoints. À ce niveau de généralité, ∅ et tout sous-ensemble A de


X sont séparés et ∅ est connexe.

Exemple 9.1.
1) Les intervalles [0, 1] et ]1, 2] ne sont pas séparés.
2) R, Rk , les intervalles [a, b], ]a, b], [a, b[ , et ]a, b[ dans R sont connexes.
3) Q et l’ensemble à deux éléments {0, 1} ne sont pas connexes.

En topologie générale, on trouve une définition différente de la connexité (par-


tie (ii) du Théorème 9.1). Il y a cependant équivalence.

Définition 9.2 (Topologie générale).


Soit (X, d) un espace métrique. Le sous-ensemble E ⊂ X est connexe s’il n’est pas
la réunion de deux ensembles non-vides, disjoints et ouverts de (E, d).

Théorème 9.1. Soit E un sous-ensemble d’un espace métrique (X, d). Les pro-
priétés suivantes sont équivalentes :
(i) E est la réunion de deux ensembles séparés non-vides de (X, d) ;
(ii) E est la réunion de deux ouverts de (E, d) 17 non-vides et disjoints ;
(iii) il existe un sous-ensemble G, ∅ 6= G $ E, qui soit à la fois fermé et
ouvert 18 dans (E, d).
Démonstration. (i) ⇒ (ii) E est la réunion A ∪ B de deux ensembles séparés A et
B non-vides. Alors,
)
A ∩ B = ∅ ⇒ ∅ 6= A ⊂ E\B  
⇒ E = A ∪ B = E\B ∪ E\A .
B ∩ A = ∅ ⇒ ∅ 6= B ⊂ E\A

E est donc la réunion de deux ouverts non-vides par rapport à la topologie induite
sur (E, d). En effet, par le Théorème 3.3, E\B = E ∩ [X\B] est l’intersection de E
et de l’ouvert X\B dans (X, d). Même chose pour E\A. Quant à leur intersection
 
E\B ∩ E\A = E\(A ∪ B) ⊂ E\(A ∪ B) = ∅.

Ceci donne le résultat.


(ii) ⇒ (iii) Il existe deux ouverts par rapport à la topologie induite sur (E, d)
qui sont non-vides et disjoints dans E tel que E = A ∪ B. Les complémentaires sont
donc fermés dans (E, d) :
)
∅ 6= A = E\B fermé
⇒ ∅ 6= A $ E.
∅ 6= B = E\A

17. Ouverts par rapport à la topologie induite (ou relative) sur (E, d).
18. Ouverts et fermés par rapport à la topologie induite (ou relative) sur (E, d).
98 Chapitre 3. Topologie et suites dans les espaces métriques

A est donc à la fois ouvert et fermé et différent de ∅ et E.


(iii) ⇒ (i) Soit G, ∅ 6= G $ E à la fois ouvert et fermé dans (E, d). Alors

E = G ∪ (E\G) et G ∩ (E\G) = ∅.

Comme G est ouvert et fermé dans (E, d), le complément E\G est fermé et ouvert
dans (E, d). Par le Théorème 3.3, il existe des ouverts O et O′ dans (X, d) tel que

G=E∩O et E\G = E ∩ O′
⇒ E\G = E ∩ (X\O) et G = E ∩ (X\O′ ).

Ces ensembles sont séparés car pour les fermetures dans (X, d)

G ∩ E\G = E ∩ O ∩ E ∩ (X\O) ⊂ E ∩ O ∩ E ∩ (X\O) = ∅


E\G ∩ G= E\G ∩ E\(E\G) = E ∩ O′ ∩ E ∩ (X\O′ ) ⊂ E ∩ O′ ∩ E ∩ (X\O′ ) = ∅

puisque X\O et X\O′ sont fermés dans (X, d) comme compléments des ouverts O
et O′ . On a utilisé le fait que A ∩ B ⊂ A ∩ B par le Théorème 3.10 (ii). G et E\G
sont donc séparés.
En prenant systématiquement le contraire de chaque propriété, on obtient des
conditions équivalentes pour la connexité.
Corollaire 1. Soit E un sous-ensemble d’un espace métrique (X, d). Les propriétés
suivantes sont équivalentes :
(i) E est connexe dans (X, d) (Définition 9.1 (ii)) ;
(ii) E n’est pas la réunion de deux sous-ensembles non-vides, disjoints et ou-
verts dans (E, d) 19 (Définition 9.2) ;
(iii) les seuls sous-ensembles de E qui soient à la fois fermés et ouverts 20 dans
(E, d) sont ∅ et E.

Remarque 9.1.
Dans la Définition 9.1 (ii), on travaille avec des adhérences dans (X, d), alors que
pour l’autre définition, les ouverts sont par rapport à la topologie induite sur (E, d)
et non par rapport à celle de (X, d). La notion de connexité est donc, comme celles
de compacité et de bornitude, une notion intrinsèque.

Exemple 9.2.
On considère l’ensemble à deux éléments X = {0, 1} dans R avec la métrique
d(x, y) = |x − y|. Les ensembles ∅ et X sont ouverts et fermés. Les ensembles
{0} et {1} sont ouverts car B1/2 (0) = {0} et B1/2 (1) = {1}. Ils sont fermés car les
compléments des ouverts {0} et {1}

{0} = X\{1} et {1} = X\{0}

sont fermés. L’espace X = {0, 1} n’est donc pas connexe.


19. Ouverts par rapport à la topologie induite (ou relative) sur (E, d).
20. Ouverts et fermés par rapport à la topologie induite (ou relative) sur (E, d).
9. Ensembles connexes et ensembles convexes 99

Exemple 9.3.
On considère dans R2 le sous-ensemble X = B1 (0, 0) ∪ B1 (3, 3). Les deux boules
sont non-vides, disjointes et sont des ensembles ouverts dans (X, d). L’espace X
n’est donc pas connexe. De plus, par complémentarité, B1 (0, 0) = X\B1 (3, 3)
et B1 (3, 3) = X\B1 (0, 0) sont fermées dans (X, d) par le Théorème 3.5 et, par
conséquent, ouvertes et fermées dans (X, d) sans être égales à ∅ ou X. Attention,
elles ne seraient pas fermées dans (R2 , d).

Théorème 9.2. E ⊂ R est connexe si et seulement si


∀x, y ∈ E, x < y, x < z < y ⇒ z ∈ E.
Démonstration. (⇒) Par l’absurde. Supposons qu’il existe x, y ∈ E et z ∈ R tels
que x < z < y et z ∈
/ E. Alors
déf déf
E = Az ∪ Bz , où Az = E∩ ] − ∞, z[ et Bz = E∩ ]z, +∞[ .
Comme x ∈ Az et y ∈ Bz , ces deux ensembles ne sont pas vides. Enfin,
Az ∩ Bz ⊂ ] − ∞, z[ ∩ [z, +∞[ = ∅
Az ∩ Bz ⊂ ] − ∞, z] ∩ ]z, +∞[ = ∅
et Az et Bz sont séparés. Comme E = Az ∪ Bz , E n’est pas connexe ce qui contredit
l’hypothède du théorème.
(⇐) Par l’absurde. Supposons que E ne soit pas connexe. On peut alors trouver
deux ensembles séparés A et B non vides tels que E = A∪B, A∩B = ∅ et A∩B = ∅.
En particulier, A ∩ B = ∅ et il existe x ∈ A et y ∈ B tel que x 6= y. On a donc ou
bien x < y ou bien x > y. Supposons, sans perte de généralité, que x < y. Posons
déf
zA = sup (A ∩ [x, y]) .
Comme (A ∩ [x, y]) est borné supérieurement par y, sup (A ∩ [x, y]) ∈ R et
zA ∈ (A ∩ [x, y]) ⊂ A ⇒ zA ∈
/B et x ≤ zA < y.
Si zA ∈/ A, alors x < zA < y et zA ∈ E = A ∪ B. Donc, zA ∈ B ce qui contredit la
fait que zA ∈
/ B.
On a donc zA et x ≤ zA < y. On construit les points
1
∀n ≥ 2, zn = zA + (y − zA )
n
pour lesquels
zA < zn < y ⇒ zn ∈ E = (A ∪ B) ∩ [x, y]
par hypothèse. Mais, comme par définition,
zA = sup (A ∩ [x, y]) < zn ⇒ zn ∈ B.
Finalement, lorsque n → ∞,
zn → zA ⇒ zA ∈ B
ce qui donne une autre contradiction puisque zA ∈ A et A ∩ B = ∅.
100 Chapitre 3. Topologie et suites dans les espaces métriques

9.2 Ensembles convexes, sous-ensembles linéaire et affine


La condition du théorème 9.2 peut s’écrire de façon équivalente

∀x, y ∈ E, ∀λ, 0 < λ < 1, λ x + (1 − λ) y ∈ E. (9.1)

Un sous-ensemble connexe dans R est le prototype d’un ensemble convexe dans un


espace vectoriel.

Définition 9.3.
Soit (X, +, ×) un espace vectoriel sur R au sens de la Définition 1.1 du Chapitre 2.
(i) E ⊂ X est convexe si

∀x, y ∈ E, ∀λ, 0 < λ < 1, λ × x + (1 − λ) × y ∈ E. (9.2)

(ii) A ⊂ X est un sous-espace affine si

∀x, y ∈ A, ∀α ∈ R, α × x + (1 − α) × y ∈ A. (9.3)

(iii) S ⊂ X est un sous-espace linéaire si

∀x, y ∈ S, ∀α, β ∈ R, α × x + β × y ∈ S. (9.4)

Par définition, ∅ est à la fois un sous-espace affine, un sous-espace linéaire et un


convexe.

Remarque 9.2.
Dire que E est convexe revient à dire que, pour toute paire de points x, y, x 6= y,
déf
dans E, le segment [x, y] = {λx + (1 − λ)y : 0 ≤ λ ≤ 1} est contenu dans E.

La boule Br (x) dans Rn est convexe. Les sous-espaces affines et les sous-espaces
linéaires sont des convexes.
Le lecteur attentif pourra s’apercevoir que la partie (⇐) de la démonstration
du Théorème 9.2 peut servir à démontrer le résultat général intuitif suivant.
Théorème 9.3. Soit (X, +, ×) un espace vectoriel normé sur R au sens de la
Définition 1.1 du Chapitre 2. Alors tout partie convexe de X est connexe.

Démonstration. Par l’absurde. Supposons que E ne soit pas connexe. On peut alors
trouver deux ensembles séparés A et B non vides tels que E = A ∪ B, A ∩ B = ∅
et A ∩ B = ∅. En particulier, A ∩ B = ∅ et il existe x ∈ A et y ∈ B tel que x 6= y.
On considère le segment [x, y] = {λx + (1 − λ)y; 0 ≤ λ ≤ 1}. On peut sans perte de
généralité orienter ce segment de façon que x < y. En posant
déf
zA = sup (A ∩ [x, y])

on se retrouve dans les conditions de la démonstration de la seconde partie du


Théorème 9.2 qui mène à deux contradictions.
10. Exercices 101

Un sous-espace affine est la translation d’un sous-espace linéaire unique.

Théorème 9.4. Soit (X, +, ×) un espace vectoriel sur R au sens de la Définition


1.1 du Chapitre 2. Soit A un sous-espace affine de X. Il existe un sous-espace
linéaire unique S de X tel que

∀a ∈ A, A = a + S.

Démonstration. On fixe a ∈ A et l’on considère l’ensemble S = A − a. Pour tout


α ∈ R et x ∈ S, il existe xA ∈ A tel que x = xA − a et α x = α (xA − a) + (1 −
α) (a − a) = α xA + (1 − α) a − a ∈ S. Pour tout x, y ∈ S, il existe xA et yA dans A
tel que x = xA − a et y = yA − a. Alors
     
1 1 1 1
(x + y) = xA + 1 − yA − a ∈ S ⇒ x + y = 2 (x + y) ∈ S.
2 2 2 2

Finalement, pour tout α et β dans R et x et y dans S, αx ∈ S et βy ∈ S, et leur


somme αx + βy ∈ S. Donc, S est bien un sous-espace linéaire.
Il reste à montrer que ce sous-espace est indépendant de a. Soit un autre point
déf
a ∈ A et son sous-espace linéaire S ′ = A − {a′ }. Alors

∀x′ ∈ S ′ = A − {a′ }, ∃x′A ∈ A tel que x′ = x′A − a′


⇒ x′ = x′A − a + (−1) (a′ − a) ∈ S ⇒ S′ ⊂ S
| {z } | {z }
∈S ∈S
et réciproquement

∀x ∈ S = A − {a}, ∃xA ∈ A tel que x = xA − a


⇒ x = xA − a′ + (−1) (a − a′ ) ∈ S ⇒ S ⊂ S ′ .
| {z } | {z }
∈S ∈S

Le sous-espace linéaire est donc unique et pour tout a ∈ A, S = A − a.

10 Exercices
Exercice 10.1 (W. Rudin [1, exercice 17, p. 22]).
Soient x, y ∈ Rk . Établir que

kx + yk2 + kx − yk2 = 2 kxk2 + 2 kyk2.

Interpréter géométriquement ce résultat.

Exercice 10.2 (W. Rudin [1, exercice 18, p. 22]).


Soit x ∈ Rk , k ≥ 2. Démontrer qu’il existe y ∈ Rk , y 6= 0, tel que x · y = 0.

Exercice 10.3.
Soit R+ = {x ∈ R : x ≥ 0}.
102 Chapitre 3. Topologie et suites dans les espaces métriques

(i) Montrer que, pour tout espace métrique (X, d) et pour toute constante
α > 0, la fonction
déf
(x, y) 7→ (αd)(x, y) = α d(x, y)

est une métrique sur X.


(ii) Si d1 et d2 sont deux métriques sur X, montrer que la fonction
déf
(x, y) 7→ (d! + d2 )(x, y) = d1 (x, y) + d2 (x, y)

est une métrique sur X.


(iii) Montrer que, pour tout espace métrique (X, d), la fonction

déf d(x, y)
(x, y) 7→ d(x, y) =
1 + d(x, y)

est une métrique sur X.


(iv) Soit {dn : n ≥ 1} une suite de fonctions dn : X × X → R+ tel que pour
tout entier n ≥ 1

∀x, y ∈ X, dn (x, y) = dn (y, x) (10.1)


∀x, y, z ∈ X, dn (x, z) ≤ dn (x, y) + dn (y, z) (10.2)
x = y ⇒ dn (x, y) = 0 (10.3)

et, en plus,

d1 (x, y) = 0 ⇒ x = y. (10.4)

Montrer que la fonction


X∞
déf 1 dn (x, y)
(x, y) 7→ d∞ (x, y) =
n=1
2n 1 + dn (x, y)

est bien définie et qu’elle est une métrique sur X.

Exercice 10.4.
Soient (Xi , di ), 1 ≤ i ≤ n, des espaces métriques et
déf
X1 × · · · × Xn = {(x1 , . . . , xn ) : xi ∈ Xi } (10.5)

l’espace produit des Xi . Montrer que la fonction


déf
(x, y) = ((x1 , . . . , xn ), (y1 , . . . , yn )) 7→ d∞ (x, y) = max di (xi , yi )
1≤i≤n (10.6)
: (X1 × · · · × Xn ) × (X1 × · · · × Xn ) → R+
10. Exercices 103

est une métrique sur X1 × · · · × Xn . De la même façon, pour tout p, 1 ≤ p < ∞,


montrer que la fonction
( n
)1/p
déf
X
p
dp (x, y) = di (xi , yi ) (10.7)
i=1

est une métrique sur X1 × · · · × Xn . (Utiliser l’inégalité de Minkowski du Théorème


1.2)

Exercice 10.5.
Soit E un espace vectoriel normé au sens des Définitions 1.1 et 1.4 du Chapitre 2.
Montrer que
déf
d(x, y) = kx − yk

est une métrique sur E.

Exercice 10.6 (W. Rudin [1, exercice 7, p. 41]).


Soient A1 , A2 , . . . des sous-ensembles d’un espace métrique. On pose

Bn = ∪ni=1 Ai et B = ∪∞
i=1 Ai .

Démontrer que

∀n ≥ 1, Bn = ∪ni=1 Ai et B ⊃ ∪∞
i=1 Ai .

Donner un exemple où l’inclusion est stricte.

Exercice 10.7 (W. Rudin [1, exercice 5, p. 41]).


Donner un exemple d’un ensemble borné de R ayant exactement trois points d’ac-
cumulation.

Exercice 10.8 (W. Rudin [1, exercice 6, p. 41]).


On désigne par E ′ l’ensemble des points d’accumulation d’un sous-ensemble d’un
espace métrique (X, d). Établir que E ′ est fermé et que E et E ont les mêmes points
d’accumulation. E et E ′ ont-ils toujours les mêmes points d’accumulation ?

Exercice 10.9 (W. Rudin [1, exercice 8, p. 41]).


Tout point d’un ensemble fermé E ⊂ R2 est-il point d’accumulation de E ? Re-
prendre le problème en supposant E ouvert.

Exercice 10.10 (W. Rudin [1, exercice 9, p. 41]).


Soit (X, d) un espace métrique et E un sous-ensemble de X. Montrer que
(a) ∁ int E = ∁E.
(b) Est-ce que E et int E ont le même intérieur ?
(c) Est-ce que E et int E ont la même adhérence ?
104 Chapitre 3. Topologie et suites dans les espaces métriques

Exercice 10.11 (W. Rudin [1, exercice 14 p. 42]).


Donner un exemple d’un recouvrement ouvert de l’intervalle ]0, 1[ dont on ne peut
extraire de sous-recouvrement fini.

Exercice 10.12 (W. Rudin [1, exercice 10, p. 41]).


Si X est un ensemble infini, on pose pour tout x, y ∈ X
(
1, si x 6= y
d(x, y) =
0, si x = y.
Montrer que d est une métrique sur X. Quels en sont les ouverts ? les fermés ? les
compacts ?

Exercice 10.13.
On considère l’ensemble à deux éléments {0, 1} dans R équipé d’une métrique arbi-
traire d (il en existe au moins une : d(x, y) = |x − y|).
(i) Énumérer tous les ouverts de ({0, 1}, d). Justifier.
(ii) Énumérer tous les compacts de ({0, 1}, d). Justifier.
(iii) Est-ce que ({0, 1}, d) est complet ? Justifier.
(iv) Énumérer tous les fermés de X = {0, 1, 2} pour une métrique arbitraire
dX sur X. Justifier.

Exercice 10.14 (W. Rudin [1, exercice 20 p. 75]).


Soit {xn } une suite de Cauchy d’une espace métrique (X, d) ayant une valeur
d’adhérence x ∈ X. Montrer que xn → x.

Exercice 10.15.
Soit X = R muni de la métrique d(x, y) = |x − y|.
(i) Montrer que l’application
déf x
x 7→ ϕ(x) = : R → ] − 1, 1[ (10.8)
1 + |x|
est une bijection.
(ii) Vérifier que
déf x y
dϕ (x, y) = d(ϕ(x), ϕ(y)) = − (10.9)
1 + |x| 1 + |y|
est une métrique sur R.
(iii) Vérifier que la suite {n}, n ≥ 1, est dϕ -Cauchy, mais pas d-Cauchy.

Exercice 10.16 (W. Rudin [1, exercice 21 p. 75]).


Soient (X, d) un espace métrique complet et {En } une suite décroissante de fermés
bornés non-vides tel que
lim diam (En ) = 0.
n→∞

Montrer que ∩∞
n=1 En est un singleton.
10. Exercices 105

Exercice 10.17 (W. Rudin [1, exercice 22 p. 42]).


On dit qu’un espace métrique est séparable s’il contient un sous-espace dénombrable
et dense. Montrer que Rk est séparable.

Exercice 10.18 (W. Rudin [1, exercice 23 p. 42]).


On dit qu’une famille d’ouverts {Oα } est une base de X si tout ouvert de X est
la réunion d’ouverts de cette famille. Montrer qu’un espace métrique séparable
posssède une base dénombrable.

Exercice 10.19 (W. Rudin [1, exercice 24 p. 42]).


Soit un espace métrique (X, d) dans lequel tout sous-ensemble infini possède au
moins un point d’accumulation. Démontrer que X est séparable. Indication : Soit
r > 0 et x1 ∈ X ; ayant déterminé x1 . . . . , xj ∈ X, choisir, s’il existe, un point
xj+1 tel que d(xj , xj+1 ) ≥ r pour tout i = 1, . . . , j. Montrer que cette construction
s’arrête au bout d’un nombre fini de boules ouvertes de rayon r. Prendre r = 1/n
(n = 1, 2, 3, . . . ) et considérer les centres des boules correspondantes.

Exercice 10.20 (W. Rudin [1, exercice 25 p. 42]).


Démontrer que tout espace métrique compact K a une base dénombrable et qu’il
est donc séparable. Indication : pour tout entier n > 0, il existe un nombre fini de
boules ouvertes de rayon 1/n recouvrant K.
106 Chapitre 3. Topologie et suites dans les espaces métriques
Chapitre 4
Fonctions,
limites et continuités

1 Rappels sur les applications et les fonctions


Il faut se reporter à la Définition 1.1 au début du Chapitre 2 pour la définition
d’une application (fonction) et celles d’application induite ou d’application inverse
induite. On utilisera indifféremment les termes applications et fonctions.

Définition 1.1.
Soit une fonction f : X → Y , l’ensemble P(X) des sous-ensembles de X et l’en-
semble P(Y ) des sous-ensembles de Y .
(i) À chaque A ⊂ X, on associe l’image de A par f
déf
f (A) = {f (x) : x ∈ A} ⊂ Y. (1.1)

On utilisera la (même) notation f pour l’application induite

A 7→ f (A) : P(X) → P(Y ). (1.2)

(ii) À chaque B ⊂ Y , on associe l’image inverse ou réciproque de B par f


déf
f −1 (B) = {x ∈ X : f (x) ∈ B} ⊂ X. (1.3)

On utilisera la notation f −1 pour l’application inverse induite

B 7→ f −1 (B) : P(Y ) → P(X). (1.4)

On rappelle les relations et résultats suivants.


Théorème 1.1. Soit f : X → Y . Alors l’application inverse induite f −1 : P(Y ) →
P(X) préserve les opérations élémentaires suivantes :
(1) f −1 (∪α Bα ) = ∪α f −1 (Bα ) ;

107
108 Chapitre 4. Fonctions, limites et continuités

(2) f −1 (∩α Bα ) = ∩α f −1 (Bα ) ;


(3) f −1 (B1 \B2 ) = f −1 (B1 )\f −1 (B2 ).

Démonstration. Exercice 10.1.

L’application inverse induite f −1 commute donc avec les opérations de réunion,


d’intersection, et de complémentarité. Ce n’est pas le cas de l’application induite f .

Théorème 1.2. Soit f : X → Y . Alors l’application induite f : P(X) → P(Y )


préserve les opérations suivantes :
(1) f (∪α Aα ) = ∪α f (Aα ) ;
(2) f (∩α Aα ) ⊂ ∩α f (Aα ).

Démonstration. Exercice 10.2.

Un exemple pour lequel f (A1 ∩ A2 ) $ f (A1 ) ∩ f (A2 ) dans la partie (2) est la
fonction x 7→ f (x) = 1 : R → R avec A1 = [0, 1] et A2 = [2, 3]. En effet, A1 ∩A2 = ∅,
f (A1 ∩ A2 ) = ∅ et f (A1 ) ∩ f (A2 ) = {1}.

Théorème 1.3. Soit f : X → Y . Alors


(1) pour chaque A ⊂ X, on a A ⊂ f −1 [f (A)],
(2) pour chaque A ⊂ X et B ⊂ Y , on a
 
f A ∩ f −1 (B) = f (A) ∩ B (1.5)

et, en particulier,
 
f f −1 (B) = f (X) ∩ B. (1.6)

Démonstration. Exercice 10.3.

Comme l’application inverse induite de la composition existe toujours, on a le


résultat suivant.

Théorème 1.4. Soit f : X → Y et g : Y → Z. Alors (g ◦ f )−1 = f −1 ◦ g −1 , où


f −1 , g −1 et (g ◦ f )−1 sont les applications inverses induites.

Démonstration. Exercice 10.4.

Théorème 1.5. On se donne :


- un ensemble arbitraire X et un recouvrement {Aα } de X par des sous-
ensembles de X, c’est-à-dire X = ∪α Aα ;
- un autre ensemble arbitraire Y et une famille fα : Aα → Y d’applications
tel que

∀α, β, fα |Aα ∩Aβ = fβ |Aα ∩Aβ .


2. Limite d’une fonction 109

Alors, il existe une application unique f : X → Y qui est un prolongement de chaque


fα :
∀α, f |A α = f α .
Démonstration. Exercice 10.5.
Théorème 1.6. Soit f : X → Y et g : Y → X tel que g ◦ f = IX , où IX est la
fonction identité sur X. Alors f est injective et g est surjective.
Démonstration. Exercice 10.6.

2 Limite d’une fonction


2.1 Limite d’une fonction en un point d’accumulation
Définition 2.1.
Soient
- (X, dX ) et (Y, dY ) deux espaces métriques,
- E ⊂ X et a ∈ E ′ un point d’accumulation de E, c-à-d., x ∈ X tel que
pour tout r > 0, Br′ (x) ∩ E 6= ∅),
- f : E → (Y, dY ) une fonction.
(i) On dit que f (x) tend vers y ∈ Y lorsque x ∈ E tend vers a si

∀ε > 0, ∃δ > 0 tel que ∀x ∈ E , 0 < dX (x, a) < δ, dY (f (x), y) < ε. (2.1)
On dira que y est la limite 1 de f en a par rapport à E et on l’écrira
lim f (x) ou simplement lim f (x) (2.2)
x→a x→a
E

lorsque le contexte ne prête pas à confusion.


(ii) La limite de f : E → (Y, dY ) en un point isolé de E n’est pas définie.

Remarque 2.1.
Pour une fonction f : (X, dX ) → (Y, dY ), il ne faut pas confondre la Définition 2.1
de la limite en a ∈ E ′ de f : E → (Y, dY ) avec celle (plus forte) de limite en a ∈ E ′
de f : X → (Y, dY )
lim f (x) (2.3)
x→a
X
qui signifie

∀ε > 0, ∃δ > 0 tel que ∀x ∈ X , 0 < dX (x, a) < δ, dY (f (x), y) < ε, (2.4)
où l’on approche du point a non seulement par des points x de E mais aussi par
des points dans le plus gros ensemble X.
1. C’est K. Weierstrass qui le premier introduisit la définition epsilon-delta de la limite d’une
fonction de la manière qu’elle est écrite de nos jours. Il introduisit aussi la notation lim et limx→a
(voir l’histoire des mathématiques de D. Burton [1, pp. 558–559]).
110 Chapitre 4. Fonctions, limites et continuités

Exemple 2.1.
Soient X = R2 , E = B1 (0, 0), a ∈ R2 tel que kak = 1 et la fonction
(
déf 1, si x ∈ B1 (0, 0),
f (x) =
0, si x ∈ R2 \B1 (0, 0).

Cette fonction n’a pas de limite en a dans R2 , mais elle en a une dans B1 (0, 0)
lim f (x) = 1 6= 0 = f (a).
x → a
B1 (0,0)

Elle n’est pas non plus égale à la valeur de f en a.

y f (a) = y
f (a) f (a)

a a a

Figure 4.1. Exemples de fonctions f . Pour E = R, la limite y de f (x) en


a existe pour les seconde et troisième fonctions, mais pas pour la première.

Exemple 2.2.
La fonction de Dirichlet 2 sur R
(
déf 0, si x ∈ Q
f (x) =
1, si x ∈ R \ Q

ne possède de limite en aucun point de R.


Si f (x) a une limite y en a ∈ R, alors pour ε = 1/4 > 0, il existe δ > 0 tel que
0 < |x − a| < δ ⇒ |f (x) − y| < 1/4.
2. Dirichlet a été élevé en Allemagne, puis a été ensuite envoyé en France pour suivre ses
études supérieures. Il fut en contact avec les plus grands mathématiciens français de l’époque, à
l’instar de Legendre, Laplace ou Fourier. Il retourne ensuite en 1825 en Allemagne où il travaille
avec Gauss, dont il reprendra la chaire à l’Université de Göttingen, et Jacobi. Il eut entre autres
comme élève Riemann. Les travaux de Dirichlet ont surtout porté sur les séries de Fourier et
l’arithmétique, où on lui doit l’essentiel de la démonstration du dernier théorème de Fermat à
l’aide des entiers de Dirichlet pour le cas où le paramètre est égal à cinq. On lui doit également des
travaux sur les intégrales et la recherche de fonctions discontinues. Un célèbre problème d’analyse
porte son nom : le Problème de Dirichlet. Dirichlet a également travaillé sur le théorème de Fermat-
Wiles. Aussi, il a prouvé le théorème de Dirichlet conjecturé à l’origine par Legendre et Gauss. Il
est fait membre étranger de la Royal Society en 1855.
2. Limite d’une fonction 111

Figure 4.2. Johann Peter Gustav Lejeune Dirichlet (1805–1859).

Comme l’intervalle (a − δ, a + δ) contient une infinité de rationnels et d’ irrationnels


et que la fonction ne prend que les valeurs 0 et 1, il vient

0 < |x − a| < δ ⇒ |0 − y| < 1/4 et |1 − y| < 1/4


⇒ −1/4 < y < 1/4 et 3/4 < y < 5/4

une contradiction.

Comme pour les points d’accumulation, on a une caractérisation de la limite


en termes de suites.
Théorème 2.1. Soient X, Y, E, f, a et y comme dans la Définition 2.1. Alors

lim f (x) = y (2.5)


x→a
E

si et seulement si

lim f (xn ) = y (2.6)


n→∞

pour toute suite {xn } ⊂ E, xn 6= a, qui converge vers a.


Démonstration. (⇒). En effet, soit une suite {xn } ⊂ E, xn 6= a, qui converge vers
a. Soit un couple (ε, δ) associé à la limite. Il existe N ≥ 1 tel que pour tout n > N ,
0 < dX (xn , a) < δ et donc

∀n > N, dY (f (xn ), y) < ε

et limn→∞ f (xn ) = y.
(⇐). Par l’absurde. Supposons

∃ε > 0 tel que ∀δ > 0, ∃x ∈ E, 0 <dX (x, a) < δ, dY (f (x), y) ≥ ε. (2.7)

Pour chaque n ≥ 1,

∃xn ∈ E, 0 <dX (xn , a) < 1/n, dY (f (xn ), y) ≥ ε. (2.8)

On obtient bien une suite {xn } ⊂ E, xn 6= a, qui converge vers a mais pour laquelle
f (xn ) ne converge pas vers y en contradiction avec notre hypothèse.
112 Chapitre 4. Fonctions, limites et continuités

Corollaire 1. Si f admet une limite en a par rapport à E, cette limite est unique.
Démonstration. Supposons qu’il existe deux limites y1 et y2 . Par le théorème, il
existerait une suite {xn } ⊂ E, xn 6= a, qui converge vers a tel que

lim f (xn ) = y1 et lim f (xn ) = y2 .


n→∞ n→∞

Comme la limite d’une suite convergente est unique, il vient y1 = y2 .

1.5

0.5

-2.5 -2 -1.5 -1 -0.5 0 0.5 1 1.5 2 2.5

-0.5

-1

-1.5

Figure 4.3. Limite de sin(1/x) en a = 0 ?

Exemple 2.3.
déf
Soit la fonction x 7→ f (x) = sin(1/x) : R \{0} → R. On prend les suites
π 
déf 2 1
x+
n = →0 ⇒ f (x+ n ) = sin + 2nπ = 1
π 4n + 1 2
2 1  π 
déf
x−
n = → 0 ⇒ f (x−
n ) = sin − + 2nπ = −1.
π 4n − 1 2
f (x) n’a donc pas de limite en x = 0.

Définition 2.2.
Soit (X, d) un espace métrique.
(i) Une fonction f : (X, d) → R est dite fonction à valeurs réelles.
(ii) Une fonction f : (X, d) → C est dite fonction à valeurs complexes.
(iii) Pour k ≥ 1, on dira que f : (X, d) → Rk et f : (X, d) → Ck sont des
fonctions à valeurs vectorielles.
2. Limite d’une fonction 113

Pour les fonctions à valeurs vectorielles, on peut définir les opérations suivantes :
déf déf déf
(f + g)(x) = f (x) + g(x), (f · g)(x) = f (x) · g(x), (λ f )(x) = λ f (x) (2.9)
pour λ ∈ R.
Théorème 2.2. Soient f, g : (X, d) → C, E ⊂ X, a ∈ X un point d’accumulation
de E et y et z dans C tel que
lim f (x) = y et lim g(x) = z.
x→a x→a

Alors,
(a) limx→a (f + g)(x) = y + z ;
(b) limx→a (f g)(x) = y z ;
(c) limx→a (f /g) (x) = y/z si z 6= 0.
Si f et g étaient des fonctions à valeurs vectorielles, on aurait
(a) limx→a (f + g)(x) = y + z,
(b) limx→a (f · g)(x) = y · z,
en raisonnant composante par composante.

2.2 Limite d’une fonction d’une variable réelle aux infinis


Comme il y a un ordre dans R, la notion de limite d’une fonction f : R → (Y, d)
en un point de R peut être étendue à ±∞.

Définition 2.3.
Soit f : R → (Y, d).
(i) Soit E un sous-ensemble de R qui n’est pas borné supérieurement. On dit
f tend vers y ∈ Y lorsque x ∈ E tend vers +∞ si
∀ε > 0, ∃M tel que ∀x ∈ E, x > M, dY (f (x), y) < ε. (2.10)
On écrira
lim f (x) = y ou lim f (x) = y. (2.11)
x→ +∞ x→ +∞
E

(ii) Soit E un sous-ensemble de R qui n’est pas borné inférieurement. On dit


f tend vers y ∈ Y lorsque x ∈ E tend vers −∞ si
∀ε > 0, ∃m tel que ∀x ∈ E, x < m, dY (f (x), y) < ε. (2.12)
On écrira
lim f (x) = y ou lim f (x) = y. (2.13)
x→ −∞ x→ −∞
E

Si Y est un espace vectoriel comme R, C, Rk et Ck , alors les opérations algébriques


associées à ces espaces s’appliquent aux limites de fonctions en ±∞.
114 Chapitre 4. Fonctions, limites et continuités

2.3 Limite inférieure et limite supérieure d’une fonction à


valeurs réelles
On considère des fonctions f : (X, d) → R. Par exemple, la fonction x 7→
f (x) = sin(1/x) : R \{0} → R de l’Exemple 2.3 qui n’a pas de limite en x = 0. On
peut cependant trouver des suites xn → 0 telles que la suite {f (xn )} tende vers
chaque point de l’intervalle [−1, 1] qui est l’ensemble des points d’accumulation de
toutes les suites {f (xn )} lorsque xn → 0. Comme il y a une relation d’ordre sur
R, on peut distinguer ce qui est en dessus et ce qui est en dessous et parler de −1
comme une limite inférieure et de +1 comme une limite supérieure.
On se place dans le contexte suivant :
(i) (X, d) est un espace métrique et E, ∅ 6= E ⊂ X,
(ii) a ∈ E ′ est un point d’accumulation de E,
(iii) f : E → R.
On considère d’abord le cas inférieure. On associe à ε > 0, l’infimum suivant
déf
g(ε) = inf f (x). (2.14)
x∈Bε′ (a)∩E

Comme g(ε) est l’infimum de f sur l’ensemble non-vide Bε′ (a) ∩ E, il est égal à un
réel ou à −∞. La fonction g(ε) est monotone croissante lorsque ε tend vers 0 car

0 < ε1 < ε2 ⇒ g(ε1 ) ≥ g(ε2 ).

Donc, la limite suivante existe dans R = R ∪{±∞} :

lim g(ε)∈ R,
εց0

et, comme g(ε) croı̂t lorsque ε → 0, on a aussi

lim g(ε) = sup g(ε).


εց0 ε>0

On en arrive à la définition suivante.

Définition 2.4.
Soient (X, d) un espace métrique, E, ∅ 6= E ⊂ X, a ∈ E ′ est un point d’accumula-
tion de E, et f : E → R.
(i) On appelle limite inférieure de f lorsque x tend vers a dans E la quantité
déf
lim inf f (x) = sup inf f (x).
x→a ε>0 x∈Bε′ (a)∩E
E

(ii) On appelle limite supérieure de f lorsque x tend vers a dans E la quantité


déf
lim sup f (x) = inf sup f (x).
x→a ε>0 x∈B ′ (a)∩E
E ε

Les limites inférieure et supérieure ne sont pas définies en un point isolé.


3. Fonctions continues 115

On vérifiera que pour la fonction f (x) = sin(1/x) de l’Exemple 2.3

lim inf f (x) = −1 et lim sup f (x) = 1.


x→0 x→0
R R

Mais pour la fonction f (x) = 1/x, on aura

lim inf f (x) = −∞ et lim sup f (x) = +∞.


x→0 x→0
R R

3 Fonctions continues
3.1 Définitions et propriétés
Définition 3.1.
Soient
- (X, dX ) et (Y, dY ) deux espaces métriques et
- E un sous-ensemble non-vide de X.
(i) Une fonction f : (E, dX ) → (Y, dY ) est continue en a ∈ E si

∀ε > 0, ∃δ > 0 tel que ∀x ∈ E , dX (x, a) < δ, dY (f (x), f (a)) < ε. (3.1)

(ii) Une fonction f : (E, dX ) → (Y, dY ) est continue sur E si f est continue en tout
point de E.

Remarque 3.1.
Il aurait été suffisant de donner la définition pour E = X, mais on a voulu mettre
l’accent sur une ambiguı̈té possible pour une fonction f : X → R lorsque E ( X.
En effet, la continuité par rapport à (X, d),

∀ε > 0, ∃δ > 0 tel que ∀x ∈ X , dX (x, a) < δ, dY (f (x), f (a)) < ε, (3.2)

implique la continuité par rapport à (E, d), mais la réciproque n’est en général pas
vraie. Par exemple, si l’on considère la fonction
( )
déf 1, kxk ≤ 1
x 7→ f (x) = : Rk → R
0, kxk > 1

et pour E la boule fermée B1 (0) dans Rk , la fonction f : B1 (0) → R est constante


et donc continue sur B1 (0), mais comme fonction f : Rk → R elle est discontinue
sur la frontière ∂E qui correspond à la sphère S k−1 = {x ∈ Rk : kxk = 1}.

Remarque 3.2.
La métrique d : (X × X, d1 ) → R est continue lorsque l’espace produit X × X est
muni de la métrique (voir l’Exercice 10.4 du Chapitre 3)
déf
d1 ((x, y), (x′ , y ′ )) = d(x, x′ ) + d(y, y ′ ).
116 Chapitre 4. Fonctions, limites et continuités

Soient (a, b) et (x, y) ∈ X × X. Par l’inégalité du triangle répétée

d(x, y) − d(a, b) ≤ d(x, y) − d(a, y) + [d(a, y) − d(a, b)]


⇒ |d(x, y) − d(a, b)| ≤ |d(x, y) − d(a, y)| + |d(a, y) − d(a, b)|
≤ d(x, a) + d(y, b)
⇒ |d(x, y) − d(a, b)| ≤ d(x, a) + d(y, b) = d1 ((x, y), (a, b)).

On obtient donc la continuité sur l’espace produit X × X.

Comme la compacité, la continuité peut être caractérisée à l’aide de suites.


Théorème 3.1. (X, dX ) et (Y, dY ) deux espaces métriques et E un sous-ensemble
de X. Alors f : (E, dX ) → (Y, dY ) est continue en a ∈ E si et seulement si

∀{xn } ⊂ E telle que xn → a, lim f (xn ) = f (a). (3.3)


n→∞

Démonstration. (⇒) Soit un couple (ε, δ) associé à la continuité de f en a. On


considère une suite {xn } ⊂ E qui converge vers a. Il existe N ≥ 1 tel que pour tout
n > N , dX (xn , a) < δ et donc

∀n > N, dY (f (xn ), f (a)) < ε ⇒ lim f (xn ) = f (a).


n→∞

(⇐) Par l’absurde. Supposons

∃ε > 0 tel que ∀δ > 0, ∃x ∈ E, dX (x, a) < δ, dY (f (x), f (a)) ≥ ε. (3.4)

Pour chaque n ≥ 1,

∃xn ∈ E, dX (xn , a) < 1/n, dY (f (xn ), f (a)) ≥ ε. (3.5)

On obtient bien une suite {xn } ⊂ E qui converge vers a mais pour laquelle f (xn )
ne converge pas vers f (a) en contradiction avec notre hypothèse.
Par définition de la continuité, toute fonction f est continue en un point isolé de E.
En effet, a ∈ E est un point isolé de E s’il existe r > 0 tel que Br′ (a) ∩ E = ∅. Donc,
pour tout δ, 0 < δ ≤ r, Bδ (a) = {a} et f (a) − f (a) = 0 ce qui trivialement donne la
continuité en a. La continuité n’a donc à être vérifiée qu’aux points d’accumulation
de E. Des Théorèmes 2.1 et 3.1 on a le résultat suivant.
Corollaire 1. Soient (X, dX ) et (Y, dY ) deux espaces métriques, E un sous-ensemble
de X et f : (E, dX ) → (Y, dY ). Si a ∈ E est un point d’accumulation de E, c’est-à-
dire, a ∈ E ∩ E ′ , alors f est continue en a ∈ E si et seulement si

lim f (x) = f (a).


x→a
E

À la lumière du Corollaire 1, les opérations sur des fonctions continues f :


E ⊂ (X, dX ) → R du Théorème 2.2 donnent des fonctions continues. L’opération
fonctionnelle qui est peut-être la plus importante est celle de la composition de deux
fonctions.
3. Fonctions continues 117

Théorème 3.2. Soient (X, dX ), (Y, dY ) et (Z, dZ ) trois espaces métriques, E ⊂ X,


f : (E, dX ) → (Y, dY ) continue en a ∈ E,
g : (f (E), dY ) → (Z, dZ ) continue en f (a) ∈ f (E),
et la composée g ◦ f de f et de g
déf
x 7→ (g ◦ f )(x) = g(f (x)) : (E, dX ) → (Z, dZ ).

Alors g ◦ f est continue en a ∈ E.

Démonstration. Soit ε > 0. Comme g est continue en f (a), il existe η > 0 tel que

∀y ∈ f (E) tel que dY (y, f (a)) < η, dZ (g(y), g(f (a)) < ε.

Par continuité de f en a, il existe δ > 0 tel que

∀x ∈ E tel que dX (x, a) < δ, dY (f (x), f (a)) < η.

En combinant les deux propriétés

∀x ∈ E tel que dX (x, a) < δ, dZ (g(f (x)), g(f (a)) < ε

et g ◦ f est continue en a.

Pour simplifier la présentation, on donne les prochains théorèmes avec E = X.

Théorème 3.3. Soient (X, dX ) et (Y, dY ) deux espaces métriques et une fonction
f : (X, dX ) → (Y, dY ). Les propriétés suivantes sont équivalentes.
(i) f est continue sur X.
(ii) Pour tout A ⊂ X, on a f (A) ⊂ f (A).
(iii) Pour tout B ⊂ Y , on a f −1 (B) ⊂ f −1 (B).
(iv) ∀ F un fermé dans Y , f −1 (F ) est un fermé dans X.
(v) ∀ O un ouvert dans Y , f −1 (O) est un ouvert dans X.

Démonstration. (i) ⇒ (ii) Soit A ⊂ X et b ∈ A. On montre que f (b) ∈ f (A). Ceci


revient à montrer que f (b) est un point d’adhérence de f (A) ou que

∀ε > 0, Bε (f (b)) ∩ f (A) 6= ∅.

Par définition de la continuité, il existe δ > 0 tel que

f (Bδ (b)) ⊂ Bε (f (b)) ⇒ f (Bδ (b)) ∩ f (A) ⊂ Bε (f (b)) ∩ f (A)


⇒ f (Bδ (b) ∩ A) ⊂ f (Bδ (b)) ∩ f (A) ⊂ Bε (f (b)) ∩ f (A)
| {z }

par le Théorème 1.2 (2). Comme b ∈ A, on a Bδ (b) ∩ A 6= ∅ et, a fortiori, f (Bδ (b) ∩
A) 6= ∅ ce qui entraı̂ne Bε (f (b)) ∩ f (A) 6= ∅ tel que désiré.
118 Chapitre 4. Fonctions, limites et continuités

(ii) ⇒ (iii) Soit A = f −1 (B). Alors

f (A) ⊂ f (A) = f (f −1 (B)) = f (X) ∩ B ⊂ B


| {z } | {z }

par le Théorème 1.3 (2). Il vient alors du Théorème 1.3 (1)



f −1 (B) = A ⊂ f −1 (f (A)) ⊂ f −1 B .

(iii) ⇒ (iv) Soit F ⊂ Y fermé. Alors, comme F = F ,

f −1 (F ) ⊂ f −1 (F ) ⊂ f −1 (F ) = f −1 (F ) ⇒ f −1 (F ) = f −1 (F )
| {z }

et f −1 (F ) est fermé.
(iv) ⇒ (v) Pour tout ouvert O ⊂ Y , Y \O est fermé et

f −1 (Y \O) est fermé.

Par le Théorème 1.1 (3)

f −1 (Y \O) = f −1 (Y )\f −1 (O) = X\f −1 (O)


| {z }

et f −1 (O) est donc ouvert comme complement d’un fermé.


(v) ⇒ (i) On associe à chaque a ∈ X la boule ouverte Bε (f (a)) dans Y . Par
hypothèse, son image inverse
f −1 (Bε (f (a)))
est ouverte dans X. Puisque a ∈ f −1 (f (a)) ⊂ f −1 (Bε (f (a))), a est un point
intérieur de f −1 (Bε (f (a))) et il existe δ > 0 et une boule Bδ (a) dans X tel que

Bδ (a) ⊂ f −1 (Bε (f (a))) = X ∩ f −1 (Bε (f (a)))



⇒ f (Bδ (a)) ⊂ f f −1 (Bε (f (a))) = f (X) ∩ Bε (f (a)) ⊂ Bε (f (a))
| {z }

par le Théorème 1.3 (2). Mais f (Bδ (a)) ⊂ Bε (f (a)) est la forme ensembliste de la
définition (ε, δ) de la continuité en a.
Comme pour la notion de limite, les opérations suivantes sont permises pour
les fonctions continues à valeurs réelles ou complexes.
Théorème 3.4. Soient f, g : (X, d) → C ou R des fonctions continues sur X. Alors
(a) f + g est continue sur X ;
(b) f g est continue sur X ;
(c) f /g est continue sur X si g(x) 6= 0 pour tout x ∈ X.
Pour des fonctions à valeurs vectorielles f, g : (X, d) → Ck ou Rk continues sur X,
(a) f + g est continue sur X ;
(b) f · g est continue sur X.
3. Fonctions continues 119

Dans la base orthonormale de Rk , les applications


déf
y 7→ pi (y) = ei · y : Rk → R
qui associent à y ses composantes {yi } sont continues puisque
 1/2
Xk
dR (pi (y), pi (z)) = |pi (y) − pi (z)| ≤  |pj (y) − pj (z)|2 
j=1
 1/2
Xk
= |yj − zj |2  = dRk (y, z).
j=1

k
Même chose pour C :
 1/2
k
X
dC (pi (y), pi (z)) = |pi (y) − pi (z)| ≤  |pj (y) − pj (z)|2  = dCk (y, z).
j=1

On peut donc associer à une fonction à valeurs vectorielles f : (X, d) → Rk


k
ou C ses composantes (f1 (x), . . . , fk (x)). Pour des fonctions à valeurs vectorielles
la continuité est donc équivalente à la continuité composante par composante.
Théorème 3.5. Soit f : (X, d) → Ck ou Rk . Alors f est continue sur X si et
seulement si, pour chaque i, fi est continue sur X.
Démonstration. Considérons f : (X, d) → Rk . Si f est continue, alors la composition
f ◦ pi est continue. Réciproquement, si f ◦ pi est continue pour chaque i,
 1/2  1/2
Xk Xk
dRk (f (x′ ), f (x)) =  |pj (f (x′ )) − pj (f (x))|2  = |fj (x′ ) − fj (x)|2  .
j=1 j=1

Étant donné ε > 0, il existe δi > 0 tel que



∀x′ , dR (x′ , x) < δi , dR (fi (x′ ), fi (x)) < ε/ k.
En prenant δ = min{δ1 , . . . , δk },
 1/2
k
X √ 2
∀x′ , dR (x′ , x) < δ, dRk (f (x′ ), f (x)) <  ε/ k  =ε
j=1

et f est continue en x.
En combinant ce théorème et le Théorème 3.4 qui dit que les sommes, produits
et multiplication par un scalaire de fonctions continues sont continus, on en déduit
que les fonctions polynômiales de la forme
k
X
P (x) = cn1 ,...,nk xn1 1 . . . xnk k
i=1
120 Chapitre 4. Fonctions, limites et continuités

pour des entiers ni positifs ou nuls sont continues sur Rk . Plus généralement les
fonctions rationnelles

P (x)
f (x) = , Q(x) 6= 0, (3.6)
Q(x)

pour deux fonctions polynômiales P et Q sont continues aux points x tels que
Q(x) 6= 0.
Enfin, la norme sur Rk

x 7→ kxk : Rk → R (3.7)

est convexe et continue car de l’inégalité du triangle

kλx + (1 − λ)x′ k ≤ kλxk + k(1 − λ)x′ k ≤ λ kxk + (1 − λ) kx′ k


dR (kx′ k, kxk) = |kx′ k − kxk| ≤ kx′ − xk = dR (x′ , x).

Donc, pour toute fonction à valeurs vectorielles f continue, la fonction

x 7→ kf (x)k : Rk → R (3.8)

est continue en tant que fonction composée de deux fonctions continues.

3.2 Application ouverte ou fermée, homéomorphisme


Définition 3.2.
Soit f : (X, dX ) → (Y, dY ).
(i) L’application f est ouverte si, pour chaque ouvert O dans X, f (O) est
ouvert dans Y .
(ii) L’application f est fermée si, pour chaque fermé F dans X, f (F ) est fermé
dans Y .

Définition 3.3.
Soit f : (X, dX ) → (Y, dY ) une bijection.
(i) On dit que f est un homéomorphisme si f est continue sur X et f −1 est
continue sur Y . On écrira f : X ∼
=Y.
(ii) On dit que deux espaces (X, dX ) et (Y, dY ) sont homéomorphes s’il existe
un homéomorphisme f entre X et Y . On écrira X ∼ = Y.

Exemple 3.1.
P 1/2
déf k
Pour k ≥ 1 on introduit la norme euclidienne kx − ykRk = i=1 |xi − yi |2 et
déf
la métrique dRk (x, y) = kx − ykRk . L’application
déf x
x 7→ ϕ(x) = : (Rk , dRk ) → (B1 (0), dRk ) (3.9)
1 + kxkRk
3. Fonctions continues 121

dont l’inverse est


y
y 7→ ϕ−1 (y) = : (B1 (0), dRk ) → (Rk , dRk )
1 − kykRk

est un homéomorphisme. L’ensemble étendu des réels R = R ∪{±∞} est homéo-


morphe à [−1, 1] via le prolongement ϕ̂ de la bijection ϕ
déf x
x 7→ ϕ̂(x) = : (R, df ) → [−1, 1]
1 + |x|

en identifiant ±∞ à ±1, c’est-à-dire, ϕ̂(±∞) = ±1, pour la métrique dϕ (x, y) =


|ϕ(x) − ϕ(y)| sur R.

Exemple 3.2.
Avec la même norme et métrique de l’Exemple 3.3 sur Rk , k = 2, 3, soit p = (0, 0, 1)
le pôle nord de la sphère
 q 
déf
S 2 = x ∈ R3 : kxkR3 = x21 + x22 + x23 = 1 ⊂ R3 .

L’application ϕ : (R2 , d2 ) → (S 2 \{p}, d3 ) définie par


 
déf 2z1 2z2 z12 + z22 − 1
(z1 , z2 ) 7→ ϕ(z1 , z2 ) = , , , (3.10)
z12 + z22 + 1 z12 + z22 + 1 z12 + z22 + 1

est un homéomorphisme. Son inverse est la projection stéréographique


 
déf x1 x2
(x1 , x2 , x3 ) 7→ ϕ−1 (x1 , x2 , x3 ) = , : (S 2 \{p}, d3 ) → (R2 , d2 ).
1 − x3 1 − x3

Si l’on ajoute le point à l’infini 3 à R2 on obtient toute la sphère S 2 . Ceci revient à


construire le complété de R2 pour la nouvelle métrique
déf
x, y 7→ dϕ (x, y) = kϕ(x) − ϕ(y)kR3 : R2 × R2 → R+ (3.11)

sur R2 . L’ensemble composé de R2 et du point à l’infini s’appelle la sphère de


Riemann. 4 Cette construction se généralise à Rn , n ≥ 1, et au corps des complexes
C comme cas particulier (n = 2).
3. La notion de point à l’infini apparait au XVe siècle dans le cadre du développement des
méthodes de la perspective conique, avec l’invention de la “costruzione abbreviata” d’Alberti.
L’utilisation de ces points par les géomètres des XVIe et XVIIe siècles (par exemple Maurolico ou
da Vignola en Italie, Stevin en Hollande, Desargues et Pascal en France), puis la systématisation
de leur usage au XIXe , a conduit à la création d’une discipline mathématique : la géométrie
projective. La généralisation du langage géométrique dans les mathématiques du XXe sicle, et la
possibilité de compactifier les corps des réels et des complexes par l’ajout d’un élément à l’infini
a conduit à son tour à l’utilisation de la terminologie “point à l’infini” dans d’autres branches des
mathématiques que celles directement dérivées de la géométrie.
4. Cette notion est à la base de la géométrie projective. On parle de droite projective assimi-
lable au cercle, de plan projectif assimilable à la sphère, et ainsi de suite.
122 Chapitre 4. Fonctions, limites et continuités

Théorème 3.6. Soit f : (X, dX ) → (Y, dY ) une bijection. Les propriétés suivantes
sont équivalentes :
(i) f est un homéomorphisme ;
(ii) f est continue et ouverte ;
(iii) f est continue et fermée ;
(iv) pour tout A ⊂ X, f (A) = f (A).
Démonstration. (i) ⇒ (ii) Du Théorème 3.3, comme f −1 est continue pour tout
ouvert O dans X,

f (O) = (f −1 )−1 (O) est ouvert.

(ii) ⇒ (iii) Du Théorème 3.3, comme f = (f −1 )−1 est ouverte, f −1 est conti-
nue. Du même théorème, pour tout fermé F dans X

f (F ) = (f −1 )−1 (F ) est fermé.

(iii) ⇒ (iv) Comme f est continue on a du Théorème 3.3 f (A) ⊂ f (A). Comme
f est fermée, on a aussi f (A) fermé. Donc

f (A) ⊂ f (A) ⊂ f (A) = f (A) ⇒ f (A) = f (A).

(iv) ⇒ (i) Comme pour tout A ⊂ X, f (A) ⊂ f (A), f est continue par le
Théorème 3.3. Pour établir la continuité de f −1 , il suffit de montrer que pour tout
fermé F ⊂ X, (f −1 )−1 (F ) = f (F ) est fermé. En faisant A = F , on a f (F ) =
f (F ) = f (F ) et f (F ) est fermé dans Y .
On peut facilement vérifier le résultat suivant à partir du Théorème 1.6.
Théorème 3.7. Soient f : (X, dX ) → (Y, dY ) et g : (Y, dY ) → (X, dX ) deux
applications continues tel que g ◦ f = IX et f ◦ g = IY . Alors f est bijective,
g = f −1 et f est un homéomorphisme.

3.3 Métriques équivalentes


Définition 3.4.
Deux métriques d1 et d2 sur un ensemble X sont équivalentes 5 si l’application
identité
déf
x 7→ IX (x) = x : (X, d1 ) → (X, d2 ) (3.12)

est un homéomorphisme. On écrira d1 ∼ d2 .


5. Pour éviter de parler de topologie, on donne ici une forme équivalente de la définition pour
les espaces métriques.

Définition 3.5 (J. Dugundji [1, Déf. 3.1 et Th. 3.2, sec. 3, Chapitre IX, p. 184]).
Soient deux métriques d1 et d2 sur l’espace X. On dit que d1 et d2 sont équivalentes si les topologies
T (d1 ) et T (d2 ) sont équivalentes (T (di ) = l’ensemble de tous les ouverts dans (X, di )).
3. Fonctions continues 123

Théorème 3.8. Soient deux métriques d1 et d2 sur un ensemble X. Elles sont


équivalentes si et seulement si pour tout a ∈ X et ε > 0
(i) il existe δ1 = δ1 (a, ε) > 0 tel que

∀x ∈ X tel que d1 (x, a) < δ1 , d2 (x, a) < ε

(ii) il existe δ2 = δ2 (a, ε) > 0 tel que

∀x ∈ X tel que d2 (x, a) < δ2 , d1 (x, a) < ε.

Démonstration. Par définition d’un homéomorphisme et de la continuité de l’iden-


tité dans les deux sens.

Exemple 3.3.
On a montré au Théorème 1.2 du Chapitre 3 que les fonctions
" k
#1/p
déf
X déf
p
dp (x, y) = |xi − yi | , p ≥ 1 un entier, d∞ (x, y) = max |xi − yi |,
1≤i≤k
i=1

sont toutes des métriques sur Rk . Pour montrer qu’elles sont toutes équivalentes, il
suffit de montrer l’équivalence des normes. Pour 1 ≤ p, q < ∞ et x ∈ Rk

k
" k #1/p " k #1/q " k #1/p
X X X X
p p p q p
∀i, |xi | ≤ |xi | ⇒ |xi | ≤ |xi | ⇒ |xi | ≤ |xi | k 1/q
i=1 i=1 i=1 i=1
1/q 1/p
⇒ kxkp ≤ k kxkq et kxkq ≤ k kxkp .

Par la même technique, pour 1 ≤ p < ∞ et x ∈ Rk

∀i, |xi | ≤ kxkp ⇒ kxk∞ = max |xi | ≤ kxkp


1≤i≤k
" k #1/p
X
p
|xi | ≤ max |xi | = kxk∞ ⇒ kxkp = |xi | ≤ k 1/p kxk∞ .
1≤i≤k
i=1

On en conclut que pour tous 1 ≤ p, q ≤ ∞

dp (x, y) = kx − ykp ≤ k 1/p kx − ykq = dq (x, y)


dq (x, y) = kx − ykq ≤ k 1/q kx − ykp = dp (x, y)

On a bien un homéomorphisme : pour tout ε > 0 :


(i) ∃δq = ε/k 1/p > 0 tel que

∀x, y ∈ Rk , dq (x, y) < δq , dp (x, y) < k 1/p δq = ε

(ii) ∃δp = ε/k 1/q > 0 tel que

∀x, y ∈ Rk , dp (x, y) < δp , dq (x, y) < k 1/q δp = ε


124 Chapitre 4. Fonctions, limites et continuités

On voit que les δp et δq ne dépendent que de ε. Cette continuité est plus forte que la
simple continuité. En particulier, l’homéomorphisme x 7→ IRk (x) = x : (Rk , dp ) →
(Rk , dq ) transporte les suites de Cauchy en suites de Cauchy puisque pour tous
1 ≤ p, q ≤ ∞

dp (xn , xm ) = kxn − xm kp ≤ k 1/p kxn − xm kq = dq (xn , xm )


dq (xn , xm ) = kxn − xm kq ≤ k 1/q kxn − xm kp = dp (xn , xm )

Exemple 3.4 (Exercice 10.14, page 154).


P 1/2
k
L’homéomorphisme ϕ de l’Exemple 3.1 pour k ≥ 1 et dRk (x, y) = i=1 |xi − yi |2

déf x
x 7→ ϕ(x) = : (Rk , dRk ) → (B1 (0), dRk ) (3.13)
1 + kxkRk

induit la nouvelle métrique équivalente suivante sur Rk


déf
dϕ (x, y) = dRk (ϕ(x), ϕ(y)) = kϕ(x) − ϕ(y)kRk
dRk (x, y) = kϕ−1 (ϕ(x)) − ϕ−1 (ϕ(y))kRk

puisque ϕ et ϕ−1 sont continues.


L’homéomorphisme ϕ : (R2 , dR2 ) → (S 2 \{p}, dR3 ) de l’Exemple 3.2
 
déf 2z1 2z2 z12 + z22 − 1
(z1 , z2 ) 7→ ϕ(z1 , z2 ) = , , (3.14)
z12 + z22 + 1 z12 + z22 + 1 z12 + z22 + 1

induit aussi la nouvelle métrique équivalente suivante sur R2


déf
dϕ (x, y) = dR3 (ϕ(x), ϕ(y)) = kϕ(x) − ϕ(y)kR3
kx − ykR2 = kϕ−1 (ϕ(x)) − ϕ−1 (ϕ(y))kR2

puisque ϕ et ϕ−1 sont continues.

Un autre propriété intéressante qui s’ajoute à celles du paragraphe 2.2 du


Chapitre 3 page 58 est que, parmi toutes les métriques équivalentes, on peut toujours
en choisir une qui soit bornée sur X.
Théorème 3.9. Soit d une métrique sur X et M > 0.
(i) La fonction
déf
(x, y) 7→ dM (x, y) = min{d(x, y), M } : X × X → R+ (3.15)

est une métrique sur X.


(ii) La métrique dM est équivalente à la métrique d.
3. Fonctions continues 125

Démonstration. (i) dM est une métrique. En effet, dM (x, y) = 0 < M entraı̂ne


d(x, y) = dM (x, y) = 0 et donc x = y. Il y a symétrie car

dM (x, y) = min{d(x, y), M } = min{d(y, x), M } = dM (y, x).

Pour l’inégalité du triangle, on a déjà d(x, z) ≤ d(x, y) + d(y, z). Si d(x, y) ≥ M ou


d(y, z) ≥ M , alors dM (x, y) = M ou dM (y, z) = M et

dM (x, z) = min{d(x, z), M } ≤ M ≤ dM (x, y) + dM (y, z).

Si d(x, y) < M et d(y, z) < M , alors dM (x, y) = d(x, y) et dM (y, z) = d(y, z) et

dM (x, z) = min{d(x, z), M } ≤ d(x, z) ≤ d(x, y) + d(y, z) = dM (x, y) + dM (y, z).

(ii) On applique le Théorème 3.8 en un point a ∈ X et ε > 0. Dans un sens,


par définition, on a dM (x, a) ≤ d(x, a). En prenant δ = ε,

∀x ∈ X, d(x, a) < δ ⇒ dM (x, a) ≤ d(x, a) < δ = ε.

Dans l’autre sens, on prend δ = min{M, ε} > 0

∀x ∈ X, dM (x, a) < δ ≤ M ⇒ d(x, a) = dM (x, a) < δ ≤ ε.

On peut facilement vérifier les propriétés suivantes sont préservées.

Théorème 3.10. Soient d1 , d2 deux métriques équivalentes sur X. Une fonction

f : (X, d1 ) → (Y, dY )

est continue, ouverte, ou fermée si et seulement si

f : (X, d2 ) → (Y, dY )

est respectivement continue, ouverte, ou fermée.

En général, un homéomorphisme ne préserve pas les suites de Cauchy. On


verra plus loin qu’il faut la continuité uniforme 6 pour transporter les suites de
Cauchy en suites de Cauchy. Ceci veut dire que pour deux métriques équivalentes,
une suite de Cauchy pour l’une peut ne pas l’être pour l’autre comme on l’a indiqué
dans l’Exemple 6.1 du Chapitre 3. La complétude est donc une propriété de la
métrique. Ce n’est pas une notion topologique (voir la note 5 au bas de la page 122
et J. Dugundji [1, Chap. XIV, pp. 292–293]). On revient donc sur cet exemple
important avec plus de détails incluant l’équivalence des deux métriques.

6. Voir la Définition 6.1 page 138 et le Théorème 6.2 page 140.


126 Chapitre 4. Fonctions, limites et continuités

Exemple 3.5 (Exemple 6.1 du Chapitre 3 page 81 et les Exemples 3.1 et 3.4).
Soit d(x, y) = |x − y| la métrique sur X = R et la bijection
déf x
x 7→ ϕ(x) = : R → ] − 1, 1[ (3.16)
1 + |x|
qui a pour inverse
déf y
y 7→ ϕ−1 (y) = : ] − 1, 1[ → R . (3.17)
1 − |y|
Les fonctions ϕ et ϕ−1 sont continues comme quotients de deux fonctions continues
dont le dénominateur ne s’annulle pas. La fonction ϕ est donc un homéomorphisme
par le Théorème 3.7.
On a vu dans l’Exemple 6.1 du Chapitre 3 que la fonction
déf x y
dϕ (x, y) = d(ϕ(x), ϕ(y)) = − (3.18)
1 + |x| 1 + |y|
est aussi une métrique sur R. L’application identité
déf
x 7→ I(x) = x : (R, d) → (R, dϕ ) (3.19)
qui est donc une bijection continue dans les deux sens et les deux métriques d et dϕ
sont équivalentes sur R au sens de la Définition 3.4. En effet, comme ϕ est continue,
x y
∀ε > 0, ∃δ1 > 0, ∀y, |y − x| < δ1 , − <ε
1 + |x| 1 + |y|
⇒ ∀y, |y − x| < δ1 , dϕ (y, x) < ε.
Dans l’autre sens, x = ϕ−1 (ϕ(x)) et
d(y, x) = |y − x| = |ϕ−1 (ϕ(y)) − ϕ−1 (ϕ(x))|.
Comme ϕ−1 est aussi continue au point ϕ(x),
∀ε > 0, ∃δ2 > 0, ∀z ∈ ] − 1, 1[ , |z − ϕ(x)| < δ2 , ϕ−1 (z) − ϕ−1 (ϕ(x)) < ε.
En particulier,
∀y ∈ R, |ϕ(y) − ϕ(x)| < δ2 , ϕ−1 (ϕ(y)) − ϕ−1 (ϕ(x)) < ε
⇒ ∀y ∈ R, dϕ (y, x) < δ2 , d(y, x) = |y − x| < ε.
La fonction ϕ est cependant un peu plus continue que son inverse ϕ−1 . En effet,
x y x − y + x |y| − y |x|
dϕ (x, y) = − =
1 + |x| 1 + |y| (1 + |x|) (1 + |y|)
(1 + |y|) (x − y) + y (|y| − |x|)
=
(1 + |x|) (1 + |y|)
(1 + |y|) |x − y| + |y| |y − x|
≤ < 2 |y − x| = 2 d(y, x).
(1 + |x|) (1 + |y|)
3. Fonctions continues 127

Comme dϕ (x, y) < 2 d(y, x), toute suite d-Cauchy est dϕ -Cauchy : dϕ (xn , xm ) <
2 |xn − xm | = 2 d(xn , xm ). Cependant, la réciproque est fausse. La suite {n} n’est
pas d-Cauchy car n → +∞ mais elle est dϕ -Cauchy. En effet, pour tout ε > 0,
N > 1/ε, n > N et k ≥ 1,
n n+k k 1 1
dϕ (n, n + k) = − = < < < ε.
1+n 1+n+k (1 + n) (1 + n + k) 1+n n

3.4 Prolongement continu


On a vu à la Remarque 3.1 que, pour une fonction f : (X, dX ) → R et un
sous-ensemble A ⊂ X, la continuité de f : (A, dX ) → R sur A n’implique pas
nécessairement celle de f : (X, dX ) → R en tout point de A. En général, cette
dernière notion est plus forte. Les deux notions de continuité coı̈ncident cependant
pour un point intérieur de A et donc pour A ouvert, mais, en général, pas pour un
point frontière de A.
On peut alors se poser la question suivante. Étant donnée une fonction f :
(A, dX ) → (Y, dY ) continue sur A ⊂ X, peut-on la prolonger en une fonction F :
(X, dX ) → (Y, dY ) continue sur X ? Ce n’est pas toujours possible comme le montre
l’exemple de la fonction continue x 7→ f (x) = 1/(x (1 − x)) : (0, 1) → R définie sur
l’intervalle ouvert (0, 1) qui ne possède pas de prolongement continu sur tout R.

Définition 3.6.
Soit A, ∅ 6= A ⊂ X. On dit que F : X → Rn est un prolongement de f : A → Rn si
∀a ∈ A, F (a) = f (a) (ou sous forme compacte F |A = f ).
La fonction F |A : A → Rn est appelée restriction de F à A.

On peut démontrer facilement en dimension un (X = R) que la conjoncture est


vraie pour un fermé A à partir du Théorème 8.2 du Chapitre 3.
Théorème 3.11. Soit A, ∅ 6= A ⊂ R, fermé et f : A → Rn une fonction continue
sur A. Alors, il existe un prolongement F : R → Rn de f continu sur R.
Démonstration. Il suffit de démontrer le résultat pour n = 1 et de l’appliquer à
chaque composante de f dans le cas vectoriel. Comme A est fermé, son complément
R \A est ouvert dans R. Par le Théorème 8.2 du Chapitre 3, tout sous-ensemble
ouvert de R peut s’écrire comme la réunion au plus dénombrable intervalles ouverts
disjoints {Ii } (Ii ∩ Ij = ∅ si i 6= j), c’est-à-dire
[
R \A = Ii .
i

Chaque Ii est de la forme ]ai , bi [ et, nécessairement ai ∈ A et bi ∈ A où les valeurs


de la fonction f sont f (ai ) et f (bi ). On définit le prolongement F de f sur ]ai , bi [
comme suit
déf bi − x x − ai
F (x) = f (ai ) + f (bi ) , ai < x < b i . (3.20)
b i − ai b i − ai
128 Chapitre 4. Fonctions, limites et continuités

C’est une fonction continue sur [ai , bi ] qui coı̈ncide avec f aux deux extrémités
de l’intervalle [ai , bi ]. En procédant intervalle par intervalle, on construit ainsi une
fonction continue sur R dont la restriction à A est f .

Le prolongement n’est pas unique car, au lieu de tracer une droite entre
(ai , f (ai )) et (bi , f (bi )), on aurait pu prendre n’importe quelle fonction continue
sur [ai , bi ] passant par (ai , f (ai )) et (bi , f (bi )).
Ce résultat demeure vrai non seulement dans l’espace euclidien Rn de dimen-
sion n ≥ 2 mais aussi dans un espace métrique arbitraire (X, d). En 1915 H. Tietze

Figure 4.4. Heinrich Franz Friedrich Tietze (1880–1964).

[1] construisit le prolongement


 1/dA (x)
déf f (a)
F (x) = sup
a∈A 1 + d(x, a)2

d’une fonction f : A → R pour A fermé sous l’hypothèse que inf x∈A f (x) > 0. Cette
restriction n’est pas contraignante car on peut à l’aide d’un homéomorphisme de R,
comme par exemple
déf z
z 7→ h(z) = + 2 : R → ]1, 2[ ,
1 + |z|

transformer n’importe quelle fonction f : A → R en une fonction f˜ = h◦f : A → R+ .


En 1919, F. Hausdorff [1, p. 296] 7 construisit un autre prolongement ne
nécessitant pas l’hypothèse que inf x∈A f (x) > 0. On démontre le théorème directe-
ment pour ce prolongement pour l’espace euclidien Rn , mais il est aussi vrai dans un
espace topologique T4, et en particulier dans un espace métrique, en faisant appel
au Lemme de Uryshohn 8 en topologie. On aura besoin de la fonction distance déjà
rencontrée dans l’Exemple 2.2 de la métrique de Hausdorff au Chapitre 3 page 56.
7. Voir page 57.
8. Pavel Samouilovitch Urysohn (1898-1924).
3. Fonctions continues 129

Lemme 3.1. Soient (X, d) un espace métrique et A, ∅ 6= A ⊂ X.


(i) La fonction
déf
x 7→ dA (x) = inf d(a, x) : (X, d) → R (3.21)
a∈A

est bien définie 9 et

∀x, y ∈ X, |dA (y) − dA (x)| ≤ d(y, x). (3.22)

(ii) Si, en plus, (X, d) est complet, alors, pour tout A, ∅ 6= A ⊂ X,

{x ∈ X : dA (x) = 0} = A et dA = dA .

(iii) Si (X, d) = (Rn , d) est l’espace euclidien pour la métrique dp (x, y) = kx −


ykp , 1 ≤ p ≤ ∞, correspondant à une norme, alors, pour tout A, ∅ 6= A ⊂
Rn , et tout x ∈ Rn , il existe p ∈ A tel que dA (x) = d(x, p).
Démonstration. (i) Comme la fonction a 7→ dX (x, a) : A → R est non-négative,
elle est bornée inférieurement et son infimum par rapport à A appartient à R.
L’application
déf
x 7→ dA (x) = inf dX (x, a) : (X, dX ) → R (3.23)
a∈A

est donc bien définie.


Par l’inégalité du triangle pour tout a ∈ A

d(a, y) ≤ d(a, x) + d(x, y) ⇒ inf d(a, y) ≤ inf d(a, x) + d(x, y)


a∈A a∈A

et dA (y) ≤ dA (x) + d(x, y). En interchangeant les rôles de x et de y, on obtient


dA (x) ≤ dA (y) + d(y, x). Enfin, par symétrie de d(x, y), on obtient (3.22).
(ii) Pour tout a ∈ A, 0 ≤ dA (a) ≤ d(a, a) = 0 et A ⊂ d−1 A {0} et, comme
dA {0} est fermé, A ⊂ d−1
−1
A {0}. Dans l’autre sens, par l’absurde. S’il existe x ∈ X
tel que dA (x) = 0 et x ∈
/ A, alors x ∈ X\A qui est ouvert. Il existe r > 0 tel que

{y ∈ X : d(y, x) ≤ r} ⊂ B2r (x) ⊂ X\A


⇒ A ⊂ A ⊂ {y ∈ X : d(y, x) > r}
⇒ 0 = dA (x) = inf d(a, x) ≥ inf d(y, x) ≥ r > 0
a∈A y∈X
d(y,x)>r

ce qui donne une contradiction. Enfin, comme A ⊂ A, dA (x) ≥ dA (x) pour tout
x ∈ X. Par définition de l’infimum dA (x), pour tout n ≥ 1, il existe bn ∈ A tel que

1
dA (x) ≤ d(bn , x) < dA (x) +
2n
9. On verra plus loin qu’elle est non seulement continue mais aussi lipschitzienne sur X au
sens de la Définition 7.1 page 142.
130 Chapitre 4. Fonctions, limites et continuités

et il existe xn ∈ A tel que d(an , bn ) < 1/(2n). Il vient donc

1 1
dA (x) ≤ d(an , x) ≤ d(an , bn ) + d(bn , x) < + dA (x) +
2n 2n
⇒ dA (x) ≤ dA (x)

et on a bien dA = dA sur X.
(iii) Si x ∈ A, on a dA (x) = 0 et ΠA (x) = {x}. Sinon, par définition de
l’infimum, pour tout n ≥ 1, il existe an ∈ A tel que

1 1
inf d(a, x) ≤ d(an , x) < inf d(a, x) + ⇒ 0 ≤ d(an , x) − inf d(a, x) <
a∈A a∈A n a∈A n

et la suite {d(an , x)} converge vers dA (x). Comme cette suite est bornée dans R,
la suite {an } est aussi bornée dans Rn . Par le Théorème 6.2 (c) du Chapitre 3, de
toute suite bornée dans Rn , on peut extraire une sous-suite convergente : il existe
p ∈ Rn et {ank } tel que ank → p et donc la limite p ∈ A. Enfin, par continuité de
la métrique,

d(ank , x) → d(p, x) et dA (x) = d(p, x)

et, pour chaque x ∈ X, il existe p ∈ A tel que dA (x) = d(p, x).

Théorème 3.12. Soient (X, d) = (Rn , d) l’espace euclidien pour la métrique d


correspondant à une norme, A, ∅ 6= A ⊂ X, fermé et f : (A, d) → R une fonction
continue sur A.
(i) On suppose qu’il existe deux réels λ < µ tel que

∀a ∈ A, λ < f (a) < µ. (3.24)

Alors la fonction 10


 f (x), si x ∈ A,
déf  
F (x) = d(x, a) (3.25)
 inf f (a) +
 a∈A −1 , si x ∈ X\A,
dA (x))

est un prolongement continu de f à X tel que

∀x ∈ X, λ < F (x) < µ. (3.26)

(ii) Toute application continue f : A → Rn possède un prolongement continu


sur X.

Démonstration. On procède en trois étapes pour démontrer (i).

10. C’est le prolongement utilisé par F. Hausdorff [1, p. 296] en 1919 pour démontrer ce
théorème (voir aussi R. Engelking [1, exercice 4.1.F, p. 247, Théorème 2.1.8]).
3. Fonctions continues 131

(a) On démontre d’abord que la fonction F est bien définie et qu’elle vérifie
les inégalités (3.26). La fonction F est bien définie pour x ∈ A. Pour x ∈ X\A,
comme A est fermė, on a d(x, a) ≥ dA (x) > 0 et

d(x, a)
∀a ∈ A, f (a) + − 1 ≥ f (a) > λ.
dA (x)

Comme cette fonction est bornée inférieurement, son infimum, F (x), par rapport à
A, appartient à R. La fonction F est donc bien définie et
 
d(x, a)
F (x) = inf f (a) + − 1 ≥ inf f (a) ≥ λ.
a∈A dA (x) a∈A

Par hypothèse, pour tout x ∈ A, F (x) = f (x) > λ. Mais l’inégalité est aussi stricte
en tout point x ∈ X\A car dA (x) > 0. Sinon, F (x) = λ et, par définition de
l’infimum, pour tout n ≥ 1, il existe an ∈ A tel que

d(x, an ) 1
λ ≤ f (an ) + −1<λ+ .
dA (x) n

Comme f (an ) > λ et d(x, an )/dA (x) − 1 ≥ 0,

f (an ) → λ et d(x, an ) → dA (x).

Comme la suite {d(x, an )} est bornée la suite {an } l’est aussi. Du Lemme 3.1 (iii),
il existe une sous-suite {ank } ⊂ A et p ∈ A tel que ank → p et d(x, ank ) → d(x, p) =
dA (x). Par continuité de f sur A, il vient aussi f (ank ) → f (p) et on obtient la
contradiction λ < f (p) = λ. Pour la borne supérieure, comme il existe p ∈ A tel
que d(x, p) = dA (x),
 
d(x, a) d(x, p)
F (x) = inf f (a) + − 1 ≤ f (p) + − 1 = f (p) < µ.
a∈A dA (x) dA (x)

(b) F continu sur X\A. Comme X\A est un ouvert, en tout point x ∈ X\A,
il existe r > 0 tel que B2r (x) ⊂ X\A. On a donc

dA (x) = inf d(x, a) ≥ 2r.


a∈A

Pour tout y ∈ Br (x)

d(a, y) ≥ d(a, x) − d(y, x) ≥ dA (x) − d(y, x)


⇒ dA (y) = inf d(a, y) ≥ dA (x) − d(y, x) > 2r − d(y, x) > 2r − r = r
a∈A

⇒ inf dA (y) > r > 0.


y∈Br (x)
132 Chapitre 4. Fonctions, limites et continuités

Soit y ∈ Br (x). Par définition de l’infimum, pour tout ε > 0,


d(aε , y)
∃aε ∈ A tel que F (y) ≤ f (aε ) + − 1 < F (y) + ε ≤ µ + ε
dA (y)
d(aε , y) d(aε , y)
⇒ λ+ − 1 ≤ f (aε ) + − 1 < F (y) + ε ≤ µ + ε
dA (y) dA (y)
⇒ d(aε , y) ≤ [µ − λ + 1 + ε] dA (y) < [µ − λ + 1 + ε] dA (y)
⇒ d(aε , y) < [µ − λ + 1 + ε] [dA (x) + d(x, y)]
< [µ − λ + 1 + ε] [dA (x) + r] .
On pose
déf
c(ε) = [µ − λ + 1 + ε] [dA (x) + r] > dA (x) + r ≥ 3r
⇒ d(aε , y) < c(ε).

Soient y, z ∈ Br (x) et le aε ∈ A asspcié à y et ε


d(z, aε ) d(y, aε ) d(z, aε ) d(y, aε )
F (z) ≤ f (aε ) + − 1 = f (aε ) + −1+ − .
dA (z) dA (y) dA (z) dA (y)
On estime
d(z, aε ) d(y, aε ) d(z, y) + d(y, aε ) d(y, aε )
− ≤ −
dA (z) dA (y) dA (z) dA (y)
 
d(z, y) 1 1
= + d(y, aε ) −
dA (z) dA (z) dA (y)
 
d(z, y) dA (y) − dA (z)
≤ + d(y, aε )
r dA (z) dA (y)
d(z, y) d(z, y)
≤ + d(y, aε )
 r  r2
1 c(ε)
≤ + 2 d(z, y).
r r
On obtient donc pour tout ε > 0
 
1 c(ε)
F (z) ≤ F (y) + ε + + 2 d(z, y).
r r
En laissant ε tendre vers 0, on obtient finalement
 
1 [µ − λ + 1] [dA (x) + r]
F (z) − F (y) ≤ + d(z, y).
r r2
Comme la constante est indépendante de y et z, on peut changer leurs rôles et il
vient
 
1 [µ − λ + 1] [dA (x) + r]
|F (z) − F (y)| ≤ + d(z, y),
r r2
3. Fonctions continues 133

d’où la continuité uniforme de F sur Br (x) et en particulier en x.


(c) Il reste à établir la continuité en un point frontière x ∈ ∂A. Soient x ∈ ∂A
et une suite {yn } convergeant vers x dans (X, d), c’est-à-dire, d(yn , x) → 0. On
extrait de cette suite deux sous-suites {ynk } ⊂ A et {yn′k } ⊂ X\A en séparant les
éléments qui appartiennent à A de ceux qui appartiennent à X\A. L’une ou l’autre
de ces sous-suites contient un nombre infini d’éléments. Si c’est {ynk }, alors ynk → x
et, par continuité de f sur A, f (ynk ) → f (x). L’autre cas est moins immédiat.
Soit une suite {yn } ⊂ X\A convergeant vers x dans (X, d), c’est-à-dire,
d(yn , x) → 0. On veut démontrer que F (yn ) → f (x). On construit la suite sui-
vante : par définition de l’infimum, pour tout entier n ≥ 1 il existe an ∈ A tel
que

d(an , yn ) 1
F (yn ) ≤ f (an ) + − 1 < F (yn ) + . (3.27)
dA (yn ) n

De là

d(an , yn ) 1
0≤ < F (yn ) − f (an ) + 1 + ≤ µ − λ + 2
dA (yn ) n
⇒ d(an , yn ) < (µ − λ + 2) dA (yn ) ≤ (µ − λ + 2) d(x, yn )
⇒ d(an , x) ≤ d(an , yn ) + d(yn , x) ≤ (µ − λ + 3) d(x, yn ).

Comme yn → x, il vient an → x et par continuité f (an ) → f (x).


Comme on a déjà établi que F est borné inférieurement par λ et supérieure-
ment par µ,

λ ≤ F (yn ) ≤ µ.

Il existe donc F̂ ∈ R et une sous-suite {F (ynk } telle que F (ynk ) → F̂ . De là, comme
d(an ,yn )
dA (yn ) − 1 ≥ 0,

d(ank , ynk ) 1
f (ank ) ≤ f (ank ) + − 1 < F (ynk ) + ⇒ f (x) ≤ F̂ .
dA (ynk ) nk

Pour démontrer l’inégalité dans l’autre sens, par définition de dA (ynk ) en tant qu’in-
fimum sur A, il existe bnk ∈ A tel que
 
1
0 < dA (ynk ) ≤ d(bnk , ynk ) < 1+ dA (ynk ) (3.28)
k
 
1
⇒ d(bnk , x) ≤ d(bnk , ynk ) + d(ynk , x) < 1 + dA (ynk ) + d(ynk , x)
k
 
1
≤ 2+ d(ynk , x)
k
⇒ bnk → x et f (bnk ) → f (x). (3.29)
134 Chapitre 4. Fonctions, limites et continuités

Comme F est un infimum par rapport à A, en utilisant (3.28) et (3.29)


 
d(bnk , ynk ) 1
F (ynk ) ≤ f (bnk ) + − 1 ≤ f (bnk ) + 1 + −1 (3.30)
dA (ynk ) k
1
⇒ F̂ = lim F (ynk ) ≤ lim f (bnk ) + lim = f (x) ⇒ F̂ ≤ f (x). (3.31)
k→∞ k→∞ k→∞ k

En combinant ceci avec le résultat précédent, il vient F̂ = f (x). Donc, comme toute
sous-suite convergente de {F (yn )} converge vers f (x), on en conclut que toute la
suite converge, c’est-à-dire, F (yn ) → f (x), ce qui complète la démonstration de la
continuité du prolongement F sur X.
(ii) Pour une application f : A → R, on utilise l’homéomorphisme (3.16) de
l’Exemple 3.5
déf z
z 7→ h(z) = : R → ] − 1, 1[ .
! + |z|

On associe à la fonction f : A → R continue sur A, la nouvelle fonction continue


déf
x 7→ f˜(x) = h(f (x)) : A → ] − 1, 1[

qui satisfait les hypothèses de la partie (i) avec λ = −1, µ = +1. On obtient alors
un prolongement Fe : X → ] − 1, 1[ . Il suffit ensuite de revenir en introduisant la
fonction F = h−1 ◦ Fe continue sur X pour laquelle

F |A = (h−1 ◦ Fe )|A = h−1 ◦ Fe|A = h−1 ◦ (h ◦ f ) = f.

On obtient donc bien un prolongement continu F de f à X.


Pour une application f : A → Rn , on applique ce qui précède composante par
composante.

4 Continuité et compacité
Définition 4.1.
Une fonction f : (X, dX ) → (Y, dY ) est bornée sur un sous-ensemble E de X, s’il
existe x0 ∈ E et M > 0 tel que f (E) ⊂ BM (f (x0 )).

Lorsque (Y, dY ) = (Rn , dp ), dp (x, y) = kx − ykp , 1 ≤ p ≤ ∞, on peut remplacer


f (x0 ) par 0 ∈ Rn , c’est-à-dire,

∃M > 0, ∀x ∈ E, kf (x)kp ≤ M.

La continuité préserve la compacité.

Théorème 4.1. Soit f : (X, dX ) → (Y, dY ) continue. Si X est compact, alors f (X)
est compact dans (Y, dY ). En particulier, f (X) est fermée et bornée et l’application
f est bornée sur X.
4. Continuité et compacité 135

Démonstration. Soit {Gα } un recouvrement ouvert de f (X). Comme f est continue


f −1 (Gα ) est ouvert. Du Théorème 1.1 (1)

f −1 (∪α Gα ) = ∪α f −1 (Gα )
f (X) ⊂ ∪α Gα ⇒ f −1 [f (X)] ⊂ f −1 [∪α Gα ] ⊂ ∪α f −1 (Gα ).

Par le Théorème 1.3 (1)

X ⊂ f −1 [f (X)] ⊂ ∪α f −1 (Gα ).

La famille {f −1 (Gα )} est donc un recouvrement ouvert du compact X. Il existe


donc un sous-recouvrement fini

X ⊂ ∪ni=1 f −1 (Gαi ) = ∪ni=1 X ∩ f −1 (Gαi )


   
⇒ f (X) ⊂ f ∪ni=1 X ∩ f −1 (Gαi ) = ∪ni=1 f X ∩ f −1 (Gαi ) .
 
Par le Théorème 1.3 (2), f X ∩ f −1 (Gαi ) = f (X) ∩ Gαi et
 
f (X) ⊂ ∪ni=1 f X ∩ f −1 (Gαi ) = ∪ni=1 f (X) ∩ Gαi ⊂ ∪ni=1 Gαi .

On a donc construit un sous-recouvrement fini de f (X) qui est donc compact.

On en déduit le théorème d’existence de Weierstrass.

Théorème 4.2. Soit f : (X, dX ) → (R, dR ) une application continue pour la


métrique dR (x, y) = |x − y|. Si X est compact, alors

∃a ∈ X tel que f (a) = inf f (X) et ∃b ∈ X tel que f (b) = sup f (X). (4.1)

Démonstration. Par compacité de X, f (X) est compact. Il est donc borné et, a for-
tiori, borné inférieurement et supérieurement. Par le Théorème 3.8 et son corollaire
du Chapitre 3

inf f (X) ∈ f (X) et sup f (X) ∈ f (X).

Comme f (X) est aussi fermé, on a

inf f (X) ∈ f (X) et sup f (X) ∈ f (X),

d’où l’existence des points a et b dans X.

Théorème 4.3. Soit f : (X, dX ) → (Y, dY ) une application bijective et continue


sur X. Si X est compact, alors l’application réciproque

f −1 : (Y, dY ) → (X, dX )

est bien définie et continue sur Y .


136 Chapitre 4. Fonctions, limites et continuités

Démonstration. Comme pour une bijection f on a f = (f −1 )−1 , il suffit de démontrer


que pour tout ouvert G dans X, f (G) = (f −1 )−1 (G) est ouvert dans Y . Le complément
X\G de l’ouvert G ⊂ X est fermé dans le compact X. X\G est donc compact
comme sous-ensemble fermé d’un compact. Par le théorème précédent f (X\G) est
compact. Du Théorème 1.1 (3)

f (X\G) = f (X)\f (G) = Y \f (G)

et f (G) est ouvert dans Y comme complement d’un fermé.

Exemple 4.1.
Soient
déf déf
X = [0, 2π[ et Y = {x ∈ R2 : kxk = 1}

et l’application continue et bijective

t 7→ (cos t, sin t) : [0, 2π[ → {x ∈ R2 : kxk = 1}.

L’ensemble X n’est pas compact dans R et l’application réciproque f −1 n’est pas


continue en (1, 0) puisque pour ε > 0 tendant vers 0,
p p
f −1 {( 1 − ε2 , ε)} → 0 et f −1 {( 1 − ε2 , −ε)} → 2π.

L’hypothèse de compacité de X est donc essentielle dans le théorème même si son


image par f , le cercle de rayon 1, est ici compacte dans R2 .

5 Continuité et connexité
On a vu au Chapitre 3 que, comme la compacité et la bornitude, la connexité
est une notion intrinsèque. Elle aussi est préservée par la continuité.
Théorème 5.1. Soit f : (X, dX ) → (Y, dY ) continue. Si E ⊂ X est connexe, alors
f (E) est connexe dans (Y, dY ).
Démonstration. Par l’absurde. Supposons que f (E) = A ∪ B pour deux sous-
ensembles séparés non-vides A et B de Y . Alors

E ⊂ f −1 (f (E)) = f −1 (A ∪ B) = f −1 (A) ∪ f −1 (B)


⇒ E = (E ∩ f −1 (A)) ∪ (E ∩ f −1 (B))

Posons
déf déf
G = E ∩ f −1 (A) et H = E ∩ f −1 (B) ⇒ E =G∪H

par le Théorème 1.1 (1). Comme A et B ne sont pas vides, par le Théorème 1.3 (2)

f (G) = f (E ∩ f −1 (A)) = f (E) ∩ A = A 6= ∅ ⇒ G 6= ∅


−1
f (H) = f (E ∩ f (B)) = f (E) ∩ B = B 6= ∅ ⇒ H 6= ∅
5. Continuité et connexité 137

et G et H ne sont pas vides. Il reste à montrer que G et H sont séparés pour obtenir
une contradiction. Il vient
A⊂A ⇒ f −1 (A) ⊂ f −1 (A) ⇒ G = E ∩ f −1 (A) ⊂ E ∩ f −1 (A)
B⊂B ⇒ f −1 (B) ⊂ f −1 (B) ⇒ H = E ∩ f −1 (B) ⊂ E ∩ f −1 (B)

Comme f est continue, par le Théorème 3.3, f −1 (A) et f −1 (B) sont fermés et
G ⊂ E ∩ f −1 (A) ⊂ E ∩ f −1 (A) ⇒ G ⊂ E ∩ f −1 (A)
H ⊂ E ∩ f −1 (B) ⊂ E ∩ f −1 (B) ⇒ H ⊂ E ∩ f −1 (B).
Enfin, par le Théorème 1.1 (2)
  
G ∩ H ⊂ (E ∩ f −1 A) ∩ E ∩ f −1 (B) = (E ∩ E) ∩ f −1 (A) ∩ f −1 (B)

= E ∩ f −1 (A ∩ B) = ∅
  
H ∩ G ⊂ (E ∩ f −1 B) ∩ E ∩ f −1 (A) = (E ∩ E) ∩ f −1 (B) ∩ f −1 (A)

= E ∩ f −1 (B ∩ A) = ∅
⇒ G∩H =∅ et G ∩ H = ∅.
G et H sont bien séparés ce qui contredit le fait que E est connexe.
On obtient ainsi le Théorème des valeurs intermédiaires.
Théorème 5.2. Soit f : [a, b] → R, a < b, continue sur [a, b].
(i) Si f (a < f (b), alors
∀c, f (a) < c < f (b) ⇒ ∃x, a < x < b, tel que f (x) = c.

(ii) Si f (a > f (b), alors


∀c, f (a) > c > f (b) ⇒ ∃x, a < x < b, tel que f (x) = c.

Démonstration. (i) Comme [a, b] est connexe, f ([a, b]) est connexe. Par le Théorème
9.2 du Chapitre 3, tout c tel que f (a) < c < f (b) appartient à f ([a, b]). Il existe
donc x ∈ [a, b] tel que f (x) = c. Comme f (a) < f (x) < f (b), x ne peut être a ou b.
(ii) Même démonstration.
La réciproque de ce théorème n’est pas vraie. On peut avoir la propriété des
valeurs intermédiaires sans que f soit continue.

Exemple 5.1.
La fonction f : [−2, 2] → R possède la propriété des valeurs intermédiaires sur
[−2, 2], mais n’est pas continue en x = −1 et x = 1


 x, − 2 ≤ x ≤ −1
déf
f (x) = − x, −1<x<1 (5.1)


x, 1 ≤ x ≤ 2.
138 Chapitre 4. Fonctions, limites et continuités

Avant de terminer, considérons l’ensemble à deux éléments {0, 1} qui n’est pas
connexe pour la métrique d(x, y) = |x − y| et la famille des fonctions
f : (X, d) → {0, 1}. (5.2)
Si X est connexe et non vide et f est continue sur X, son image f (X) doit être
connexe. Elle ne peut donc être que {0} ou {1}. Ceci signifie que si X est connexe,
il n’existe pas de fonction continue et surjective de (X, d) dans {0, 1}.
La réciproque est vraie et donne une nouvelle caractérisation de la connexité
qui s’ajoute à celles du Corollaire 1 au Théorème 9.1 du Chapitre 3.
Théorème 5.3. (X, d) est connexe si et seulement si il n’existe pas d’application
continue et surjective de (X, d) dans {0, 1}.
Démonstration. Il suffit de démontrer la réciproque. Supposons que X ne soit pas
connexe, alors, par le Théorème 9.1 du Chapitre 3, il existe E, ∅ 6= E $ X, qui est
à la fois ouvert et fermé dans (X, d). La fonction surjective
( )
déf 1, si x ∈ E
x 7→ χE (x) = : (X, d) → {0, 1}
0, si x ∈ X\E

est donc surjective. Dans {0, 1}, les ouverts sont ∅, {0}, {1}, et {0, 1}. Les images
inverses
f −1 (∅) = ∅, f −1 ({1}) = E, f −1 ({0}) = X\E, f −1 ({0, 1}) = X
sont toutes des sous-ensembles ouverts de X car, E étant ouvert et fermé, X\E
est ouvert. L’application surjective χE est donc continue ce qui contredit notre
hypothèse.

Remarque 5.1.
La fonction χE est appelée fonction caractéristique de E. À toute fonction f :
(X, d) → {0, 1} on peut associer l’ensemble
déf
E = {x ∈ X : f (x) = 1}
et la fonction caractéristique χE pour laquelle f = χE . Il y a donc une bijection
entre l’ensemble des fonctions caractéristiques et l’ensemble P(X) :
déf
E 7→ χE : P(X) → {0, 1}X = {χE : E ⊂ X}. (5.3)

La notation {0, 1}X peut être interprétée comme une extension de la notation du
produit {0, 1}n de n copies de {0, 1}.

6 Fonctions uniformément continues


6.1 Définitions et propriétés
Définition 6.1.
Une fonction f : (X, dX ) → (Y, dY ) entre deux espaces métriques est uniformément
6. Fonctions uniformément continues 139

continue sur E ⊂ X si, pour tout ε > 0, il existe δ > 0 tel que

∀x, x′ ∈ E pour lesquels dX (x′ , x) < δ, dY (f (x′ ), f (x)) < ε.

Une fonction uniformément continue sur E est continue sur E, mais la réciproque
n’est pas vraie comme le montre l’exemple de la fonction

f (x) = 1/x, x ∈ X = R+ = {x ∈ R : x > 0}, (6.1)

qui n’est pas uniformément continue sur ]0, 1], mais qui est uniformément continue
sur [1, +∞). La fonction f (x) = x sur R est uniformément continue mais pas bornée
sur R.

Exemple 6.1 (Fonction distance).


Par le Lemme 3.1, la fonction distance dA associée à un sous-ensemble non-vide A
de l’espace métrique (X, d) est uniformément continue sur X.

Théorème 6.1. Soit f : (X, dX ) → (Y, dY ) continue sur X. Si X est compact,


alors f est uniformément continue sur X.
Démonstration. Soit ε > 0. Comme f est continue en chaque point x ∈ X,
ε
∃δ(ε, x) > 0 tel que ∀x′ ∈ X, dX (x′ x) < δ(ε, x), dY (f (x′ ), f (x)) < . (6.2)
2
La famille de boules {Bδ(ε,x)/2 (x) : x ∈ X} forme un recouvrement ouvert du
compact X. Il existe donc un sous-recouvrement fini

X ⊂ ∪m
i=1 Bδ(ε,xi )/2 (xi ).

On choisit

δ = min {δ(ε, xi )/2} > 0


1≤i≤m

puisque le minimum est pris par rapport à un nombre fini de scalaires strictement
positifs. Ayant construit un δ correspondant au ε, on vérifie maintenant la continuité
uniforme. Soient x′ , x ∈ X tel que dX (x′ , x) < δ. Comme il y a recouvrement fini,
il existe xi ∈ X tel que x ∈ Bδ(ε,xi )/2 (xi ) et donc

δ(ε, xi )
dX (x′ , xi ) ≤ dX (x′ , x) + dX (x, xi ) ≤ δ + < δ(ε, xi )
2
ε
⇒ dY (f (x′ ), f (xi )) < .
2
De là, pour x′ , x ∈ X tel que dX (x′ , x) < δ,
ε ε
dY (f (x′ ), f (x)) < dY (f (x′ ), f (xi )) + dY (f (xi ), f (x)) < + =ε
2 2
ce qui donne bien la continuité uniforme.
140 Chapitre 4. Fonctions, limites et continuités

La compacité est essentielle comme le montrent les exemples suivants.

Exemple 6.2 (E borné mais pas compact dans Rk ).


Il existe donc un point d’accumulation a de E qui n’appartienne pas à E.
(i) La fonction
déf 1
x 7→ f (x) = : B1′ (a) → R
kx − ak
est continue sur E = B1′ (a), mais pas bornée et pas uniformément continue.
(ii) La fonction
déf 1
x 7→ f (x) = : B1′ (a) → R
1 + kx − ak
est continue et bornée par 1 sur E = B1′ (a), f (B1′ (a)) = (1/2, 1), mais il
n’existe pas de point de E = B1′ (a) qui réalise le sup f (E) = 1.

Exemple 6.3 (E fermé, mais pas borné dans Rk ). (i) La fonction


déf
x 7→ f (x) = x : R → R
est uniformément continue sur E = R, mais non-bornée.
(ii) La fonction
déf
x 7→ f (x) = 1 − e−x : R+ → R+ , R+ = {x ∈ R : x ≥ 0}
est continue er bornée sur E = R+ , f (R+ ) = (0, 1], mais il n’existe pas de
point de E = R+ qui réalise le inf f (E) = 0.
(iii) Toute fonction f : Z → R est uniformément continue pour δ < 1.

La continuité uniforme est suffisante pour transporter les suites de Cauchy en


suites de Cauchy. En effet, la fonction x 7→ f (x) = 1/x : ]0, 1[ → R est continue sur
]0, 1[ . La suite {1/(2n)} est Cauchy dans ]0, 1[ , mais la suite {f (1/(2n)} = {2n}
n’est pas Cauchy dans R.
Théorème 6.2. Soit f : (X, dX ) → (Y, dY ) une application uniformément continue
sur E ⊂ X. La suite {f (xn )} image d’une suite de Cauchy {xn } dans (E, dX ) est
une suite de Cauchy dans (f (E), dY ).
Démonstration. Soit {xn } une suite de Cauchy dans (E, dX ). Par continuité uni-
forme sur E, pour tout ε > 0, il existe δ > 0 tel que
∀n, m ≥ 1 tel que dX (xn , xm ) < δ, dY (f (xn , xm ) < ε.
Comme la suite {xn } est de Cauchy, il existe N ≥ 1 tel que
∀n, m > N, dX (xn , xm ) < δ.
Donc, pour tout ε > 0, il existe N ≥ 1 tel que
∀n, m > N, dY (f (xn ), f (xm )) < ε.
La suite {f (xn )} est Cauchy dans (Y, dY ).
6. Fonctions uniformément continues 141

Remarque 6.1.
La composition g ◦ f de deux fonctions f : (X, dX ) → (Y, dY ) uniformément conti-
nue sur E ⊂ X et g : (Y, dY ) → (Z, dZ ) uniformément continue sur f (E) ⊂ Y
est uniformément continue sur X (voir Exercice 10.11). Les opérations habituelles
préservent la continuité uniforme sur un sous-ensemble E de (X, dX ) : pour f, g :
(X, dX ) → R
déf déf
(f + g)(x) = f (x) + g(x) et ∀α ∈ R, (αf )(x) = α f (x).

6.2 Prolongement uniformément continu


Les fonctions uniformément continues sur un sous-ensemble E d’un espace
métrique (X, dX ) ont aussi une propriété fort intéressante : elles possèdent un pro-
longement uniformément continu sur l’adhérence E de E dans (X, dX ) et, si E = X
b de X.
n’est pas complet, sur le complété X
Théorème 6.3. Soit f : (X, dX ) → (Y, dY ), où (Y, dY ) est un espace métrique
complet.
(i) Si f est uniformément continue sur un sous-ensemble E de X, alors il
existe un prolongement unique f¯ : (E, dX ) → (Y, dY ) uniformément continu
sur E.
b dˆX ) le complété de (X, dX ). 11 Si f est uniformément continue
(ii) Soit (X,
b dˆX ) → (Y, dY )
sur (X, dX ), alors il existe un prolongement unique fˆ : (X,
uniformément continu sur X. b

Démonstration. (i) Soit x ∈ X un point d’accumulation de E dans (X, dX ) qui ne


soit pas dans E. Alors, on peut construire une suite de Cauchy {xn } ⊂ E, xn 6= x,
en choisissant pour chaque n ≥ 1

xn ∈ E ∩ B1/n (x).

Par le Théorème 6.2, la suite {f (xn )} ⊂ f (E) est Cauchy dans (Y, dY ). Comme
(Y, dY ) est complet, la suite {f (xn )} converges vers un point y ∈ Y . Ce point
est unique car toutes les suites de Cauchy {xn } ⊂ E convergeant vers x sont
équivalentes. Par continuité uniforme, les suites de Cauchy {f (xn )} ⊂ f (E) sont
aussi équivalentes et elles ont donc toutes la même limite y. On pose f¯(x) = y ce
qui définit f¯ uniquement en tout point d’accumulation de E qui n’est pas dans E.
Par hypothèse, f¯ = f est continue en tout point de E et, par construction, f¯ est
continue en tout point d’accumulation de E qui n’appartient pas à E.
b = S/R est l’ensemble de toutes les
11. Voir la définition donnée en (6.7) au Chapitre 3. X
classes d’équivalence de suites de Cauchy dans (X, dX ) et l’application
déf b
x 7→ ϕ(x) = R{x} : X → X. (6.3)
b dˆX ).
est une isométrie de (X, dX ) sur l’image X0 = ϕ(X) de X par ϕ dans (X,
142 Chapitre 4. Fonctions, limites et continuités

Il reste à montrer que f¯ est uniformément continue sur E. Comme f est


uniformément continue sur E, pour tout ε > 0, il existe δ > 0 tel que

∀x1 , x2 ∈ E tel que dX (x1 .x2 ) < 3δ, dY (f (x1 ), f (x2 )) < ε/3.

Soient x̄1 , x̄2 ∈ E tel que dX (x̄1 , x̄2 ) < δ. Par construction de f¯, il existe x1 , x2 ∈ E
tel que

dX (x̄2 , x2 ) < δ et dY (f (x̄2 ), f (x2 )) < ε/3


dX (x̄1 , x1 ) < δ et dY (f (x̄1 ), f (x1 )) < ε/3.

Ceci entraı̂ne

dX (x1 , x2 ) ≤ dX (x1 , x̄1 ) + dX (x̄1 , x̄2 ) + dX (x̄2 , x2 ) < δ + δ + δ = 3δ

et par continuité uniforme sur E

dY (f (x1 ), f (x2 )) < ε/3.

Finalement,

dY (f (x̄2 ), f (x̄1 )) ≤ dY (f (x̄2 ), f (x2 )) + dY (f (x2 ), f (x1 )) + dY (f (x1 ), f (x̄1 ))


< ε/3 + ε/3 + ε/3 = ε.

On a bien la continuité uniforme sur E.


b au Théorème 6.5 du Chapitre 3, l’image
(ii) Par construction du complété X
b
X0 = ϕ(X) de X dans X par l’isométrie ϕ est dense dans X b : X0 = X.b Comme ϕ
est une isométrie, ϕ est un homéomorphisme de X sur X0 . En particulier, ϕ−1 est
continue sur X0 . On applique donc la première partie du théorème à l’application
f ◦ ϕ−1 : (ϕ(X), d) ˆ → (Y, dY ). Cette application est uniformément continue sur
ϕ(X) car, par isométrie,

dX (x1 , x2 ) = dXb (ϕ(x1 ), ϕ(x2 )) < δ


−1
⇒ dY (f ◦ ϕ (ϕ(x1 )), f ◦ ϕ−1 (ϕ(x2 )) = dY (f (x1 ), f (x2 )) < ε.

7 Fonctions lipschitziennes
7.1 Définitions et propriétés
Définition 7.1.
Soit une fonction f : (X, dX ) → (Y, dY ) entre deux espaces métriques.
(i) f est lipschitzienne en x ∈ X s’il existe une constante c(x) > 0 et un rayon
r(x) > 0 tel que

∀x1 , x2 ∈ Br(x) (x), dY (f (x1 ), f (x2 )) ≤ c(x) dX (x1 , x2 ).


7. Fonctions lipschitziennes 143

(ii) f est lipschitzienne sur un sous-ensemble E de X s’il existe c(E) > 0 tel
que

∀x1 , x2 ∈ E, dY (f (x1 ), f (x2 )) ≤ c(E) dX (x1 , x2 ).

On associe à f et E la plus petite constante de Lipschitz

déf dY (f (x1 ), f (x2 ))


Lip (f, E) = sup . (7.1)
x1 ,x2 ∈E dX (x1 , x2 )
x1 6=x2

Il vient immédiatement.

Théorème 7.1. Une fonction f : (X, dX ) → (Y, dY ) lipschizienne sur E ⊂ X est


uniformément continue sur E.

Démonstration. Pour ε > 0, on prend δ = ε/c(E) > 0.

Exemple 7.1.
La norme x 7→ f (x) = kxk2 : (Rn , d2 ) → (R, dR ) est lipschitzienne sur (Rn , d2 ) de
constante c(Rn ) = 1 pour les métriques d2 (x, y) = kx − yk2 et dR (a, b) = |a − b|
puisque

∀y, z ∈ Rn , dR (f (y), f (z)) = |f (y) − f (z)| = |kyk2 − kzk2|


≤ ky − zk2 = d2 (y, z).

La fonction f (x) = kxk22 est lipschitzienne en x ∈ Rn puisque pour tout r > 0

∀y, z ∈ Br (x), |f (y) − f (z)| = kyk22 − kzk22


≤ ky + zk2 ky − zk2 ≤ 2(r + kxk2 )ky − zk2 ,

pour la constante locale c(x) = 2(r + kxk2 ).

Exemple 7.2 (Fonction distance).


Soit dA la fonction distance associée à un sous-ensemble non-vide A de l’espace
métrique (X, d). Par le Lemme 3.1, dA est une fonction lipschizienne sur (X, dX )
de constante c(X) = 1.

Remarque 7.1.
La composition g ◦ f de deux fonctions f : (X, dX ) → (Y, dY ) lipschitzienne en
x ∈ X et g : (Y, dY ) → (Z, dZ ) lipschitzienne en f (x) ∈ Y est lipschitzienne en
x ∈ X (voir Exercice 10.11). Les opérations habituelles préservent la continuité
lipschitzienne sur un sous-ensemble E de (X, dX ) : pour f, g : (X, dX ) → Rn

déf déf
(f + g)(x) = f (x) + g(x) et ∀α ∈ R, (αf )(x) = α f (x).
144 Chapitre 4. Fonctions, limites et continuités

7.2 Prolongement lipschitzien


Théorème 7.2. Soient E un sous-ensemble non-vide d’un espace métrique (X, dX )
et, pour chaque entier k ≥ 1, la métrique d2 (y1 , y2 ) = ky1 − y2 k2 sur Rk associée à
la norme euclidienne
( k )1/2
X 2
kyk2 = |xi | .
i=1

(i) Étant donné une fonction f : (E, dX ) → R lipschitzienne sur E de constante


Lip (f, E), la fonction
déf
x 7→ F (x) = inf {f (a) + Lip (f, E) dX (x, a)} : (X, dX ) → R (7.2)
a∈E

est un prolongement lipschitzien de f à X de constante Lip (F, X) =


Lip (f, E).
(ii) Étant donné une fonction f : (E, dX ) → (Rk , d2 ) lipschitzienne sur E, il
existe un prolongement √lipschitzien F : (X, dX ) → (Rk , d2 ) de f à X de
constante Lip (F, X) ≤ k Lip (f, E).
Démonstration. (i) La fonction a 7→ f (a) + Lip (f, E) dX (x, a) : E → R est bornée
inférieurement puisque pour tout a et b dans A
f (a) ≥ f (b) − Lip (f, E) dX (b, a)
≥ f (b) − Lip (f, E) [dX (x, a) + dX (b, x)]
⇒ f (a) + Lip (f, E) dX (x, a) ≥ f (b) − Lip (f, E) dX (b, x)
⇒ inf {f (a) + Lip (f, E) dX (x, a)} ≥ f (b) − Lip (f, E) dX (b, x).
a∈A

L’infimum appartient donc bien à R et l’application x 7→ F (x) : X → R est bien


définie.
On vérifie maintenant que c’est un prolongement. Si b ∈ E,

F (b) = inf {f (a) + Lip (f, E) dX (b, a)} ≤ f (b) + Lip (f, E) dX (b, b) = f (b).
a∈E

Comme f est lipschitzienne sur E, on a aussi pour tout a ∈ E

f (b) ≤ f (a) + Lip (f, E) dX (b, a)


⇒ f (b) ≤ inf {f (a) + Lip (f, E) dX (b, a)} = F (b).
a∈E

On obtient F (b) = f (b) sur E. F est donc bien un prolongement de f à X.


Enfin, F est lipschitzienne sur X. Pour x, y ∈ X, par l’inégalité du triangle

{f (a) + Lip (f, E) dX (y, a)} ≤ {f (a) + Lip (f, E) dX (x, a)} + Lip (f, E) dX (y, x).

En prenant l’infimum par rapport à a ∈ A de chaque côté

F (y) ≤ F (x) + Lip (f, E) dX (y, x).


8. Application contractante et théorème du point fixe 145

En intercheangeant les rôles de x et y, il vient


|F (y) − F (x)| ≤ Lip (f, E) dX (y, x).
(ii) Lorsque k > 1, chaque composante de f = (f1 , . . . , fk ) vérifie
∀x, y ∈ E, |fi (y) − fi (x)| ≤ kf (y) − f (x)kRk ≤ c(f, E) dX (y, x).
On associe donc à chaque composante fi le prolongement Fi de la partie (ii) pour
lequel
|Fi (x) − Fi (y)| ≤ Lip (f, E) dX (x, y).

Ceci donne un prolongement F = (F1 , . . . , Fk ) : (X, dX ) → Rk de f à X tel que


k
X k
X
|Fi (x) − Fi (y)|2 ≤ (Lip (f, E) dX (x, y))2
i=1 i=1

⇒ kF (x) − F (y)kRk ≤ k Lip (f, E) dX (x, y).

Remarque 7.2.
On peut améliorer l’estimé de la constante de Lipschitz du prolongement de la partie
(ii). Le théorème de M. D. Kirszbraun [1] 12 affirme que pour un sous-ensemble
E d’un espace de Hilbert H1 et une fonction lipschitzienne f : U → H2 , H2 un
autre espace de Hilbert, sur U , il existe un prolongement F : H1 → H2 lipschitzien
avec la même constante de Lipschitz : Lip (F, H1 ) = Lip (f, E). On a comme cas
particulier les espaces euclidiens H1 = Rn et H2 = Rk . C’est sous cette forme que
Kirszbraun démontra initiallement son résultat. La version hilbertienne se trouve
par exemple dans J. T. Schwartz [1, p. 21]. En général, ce résultat n’est pas vrai
dans les espaces de Banach même s’ils sont de dimension finie comme Rk , k > 1,
équipé de la norme
( k )1/p
déf
X
kxkℓp (Rk ) = |xi |p , p 6= 2
i=1

(J. T. Schwartz [1, p. 20]).

8 Application contractante et théorème du point fixe


Définition 8.1.
Soit (X, d) un espace métrique. L’application ϕ : (X, d) → (X, d) est dite contrac-
tante ou est une contraction si
∃k, 0 < k < 1, ∀x, y ∈ X, d(ϕ(x), ϕ(y)) ≤ k d(x, y). (8.1)

12. Le théorème fut démontré par Mojzesz David Kirszbraunc (1903 ou 1904–1942), et plus
tard de nouveau par Frederick A. Valentine (1911– 2002) (cf. F. A. Valentine [1, 2]).
146 Chapitre 4. Fonctions, limites et continuités

Les applications contractantes sont donc des applications lipschitziennes d’un espace
métrique dans lui même.
Théorème 8.1. Soient (X, d) un espace métrique complet et ϕ : (X, d) → (X, d)
une application contractante. Alors
∃x ∈ X tel que ϕ(x) = x
et ce point est unique.
Démonstration. Soit x0 ∈ X un point quelconque. On construit la suite suivante :
x1 = ϕ(x0 ), x2 = ϕ(x1 ), ... , xn+1 = ϕ(xn ), ...
Soit k, 0 < k < 1, la constante telle que
∀x, y ∈ X, d(ϕ(x), ϕ(y)) ≤ k d(x, y).
On vérifie que
d(x2 , x1 ) = d(ϕ(x1 ), ϕ(x0 )) ≤ k d(x1 , x0 ),
d(x3 , x2 ) = d(ϕ(x2 ), ϕ(x1 )) ≤ k d(x2 , x1 ) ≤ k 2 d(x1 , x0 ),
d(x4 , x3 ) = d(ϕ(x3 ), ϕ(x2 )) ≤ k d(x3 , x2 ) ≤ k 3 d(x1 , x0 ),
...
d(xn+1 , xn ) ≤ k n d(x1 , x0 ).
On a ainsi construit une suite {xn } qui est de Cauchy : pour n < m
m
X m
X kn
d(xn , xm ) ≤ d(xi , xi−1 ) ≤ k i−1 d(x1 , x0 ) ≤ d(x1 , x0 ).
i=n+1 i=n+1
1−k

Comme X est complet, il existe un point x ∈ X tel que xn → x. L’application ϕ


est lipschitzienne sur X de constante k. Elle est donc continue et
ϕ(x) = lim ϕ(xn ) = lim xn+1 = x.
n→∞ n→∞

Le point x est unique, car s’il y en avait un autre y 6= x, on aurait d(x, y) 6= 0 et


ϕ(x) = x et ϕ(y) = y ⇒ d(x, y) = d(ϕ(x), ϕ(y)) ≤ k d(x, y) ⇒ k≥1
ce qui contredit l’hypothèse du théorème.

9 Fonctions d’une variable réelle


9.1 Limites à gauche, limites à droite, discontinuités
Comme les réels forment un ensemble ordonné que l’on peut identifier à la
droite orientée, on peut distinguer la gauche de la droite et introduire la notion de
limite à gauche et de limite à droite d’une fonction f : R → (Y, d) en un point x0 ∈ R
comme cas particulier de la notion de limite de la Définition 2.1 où l’ensemble E
serait {x ∈ R : x < x0 } pour la gauche et {x ∈ R : x > x0 } pour la droite.
9. Fonctions d’une variable réelle 147

Définition 9.1.
Soit f : R → (Y, d) et x0 ∈ R.
(i) f possède une limite à gauche en x0 si

lim f (x) (9.1)


x<x0
x→x0

existe. On l’écrira alors

f (x0 − ) ou lim f (x). (9.2)


x→x−
0

(ii) f possède une limite à droite en x0 si

lim f (x) (9.3)


x>x0
x→x0

existe. On l’écrira alors

f (x0 + ) ou lim f (x). (9.4)


x→x+
0

On en déduit que

lim f (x) existe


x→x0
⇐⇒ f (x0 + ) et f (x0 − ) existent et f (x0 + ) = f (x0 − ).
x∈R

limite limite
à droite à gauche
lim f (x)
x→a−
lim f (x)
x→a+

a a

Définition 9.2.
Soit f : ]a, b[ → (Y, d), a < b, et x ∈ ]a, b[ un point de discontinuité de f .
(i) La fonction f possède un point de discontinuité de la première espèce en
x ∈ ]a, b[ si f (x+ ) et f (x− ) existent.
(ii) La fonction f possède un point de discontinuité de la seconde espèce en
x ∈ ]a, b[ si x n’est pas une discontinuité de la première espèce.

Il y a deux cas possibles pour une discontinuité de la première espèce :


a) f (x− ) 6= f (x+ ) ;
148 Chapitre 4. Fonctions, limites et continuités

b) f (x− ) = f (x+ ) 6= f (x).


La fonction de l’Exemple 5.1 possède une discontinuité de la premièr espèce en −1
et 1.

Exemple 9.1.
Les fonctions f : R → R suivantes ont des discontinuités de seconde espèce.
a) Discontinuité de seconde espèce en tout point de R :
(
déf 1, si x ∈ Q
f (x) =
0, si x ∈ R \ Q .

Il s’agit de la fonction caractéristique χQ .


b) Discontinuité de seconde espèce en tout point x 6= 0 et continue en x = 0 :
(
déf x, si x ∈ Q
f (x) =
0, si x ∈ R \ Q .

c) Discontinuité de seconde espèce en x = 0 et continue en tout point x 6= 0 :


  
 sin 1 ,

si x 6= 0
déf
f (x) = x

 0, si x = 0.

9.2 Fonction monotone


Pour les fonctions à valeurs réelles, on peut introduire la notion de monotoni-
cité et étudier leurs discontinuités.

Définition 9.3.
Soit une fonction f : ]a, b[ → R.
(i) f est croissante sur ]a, b[ si

a<x<y<b ⇒ f (x) ≤ f (y)

(ii) f est décroissante sur ]a, b[ si

a<x<y<b ⇒ f (x) ≥ f (y)

Dans les deux cas, on dira que f est monotone sur ]a, b[ .

Par définition, f est décroissante si et seulement si −f est croissante. Il suffira donc


d’étudier les propriétés des fonctions croissantes.
Théorème 9.1. Soit une fonction f : ]a, b[ → R croissante.
9. Fonctions d’une variable réelle 149

(i) Pour tout x ∈ ]a, b[ , f (x+ ) et f (x− ) existent et

sup f (z) = f (x− ) ≤ f (x) ≤ f (x+ ) = inf f (z). (9.5)


a<z<x x<z<b

En particulier, f n’a pas de discontinuités de seconde espèce.


(ii) Pour tout a < x < y < b

f (x+ ) ≤ f (y − ).

(iii) L’ensemble des points de discontinuité de f est au plus dénombrable.


On a des résultats symétriques pour les fonctions décroissantes.
Démonstration. (i) Par définition d’une fonction croissante, pour tout a < x < y <
b, on a f (x) ≤ f (y). L’ensemble {f (t) : a < t < x} est donc borné supérieurement
par f (y) et
déf
∀z, a < z < x, f (z) ≤ A = sup f (t) ∈ R et A ≤ f (x) ≤ f (y);
a<t<x

l’ensemble {f (t) : x < t < b} est borné inférieurement par f (x) et


déf
∀z, x < z < b, f (z) ≥ B = inf f (t) ∈ R et f (x) ≤ B.
x<t<b

On montre maintenant que A = f (x− ). Puisque A ∈ R, pour tout ε > 0,

∃z, a < z < x, tel que A − ε < f (z) ≤ A.

On pose δ = x − z > 0 : pour tout y, a < y < x, tel que |x − y| < δ, on a

z =x−δ <y <x ⇒ A − ε < f (z) ≤ f (y) ≤ sup f (z) = A


a<z<x

⇒ ∀y, a < y < x, tel que |x − y| < δ, |f (y) − A| < ε.

Par définition de la limite à gauche,

f (x− ) = A = sup f (t) ≤ f (x).


a<t<x

De la même façon

f (x) ≤ f (x+ ) = B = inf f (t)


x<t<b

et cela donne (9.5).


(ii) Pour a < x < y < b, il existe t tel que a < x < t < y < b et

f (x+ ) = inf f (z) ≤ f (t) ≤ sup f (z) = f (y − ).


x<z<b a<z<y

(iii) Soit E l’ensemble des points de discontinuité de f . On a montré que


f (x− ) ≤ f (x) ≤ f (x+ ) et que les discontinuités de f sont de première espèce.
150 Chapitre 4. Fonctions, limites et continuités

On utilise maintenant la densité des rationnels dans ]a, b[ pour construire une
application injective r : E → Q.
Si x ∈ E, ou bien f (x− ) < f (x) ≤ f (x+ ) et il existe un rationnel r(x) tel
que f (x− ) < r(x) < f (x) ≤ f (x+ ), ou bien f (x− ) ≤ f (x) < f (x+ ) et il existe
un rationnel r(x) tel que f (x− ) ≤ f (x) < r(x) < f (x+ ). On a donc construit une
fonction r : E → r(E) ⊂ Q. Cette fonction est injective puisque pour x1 , x2 ∈ E,
x1 < x2 , il vient dans tous les cas r(x1 ) < r(x2 ). E peut donc être identifié au
sous-ensemble r(E) de Q qui est au plus dénombrable.

Remarque 9.1.
On peut montrer que les points de discontinuité d’une fonction monotone ne sont
pas nécessairement des points isolés.

9.3 ◮ Fonction à variation bornée, fonction absolument


continue
À partir des fonctions monotones, on peut introduire les fonctions à variation
bornée (voir, par exemple, E. Asplund et L. Bungart [1, Chapitre 6]).

Définition 9.4.
Soit f : [a, b] → R, a < b. f est à variation bornée sur [a, b] si le supremum
( n )
déf
X
Var [a, b] = sup |f (ak ) − f (ak−1 | : n ≥ 0, a ≤ a0 ≤ · · · ≤ an ≤ b (9.6)
k=1

pris par rapport à toutes les suites finies a0 , . . . , an et à tous les entiers n ≥ 0 est
fini. On appelle Var [a, b] la variation totale de f sur [a, b].

Si f est monotone, Var [a, b] = |f (b) − f (a)|.


Ces fonctions peuvent s’écrire comme la différence de deux fonctions mono-
tones croissantes. Elles n’ont donc que des discontinuités de première espèce en
nombre au plus dénombrable. Elles se décomposent en la somme d’une fonction
absolument continue et d’une fonction de saut.

Définition 9.5.
Soit f : [a, b] → R, a < b. f est absolument continue sur [a, b] si pour tout ε > 0,
il existe δ > 0 tel que pour toute suite a ≤ a1 ≤ b1 ≤ · · · ≤ ak ≤ bk ≤ · · · ≤ an ≤
bn ≤ b et tout n ≥ 1 tel que
X n n
X
|bk − ak | < δ, on a |f (bk ) − f (ak )| < ε. (9.7)
k=1 k=1

Les fonctions absolument continues sont les seules fonctions qui sont l’intégrale de
leur dérivée. Déterminer cette classe de fonction était l’une des préoccupations de
Henri Lebesgue. En effet, on savait qu’il existait des fonctions continues mono-
tones croissantes qui n’étaient pas l’intégrale (au sens de Lebesgue) de leur dérivée
10. Exercices 151

presque partout. C’est le cas de l’≪escalier de Cantor≫ qui est une fonction mono-
tone, définie et continue partout sur le segment [0, 1] (voir Figure 4.5). Sa dérivée
est, évidemment, égale à zéro en tout point appartenant à un intervalle contigu

f (x)

0
0 1

Figure 4.5. Construction de l’escalier de Cantor

quelconque, c’est-à-dire, presque partout. Par conséquent, pour cette fonction on a


Z x
0= f ′ (t) dt < f (x) − f (0) = f (x), 0 < x ≤ 1. (9.8)
0

10 Exercices
Exercice 10.1.
Soit f : X → Y . Alors l’application inverse induite f −1 : P(Y ) → P(X) préserve
les opérations élémentaires suivantes :
(1) f −1 (∪α Bα ) = ∪α f −1 (Bα ).
(2) f −1 (∩α Bα ) = ∩α f −1 (Bα ).
(3) f −1 (B1 \B2 ) = f −1 (B1 )\f −1 (B2 ).

Exercice 10.2.
Soit f : X → Y . Alors l’application induite f : P(X) → P(Y ) préserve les
opérations suivantes :
(1) f (∪α Bα ) = ∪α f (Bα ).
(2) f (∩α Bα ) ⊂ ∩α f (Bα ).

Exercice 10.3.
Soit f : X → Y . Alors
(1) pour chaque A ⊂ X, f −1 [f (A)] ⊃ A.
152 Chapitre 4. Fonctions, limites et continuités

(2) pour chaque A ⊂ X et B ⊂ Y ,


 
f A ∩ f −1 (B) = f (A) ∩ B (10.1)
et, en particulier,
 
f f −1 (B) = f (X) ∩ B. (10.2)

Exercice 10.4.
Soit f : X → Y et g : Y → Z. Alors, pour les applications induites, on a (g ◦ f )−1 =
f −1 ◦ g −1 .

Exercice 10.5. (i) Soit un ensemble arbitraire X et soit {Aα } un recouvre-


ment de X par des sous-ensembles de X.
(ii) Soit Y un autre ensemble et une famille fα : Aα → Y d’applications tel
que
∀α, β, fα |Aα ∩Aβ = fβ |Aα ∩Aβ .
Alors, il existe une application unique f : X → Y qui est un prolongement de
chaque fα :
∀α, f |A α = f α .

Exercice 10.6.
Soit f : X → Y et g : Y → X tel que g ◦ f = IX où IX est la fonction identité sur
X. Alors f est injective et g est surjective.

Exercice 10.7 (W. Rudin [1, Exercice 3, p. 91]).


Soit f : (X, dX ) → R une application continue. Montrer que
déf
f −1 {0} = {x ∈ X : f (x) = 0} (10.3)
est fermé dans (X, d).

Exercice 10.8 (W. Rudin [1, Exercice 4, p. 91]).


Soient f, g : (X, dX ) → (Y, dY ) deux applications continues entre deux espaces
métriques et E un sous-ensemble dense dans (X, d). Montrer que
(i) f (E) est dense dans (f (X), dY ) ;
(ii) f = g sur E entraı̂ne f = g sur X.

Exercice 10.9 (W. Rudin [1, Exercice 7, p. 91]). (i) On se donne la fonction
f : R2 → R
 2 
 xy , si (x, y) 6
= (0, 0)
déf
f (x, y) = x2 + y 4
 
0, si (x, y) = (0, 0)
10. Exercices 153

Montrer que f est bornée sur R2 et n’est pas continue en (0, 0), mais que
sa restriction à toute droite passant par (0, 0) est continue.
(ii) On se donne la fonction g : R2 → R
 2 
 xy , si (x, y) 6= (0, 0)
déf
g(x, y) = x2 + y 6
 
0, si (x, y) = (0, 0)
Montrer que g n’est bornée sur aucun voisinage de (0, 0) et n’est pas conti-
nue en (0, 0), mais que sa restriction à toute droite passant par (0, 0) est
continue.

Exercice 10.10 (W. Rudin [1, Exercice 9, p. 91]).


Démontrer que l’on peut remplacer la définition de la continuité uniforme sur X
par : pour tout ε > 0, il existe δ > 0 tel que
∀E ⊂ X tel que diam (E) < δ, diam f (E) < ε.

Exercice 10.11 (W. Rudin [1, Exercice 12, p. 92]).


Démontrer.
(i) La composition g◦f de deux fonctions f : (X, dX ) → (Y, dY ) uniformément
continue sur E ⊂ X et g : (Y, dY ) → (Z, dZ ) uniformément continue sur
f (E) ⊂ Y est uniformément continue sur X
(ii) La composition g ◦ f de deux fonctions f : (X, dX ) → (Y, dY ) lipschit-
zienne en x ∈ X et g : (Y, dY ) → (Z, dZ ) lipschitzienne en f (x) ∈ Y est
lipschitzienne en x ∈ X.

Exercice 10.12 (W. Rudin [1, Exercice 15, p. 92]).


On dit qu’une application f : (X, dX ) → (Y, dY ) est ouverte si l’image f (O) de
tout ouvert O dans X est ouverte dans Y . Montrer qu’une application f : R → R
continue et ouverte est monotone.

Exercice 10.13.
Soient deux espaces métriques (X, dX ) et (Y, dY ) et leur produit
déf
X × Y = {(x, y) : x ∈ X et y ∈ Y } . (10.4)
(i) Montrer que
déf
((x, y), (x′ , y ′ )) 7→ dX×Y ((x, y), (x′ , y ′ )) = dX (x, x′ ) + dY (y, y ′ )
(10.5)
: (X × Y ) × (X × Y ) → R+
définit une métrique sur X × Y .
(ii) Montrer que la projection sur X
déf
(x, y) 7→ pX (x, y) = x : (X × Y, dX×Y ) → (X, dX )
est lipschitzienne sur X × Y .
154 Chapitre 4. Fonctions, limites et continuités

Exercice 10.14.
On dénote par dn (y, x) = ky − xkRn la métrique euclidienne sur Rn , n ≥ 1 un entier.
Soit le pole nord p = (0, 0, 1) ∈ R3 de la sphère de rayon un
 q 
(2) déf déf
S = x = (x1 , x2 , x3 ) : kxkR3 = x1 + x2 + x3 = 1 ⊂ R3 .
2 2 2

(i) Montrer que l’application


 
déf x1 x2
x = (x1 , x2 , x3 ) 7→ ϕ(x) = , : S (2) \{p} → R2 (10.6)
1 − x3 1 − x3

est une bijection et donner l’expression de l’application inverse ϕ−1 .


(ii) Montrer que ϕ : (S (2) \{p}, d3 ) → (R2 , d2 ) est un homéomorphisme. (On
peut supposer que toute fonction polynômiale est continue et utiliser les
théorèmes sur le produit et le quotient d’applications continues.)
(iii) Montrer que la fonction
déf
(x, y) 7→ ρ(x, y) = d3 (ϕ−1 (x), ϕ−1 (y)) : R2 × R2 → R+ (10.7)

est une métrique sur R2 .


(iv) Montrer que l’application ϕ : (S (2) \{p}, d3) → (R2 , ρ) est une isométrie et
c2 , ρ̂) de (R2 , ρ).
donc une isométrie de (S (2) \{p}, d ) dans le complété (R
3
c2 , ρ̂) de (R2 , ρ) est compact.
(v) Montrer que le complété (R
Chapitre 5
Espaces vectoriels,
convergences et
applications linéaires

1 Rappels : espace vectoriel, norme, et espace de


Banach
On revient sur les notions introduites au Chapitre 3.

Définition 1.1.
Soit E un ensemble non vide. On dit que E est un espace vectoriel sur R muni d’une
addition
x, y 7→ x + y : E × E → E
et d’une multiplication à gauche ou multiplication par un scalaire

λ, x 7→ λ x : R ×E → E

si (E, +) est un groupe commutatif, c’est-à-dire


(EV 1) x + y = y + x (commutativité),
(EV 2) (x + y) + z = x + (y + z) (associativité),
(EV 3) il existe un élément 0 (vecteur zéro ou origine de E) dans E tel que

∀x ∈ E, x + 0 = x,

(EV 4) pour chaque x ∈ E, il existe −x (inverse additif de x) tel que

x + (−x) = 0,

et pour tout λ et µ dans R et x et y dans E


(EV 5) λ (x + y) = λx + λy,
(EV 6) (λ + µ) x = λx + µx,
(EV 7) (λµ) x = λ (µx),
(EV 8) pour tout x, 1 x = x.

155
156 Chapitre 5. Espaces vectoriels, convergences et applications linéaires

Les éléments d’un espace vectoriel sont appelés vecteurs. La définition d’espace
vectoriel s’applique aussi au cas où R est remplacé par C.

Définition 1.2.
Soit E un espace vectoriel. Une norme sur E est une application
x 7→ kxkE : E → R+ (1.1)
qui satifait les axiomes suivants :
(N1) kxkE = 0 ⇐⇒ x = 0.
(N2) kλxkE = |λ| kxkE .
(N3) kx + ykE ≤ kxkE + kykE (inégalité du triangle).
Un espace vectoriel muni d’une norme est applelé espace vectoriel normé ou sim-
plement espace normé.

Théorème 1.1. Soit E un espace (vectoriel) normé. La fonction


déf
(x, y) 7→ d(x, y) = kx − ykE : E × E → R+ (1.2)
est une métrique sur E.
Démonstration. En effet, on a l’axiome (M1) car
x=y ⇐⇒ kx − yk = 0
par (N1). Pour (M2), ky − xk = k(−1)(x − y)k = kx − yk par (N2). Enfin, pour
(M3),
kx − zk = k(x − y) + (y − z)k ≤ kx − yk + ky − zk
par (N3).

Définition 1.3.
Un espace vectoriel normé est applelé espace de Banach s’il est complet par rapport
à la métrique associée à sa norme.

Exemple 1.1.
L’espace euclidien Rn est un espace vectoriel normé pour les opérations
déf
(x1 , . . . , xn ) + (y1 , . . . , yn ) = (x1 + y1 , . . . , xn + yn )
(1.3)
déf
λ (x1 , . . . , xn ) = (λ x1 , . . . , λ xn )
et l’une des normes du Théorème 1.2 du Chapitre 3 (voir aussi le Théorème 1.1 du
Chapitre 3 pour p = 2) :
( n )1/p
déf
X déf
p
kxkp = |xi | , 1 ≤ p < +∞, ou kxk∞ = max |xi | . (1.4)
1≤i≤n
i=1

Elle sont toutes équivalente (voir l’Exemple 3.3 du Chapitre 3). Par le Théorème
6.4 du Chapitre 3, Rn est complet par rapport à la métrique correspondant à p = 2.
C’est donc un espace de Banach. En fait, on peut montrer que Rn est un espace de
Banach pour toutes les normes k kp , 1 ≤ p ≤ +∞.
2. Suites, espaces et séries de fonctions 157

2 Suites, espaces et séries de fonctions


2.1 Convergences des suites de fonctions
On peut introduire de nombreux types de convergence d’une suite de fonctions
{fn } vers une fonction f . Certains peuvent être globaux comme
Z b
|fn (x) − f (x)|2 dx → 0
a

d’autres ponctuels comme

∀x, a ≤ x ≤ b, fn (x) → f (x).

On considère ici les convergences ponctuelles pour lesquelles on introduit un peu de


vocabulaire.

Définition 2.1.
Soient un ensemble E 6= ∅, un espace normé (F, k kF ), une suite de fonctions {fn },
fn : E → F , et une fonction f : E → F .
(i) La suite {fn } converge vers f (converge simplement ou ponctuellement) si

∀x ∈ E, fn (x) → f (x) dans F.

(ii) La suite {fn } converge uniformément vers f sur E si

∀ε > 0, ∃N > 0, ∀n > N, ∀x ∈ E, kfn (x) − f (x)kF < ε.

(iii) La famille {fα } est simplement bornée sur E si

∀x ∈ E, ∃φ(x) ≥ 0, ∀α, kfα (x)kF ≤ φ(x).

(iv) La famille {fα } est uniformément bornée sur E si

∃M > 0, ∀α, ∀x ∈ E, kfα (x)kF ≤ M.

(v) Soit (E, dE ) un espace métrique.


(a) La famille {fα } est équicontinue en x ∈ E si

∀ε > 0, ∃δ > 0, ∀α, ∀y ∈ E , dE (y, x) < δ, kfα (x) − fα (y)kF < ε.

(b) La famille {fα } est uniformément équicontinue sur E si

∀ε > 0, ∃δ > 0, ∀α, ∀x, y ∈ E , dE (y, x) < δ, kfα (x) − fα (y)kF < ε.

On donne maintenant l’équivalent du critère de Cauchy pour des suites de fonctions.


158 Chapitre 5. Espaces vectoriels, convergences et applications linéaires

Théorème 2.1. Soit F un espace de Banach, un ensemble E 6= ∅ et une suite de


fonctions {fn }, fn : E → F . Les conditions suivantes sont équivalentes :
(i) Il existe f : E → F tel que fn converge uniformément vers f sur E.
(ii) (critère de Cauchy uniforme) Pour tout ε > 0, il existe N > 0 tel que
∀n, m > N, ∀x ∈ E, kfn (x) − fm (x)kF < ε. (2.1)

(iii) Pour tout ε > 0, il existe N > 0 tel que


∀n, m > N, sup kfn (x) − fm (x)kF < ε. (2.2)
x∈E

Démonstration. Les parties (ii) et (iii) sont clairement équivalentes.


(i) ⇒ (ii). S’il existe f : E → F tel que fn converge uniformément vers f ,
alors, par définition,
∀ε > 0, ∃N > 0, ∀n > N, ∀x ∈ E, kfn (x) − f (x)kF < ε/2.
Par l’inégalité du triangle, pour tous n, m > N
∀x ∈ E, kfn (x) − fm (x)kF < ε.
(ii) ⇒ (i). Réciproquement, si la condition de Cauchy (2.1) est vérifée, alors,
pour chaque x ∈ E, la suite {fn (x)} est Cauchy dans l’espace de Banach F . Il existe
donc f (x) ∈ F tel que fn (x) → f (x). Comme cette limite est unique pour chaque
x ∈ E, cela définit une fonction f : E → F pour laquelle la suite {fn } converge
simplement vers f .
Pour montrer la convergence uniforme sur E, on repart de la propriété (2.1) :
∀ε > 0, ∃N tel que ∀n, m > N, ∀x ∈ E, kfn (x) − fm (x)kF < ε/2.
Donc, pour tout x ∈ E et n, m > N
kfn (x)−f (x)kF ≤ kfn (x)−fm (x)kF + kfm (x)−f (x)kF < ε/2 + kfm (x)−f (x)kF .
Puisque la suite {fm (x)} converge vers f (x), il existe m > N assez grand pour que
kfm (x) − f (x)kF < ε/2 et il vient
∀n > N, ∀x ∈ E, kfn (x) − f (x)kF < ε/2 + ε/2 = ε.
Par définition, la suite {fn } converges uniformément vers f sur E.
La convergence simple d’une suite de fonctions continues n’est pas suffisante
pour obtenir la continuité de la fonction limite comme le montre l’exemple suivant.

Exemple 2.1.
Pour chaque entier n ≥ 1, soit la fonction continue fn : [0, 2] → R définie par


1, si x ∈ [0, 1],
déf
fn (x) = 1 − n(x − 1), si x ∈ [1, 1 + 1/n],


0, si x ∈ [1 + 1/n, 2].
2. Suites, espaces et séries de fonctions 159

Il est facile de vérifier que


(
1, si x ∈ [0, 1],
lim fn (x) =
n→∞ 0, si x ∈ ]1, 2],

est une fonction discontinue en x = 1. Cette suite est simplement convergente mais
pas uniformément convergente sur [0, 2]. En effet, pour tout n ≥ 1
   
1 1 1
sup |fn (x) − f (x)| ≥ fn 1 + −f 1+ = .
x∈[0,2] 2n 2n 2

Théorème 2.2. Soient F un espace de Banach, (E, d) un espace métrique et une


suite de fonctions {fn }, fn : E → F , convergeant uniformément vers f : E → F .
Alors
(i) Si les fonctions {fn } sont continues sur E, alors f est continue sur E,
(ii) Si les fonctions {fn } sont uniformément continues sur E, alors f est uni-
formément continue sur E et la famille {fn } est uniformément équicontinue
sur E.
(iii) Si les fonctions {fn } sont uniformément bornées sur E, alors f est bornée
sur E.

Démonstration. Par hypothèse, pour tous x, y ∈ E et tout n ≥ 1 on a l’estimé

kf (x) − f (y)kF ≤ kf (x) − fn (x)kF + kfn (x) − fn (y)kF + kfn (y) − f (y)kF . (2.3)

(i) Soit ε > 0. Puisque fn converge uniformément vers f , on a par la Définition


2.1 (ii)

∃N > 0, ∀n > N, ∀z ∈ E, kfn (z) − f (z)kF ≤ ε/3. (2.4)

En revenant à l’estimé (2.3) pour n̄ > N , il vient

∀y ∈ E, kf (x) − f (y)kF ≤ ε/3 + kfn̄ (x) − fn̄ (y)kF + ε/3. (2.5)

Enfin, comme fn̄ est continue en x, il existe δ > 0 tel que

∀y ∈ E, d(y, x) < δ, kfn̄ (x) − fn̄ (y)kF < ε/3


⇒ ∀y ∈ E, d(y, x) < δ, kf (x) − f (y)kF < ε

et la fonction f est continue en x et donc sur E.


(ii) On reprend la fin de la démonstration de la partie (i) juste après (2.5).
Enfin, comme fn̄ est uniformément continue sur E, il existe δ > 0 tel que

∀x, y ∈ E, d(y, x) < δ, kfn̄ (x) − fn̄ (y)kF < ε/3


⇒ ∀x, y ∈ E, d(y, x) < δ, kf (x) − f (y)kF < ε
160 Chapitre 5. Espaces vectoriels, convergences et applications linéaires

et la fonction f est uniformément continue sur E.


Enfin, on a pour tous x, y ∈ E

kfn (y) − fn (x)kF ≤ kfn (y) − f (y)kF + kf (y) − f (x)kF + kf (x) − fn (x)kF

De (2.4), il existe N > 0 tel que pour tout n > N

kfn (y) − fn (x)kF ≤ ε/3 + kf (y) − f (x)kF + ε/3.

Par continuité uniforme de f , il existe δ0 > 0 tel que

∀x, y ∈ E, d(y, x) < δ0 , kf (x) − f (y)kF < ε/3

ce qui entraı̂ne

∀x, y ∈ E, d(y, x) < δ0 , ∀n > N, kfn (x) − fn (y)kF < ε.

Enfin, comme f1 , . . . , fN est une famille finie de fonctions uniformément continues,


il existe δ, 0 < δ ≤ δ0 , tel que

∀x, y ∈ E, d(y, x) < δ, ∀n ≤ N, kfn (x) − fn (y)kF < ε.

La famille composée de {fn } et de f est donc uniformément équicontinue sur E.


(iii) Soit M la borne sur la famille {fn } :

∀n ≥ 1, ∀x ∈ E, kfn (x)kF ≤ M.

Pour tout n ≥ 1,

kf (x)kF ≤ kf (x) − fn (x)kF + kfn (x)kF ≤ kf (x) − fn (x)kF + M.

Par convergence simple, en laissant n tendre vers l’infini, kf (x)kF ≤ M .

La condition (2.3) de convergence uniforme du théorème est suffisante pour


que la fonction limite soit continue mais elle n’est pas nécessaire comme le montre
l’exemple suivant.

Exemple 2.2 (W. Rudin [1, Théorème 7.12 p. 139]).


On considère la suite suivante de fonctions continues définies sur [0, 1] :
déf
fn (x) = n2 x(1 − x2 )n , n ≥ 1.

C’est un fonction non-négative telle que fn (1) = fn (0) = 0. Les limites aux deux
bouts sont donc 0. Pour 0 < x < 1, on applique le critère du quotient :
 2
fn+1 (x) n+1
= (1 − x2 ) → (1 − x2 ) < 1
fn (x) n
⇒ lim fn (x) = 0.
n→∞
2. Suites, espaces et séries de fonctions 161

La suite {fn } converge donc √


simplement, mais pas uniformément vers la fonction
f = 0. En effet, pour xn = 1/ 1 + 2n
 n
n2 1
sup |fn (x) − f (x)| ≥ |fn (xn ) − f (xn )| = √ 1−
x∈[0,1] 1 + 2n 2n + 1
 n  n
n2 1 n3/2 1
≥ √ 1− = 1− .
4n n 2 n

Comme (1−1/n)n tend vers e−1 lorsque n tend vers l’infini, le côté droit de l’inégalité
tend vers l’infini et la convergence n’est pas uniforme.

2.2 Espaces de Banach de fonctions bornées/continues


On introduit maintenant à titre d’exemples l’espace des fonctions bornées au
sens de la Définition 4.1 du Chapitre 4 et de ses deux sous-espaces de fonctions
continues et uniformément continues qui coı̈ncident lorsque (E, d) est un compact.

Exemple 2.3.
Soit E un ensemble non-vide et F un espace de Banach. L’espace

déf
B(E; F ) = {f : (E, d) → F | f bornée sur E} (2.6)
déf déf
(f + g)(x) = f (x) + g(x), (λ f )(x) = λ f (x) (2.7)

est un espace vectoriel car il hérite des propriétés de l’espace F : les deux opérations
sont bien définies et préservent la “bornitude” sur E. La fonction

déf
f 7→ kf kB(E;F ) = sup kf (x)kF : B(E; F ) → R+ (2.8)
x∈E

est donc bien définie : comme f est bornée sur E, le supremum est un réel positif.
De plus, c’est une norme car les trois propriétés qui la caractérisent sont vérifées :

0 = sup kf (x)kF ⇐⇒ f (x) = 0 sur E,


x∈E
sup kλ f (x)kF = sup |λ| kf (x)kF = |λ| sup kf (x)kF
x∈E x∈E x∈E
kf (x) + g(x)kF ≤ kf (x)kF + kg(x)kF ≤ sup kf (x)kF + sup kg(x)kF
x∈E x∈E
⇒ sup kf (x) + g(x)kF ≤ sup kf (x)kF + sup kg(x)kF
x∈E x∈E x∈E
⇒ kf + gkB(E;F ) ≤ kf kB(E;F ) + kgkB(E;F ).

C’est un espace vectoriel normé.

On passe aux sous-espaces de fonctions continues.


162 Chapitre 5. Espaces vectoriels, convergences et applications linéaires

Exemple 2.4.
Soit E 6= ∅ un sous-ensemble d’un espace métrique (X, d) et F un espace de Ba-
nach. Soit C 0 (E; F ) l’espace des fonctions continues sur E mais pas nécessairement
bornées sur E. Le sous-espace
déf
B 0 (E; F ) = {f : (E, d) → F | f continue et bornée sur E} (2.9)
déf déf
(f + g)(x) = f (x) + g(x), (λ f )(x) = λ f (x) (2.10)
déf
f 7→ kf kB(E;F ) = sup kf (x)kF : B(E; F ) → R+ (2.11)
x∈E

est un espace vectoriel normé car c’est un sous-espace de B(E; F ) muni de la même
norme (métrique) (2.8) et un espace vectoriel car les deux opérations préservent la
continuité. Lorsque Y = R, on adoptera la notation B 0 (E) pour B 0 (E; R).

Le second espace est l’espace des fonctions uniformément continues bornées sur E
qui est un sous-espace de B 0 (E; F ) de l’Exemple 2.4.

Exemple 2.5.
Soit E 6= ∅ un sous-ensemble d’un espace métrique (X, d) et F un espace de Banach.
L’espace 1
déf
C 0 (E; F ) = {f : (E, d) → F | f uniformément continue et bornée sur E} (2.12)
déf déf
(f + g)(x) = f (x) + g(x), (λ f )(x) = λ f (x) (2.13)
déf
f 7→ kf kB(E;F ) = sup kf (x)kF : B(E; F ) → R+ (2.14)
x∈E

est un espace vectoriel car les deux opérations préservent la continuité uniforme et
que C 0 (E; F ) ⊂ B 0 (E; F ) avec la même métrique (2.8). La notation E rappelle le
fait qu’il y a toujours un prolongement uniformément continu unique à E (Théorème
6.3, Chapitre 4) et dans ce cas-ci le prolongement est aussi borné. est une norme sur
C 0 (E; F ) puisque C 0 (E; F ) ⊂ B 0 (E; F ). Lorsque Y = R, on adoptera la notation
C 0 (E) pour C 0 (E; R).

On groupe les propriétés des espaces C 0 (E; F ) ⊂ B 0 (E; F ) ⊂ B(E; F ) dans


un seul théorème.
Théorème 2.3. Soit F un espace de Banach.
(i) Soit un ensemble E 6= ∅. L’espace (vectoriel) normé B(E; F ) tel que défini
dans l’Exemple 2.3 muni de la norme (2.8) est un espace de Banach.
(ii) Soit E 6= ∅ un sous-ensemble d’un espace métrique (X, d). L’espace (vec-
toriel) normé B 0 (E; F ) tel que défini dans l’Exemple 2.4 muni de la norme
(2.8) est un espace de Banach.
(iii) Soit E 6= ∅ un sous-ensemble d’un espace métrique (X, d). L’espace (vec-
toriel) normé C 0 (E; F ) tel que défini dans l’Exemple 2.5 muni de la norme
(2.8) est un espace de Banach.
1. On adopte la notation de R. A. Adams et J. J. F. Fournier [1].
2. Suites, espaces et séries de fonctions 163

(iv) Soit E 6= ∅ un sous-ensemble compact d’un espace métrique (X, d). Alors

déf
C 0 (E; F ) = {f : (E, d) → F |f continue sur E} (2.15)

muni de la norme (2.8) est un espace de Banach et

C 0 (E; F ) = B 0 (E; F ) = C 0 (E; F ). (2.16)

Démonstration. (i) Il reste à montrer que B(E; F ) est complet. Soit {fn } une suite
de Cauchy dans B(E; F ) : pour tout ε > 0 il existe N > 0 tel que

∀n, m > N, kfn − fm kB(E;F ) < ε. (2.17)

Par l’équivalence des parties (iii) et (i) du Théorème 2.1, il existe f : E → F tel que
{fn } convergerge uniformément vers f . Ceci définit la fonction f : E → F candidate
pour la limite de la suite {fn }. Mais une suite de Cauchy est toujours bornée :

∃M tel que ∀n ≥ 1, kfn kB(E;F ) = sup kfn (x)kF ≤ M.


x∈E

Les fonctions de la famille {fn } sont donc uniformément bornées sur E. Par le
Théorème 2.2, la fonction f est aussi bornée sur E. Elle appartient donc à B(E; F )
qui est par ce fait complet.
(ii) Il faut montrer que B 0 (E; F ) est complet. Soit {fn } une suite de Cauchy
dans B 0 (E; F ). Comme B 0 (E; F ) ⊂ B(E; F ) et que ce dernier est complet, il existe
f ∈ B(E; F ) tel que {fn } converge uniformément vers f sur E. Comme les {fn }
sont continues, f est continue par le Théorème 2.2 (i) et B 0 (E; F ) est complet.
(iii) Il faut montrer que C 0 (E; F ) est complet. Soit {fn } une suite de Cauchy
dans C 0 (E; F ). Comme C 0 (E; F ) ⊂ B 0 (E; F ) et que ce dernier est complet, il existe
f ∈ B 0 (E; F ) tel que {fn } converge uniformément vers f sur E. Comme les {fn }
sont uniformément continues, f est uniformément continue par le Théorème 2.2 (ii)
et B 0 (E; F ) est complet.
(iv) Toute fonction continue sur E est bornée par le Théorème 4.1 et uni-
formément continue par le Théorème 6.1 du Chapitre 4. Les trois espaces coı̈ncident
donc avec la même norme (2.8). Conséquemment C 0 (E; F ) est un Banach.

Exemple 2.6.
Une limitation importante des définitions des espaces B 0 (E; F ) et C 0 (E; F ) est
la condition que les fonctions soient bornées sur E. Dans certains cas, on peut
palier à cette difficulté. Par exemple, lorsque E = Ω, un sous-ensemble ouvert de
Rk , on montre qu’il existe une suite croissante de compacts non vides Kk tel que
Ω = ∪k≥1 Kk et, pour tout compact K ⊂ Ω, il existe k ≥ 1 tel que K ⊂ Kk (voir
l’Exercice 8.3 en fin de chapitre). À l’aide de cette suite on peut déinir une métrique
sur l’espace

déf
C 0 (Ω) = {f : Ω → R |f continue sur Ω}
164 Chapitre 5. Espaces vectoriels, convergences et applications linéaires

des fonctions continues sur Ω, où Ω n’est pas nécessairement borné (voir l’Exercice
8.4 en fin de chapitre). La construction se fait comme suit. Pour f ∈ C 0 (Ω) et k ≥ 1
on définit
déf
qk (f ) = sup |f (x)|
x∈Kk

et on choisit pour métrique sur C 0 (Ω) la fonction



X
déf 1 qk (f − g)
d(f, g) = .
2k 1 + qk (f − g)
k=1

C’est la métrique de convergence uniforme sur les compacts. (voir la propriété (iv)
du paragraphe 2.2, page 58, et l’Exercice 10.3 (iv) page 101 du Chapitre 3).

2.3 Espace de fonctions lipschitziennes


On donne un dernier exemple pour compléter le palmarès des espaces de fonc-
tions continues.

Exemple 2.7.
Soit E 6= ∅ un sous-ensemble d’un espace métrique (X, d) et F un espace de Banach.
déf
C 0,1 (E; F ) = {f : E → F | f lipschitzienne et bornée sur E} (2.18)
déf déf
(f + g)(x) = f (x) + g(x), (λ f )(x) = λ f (x) (2.19)

est un espace vectoriel car ces opérations préservent la “lipschitzité” et la “bor-


nitude” sur E. La notation E rappelle le fait qu’il y a toujours un prolongement
uniformément continu unique à E et, dans ce cas-ci, le prolongement est aussi borné
et lipschitzien de même constante. On introduit la fonction

déf |f (x) − f (y)|


f 7→ c(f, E) = sup : C 0,1 (E; F ) → R+ (2.20)
x6=y∈E d(x, y)

qui n’est pas une norme sur C 0,1 (E; F ) et on dénote par kf kB(E;F ) la norme (2.8)
sur B 0 (E; F ). La nouvelle fonction
déf
f 7→ kf kC 0,1 (E;F ) = kf kB(E;F ) + c(f, E) : C 0,1 (E; F ) → R+ (2.21)

est maintenant une norme.

Théorème 2.4. L’espace (vectoriel) normé C 0,1 (E; F ) tel que défini dans l’Exemple
2.7 avec la norme (2.21) est un espace de Banach.

Démonstration. Soit {fn } une suite de Cauchy pour la norme C 0,1 (E; F ). Comme
C 0,1 (E; F ) ⊂ C 0 (E; F ) et que kf kB(E;F )) ≤ kf kC 0,1 (E;F ) , {fn } est aussi une suite
de Cauchy dans C 0 (E; F ). Par la démonstration du Théorème 2.3 (iii), il existe
2. Suites, espaces et séries de fonctions 165

une fonction limite f qui est uniformément continue et bornée sur E et fn → f


uniformément pour la norme (2.8). Il reste à démontrer que f ∈ C 0,1 (E; F ) et que
c(fn −f, E) → 0 puisque l’on sait déjà que f ∈ C 0 (E; F ) et que kfn −f kB(E;F ) → 0.
Par définition d’une suite de Cauchy pour la norme C 0,1 (E; F ),

∃M > 0, ∀n ≥ 1, kfn kB(E;F ) + c(fn , E) ≤ M


∀ε > 0, ∃N > 0, ∀m, n > N, kfn − fm kB(E;F ) + c(fn − fm , E) < ε.

Pour tout x, y ∈ E et tout n, m > N on a l’estimé

k(fn (x) − fm (x)) − (fn (y) − fm (y))kF


≤ c(fn − fm , E) < ε.
d(x, y)

En laissant m tendre vers l’infini, il vient

k(fn (x) − f (x)) − (fn (y) − f (y))kF


≤ε
d(x, y)
k(fn (x) − f (x)) − (fn (y) − f (y))kF
⇒ ∀n > N, c(fn − f, E) = sup ≤ ε.
x6=y∈E d(x, y)

Par l’inégalité du triangle, pour n > N ,

kf (x) − f (y)kF kf (x) − fn (x) − (f (y) − fn (y))kF kfn (x) − fn (y)kF


≤ +
d(x, y) d(x, y) d(x, y)
kf (x) − f (y)kF
⇒ ∀x 6= y ∈ E, ≤ c(fn − f, E) + c(fn , E) ≤ ε + M
d(x, y)

et f est bien lipschitzienne sur E. Enfin, comme on a montré que pour la suite de
Cauchy {fn } dans la norme (2.21) de C 0,1 (E; F ),

∃N > 0, ∀n > N, kfn − f kB(E;F ) + c(fn − f, E) < ε,

f ∈ C 0,1 (E; F ) est bien la limite de {fn } pour la norme (2.21) de C 0,1 (E; F ).

Remarque 2.1.
Ici aussi on peut se libérer de la contrainte que les fonctions soient bornées en
remplaçant la norme du supremum par la norme de kf (x0 )kF en un point de x0 ∈ E :

déf
f 7→ kf kLip (E;F ) = kf (x0 )kF + c(f, E) : Lip (E; F ) → R+ (2.22)

où
déf
Lip (E; F ) = {f : E → F | f lipschitzienne sur E} . (2.23)
166 Chapitre 5. Espaces vectoriels, convergences et applications linéaires

2.4 Séries de fonctions


On rappelle que, étant donné une suite {ai }∞
i=1 dans R et les sommes partielles
n
X
déf
sn = ai ,
i=1

la série dénotée

X X
ai ou ai
i=1

est la suite des sommes partielles {sn }. La série est dite convergente si la suite {sn }
converge.

Définition 2.2.
Soient E 6= ∅ un sous-ensemble d’un espace métrique (X, d), F un espace de Banach,
une suite de fonctions {fi }, fi : E → F , et, pour chaque x ∈ E, les sommes partielles
n
X
déf
sn (x) = fi (x), n ≥ 1. (2.24)
i=1
P
(i) On dit que la série fi converge (ou converge simplement ou ponctuelle-
ment sur E) si la suite de fonctions {sn } converge (simplement sur E).
P
(ii) On dit que fi converge uniformément (sur E) si la suite de fonctions
{sn } converge uniformément (sur E).

Le critère suivant est dit de Weierstrass.


Théorème 2.5. Soient E 6= ∅ un sous-ensemble d’un espace métrique (X, d), F
un espace de Banach, et une suite de fonctions {fi }, fi : E → F , vérifiant
∀i ≥ 1, ∃ai ≥ 0, ∀x ∈ E, kfi (x)kF ≤ ai . (2.25)
P P
Si la série numérique ai converge, alors la série de fonctions fi converge uni-
formément.
P
Démonstration. Si ai est convergente, alors pour tout ε > 0, il existe N tel que
m
X
∀m ≥ n > N, ai < ε.
i=n

Donc pour tous m ≥ n > N et tout x ∈ E


m
X m
X m
X
ksm (x) − sn−1 (x)kF = fi (x) ≤ kfi (x)kF ≤ ai < ε.
i=n F i=n i=n

Comme le critère de Cauchy est satisfait pour la suite de fonctions {sn }, elles
convergent uniformément par le Théorème 2.1 et, par définition, la série converge
uniformément.
3. ◮ Espaces de Banach de fonctions différentiables 167

3 ◮ Espaces de Banach de fonctions différentiables


Bien que l’on n’abordera la différentielle d’une fonction de plusieurs variables
qu’au prochain chapitre, il est intéressant d’anticiper un peu et de présenter des
espaces de Banach de fonctions k-fois continûment différentiables dans un sou-
ensemble ouvert Ω de Rn .

Exemple 3.1.
Soit Ω un sous-ensemble ouvert non-vide de Rn . L’espace
 

 f continue et bornée sur Ω 
déf
B 1 (Ω) = f : Ω → R ∂i f continue et bornée sur Ω, (3.1)

 

1≤i≤n
déf déf
(f + g)(x) = f (x) + g(x), (λ f )(x) = λ f (x), (3.2)

où ∂i f est la dérivée partielle ∂f /∂xi de f , est un espace vectoriel. La fonction


n
X
déf
f 7→ kf kB1 (Ω) = kf kB(Ω;R) + k∂i f kB(Ω;R) (3.3)
i=1

est une norme sur B 1 (Ω). C’est un espace de Banach.

Exemple 3.2.
Soit Ω un sous-ensemble ouvert non-vide de Rn . L’espace
 

 f uniformément continue et bornée sur Ω  
déf
C 1 (Ω) = f : Ω → R ∂i f uniformément continue et bornée sur Ω, (3.4)

 

1≤i≤n
déf déf
(f + g)(x) = f (x) + g(x), (λ f )(x) = λ f (x), (3.5)

où ∂i f est la dérivée partielle ∂f /∂xi de f , est un espace vectoriel. La fonction


n
X
déf
f 7→ kf kC 1 (Ω) = kf kB(Ω;R) + k∂i f kB(Ω;R) (3.6)
i=1

est une norme sur C 1 (Ω). C’est un espace de Banach.

Exemple 3.3.
De la même façon on peut définir B k (Ω) et C k (Ω) pour k ≥ 2 sur un sous-ensemble
ouvert non-vide Ω de Rn . On introduit d’abord des notations compactes pour les
dérivées partielles de tout ordre. Soit Nn l’ensemble de toutes les n-suites d’entiers
α = (α1 , . . . , αn ) ∈ Nn . Un élément de Nn sera appelé un multi-index. Pour chaque
α ∈ Nn , on définit l’ordre |α| de α et la dérivée partielle ∂ α comme suit :
n
X ∂ |α|
|α| = αi , ∂α = . (3.7)
i=1
∂xα
1
1
. . . ∂xα
n
n
168 Chapitre 5. Espaces vectoriels, convergences et applications linéaires

On définit de façon récursive pour k ≥ 2 les ensembles



déf
B k (Ω) = f ∈ B k−1 (Ω) : ∂ α f ∈ B 0 (Ω), ∀α, |α| = k
déf 
C k (Ω) = f ∈ C k−1 (Ω) : ∂ α f ∈ C 0 (Ω), ∀α, |α| = k .

Ce sont des espaces vectoriels. On considère les fonctions 2


déf
|f |0,Ω = sup |f (x)|
x∈Ω
 déf

 max sup |∂ α f (x)|
 |f |m,Ω = |α|=m  (3.8)
x∈Ω
, 1 ≤ m ≤ k.

 kf km,Ω déf 

= max |f |m,Ω
0≤m≤k

Les fonctions (f, g) 7→ |f − g|m,Ω pour m ≥ 1 ne sont pas des métriques mais
seulement des pseudo-métriques. Elles vérifient les axiomes (M2) et (M3), mais
|f |m,Ω = 0 n’entraı̂ne pas f = 0 pour l’axiome (M1). La fonction

f 7→ kf kk,Ω : B k (Ω) → R+ (3.9)

est une norme sur B k (Ω) et sur son sous-espace C k (Ω). Ce sont des espaces de
Banach.

Exemple 3.4.
Soit Ω un sous-ensemble ouvert non-vide de Rn . Les espaces
 

 f continue et bornée sur Ω 

∞ déf n
B (Ω) = f : Ω → R ∀k ≥ 1, ∀α ∈ N tel que |α| = k (3.10)

 α


∂ f continue et bornée sur Ω
 

 f uniformément continue et bornée sur Ω  
déf
C ∞ (Ω) = f : Ω → R ∀k ≥ 1, ∀α ∈ Nn tel que |α| = k (3.11)

 

∂ α f uniformément continue et bornée sur Ω

pour l’addition et la multiplication par un scalaire


déf déf
(f + g)(x) = f (x) + g(x), (λ f )(x) = λ f (x), (3.12)

sont des espaces vectoriels. Toutes les normes sur B k (Ω) et C k (Ω) sont des normes
sur B ∞ (Ω) et C ∞ (Ω), mais B ∞ (Ω) et C ∞ (Ω) ne sont pas complets par rapport à
2. Les |f |m,Ω , m ≥ 1, sont des semi-normes. Une semi-norme sur un espace vectoriel E est
une application q : E → R+ vérifiant les axiomes suivants :
(i) homogénéité : ∀λ ∈ R, ∀x ∈ E, q(λ x) = |λ| q(x) ;
(ii) sous-additivité : ∀x, y ∈ E, q(x + y) ≤ q(x) + q(y).
Comme q(0) = 0 par (i), il ne manque que l’implication q(x) = 0 ⇒ x = 0 pour en faire une
norme.
4. Produit scalaire et espaces de Hilbert 169

ces normes. Cependant, la fonction 3



X 1 |f − g|k,Ω
(f, g) 7→ : B ∞ (Ω) × B ∞ (Ω) → R+ (3.13)
2k 1 + |f − g|k,Ω
k=0

est une métrique par rapport à laquelle B ∞ (Ω) et C ∞ (Ω) sont complets 4 .

4 Produit scalaire et espaces de Hilbert


Une importante famille d’espaces normés est celle pour laquelle il existe un
produit scalaire. 5

Définition 4.1.
Soit E un espace vectoriel. Un produit scalaire sur E est une application (x, y) 7→
(x|y) : E × E → R qui possède les propriétés suivantes :
(PS 1) (x|x) ≥ 0 pour tout x ∈ E.
(PS 2) (x|x) = 0 ⇐⇒ x = 0.
(PS 3) (x|y) = (y|x) pour tout x, y ∈ E.
(PS 4) (λx + µy|z) = λ(x|z) + µ(y|z) pour tout λ, µ ∈ R et x, y, z ∈ E.
Un espace vectoriel muni d’un produit scalaire est appelé espace préhilbertien. 6

Remarque 4.1.
Pour les besoins de la définition, on a adopté la notation (x|y) pour le produit
scalaire afin de le distinguer de la notation (x, y) pour une paire de points de E. On
utilisera la notation (x, y) pour le produit scalaire lorsque le contexte le permet.

Théorème 4.1. Soit E un espace vectoriel muni d’un produit scalaire. L’application
déf p
x 7→ kxk = (x|x) : E → R+ (4.1)
définit une norme sur E et l’application
(x, y) 7→ kx − yk : E × E → R+ (4.2)
est une métrique sur E. De plus, on a l’ inégalité de Cauchy-Schwarz
∀x, y ∈ E, |(x|y)| ≤ kxk kyk. (4.3)
p
Démonstration. Pourp(N1), kxk = p (x|x) = 0 ⇐⇒ p (x|x) = 0 ⇐⇒ x = 0.
2
Pour (N2), kλxk = (λx|λx) = |λ| (x|x) = |λ| (x|x) = |λ| kxk. Pour (N3),
pour tout λ ∈ R
0 ≤ (x + λy|x + λy) = (x|x) + λ2 (y|y) + 2λ(x|y)
2
p p
⇒ |(x|y)| − (x|x) (y|y) ≤ 0 ⇒ (x|y) ≤ |(x|y)| ≤ (x|x) (y|y).
3. Voir la propriété (iv) du paragraphe 2.2 du Chapitre 3, page 58.
4. Ce sont des espaces de Fréchet.
5. Inner product en anglais pour le distinguer du produit extérieur à valeurs dans E.
6. Inner product space en anglais.
170 Chapitre 5. Espaces vectoriels, convergences et applications linéaires

Donc

kx + yk2 = (x + y|x + y) =(x|x) + (y|y) + 2 (x|y)


p p
≤ (x|x) + (y|y) + 2 (x|x) (y|y)
= kx||2 + kyk2 + 2kxk kyk = (kxk + kyk)2 .
⇒ kx + yk ≤ kxk + kyk.

Définition 4.2.
Un espace vectoriel muni d’un produit scalaire est appelé espace de Hilbert s’il
est complet pour la métrique correspondant à la norme associée à son produit
scalaire.

L’espace euclidien Rn de l’Exemple 1.1 avec le produit scalaire


n
X
déf
x·y = xi yi (4.4)
i=1

est un espace de Hilbert de dimension finie.

Exemple 4.1.
On a vu au Chapitre 3 que l’espace des suites infinies
( ∞
)
X
2 déf 2
ℓ = x = (x1 , x2 , . . . ) : xi ∈ R et |xi | < ∞ ,
i=1

est un espace vectoriel avec la norme


"∞ #1/2
déf
X 2
kxkℓ2 = |xi | .
i=1

Muni du produit scalaire



X
déf
(x|y) = xi yi (4.5)
i=1

c’est un espace de Hilbert.

Exemple 4.2.
Soit C 0 ([0, 2]) l’espace de Banach des fonctions continues sur [0, 2] muni de la norme
du sup. En utilisant l’intégrale de Riemann, il est facile de vérifier que la fonction
Z 2
déf
(f, g) 7→ (f |g) = f (x) g(x) dx : C 0 ([0, 2]) × C 0 ([0, 2]) → R (4.6)
0
4. Produit scalaire et espaces de Hilbert 171

est un produit scalaire sur C 0 ([0, 2]). L’espace C 0 ([0, 2]) muni de ce produit scalaire
est préhilbertien, mais il n’est pas complet par rapport à la norme associée
Z 1/2
p 2
2
kf kL2 = (f, f ) = f (x) ) dx .
0

En effet, considérons la suite de fonctions 7 {fn } ⊂ C 0 ([0, 2]) définies comme suit :
pour chaque entier n ≥ 1


 1, si 0 ≤ x ≤ 1,


 1
fn (x) = 1 − n (x − 1),
déf si 1 < x < 1 + ,
n (4.7)



 1
 0, si 1 + ≤ x ≤ 2.
n
Ce n’est pas une suite de Cauchy dans pour la norme du supremum puisque

∀n ≥ 1, kf2n − fn kC 0 ([0.2]) = 1/2.

Mais elle est Cauchy pour la norme k kL2 . En effet, pour m > n > N


 0, si 0 ≤ x ≤ 1



 1

 (m − n) (x − 1),
 si 1 < x < 1 +
m
déf
fn (x) − fm (x) = 1 1 (4.8)

 1 − n (x − 1), si 1 + ≤x<1+

 m n



 1
 0, si 1 + ≤ x ≤ 2
n
et
Z 2
|fn (x) − fm (x)|2 dx
0
Z 1+1/m Z 1+1/n
2 2
= (m − n) |x − 1| dx + |1 − n (x − 1)|2 dx
1 1+1/m
h Z
1 n i2 1+1/n
≤ (m − n)2 3
+ 1− dx
3m m 1+1/m
h i h  
n 2 1 n i2 1 1 1 1 41 4 1
≤ 1− + 1− − ≤ + < < .
m 3m m n m 3m n 3n 3N

Il est facile de voir que la fonction fn converge simplement (ponctuellement)


vers la fonction
(
déf 1, si 0 ≤ x ≤ 1
f (x) = (4.9)
0, si 1 < x ≤ 2.

7. Voir l’Exemple 2.1 page 158.


172 Chapitre 5. Espaces vectoriels, convergences et applications linéaires

qui est discontinue en x = 1 et que




 0, si 0 ≤ x ≤ 1


 1
fn (x) − f (x) = 1 − n (x − 1), si 1 < x < 1 +
n (4.10)



 1
 0, si 1 + ≤ x ≤ 2.
n
En étendant l’intégrale de Riemann à des fonctions continues par morceaux, il vient
Z 2 Z 1+1/n Z
2 1 1 1
|fn (x) − f (x)|2 dx = |1 − n (x − 1)| dx = |1 − y|2 dx = → 0.
0 1 n 0 3n
La suite {fn } converge donc vers la fonction f ∈ / C 0 ([0, 2]) ce qui montre que
0
C ([0, 2]) n’est pas complet par rapport à la métrique associée ‘a la norme k·kL2 .

Bien qu’un espace de Hilbert soit plus proche de l’espace euclidien qu’un espace
de Banach, les espaces de Hilbert de fonctions nécessitent l’introduction de la théorie
de la mesure de Lebesgue 8 pour définir l’espace L2 (Ω) des fonctions mesurables de
carré intégrable et de la théorie des distributions pour définir les espaces de Sobolev
H k (Ω) des fonctions k-fois différentiables au sens des distributuions. Ce sont les
analogues de C 0 (Ω), C 0 (Ω), C k (Ω) et C k (Ω).

5 Applications linéaires et linéaires continues


Définition 5.1.
Une application f : E → F entre deux espaces vectoriels E et F est linéaire si
∀x, y ∈ E, f (x + y) = f (x) + f (y) (additivité) (5.1)
∀α ∈ R, ∀x ∈ E, f (λx) = λ f (x) (homogénéité). (5.2)
Elle préserve les deux opérations sur un espace vectoriel.

Les deux propriétés peuvent être combinées en une seule :


∀x, y ∈ E, ∀λ, µ ∈ R, f (λx + µy) = λ f (x) + µ f (y) (linéarité). (5.3)
Définition 5.2.
Soient (E, k ·kE ) et (F, k ·kF ) deux espaces normés. On désigne par L(E, F ) l’espace
de toutes les applications f : E → F linéaires et continues.

On verra plus loin au Théorème 6.1 page 178 que si E est de dimension finie, alors les
applications linéaires sur E sont continue. Cependant, en général, une application
linéaire n’est pas continue et cela même si E et F sont des espaces de Hilbert.
8. Par rapport à l’intégrale de Riemann, l’intégrale de Lebesgue permet d’intégrer des fonc-
tions qui sont ni continues ni bornées. Le cadre hilbertien est aussi mieux adapté aux problèmes
de la physique impliquant un potentiel ou une énergie que la nature cherche à minimiser. C’est le
principe de la moindre quantité d’action énoncé par Maupertuis en 1746 à l’Académie des sciences
en 1744, et à l’Académie royale des sciences de Prusse. Par exemple, les solutions de problèmes
aux limites pour l’équation de Laplace satisfont le principe de Dirichlet.
5. Applications linéaires et linéaires continues 173

Exemple 5.1.
La fonction
df
f 7→ : C 1 ( ]0, 1[ ) → C 0 ( ]0, 1[ )
dx
est linéaire. Elle n’est pas continue si C 1 ( ]0, 1[ ) est équippé de la norme
kf kC 0 ( ]0,1[ ) = sup |f (x)|,
0<x<1

mais elle l’est pour la norme kf kC 1 ( ]0,1[ ) définie en (3.3) page 167.

Théorème 5.1. Soit f : E → F une application linéaire entre deux espaces normés
E et F . Les propriétés suivantes sont équivalentes.
(i) f est continue sur E.
(ii) f est continue en 0.
(iii) f est uniformément continue sur E.
(iv) Il existe M > 0 tel que
∀x ∈ E, kf (x)kF ≤ M kxkE . (5.4)

Démonstration. (i) ⇒ (ii) Par définition.


(ii) ⇒ (iii) Par linéarité, f (0) = 0. Par continuité en 0, pour tout ε > 0 il
existe δ > 0 tel que
∀x ∈ E, kxkE = kx − 0kE < δ, , kf (x)kF = kf (x) − f (0)kF < ε.
Toujours par linéarité, pour tout x, x′ ∈ E, f (x′ ) − f (x) = f (x′ − x). Donc,
∀x, x′ ∈ E, kx − x′ kE < δ, kf (x) − f (x′ )kF = kf (x − x′ )kF < ε.
et f est uniformément continue sur E.
(iii) ⇒ (iv) On fixe ε et δ. Pour x 6= 0 et (δ/2) x/kxkE , par linéarité,
 
δ 1 δ x 2ε
kf (x)kF = f < ε ⇒ kf (x)kF < kxkE .
2 kxkE 2 kxkE F δ
On prend M = 2ε/δ.
(iv) ⇒ (i) Soient ε > 0 et δ = ε/M > 0. Pour tous x, y ∈ E tel que ky − xkE <
δ, on a par linéarité de f
kf (y) − f (x)kF = kf (y − x)kF ≤ M ky − xkX < M δ = ε.
f est donc uniformément continue et a fortiori continue sur E.

Remarque 5.1.
De la partie (iv), on a aussi que f est lipschitzienne sur E :
∀x, y ∈ E, kf (y) − f (x)kF = kf (y − x)kF ≤ M ky − xkE .
174 Chapitre 5. Espaces vectoriels, convergences et applications linéaires

Lorsqu’une application linéaire n’est pas continue, on peut toujours palier à


cette difficulté en enrichissant la norme de l’espace de départ.

Théorème 5.2. Soit f : E → F une application linéaire entre deux espaces normés
E et F .
(i) La fonction
déf
x 7→ kxkf = kxkE + kf (x)kF (5.5)

est une norme sur E.


(ii) L’application

x 7→ f (x) : (E, k kf ) → (F, k kF ) (5.6)

est linéaire et continue sur E.

La norme (5.6) est appelée norme du graphe.

Démonstration. La partie (ii) est une conséquence de l’inégalité

kf (x)kF ≤ kxkE + kf (x)kF = kxkf

et du Théorème 5.1 Il reste à vérifier les trois axiomes de la norme.


(N1) Comme f est linéaire, f (0) = 0 et

x=0 ⇒ kxkE = 0 et kf (0)kF = k0kF = 0 ⇒ k0kf = k0kE + kf (0)kF = 0.

Dans l’autre sens, kxkE + kf (x)kF = 0 entraı̂ne kxkE = 0 et x = 0 puisque kxkE


est une norme.
(N2) Pour λ ∈ R,

kλxkE + kf (λx)kF = |λ| kxkE + kλf (x)kF = |λ| kxkE + |λ| kf (x)kF = |λ| kxkf .

(N3)

kx + ykE + kf (x + y)kF = kx + ykE + kf (x) + f (y)kF


≤ kxkE + kf (x))kF + kykE + kf (y)kF = kxkf + kykf .

La structure d’espace vectoriel normé se transmet à l’espace des applications


linéaires continues.

Théorème 5.3. Soient E et F deux espaces normés.


(i) L(E, F ) est un espace vectoriel pour
déf déf
(f + g)(x) = f (x) + g(x), (λf )(x) = λ f (x). (5.7)
5. Applications linéaires et linéaires continues 175

(ii) La fonction

déf kf (x)kF
f 7→ kf kL(E,F ) = sup : L(E, F ) → R+ (5.8)
06=x∈E kxkE

est une norme sur L(E, F ).


(iii) Si F est un espace de Banach, L(E, F ) est un espace de Banach pour la
norme (5.8).

Remarque 5.2.
On voit facilement que kf kL(E,R) est la partie c(f, E) de la norme 9 sur C 0,1 (E).
Il est intéressante de noter que, pour les applications linéaires et continues, c(f, E)
devient une norme ce qui permet d’écarter la contrainte que f soit bornée sur E. En
effet, c(f, E) = 0 implique que f est constante, mais comme f est linéaire f (0) = 0
ce qui force la constante à être nulle.

Démonstration. (i) Directement des définitions.


(ii) Axiome (N1). Si f = 0, alors, pour tout x 6= 0, kf (x)kF /kxkE = 0 et
kf kL(E,F ) = 0. Réciproquement, kf kL(E,F ) = 0 entraı̂ne f (x) = 0 pour tout x 6= 0
et f = 0. Axiome (N2). Pour λ ∈ R,

kλf (x)kF |λ| kf (x)kF kf (x)kF


kλf kL(E,F ) = sup = sup = |λ| sup .
06=x∈E kxkE 06=x∈E kxkE 06=x∈E kxkE

Axiome (N3). Pour f, g ∈ L(E, F ) et x 6= 0

k(f + g)(x)kF kf (x) + g(x)kF kf (x)kF kg(x)kF


= ≤ + ≤ kf kL(E,F ) + kgkL(E,F ).
kxkE kxkE kxkE kxkE

(iii) Soit {fn } une suite de Cauchy dans L(E, F ) : pour tout ε > 0, il existe
N > 0 tel que, pour tout m, n > N ,

kfn (x) − fm (x)kF k(fn − fm )(x)kF


≤ sup = kfn − fm kL(E,F ) < ε. (5.9)
kxkE 06=x∈E kxkE

Pour chaque x 6= 0, la suite {fn (x)} est une suite de Cauchy et, comme F est
complet, il existe une limite f (x) ∈ F tel que fn (x) → f (x). Pour x = 0, fn (0) =
0 → 0 et on prend f (0) = 0. La fonction f est linéaire car pour tout x, x′ ∈ E et
λ, µ ∈ R,

f (λx + µx′ ) − [λf (x) + µf (x′ )] = [f (λx + µx′ ) − fn (λx + µx′ )]


+ fn (λx + µx′ ) − [λfn (x) + µfn (x′ )]
− λ [f (x) − fn (x)] − µ [f (x′ ) − fn (x′ )]
= [f (λx + µx′ ) − fn (λx + µx′ )]
− λ [f (x) − fn (x)] − µ [f (x′ ) − fn (x′ )].
9. Voir la définition (2.21) page 164.
176 Chapitre 5. Espaces vectoriels, convergences et applications linéaires

Comme le membre de droite tend vers 0, on obtient la linéarité de f . Pour montrer


que f est continue, on fait appel à la condition (iv) du Thórème 5.1 qui caractérise
la continuité de l’application linéaire f sur E. Comme la suite de Cauchy {fn } dans
L(E, F ) est bornée par une constante M , on a pour tout x ∈ E
kf (x)kF ≤ kf (x) − fn (x)kF + kfn (x)kF
≤ kf (x) − fn (x)kF + kfn kL(E,F ) kxkE
≤ kf (x) − fn (x)kF + M kxkE .
En laissant n tendre vers l’infini, il reste la condition (iv) du Thórème 5.1
∀x ∈ E, kf (x)kF ≤ M kxkE .
On a démontré que f ∈ L(E, F ).
Il ne reste plus qu’à montrer que fn → f dans la norme de L(E, F ). On
procède aux estimés suivants : pour m, n > N et x 6= 0
kfn (x) − f (x)kF kfn (x) − fm (x)kF kfm (x) − f (x)kF
≤ +
kxkE kxkE kxkE
kfn (x) − fm (x)kF kfm (x) − f (x)kF
≤ sup +
06=x∈E kxk E kxkE
kfm (x) − f (x)kF
<ε+ .
kxkE
En laissant m tendre vers l’infini, il reste pour n > N
kfn (x) − f (x)kF kfn (x) − f (x)kF
∀x 6= 0, ≤ε ⇒ kfn − f kL(E,F ) = sup ≤ ε.
kxkE 06=x∈E kxkE
Enfin, comme kfn − f kL(E,F ) ≤ ε pour tout n > N , f est la limite de {fn } dans
L(E, F ) et L(E, F ) est complet.
On donne un dernier résultat.
Théorème 5.4. Si f ∈ L(E, F ) est bijective, alors f −1 est linéaire. Si , en plus,
f −1 est continue, alors il existe 0 < m ≤ M tel que
∀x ∈ E, m kxkE ≤ kf (x)kF ≤ M kxkE . (5.10)
−1
Démonstration. (i) Comme f ∈ L(E, F ) est bijective, f est bijective. Pour tout
λ, µ ∈ R et y1 , y2 ∈ F , il existe x1 , x2 ∈ E tel que yi = f (xi ) : par linéarité de f
f −1 (λy1 + µy2 ) = f −1 (λf (x1 ) + µf (x2 ))
= f −1 (f (λx1 + µx2 )) = λx1 + µx2 = λf −1 (y1 ) + µf −1 (y2 )
et f −1 est linéaire.
(ii) Par hypothèse f −1 est continue et, de la partie (i), f −1 ∈ L(F, E). Du
Théorème 5.1 (iv), il existe M ′ > 0 tel que kf −1 (y)kE ≤ M ′ kykF et il existe M > 0
tel que kf (x)kF ≤ M kxkE . De là, en prenant y = f (x), pour tout x ∈ E
1
kxkE = kf −1 (f (x))kE ≤ M ′ kf (x)kF ⇒ kxkE ≤ kf (x)kF ≤ M kxkE
M′
et on prend m = 1/M ′ .
6. Espaces vectoriels de dimension finie 177

6 Espaces vectoriels de dimension finie


6.1 Espace euclidien
On revient à l’espace euclidien Rn de dimension n avec son produit scalaire et
sa norme (euclidienne)
n
X déf √
x·y = xi yi , kxk = x · x. (6.1)
i=1

Rn qui muni de ce produit scalaire est un espace de Hilbert. Comme on l’a vu à


l’Exemple 1.1, il y a une infinité d’autres normes sur Rn comme par exemple les
normes kxkp , 1 ≤ p ≤ ∞, qui sont toutes équivalentes à la norme kxk2 . Dans ce
paragraphe, la notation kxk sera réservée à cette norme kxk2 .
Il est utile pour le calcul d’assimiler un élément x = (x1 , . . . , xn ) ∈ Rn à la
matrice n × 1
 
x1
déf  . 
~x =  ..  (6.2)
xn

et d’utiliser la matrice tranposée ~x⊤ pour écrire le produit scalaire comme produit
de deux matrices
 
y1

 .
x · y = ~x ~y = x1 . . . xn  ..  . (6.3)
yn

Il ne faudra donc pas confondre les différentes notations


 
x1
   
x, ~x, ~x⊤ et (x1 , . . . , xn ),  ...  , x1 . . . xn .
xn

Pour alléger la notation, on laissera tomber la flèche de ~x lorsque le contexte le


permettra et on identifiera x et ~x.

Définition 6.1. (i) Un sous-ensemble S de Rn est appellé sous-espace linéaire


n
de R si S est un espace vectoriel.
(ii) Une suite {x1 , . . . , xk }, k ≥ 1, dans Rn est linéairement indépendante si,
pour toute suite de scalaires {α1 , . . . , αk } vérifiant
k
X
αi xi = 0,
i=1

on a αi = 0, 1 ≤ i ≤ k. Sinon, on dit que la suite {x1 , . . . , xk } est


linéairement dépendante.
178 Chapitre 5. Espaces vectoriels, convergences et applications linéaires

(iii) On dit qu’un sous-espace linéaire S de Rn est de dimension k s’il existe une
suite {x1 , . . . , xk } linéairement indépendante et toute suite {y1 , . . . , yℓ },
ℓ > k, est linéairement dépendante. On écrira dim S = k.
(iv) On associe à U ⊂ Rn , 10 le plus petit sous-espace linéaire de Rn qui contient
U
déf
\
Vect (U ) = S. (6.4)
S sous-espace linéaire
tel que U⊂S

On peut vérifier que tout sous-espace linéaire de Rn est fermé dans Rn et que
Vect (U ) est aussi un sous-espace linéaire fermé.

Définition 6.2.
La base canonique orthonormale de Rn est l’ensemble {eni ∈ Rn : 1 ≤ i ≤ n},
(
déf déf 1, si i = j
(eni )j = δij , δij =
0, si i 6= j,

c’est-à-dire, les éléments

en1 = (1, 0, 0, . . . , 0, 0), en2 = (0, 1, 0, n . . . , 0, 0), ..., enn = (0, 0, 0, . . . , 0, 1).

En particulier, eni · enj = δij . La fonction de deux indices δij est appelée symbole de
Kronecker.

Lorsque le contexte le permet, on écrira simplement {ei } sans l’indice n.

6.2 L’espace des applications linéaires


Théorème 6.1. (i) Soit f : Rn → R une fonction linéaire pour la norme
euclidienne sur Rn . Il existe un élément unique a ∈ Rn tel que
 
x1
n
  . 
∀x ∈ R , f (x) = a · x = a1 . . . an  ..  ,
xn

f est continue et kf kL(Rn ,R) = kak.


(ii) Soit L : Rn → Rm une application linéaire pour les normes euclidiennes
sur Rn et Rm . Alors L est continue sur Rn . Il existe une matrice m × n
unique A = {aij } telle que
    
m n a11 . . . a1n x1
X X  ..
L(x1 , . . . , xn ) =  
aij xj ei =  . . .. ..   ... 
.  
 , (6.5)
i=1 j=1 am1 . . . amn xn
10. En anglais, on écrit span (U ) pour Vect (U ).
6. Espaces vectoriels de dimension finie 179

où aij = L(enj ) · em


i , et  1/2
Xm X
n 
déf
kLkL(Rn ,Rm ) ≤ kAk2 , kAk2 = a2ij , (6.6)
 
i=1 j=1

où la norme kAk2 est appelée norme de Frobenius. 11


(iii) L(Rn , Rm ) est un espace de Banach pour la norme kLkL(Rn ,Rm ) .
(iv) L(Rn , Rm ) est un espace de Hilbert pour le produit scalaire, appelé produit
de Frobenius, 12
m X
X n √
déf
A·· B = aij bij , kAk2 = A·· A, (6.7)
i=1 j=1

des matrices A et B associées à deux éléments L et M de L(Rn , Rm ). Il


peut être identifié à Rmn muni de la norme euclidienne.

Remarque 6.1.
(i) Si l’on utilise une autre norme kak∗ que la norme euclidienne kak dans la partie
(i) du théorème, on n’aura que l’inégalité kf kL(Rn ,R) ≤ kak∗ . En général, les normes
kf kL(Rn ,R) et kak∗ seront équivalentes, mais pas égales.
(ii) La norme de Frobénius kAk2 est équivalente mais pas égale à la norme
kLkL(Rn ,Rm ) de l’application linéaire correspondante.

Démonstration. (i) Soit une fonction linéaire f : Rn → R. Tout point x = (x1 , . . . , xn )


peut s’écrire
n
X
x= xi ei
i=1

et, par linéarité de f ,


 
n f (e1 )
X déf  
f (x) = xi f (ei ) = x · g, g =  ...  .
i=1 f (en )

Le vecteur g est unique. Pour tout ε > 0, on prend δ = ε/(kgk + 1). De là,

∀y, ky − xk < δ ⇒ |f (y) − f (x)| = |f (y − x)| = |g · (y − x)|


≤ kgk ky − xk
kgk
< kgk δ = ε < ε.
kgk + 1

f est donc continue en tout point de Rn .


11. Ferdinand Georg Frobenius (1849–1917).
12. On peut montrer que A·· B = tr (A⊤ B) = tr (A B ⊤ ).
180 Chapitre 5. Espaces vectoriels, convergences et applications linéaires

Si f est identiquement nulle, on prend g = 0. Sinon, par Cauchy-Schwarz,


pour le produit scalaire
|f (x)|
∀x ∈ Rn , |f (x)| = |x · g| ≤ kxk kgk ⇒ kf kL(Rn ,R) = sup ≤ kgk.
06=x∈Rn kxk

Mais, comme |f (g)| = |g · g| = kgk2, le supremum est atteint et kf kL(Rn ,R) = kgk.
(ii) On applique (i) à chaque composante Li (x) = ei · L(x) de L : il existe
ai ∈ Rn tel que Li (x) = ai · x. En utilisant les composantes (ai1 , . . . , ain ) de chaque
ai , on forme ainsi la matrice A :
      
L1 (x) a1 · x a11 . . . a1n x1
 ..   ..   .. . .. . 
..   ... 

L(x) =  .  =  .  =  . 
Ln (x) an · x an1 . . . ann xn
| {z } | {z }
A x

Les parties (iii) et (iv) sont immédiates.


L’opération de composition de deux applications linéaires correspond à la mul-
tiplication de leurs matrices associées.
Théorème 6.2. Soient trois entiers ℓ, m, n plus grands ou égaux à 1.
(i) La composition L ◦ M de L ∈ L(Rℓ , Rm ) et de M ∈ L(Rn , Rℓ )
M L
x 7→ M (x) 7→ L(M (x)) : Rn −→
| R

{z −→} R
m

L◦M

est un élément de L(Rn , Rm ) et


kL ◦ M kL(Rn ,Rm ) ≤ kLkL(Rℓ ,Rm ) kM kL(Rn ,Rℓ ) . (6.8)

(ii) Si A est la matrice m × ℓ associée à L et B est la matrice ℓ × n associée à


M , alors la matrice m × n associée à la composition L ◦ M est le produit

X
déf
(A B)ij = aik bkj , 1 ≤ i ≤ m, 1 ≤ j ≤ n. (6.9)
k=1

des matrices A et B et
kABk2 kAk2 kBk2
z }| { z }| {
 1/2 z( }| {
)1/2  1/2
Xm X
n  m X
X ℓ X X 
ℓ n
(A B)2ij ≤ a2ik b2kj . (6.10)
   
i=1 j=1 i=1 k=1 k=1 j=1

(iii) Pour tout A ∈ L(Rn , Rm ),


déf déf
Ker A = {x ∈ Rn : Ax = 0} ⊂ Rn et Im A = {Ax : x ∈ Rn } ⊂ Rm (6.11)
sont des sous-espaces (fermés) linéaires de Rn et de Rm , respectivement.
6. Espaces vectoriels de dimension finie 181

Lorsque m = n, les éléments de l’espace L(Rn , Rn ) peuvent être identifiés avec


2
des matrices carrées n × n. Comme L(Rn , Rn ) peut être identifié à Rn , la composi-
2
tion ou le produit matriciel induit un produit non-commutatif sur Rn comme dans
le cas des quaternions pour R4 .

6.3 Orthogonalité et transposition


Définition 6.3.
L’orthogonal d’une partie U de Rn est le sous-ensemble
déf
U ⊥ = {y ∈ Rn : y · x = 0, ∀x ∈ U } .

On a un premier ensemble de propriétés.


Théorème 6.3. Soit U ⊂ Rn .
(i) U ⊥ est un sous-espace linéaire de Rn et U ⊂ (U ⊥ )⊥ .
(ii) Pour toute paire U1 ⊂ U2 , on a U2⊥ ⊂ U1⊥ .
(iii) U ⊥ = (Vect U )⊥ .
(iv) Pour tout sous-espace linéaire S non vide de Rn ,

(S ⊥ )⊥ = S.

(v) Pour tout U ⊂ Rn , (U ⊥ )⊥ = Vect U .


Démonstration. (i) En effet, pour tout x ∈ U et pour tout y1 et y2 dans U ⊥ et α,
β dans R,

(αy1 + βy2 ) · x = αy1 · x + βy2 · x = 0

et αy1 + βy2 ∈ U ⊥ . Soit x ∈ U . Par définition de U ⊥ , pour tout y ∈ U ⊥ , y · x = 0.


Mais, par définition de (U ⊥ )⊥ , x ∈ (U ⊥ )⊥ et U ⊂ (U ⊥ )⊥ .
(ii) Pour tout h ∈ U2⊥ , on a h · x = 0 pour tout x ∈ U2 . Comme U1 ⊂ U2 , il
vient h ∈ U1⊥ .
(iii) Comme U ⊂ Vect U , on a de (ii) (Vect U )⊥ ⊂ U ⊥ . Réciproquement, soit
une combinaison linéaire αx + βy de deux ééments x, y de U . On a

∀h ∈ U ⊥ , h · (αx + βy) = α h · x + β h · y = α0 + β 0 = 0

et h ∈ (Vect U )⊥ .
(iv) De la partie (i) on sait que S ⊂ (S ⊥ )⊥ . La réciproque n’est en général
pas vraie, mais ici S est un sous-espace linéaire. On considère le problème de mini-
misation suivant pour un point arbitraire z ∈ (S ⊥ )⊥ :
déf 1
inf f (x), f (x) = kx − zk2 .
x∈S 2
182 Chapitre 5. Espaces vectoriels, convergences et applications linéaires

déf
Ce problème possède une solution x0 ∈ S. En effet, comme f (x) ≥ 0, m =
inf f (S) ∈ R. Soit M > m, alors
déf
∃x ∈ S, m ≤ f (x) < M 6 ∅.
⇒ SM = {x ∈ S : f (x) ≤ M } =

Puisque f est continue sur Rn , SM est fermé. Il est aussi borné car
1 √
∀x ∈ SM , kx − zk2 ≤ M ⇒ kx − zk ≤ 2M .
2
Donc, SM est compact, f (SM ) est compact et inf f (SM ) ∈ f (SM ). Comme m =
inf f (S) = inf f (SM ), il existe x0 ∈ SM ⊂ S tel que m = f (x0 ). Pour tout t > 0 et
tout s ∈ S, x0 + ts ∈ S, f (x0 + ts) ≥ f (x0 ) et
f (x0 + ts) − f (x0 ) t
0≤ = (x0 − z) · s + ksk2 → (x0 − z) · s
t 2
lorsque t → 0. Comme S est linéaire, ±s ∈ S et

±(x0 − z) · s ≥ 0 ⇒ ∀s ∈ S, (x0 − z) · s = 0.

Donc x0 − z ∈ S ⊥ . Comme x0 ∈ S et que, par hypothèse, z ∈ (S ⊥ )⊥ , on obtient

(x0 − z) · x0 = 0 et (x0 − z) · z = 0.
| {z } ∈S | {z } ∈(S ⊥ )⊥
∈S ⊥ ∈S ⊥

On obtient finalement

kx0 − zk2 = (x0 − z) · x0 − (x0 − z) · z = 0 ⇒ z = x0 ∈ S

et (S ⊥ )⊥ ⊂ S.
(v) découle des parties (iii) et (iv).
Soit l’application linéaire A : Rn → Rm (qui admet pour représentation une
matrice m × n). On définit l’application transposée ou adjointe A⊤ : Rm → Rn de
A : Rn → Rm par le processus suivant. Pour tout y ∈ Rm , l’application x 7→ y · Ax :
Rn → R est linéaire. Il existe donc un unique vecteur a(y) ∈ Rn tel que

∀x ∈ Rn , a(y) · x = y · Ax

et ceci induit une application


déf
y 7→ A⊤ y = a(y) : Rm → Rn

quie est linéaire. En effet, pour tout α, β dans R et y1 , y2 dans Rm , on a


∀x ∈ Rn , a(αy1 + βy2 ) · x = (αy1 + βy2 ) · Ax = α y1 · Ax + β y2 · Ax
= α a(y1 ) · x + β a(y2 ) · x
= [α a(y1 ) + β a(y2 )] · x
⇒ a(αy1 + βy2 ) = α a(y1 ) + β a(y2 ).
6. Espaces vectoriels de dimension finie 183

Par construction, A⊤ vérifie l’identité

∀x ∈ Rn , y ∈ Rm , y · Ax = A⊤ y · x. (6.12)

Si Aij = Aeni · em
j est la matrice n × m associée à A pour les bases orthonormales
n m
canoniques {eni : 1 ≤ i ≤ n} et {em j : 1 ≤ j ≤ m} de R et R , alors la matrice
⊤ ⊤
m × n associée à A est donnée par (A )ij = Aji .
Théorème 6.4. (i) Pour tout A ∈ L(Rn , Rm ), on a l’identité

kA⊤ kL(Rm ,Rn ) = kAkL(Rn ,Rm )

(ii) Soient trois entiers ℓ, m, n plus grands ou égaux à 1 et la composition A◦ B


de A ∈ L(Rℓ , Rm ) et de B ∈ L(Rn , Rℓ )
déf B A
x 7→ B(x) 7→ (A ◦ B)(x) = A(B(x)) : Rn |−→ R ℓ m
{z −→} R .
A◦B

L’application

(A, B) 7→ A ◦ B : L(Rℓ , Rm ) × L(Rn Rℓ ) → L(Rn , Rm )

est continue.
(iii) Pour tout A ∈ L(Rn , Rm ), on a les identités suivantes :

(A⊤ )⊤ = A (6.13)
[Im A]⊥ = Ker(A⊤ ) (6.14)
⊥ ⊤
[Ker A] = Im (A ). (6.15)

A injective ⇐⇒ Ker A = {0} ⇐⇒ A surjective.

(iv) Pour tout A ∈ L(Rn , Rm ), l’image AU d’un convexe U est convexe.


Démonstration. (i) Du Théorème 6.1 (i), on a

|Ax · y|
kAxk = kAxkL(Rn ,R) = sup
06=y∈Rm kyk
kAxk |Ax · y|
⇒ kAkL(Rn ,Rm ) = sup = sup sup
06=x∈Rn kxk 06=x∈R 06=y∈R kxk kyk
n m

|x · A⊤ y|
kA⊤ yk = kA⊤ ykL(Rm ,R) = sup
06=x∈Rn kxk

kA yk |x · A⊤ y|
⇒ kA⊤ kL(Rm ,Rn ) = sup = sup sup .
06=y∈Rm kyk 06=y∈Rm 06=x∈Rn kxk kyk

Comme Ax · y = x · A⊤ y et que l’on peut changer l’ordre de deux supremum, il vient


kA⊤ kL(Rm ,Rn ) = kAkL(Rn ,Rm ) .
184 Chapitre 5. Espaces vectoriels, convergences et applications linéaires

(ii) Soient (A, B), (C, D) ∈ L(Rℓ , Rm )×L(Rn Rℓ ). En utilisant (i) et l’inégalité
(6.8) du Théorème 6.2 (i) :

kC ◦ D − A ◦ Bk ≤ kC ◦ D − C ◦ Bk + kC ◦ B − A ◦ Bk
≤ k(C ◦ D − C ◦ B)⊤ k + k(C − A) ◦ Bk
≤ kD⊤ ◦ C ⊤ − B ⊤ ◦ C ⊤ k + kC − Ak kBk
≤ k(D⊤ − B ⊤ ) ◦ C ⊤ k + kC − Ak kBk
≤ k(D − B)⊤ k kC ⊤ k + kC − Ak kBk
≤ kD − Bk kCk + kC − Ak kBk
≤ max{kCk, kBk} (kD − Bk + kC − Ak) |
≤ kD − Bk kCk + kC − Ak kBk
≤ max{kC − Ak + kAk, kBk} (kD − Bk + kC − Ak) .

Étant donné ε > 0, 0 < δ < 1 et (C, D) tel que

kC − Ak + kD − Bk < δ,

il vient

kC ◦ D − A ◦ Bk < max{1 + kAk, kBk} δ.

Il suffit alors de chosir δ tel que

δ = min{1, 1/ max{1 + kAk, kBk}} > 0

pour obtenir la continuité de la composition au point (A, B).


(iii) a) Pour tout x ∈ Rn et y ∈ Rm ,

Ax · y = x · A⊤ y = (A⊤ )⊤ x · y.

Donc,

∀y ∈ Rm , Ax · y = (A⊤ )⊤ x · y, ⇒ ∀x ∈ Rn , Ax = (A⊤ )⊤ x, ⇒ A = (A⊤ )⊤ .

b) Par définition,

[Im A]⊥ = {y ∈ Rm : Ax · y = 0, ∀x ∈ Rn }.

Mais

0 = Ax · y = x · A⊤ y, ∀x ∈ Rn ⇒ A⊤ y = 0 ⇒ y ∈ Ker A⊤ .

Réciproquement,

y ∈ Ker A⊤ ⇒ A⊤ y = 0 ⇒ ∀x ∈ Rn , x · A⊤ y = 0

et
0 = x · A⊤ y = Ax · y, ∀x ∈ Rn ⇒ y ∈ [Im A]⊥ .
7. Groupe général linéaire : métriques et complétude 185

c) De (6.14) en remplaçant A par A⊤ et en utilisant l’identité (6.13),

[Im A⊤ ]⊥ = Ker (A⊤ )⊤ = Ker A ⇒ ([Im A⊤ ]⊥ )⊥ = (Ker A)⊥ .

Enfin par le Théorème 6.3, comme Im A⊤ est un sous-espace linéaire (Im A⊤ )⊥⊥ =
Im A⊤ . d) Conéquence de (c).
(iv) L’image d’un convexe est un convexe par linéarité.

7 Groupe général linéaire : métriques et complétude


7.1 Rappels sur la notion de groupe
On aura maintenant besoin de la définition abstraite de groupe que l’on illus-
trera par quelques exemples.

Définition 7.1.
Soit X un ensemble arbitraire et une opération sur X × X que l’on notera +. On
dira que (X, +) est un groupe si les propriétés (ou axiomes) suivantes sont vérifiées :
(i) pour tous x, y ∈ X, x + y ∈ X (loi de composition interne) ;
(ii) pour tous x, y, z ∈ X, (x + y) + z = x + (y + z) (associativité) ;
(iii) il existe un élément neutre 0 pour lequel x + 0 = x = 0 + x quelque soit
x∈X;
(iv) chaque x ∈ X possède un inverse ou opposé −x tel que x + (−x) = 0 =
(−x) + x.
On dira que le groupe est commutatif ou abélien si, en plus, x + y = y + x pour tous
x, y ∈ X.

L’exemple le plus simple d’un groupe est l’ensemble R ou Z muni de l’addition


+ pour laquelle on peut vérifier les propriétés suivantes :
(i) pour tous x, y ∈ R, x + y ∈ R ;
(ii) pour tous x, y, z ∈ R, (x + y) + z = x + (y + z) ;
(iii) 0 est l’élément neutre pour lequel x + 0 = x = 0 + x pour tout x ∈ R ;
(iv) chaque x ∈ R possède un inverse (additif) −x tel que x + (−x) = 0 =
(−x) + x.
Dans ce cas ce groupe est commutatif, c’est-à-dire, x + y = y + x.
Mais, la notion de groupe n’est pas limitée à l’opération d’addition. En effet,
pour l’ensemble R \{0} des réels non-nuls où Q \{0} des rationnels non-nuls muni
de la multiplication × on peut vérifier les propriétés suivantes :
(i) pour tous x, y ∈ R \{0}, x × y ∈ R \{0} ;
(ii) pour tous x, y, z ∈ R \{0}, (x × y) × z = x × (y × z) ;
(iii) 1 est l’élément neutre pour lequel x × 1 = x = 1 × x pour tout x ∈ R \{0} ;
(iv) chaque x ∈ R \{0} possède un inverse (multiplicatif) x−1 tel que x× x−1 =
1 = x−1 × x.
186 Chapitre 5. Espaces vectoriels, convergences et applications linéaires

Ici aussi ce groupe est commutatif, c’est-à-dire, x × y = y × x.


Un exemple qui ne fait pas intervenir des nombres est celui de l’ensemble
P(X) des sous-ensembles d’un ensemble arbitraire X et de l’ensemble vide ∅ muni
de l’opération différence symétrique △
déf
A △ B = [A\B] ∪ [B\A] .

On peut vérifier les propriétés suivantes pour (P(X), △) :


(i) pour tous A, B ∈ P(X), A △ B ∈ P(X) ;
(ii) pour tous A, B, C ∈ P(X), (A △ B) △ C = A △ (B △ C) ;
(iii) ∅ est l’élément neutre pour lequel A △ ∅ = A = A △ ∅ pour tout
A ∈ P(X) ;
(iv) chaque A ∈ P(X) possède un inverse puisque A △ A = ∅. Ici A est son
propre inverse, c’est-à-dire, A−1 = A.
Ce groupe est aussi commutatif, c’est-à-dire, A △ B = B △ A.

7.2 Définition et propriétés


La composition ◦ de deux applications bijectives et linéaires est bijective et
linéaire, l’application identité I est l’élément neutre par rapport à ◦, et l’application
inverse d’une application linéaire et bijective est linéaire et bijective. Les applications
bijectives et linéaires forment donc un groupe pour la composition ◦ (voir Théorème
7.1 (i) plus bas).

Définition 7.2. (i) On utilisera la notation L(Rn ) pour L(Rn , Rn ).


(ii) On définit le sous-ensemble de L(Rn )

déf
GL (n) = {A ∈ L(Rn ) : A bijective} . (7.1)

On l’appellera groupe général linéaire de degré n.

GL (n) peut être identifié avec le groupe des matrices n × n inversibles muni de
la multiplication matricielle. Pour simplifier, on utilisera la même notation pour
l’application linéaire et sa matrice associée.
On aura besoin plus tard du résultat technique suivant.

Lemme 7.1. A ∈ L(Rn ) est injective si et seulement si elle est bijective.

Démonstration. Si A est bijective, elle est injective. Réciproquement, si A est injec-


tive et Im A 6= Rn , alors la suite {Ae1 , . . . , Aen } qui génère Im A est linéairement
dépendante, c’est-à-dire, il existe {α1 , . . . , αn } pas tous nuls tel que
n
X
αi Aei = 0.
i=1
7. Groupe général linéaire : métriques et complétude 187

Par linéarité et injectivité de A


n
! n n
X X X
A αi ei = αi Aei = 0 ⇒ αi Aei = 0.
i=1 i=1 i=1

Puisque la suite {e1 , . . . , en } est linéairement indépendante dans Rn , tous les αi


sont nuls ce qui contredit le fait que Im A 6= Rn .
Théorème 7.1. (i) GL (n) est un groupe par rapport à la composition ◦.
(ii) Si A ∈ GL (n) et B ∈ L(Rn ) et si
kB − AkL(Rn ) kA−1 kL(Rn ) < 1, (7.2)
alors B ∈ GL (n).
(iii) GL (n) est un sous-ensemble ouvert de L(Rn ) et l’application
déf
A 7→ g(A) = A−1 : GL (n) → GL (n) (7.3)
est bijective et continue pour la norme kAkL(Rn ) .
Démonstration. (i) On vérifie les quatre propriétés d’un groupe.
(a) Pour tout A, B ∈ GL (n), A ◦ B ∈ L(Rn ) par le Lemme 7.1 Par le Théorème
6.4 (iii), A ◦ B est bijective si et seulement si elle est injective. Donc, A(B(x)) =
(A ◦ B)(x) = 0 entraı̂ne B(x) = 0 et x = 0 car A et B sont injectives.
(b) [(A ◦ B) ◦ C](x) = (A ◦ B)(C(x)) = A(B(C(x))) = A((B ◦ C)(x))) = [A ◦ (B ◦
C)](x).
(c) L’identité I appartient à GL (n) et A(x) = I(A(x)) = (I ◦ A)(x).
(d) Comme A est linéaire et bijectif, par le Théorème 5.4, A−1 est linéaire et bijectif
et donc A−1 ∈ GL (n). De plus, A−1 ◦ A = I = A ◦ A−1 .
(ii) On pose α = 1/kA−1 kL(Rn ) et β = kB − AkL(Rn ) ce qui implique β < α.
Pour tout x
α kxk = α kA−1 Axk ≤ α kA−1 k kAxk =kAxk
≤ k(A − B)xk + kBxk ≤ β kxk + kBxk
⇒ (α − β) kxk ≤ kBxk
avec α − β > 0. On a donc x = 0 si Bx = 0 et l’application linéaire B est injective
et, a posteriori, bijective.
(iii) Pour A ∈ GL (n), soit α = 1/kA−1 kL(Rn ) . On considère la boule ouverte
Bα (A). Pour tout B ∈ Bα (A)
1
kB − AkL(Rn ) < α = ⇒ kB − AkL(Rn ) kA−1 kL(Rn ) < 1
kA−1 k L(Rn )

et de la partie (i) B ∈ GL (n). Donc Bα (A) ⊂ GL (n) et GL (n) est ouvert.


L’application A 7→ g(A) = A−1 est bijective car
∀B ∈ GL (n), B = (B −1 )−1 = g(B −1 ) et
g(A) = g(B) ⇒ B = AA−1 B = A g(A) B = B = A g(B) B = A B −1 B = A.
188 Chapitre 5. Espaces vectoriels, convergences et applications linéaires

Soit A, B ∈ GL (n) et α = 1/kA−1 kL(Rn ) :

B −1 − A−1 = B −1 (A − B) A−1
kB −1 kL(Rn )
kB −1 kL(Rn ) − kA−1 kL(Rn ) ≤ kB −1 − A−1 kL(Rn ) ≤ kA − BkL(Rn )
  α
α − kA − BkL(Rn ) 1
⇒ kB −1 kL(Rn ) ≤ kA−1 kL(Rn ) =
α α
1
⇒ kB −1 kL(Rn ) ≤
α − kA − BkL(Rn )
si kA − BkL(Rn ) < α. De plus,

kB −1 − A−1 kL(Rn ) ≤ kB −1 kL(Rn ) kA − BkL(Rn ) kA−1 kL(Rn )


1 kA − BkL(Rn )
≤ .
α − kA − BkL(Rn ) α
Pour ε > 0, il suffit de prendre
αε
kA − BkL(Rn ) < δ = α <α
1 + αε
pour obtenir
αε
1 α 1+αε
kB −1 − A−1 kL(Rn ) < αε =ε
α − α 1+αε α
ce qui donne la continuité de g en A.

7.3 Première métrique sur GL (n)


GL (n) est un sous-ensemble ouvert de l’espace de Banach L(Rn ) muni de la
norme kAkL(Rn ) . Ce n’est pas un sous-espace vectoriel car I + (−1)I = 0 n’est pas
inversible. Il n’est pas fermé pour la métrique
ρ(A, B) = kA − BkL(Rn )
sur L(Rn ) car la suite de Cauchy {(1/k)I} converge vers 0 lorsque k tend vers l’infini
et 0 n’appartient pas à GL (n).
Peut-on définir une métrique complète sur le groupe GL (n) ? Oui, il suffit
d’ajouter la norme de la différence des inverses
déf
d0 (A, B) = kA − BkL(Rn ) + kA−1 − B −1 kL(Rn ) . (7.4)
ce qui donne bien une métrique.
Théorème 7.2. Le groupe GL (n) par rapport à la composition est un espace
métrique complet pour la métrique (7.4). La composition
(A, B) 7→ A ◦ B : (GL (n), d0 ) × (GL (n), d0 ) → (GL (n), d0 )
est continue par rapport à cette métrique.
7. Groupe général linéaire : métriques et complétude 189

Démonstration. (i) d0 est une métrique. Si A = B, on a d0 (A, A) = kA − AkL(Rn ) +


kA−1 −A−1 kL(Rn ) = 0. Si d0 (A, B) = 0, on a kA−BkL(Rn ) et A = B. La fonction d0
est symétrique catr la norme de kA − BkL(Rn ) est symétrique. Enfin, on a l’inégalité
du triangle toujours parce que kAkL(Rn ) est une norme.
(ii) (GL (n), d0 ) est complet. En effet, si {An } est une suite de Cauchy par
n
rapport à cette métrique, {An } et {A−1n } sont des suites de Cauchy dans L(R )
n
qui est un espace de Banach. Il existe donc A et B dans L(R ) tel que An → A et
A−1
n → B. Du Théorème 6.4 (ii), par continuité de la composition, il vient alors

I = An ◦ A−1
n → A◦B et I = A−1
n ◦ An → B ◦ A

ce qui entraı̂ne B = A−1 et A ∈ GL (n).


(iii) On a montré au Théorème 6.4 (ii) que la composition

(A, B) 7→ A ◦ B : L(Rn ) × L(Rn ) → L(Rn )

est continue par rapport à la norme kAkL(Rn ) + kBkL(Rn ) sur L(Rn ) × L(Rn ). Donc

(A−1 , B −1 ) 7→ (A ◦ B)−1 = B −1 ◦ A−1 : L(Rn ) × L(Rn ) → L(Rn )

est continue par rapport à la norme kA−1 kL(Rn ) + kB −1 kL(Rn ) ce qui entraı̂ne la
continuité de la composition pour la métrique d0 .

7.4 ◮ Une seconde métrique sur GL (n) invariante à droite


On a cependant perdu une propriété importante de la norme sur les es-
paces vectoriels : l’invariance par rapport à la translation, c’est-à-dire, kf − gk =
k(f + h) − (g + h)k pour tout h. Grâce à cette propriété, on a Br (f ) = f + Br (0) et
la boule en f est une translation de la boule à l’origine 0 et tout voisinage du point
f est la translation par f d’un voisinage de l’origine 0. Pour récupérer l’analogue
de cette propriété dans un groupe, il faut procéder de façon un peu différente que
dans le cas d’un espace ou d’un sous-espace vectoriel. Pour une structure de groupe
l’élément neutre est la transformation identité I à comparer avec la structure d’es-
pace vectoriel où le groupe associé à l’addition + a pour élément neutre l’origine 0.
I joue donc pour GL (n) le rôle de l’origine.
Dans un premier temps on introduit la distance de A ∈ GL (n) à l’identité I
déf
d0 (A, I) = kA − IkL(Rn ) + kA−1 − IkL(Rn ) . (7.5)

Ceci permet de contrôller à la fois A et son inverse A−1 puisque d0 (A−1 , I) =


d0 (A, I). Ensuite, on étend la distance d0 à deux éléments A et B de GL (n)
déf
d0 (A, B) = d0 (A ◦ B −1 , I) = kA ◦ B −1 − IkL(Rn ) + kB ◦ A−1 − IkL(Rn ) .

On a la symétrie d0 (B, A) = d0 (A, B) car (A ◦ B −1 )−1 = B ◦ A−1 . Il y a invariance


à droite puisque pour tout A, B, C ∈ GL (n)
déf
d0 (A ◦ C, B ◦ C) = d0 ((A ◦ C ◦ (B ◦ C)−1 , I) = d0 (A ◦ B −1 , I) = d0 (A, B).
190 Chapitre 5. Espaces vectoriels, convergences et applications linéaires

C’est la propriété analogue à la translation pour la norme sur un espace vectoriel


normé : kf − gk = k(f + h) − (g + h)k. On obtient alors pour les boules

Br (I) = {X ∈ GL (n) : d0 (X, I) < r}


Br (I) ◦ A = Br (A), (7.6)
Br (A) = {Y ∈ GL (n) : d0 (Y, A) < r}.

La composition remplace la translation.


On a bien une application

(A, B) 7→ d0 (A, B) : GL (n) × GL (n) → R+

qui vérifie les deux premiers axiomes d’une métrique. Pour (M1)

0 = d0 (A, B) = kA ◦ B −1 − IkL(Rn ) + kB ◦ A−1 − IkL(Rn )


⇒ A ◦ B −1 = I et B ◦ A−1 = I ⇒ A=B

et, réciproquement, A = B entraı̂ne A ◦ B −1 = I et d0 (A, B) = 0. Pour (M2)

d0 (A, B) = kA ◦ B −1 − IkL(Rn ) + kB ◦ A−1 − IkL(Rn )


= kB ◦ A−1 − IkL(Rn ) + kA ◦ B −1 − IkL(Rn ) = d0 (B, A).

Malheureusement, on n’a pas l’axiome (M3) de l’inégalité du triangle. 13


Heureusement, pour ce groupe, il y a une construction canonique pour récupérer
l’axiome (M3). On modifie la définition de la distance d0 (A, I) de A ∈ GL (n) à
l’identité I pour y intégrer l’inégalité du triangle. 14 On considère toutes les facto-
risations finies {Fi } de A dans GL (n) :

A = F1 ◦ · · · ◦ Fk , Fi ∈ GL (n),

et la nouvelle distance entre A et I


k
X
déf
d(A, I) = inf kFi − IkL(Rn ) + kFi−1 − IkL(Rn ) (7.7)
F1 ,...,Fk ∈GL (n)
A=F1 ◦···◦Fk i=1

que l’on étend, comme précédemment, à toute paire A, B ∈ GL (n)


déf
d(A, B) = d(A ◦ B −1 , I). (7.8)

Par construction, d est encore invariante à droite : d(A ◦ C, B ◦ C) = d(A, B).


Théorème 7.3. La fonction d définie en (7.7)-(7.8) est une métrique invariante à
droite sur le groupe GL (n) et (GL (n), d) est un espace métrique complet.
13. Étant donné un ensemble X, une fonction d : X × X → R est une semi-métrique sur X si
(i) d(F.G) ≥ 0, pour tout F, G,
(ii) d(F, G) = 0 ⇐⇒ F = G,
(iii) d(F, G) = d(G, F ), pour tout F, G.
Cette notion remonte à M. Fréchet et K. Menger [1] en 1928.
14. On retouve cette construction chez A. M. Micheletti [1] en 1972.
7. Groupe général linéaire : métriques et complétude 191

Cette construction est générique et s’applique à certaines familles de trans-


formations de Rn qui ne sont pas nécessairement linéaires. Elles interviennent, par
exemple, en imagerie. 15
On aura besoin du lemme suivant que l’on démontrera plus tard.

Lemme 7.2. Pour chaque A ∈ GL (n), on a

d(A, I) ≤ kA − IkL(Rn ) + kA−1 − IkL(Rn ) ≤ d(A, I) ed(A,I) . (7.9)

Démonstration du Théorème 7.3. (i) Pour l’axiome (M1). Si A = B, alors A◦B −1 =


I et

k
X
d(A, B) = inf kFi − IkL(Rn ) + kFi−1 − IkL(Rn )
F1 ,...,Fk ∈GL (n)
i=1
A◦B −1 =F1 ◦···◦Fk

≤ kI − IkL(Rn ) + kI −1 − IkL(Rn ) = 0.

Dans l’autre sens, par le Lemme 7.2, d(A◦B −1 , I) = d(A, B) = 0 implique A◦B −1 =
I et A = B ce qui vérifie l’axiome (M1). L’axiome (M2) est immédiat puisque

kFi − IkL(Rn ) + kFi−1 − IkL(Rn ) = kFi−1 − IkL(Rn ) + kFi − IkL(Rn ) .

L’axiome (M3) aussi. En effet, soient A, B, C ∈ L(Rn ). On a A ◦ C −1 = (A ◦ B −1 ) ◦


(B ◦ C −1 ). Soit {Fi } une factorisation finie de A ◦ B −1 dans GL (n)

A ◦ B −1 = F1 ◦ · · · ◦ Fk , Fi ∈ GL (n),

et {Gj } une factorisation finie de B ◦ C −1 dans GL (n)

B ◦ C −1 = G1 ◦ · · · ◦ Gℓ , Gj ∈ GL (n), .

Ceci nous donne la factorisation finie

A ◦ C −1 = F1 ◦ · · · ◦ Fk ◦ G1 ◦ · · · ◦ Gℓ

15. Voir les travaux de R. Azencott [2] en 1994 et de A. Trouvé [1, 2, 3] en 1995 et les
travaux de F. Mémoli [1] et F. Mémoli et G. Sapiro [1] basés sur les idées de M. Gromov [1]
pour les structures métriques et les isométries (Prix Abel 2009).
192 Chapitre 5. Espaces vectoriels, convergences et applications linéaires

de A ◦ C −1 . Par définiton
k
X
d(A, C) ≤ kFi − IkL(Rn ) + kFi−1 − IkL(Rn )
i=1

X
+ kGj − IkL(Rn ) + kGj−1 − IkL(Rn )
j=1
k
X
⇒ d(A, C) ≤ inf kFi − IkL(Rn ) + kFi−1 − IkL(Rn )
F1 ,...,Fk ∈GL (n)
i=1
A◦B −1 =F1 ◦···◦Fk

X
+ inf kGj − IkL(Rn ) + kG−1
j − IkL(Rn )
G1 ,...,Gℓ ∈GL (n)
j=1
B◦C −1 =G1 ◦···◦Gℓ

⇒ d(A, C) ≤ d(A, B) + d(B, C).

(ii) Il reste à démontrer que GL (n) est complet par rapport à cette métrique.
Soit {An } une suite de Cauchy dans (GL (n), d). On procède en quatre étapes.
n
(a) Bornitude de {An } et {A−1 n } dans L(R ). Par l’inégalité du triangle

|d(I, Am ) − d(I, An )| ≤ d(Am , An ),

{d(I, An )} est Cauchy, et donc bornée par une constante L. Du Lemme 7.2

∀n ≥ 1, kAn − Ik + kA−1
n − Ik ≤ d(An , I) e
d(An ,I)
≤ L eL
déf
⇒ kAn k + kA−1 −1 −1 L
n k ≤ kIk + kAn − Ik + kIk + kAn − Ik ≤ c = 2 + L e .

n
Les suites {An } et {A−1
n } sont donc bornées dans L(R ).
−1 n
(b) Convergence de {An } et {An } dans L(R ). Pour tout m, n

An − Am = (An ◦ A−1
m − I) ◦ Am et A−1 −1 −1 −1
n − Am = (An ◦ Am − I) ◦ Am

et
−1
kAm − An k ≤ kAn ◦ Am − Ik kAm k ≤ c kAn ◦ A−1
m − Ik
kA−1 −1 −1 −1 −1
m − An k ≤ kAn ◦ Am − Ik kAm k ≤ c kAn ◦ Am − Ik
kAm − An k + kA−1 −1 −1 −1
m − An k ≤ c (kAn ◦ Am − Ik + kAn ◦ Am − Ik)

≤ c d(An , Am ) ed(An,Am ) .
n
Les suites {An } et {A−1n } sont donc Cauchy dans l’espace de Banach L(R ) et il
n −1
existe A et B dans L(R ) tel que An → A et An → B.
(c) A est bijective. Par le Théorème 6.4 (ii), la composition (F, G) 7→ F ◦ G :
L(Rn ) × L(Rn ) → L(Rn ) est continue :

I = An ◦ A−1
n →A◦B et I = An−1 ◦ An → B ◦ A.
7. Groupe général linéaire : métriques et complétude 193

On a donc bien B = A−1 et A ∈ GL (n) est un candidat pour la limite de {An }


dans (GL (n), d). De plus, kAk + kA−1 k ≤ c.
(d) Convergence de An vers A dans (GL (n), d). On procède aux estimés
d(An , A) = d(I, A ◦ A−1 −1
n ) ≤ kI − A ◦ An k + kI − An ◦ A
−1
k
= k(An − A) ◦ A−1
n k + k(A − An ) ◦ A
−1
k
≤ kAn − Ak (kA−1n k + kA
−1
k)
≤ kAn − Ak 2 c.
Comme kAn − Ak tend vers 0, d(An , A) tend vers 0 et A est bien la limite de An
dans (GL (n), d).
Démonstration du Lemme 7.2. Par définition
k
X
déf
d(A, I) = inf kFi − IkL(Rn ) + kFi−1 − IkL(Rn )
F1 ,...,Fk ∈GL (n)
A=F1 ◦···◦Fk i=1

≤ kA − IkL(Rn ) + kA−1 − IkL(Rn ) .


Soit F1 ◦ · · · + ◦Fk une factorisation de A :
A − I =F1 ◦ · · · + ◦Fk − I
=(F1 ◦ · · · ◦ Fk − F2 ◦ · · · ◦ Fk )
+ (F2 ◦ · · · ◦ Fk − F3 ◦ · · · ◦ Fk ) + · · · + Fk − I
=(F1 − I) ◦ (F2 ◦ · · · ◦ Fk )
+ (F2 − I) ◦ (F3 ◦ · · · ◦ Fk ) + · · · + (Fk − I).
On a les estimés suivants
kA − Ik ≤kF1 − Ik kF2 ◦ · · · ◦ Fk k
+ kF2 − Ik kF3 ◦ · · · ◦ Fk k + · · · + kFk − Ik
k
Y k
Y
≤kF1 − Ik kFi k + kF2 − Ik kFi k + · · · + kFk − Ik.
i=2 i=3

Puisque (1 + x) ≤ ex pour x ≥ 0, on a l’inégalité


kFi k ≤ kFi − Ik + kIk = 1 + kFi − Ik ≤ ekFi −Ik .
En l’applicant cette inégalité à plusieurs reprises, pour tout j, 1 ≤ j ≤ k,
k
Y k
Y Pk Pk
kFi −Ik
kFi k ≤ ekFi −Ik = e i=j ≤e i=i kFi −Ik
.
i=j i=j

Finalement,
k
X Pk
kFi −Ik
kA − Ik =kF1 ◦ · · · + ◦Fk − Ik ≤ kFi − Ik e i=1 ,
i=1
194 Chapitre 5. Espaces vectoriels, convergences et applications linéaires

et, de la même façon,

k
X Pk
kFi−1 −Ik
kA−1 − Ik ≤ kFi−1 − Ik e i=1

i=1
k
X  Pk
kFi − Ik + kFi−1 − Ik e i=1 (kFi −Ik+kFi −Ik) .
−1
⇒ kA−1 − Ik + kA−1 − Ik ≤
i=1

Comme la fonction x ex est monotone strictement croissante pour x ≥ 0, on peut


prendre l’infimum sur toutes les factorisation finie {Fi } de A ce qui donne l’inégalité
(7.9).

8 Exercices
Exercice 8.1.
Soit {fn } une suite de fonctions dans C 0 (K), K ⊂ Rn compact. Montrer que si
{fn } est uniformément équicontinue et que pour chaque x ∈ K, la suite {fn (x)}
dans R converge vers une fonction f : K → R,

fn (x) → f (x),

alors {fn } converge uniformément vers f . (Une famille de fonctions {fα }, fα : K →


R, est uniformément équicontinue sur K si, pour chaque ε > 0, il existe δ > 0 tel
que

∀α, ∀x, y ∈ K tel que ky − xk < δ, |fα (y) − fα (x)| < ε.)

Exercice 8.2.
Soit (X, d) un espace métrique compact, l’ensemble

déf
X = {A : ∅ 6= A ⊂ X et A fermé}
déf
et ∀A ∈ X , ∀x ∈ X, dA (x) = inf d(a, x).
a∈A

(i) Montrer que les fonctions x 7→ dA (x) : X → R+ et

déf
(A, B) 7→ ρX (A, B) = sup |dA (x) − dB (x)| : X × X → R+
x∈X

sont bien définies.


(ii) Montrer que pour tout A ∈ X , d−1
A {0} = A.
(iii) Montrer que ρX est une métrique sur X .
(iv) Montrer que (X , ρX ) est un espace métrique complet.
8. Exercices 195

Exercice 8.3.
Soit Ω un sous-ensemble ouvert non-vide de Rn . Montrer qu’il existe une suite
croissante de compacts non vides Kk tel que Ω = ∪k≥1 Kk et, pour tout compact
K ⊂ Ω, il existe k ≥ 1 tel que K ⊂ Kk .

Exercice 8.4.
Soit Ω un ouvert non-vide de Rn et
déf
C(Ω) = {f : Ω → R |f continue sur Ω}

l’espace des fonctions continues sur Ω, où Ω n’est pas nécessairement borné. Soit
{Kk } la famille des sous-ensembles compacts construite dans l’Exercice 8.3 et pour
tout f ∈ C(Ω) et k ≥ 1 on pose
déf
qk (f ) = sup |f (x)|.
x∈Kk

Montrer que la fonction



X
déf 1 qk (f − g)
d(f, g) =
2k 1 + qk (f − g)
k=1

est une métrique sur C(Ω).

Exercice 8.5. (i) Montrer que si A ∈ L(Rn ) est inversible, alors A−1 ∈ L(Rn ).
(ii) Montrer que si A ∈ L(Rn , Rm ) est injective, alors A⊤ A ∈ L(Rn ) est inver-
sible, où A⊤ ∈ L(Rm , Rn ) est l’application transposée de A.
(iii) Montrer que pour A ∈ L(Rn , Rm ), Ker A et Im A sont des sous-espaces
linéaires (espaces vectoriels).

Exercice 8.6. (i) Trouver et caractériser tous les A ∈ GL (n) tels que

d(Ax, Ay) = d(x, y) (8.1)

pour l’une des métriques complètes sur GL (n).


(ii) Est ce que l’ensemble

{A ∈ GL (n) : d(Ax, Ay) = d(x, y) x, y ∈ Rn } (8.2)

forme un groupe ?

Exercice 8.7.
Soit X = R \{0} et la fonction

déf 1 1
x, y 7→ d(x, y) = |x − y| + − .
x y

Montrer que (X, d) est un espace métrique complet.


196 Chapitre 5. Espaces vectoriels, convergences et applications linéaires

Exercice 8.8.
On considère l’ensemble P(X) des sous-ensembles d’un ensemble arbitraire X in-
cluant l’ensemble vide ∅ muni de l’opération différence symétrique △
déf
A △ B = [A\B] ∪ [B\A] .

Montrer que (P(X), △) vérifie les propriétés d’un groupe abélien ((i) à (v)) :
(i) pour tous A, B ∈ P(X), A △ B ∈ P(X) ;
(ii) pour tous A, B, C ∈ P(X), (A △ B) △ C = A △ (B △ C) ;
(iii) ∅ est l’élément neutre pour lequel A △ ∅ = A = A △ ∅ pour tout
A ∈ P(X) ;
(iv) chaque A ∈ P(X) possède un inverse puisque A △ A = ∅. Ici A est son
propre inverse, c’est-à-dire, A−1 = A ;
(v) (commutativité) A △ B = B △ A ;
(vi) pour A, B, C ∈ P(X), (A △ B) ∩ C = (A ∩ C) △ (B ∩ C).

Exercice 8.9.
Soit X un ensemble arbitraire et P(X) l’ensemble de tous les sous-ensembles de X
incluant l’ensemble vide ∅. Soit l’ensemble
déf
{0, 1}X = {toutes les applications f : X → {0, 1}}

de toutes les applications définies sur X à valeurs dans l’ensemble à deux éléments
{0, 1}. On associe à chaque A ∈ P(X) la fonction caractéristique
(
déf 1, si x ∈ A
χA (x) =
0, si x ∈ X\A.

(i) Montrer que l’application

A 7→ χA : P(X) → {0, 1}X

est bien définie et bijective.


(ii) Montrer que {0, 1}X est un groupe abélien pour l’opération
déf
(f1 △ f2 )(x) = |f1 (x) − f2 (x)| (8.3)

et en déduire que

(χA △ χB )(x) = |χA (x) − χB (x)| = χA△B (x). (8.4)

pour la différence symétrique entre A et B dans P(X)


déf
A △ B = [A\B] ∪ [B\A]. (8.5)
8. Exercices 197

(iii) Montrer que la fonction


déf
d(f, g) = sup |f (x) − g(x)| (8.6)
x∈X

définit une métrique sur {0, 1}X et que ({0, 1}X , d) est complet.
(iv) Montrer que (P(X), ρ) est un espace métrique complet pour la métrique
déf
ρ(A, B) = sup |χA (x) − χB (x)| .
x∈X

(v) En supposant démontré que P(X) est un groupe abélien pour l’opération
binaire différence symétrique (8.5) (voir la section 7.1), montrer que △ est
continue par rapport à la métrique ρ.

Exercice 8.10 (Arzelà-Ascoli).


Soit (X, d) un espace métrique compact et C 0 (X; Rk ) pour k ≥ 1 muni de la norme

k
!1/2
déf
X
2
kf kC 0 = sup kf (x)k, kyk = |yi | . (8.7)
x∈X i=1

Démontrer les énoncés suivants.


(i) Si S est un sous-ensemble compact de C 0 (X; Rk ), alors S est fermé,
(a) S est uniformément équicontinu et
(b) S est uniformément borné, c’est-à-dire, ∃M > 0, ∀f ∈ S, ∀x ∈
X, kf (x)k ≤ M .
(ii) Réciproquement, si S est un sous-ensemble de C 0 (X; Rk ) vérifiant (a) et
(b), alors l’adhérence S de S est compacte dans C 0 (X; Rk ).
198 Chapitre 5. Espaces vectoriels, convergences et applications linéaires
Chapitre 6
Dérivée,
dérivées directionnelles
et différentielles

1 Introduction
Selon certains historiens le calcul différentiel ou infinitésimal serait implicite-
ment apparu très tôt. Par exemple, le mathématicien astronome Aryabhata (476–
550 ap. J.-C.) en 499 ap. J.-C. utilisait une notion d’infinitésimaux et exprimait
un problème d’astronomie sous la forme d’une équation différentielle élémentaire. 1
Pour d’autres historiens, le calcul différentiel fut inventé au XVIIe siècle.
Si l’on accepte ce point de vue, la première idée du calcul différentiel et de la
règle pour le calcul des extrema d’une fonction remonteraient à Pierre de Fermat 2
en 1638. Il imagina, pour déterminer les maxima et minima d’une fonction et les
tangentes à certaines courbes 3 , une méthode, dite de maximis et minimis, qui le fait
regarder comme le premier inventeur du calcul différentiel. Les idées menant aux
notions de fonction, de dérivée, et d’intégrale furent développées pendant le XVIIe
siècle. Il est généralement accepté que la notion de dérivée est due à Leibniz 4
et Newton. 5 La condition obtenue par Fermat pour l’extremum d’une fonction
algébrique est donc de facto généralisée sous la forme f ′ (x) = 0. Elle est utilisée en
1691 dans la démonstration du Théorème de Rolle 6 qui mène à la règle de l’Hôpital 7
en 1696.
La publication des principaux ouvrages de Newton 8 prit plusieurs années,
1. George G. Joseph, The Crest of the Peacock, Princeton University Press (2000), pp. 298–
300.
2. Pierre de Fermat (1601–1665).
3. D’abord consignée dans une lettre à Mersenne (le correspondant de nombreux scientifiques
de l’époque qui assurait la diffusion de nouveaux résultats) en 1638, la première version imprimée
de la méthode se trouve dans le cinquième volume de Supplementum Cursus Mathematici (1642)
écrit par Herigone, et ce n’est qu’en 1679 qu’elle apparaı̂t dans Varia opera mathematica sous
le titre de Methodus ad disquirendam Maximam et Minimam suivie de De tangentibus linearum
curvarum.
4. Gottfried Wilhelm Leibniz (1646–1716).
5. Sir Isaac Newton (1643–1728).
6. Michel Rolle (1652–1719).
7. Guillaume François Antoine de l’Hôpital (1661–1704).
8. La Method of Fluxions complétée 1671 et publiéee en 1736 et Philosophiae Naturalis

199
200 Chapitre 6. Dérivée, dérivées directionnelles et différentielles

alors que Leibniz publia le premier (Nova methodus, 9 1684) et le domaine fut
subséquemment tourmenté par une querelle de priorité entre les deux inventeurs
du calcul.
≪Au début du calcul différentiel, l’utilisation de quantités infinitési-

males fut perçue comme non rigoureuse et farouchement critiquée par


plusieurs auteurs, notamment par Michel Rolle et Bishop Berkeley. Ber-
keley qualifia les infinitésimaux de fantômes de quantités évanessantes
dans son livre, The Analyst, en 1734. Plusieurs mathématiciens, in-
cluant Maclaurin, essayèrent de démontrer le bien-fondé de l’utilisation
des infinitésimaux, mais ce n’est que 150 ans plus tard, grâce aux tra-
vaux de Cauchy 10 et de Weierstrass 11 qui permettreront finalement
d’éviter les notions rudimentaires de quantités infinitésimales, que le cal-
cul différentiel et intégral put s’appuyer sur des bases solides. Dans les
écrits de Cauchy, on trouve un spectre versatile d’approches fondamen-
tales, incluant une définition de la continuité en termes d’infinitésimaux,
et un prototype (quelque peu imprécis) d’une définition de type (ε, δ)
de la limite pour définir la différentiation. Dans ses travaux Weierstrass
formalise la notion de limite et élimine les infinitesimaux. Après Weiers-
trass, il devint alors habituel de faire appel aux limites plutôt qu’aux
quantités infinitésimales pour le calcul. Cette approche formalisée par
Weierstrass devint connue comme le calcul standard. Le terme calcul
infinitésimal demeura utilisé et se répandit largement pour se référer à
l’approche de Weierstrass.≫ (cf. traduction de l’anglais de Wikipedia,
Infinitesimal Calculus)

2 Fonctions numériques d’une variable réelle


Avant d’aborder les fonctions numériques de plusieurs variables réelles, on
considère les fonctions numériques d’une seule variable réelle (voir Figure 6.1).

Définition 2.1.
Soit f : R → R une fonction numérique d’une variable réelle.
(i) La fonction f est dérivable à droite en x ∈ R si la limite
f (x + t) − f (x)
lim+ (2.1)
tց0 t
existe et est finie où limtց0+ signifie que t tend vers 0 par valeurs stricte-
ment positives. On l’écrira df (x; +1).
Principia Mathematica (Principes mathématiques de philosophie naturelle), souvent abrégé en
Principia (Principes), 1687 et 1726 (troisième édition).
9. Nova methodus pro maximis et minimis, itemque tangentibus, quae nec fractas nec ir-
rationales quantitates moratur, et singulare pro illis calculi genus (Nouvelle méthode pour les
maxima et minima, ainsi que les tangentes, qui ne bute ni sur les fractions ni sur les irration-
nelles, avec un mode original de calcul), dans Acta Eruditorum, 1684, un journal créé à Leipzig
deux ans plus tôt.
10. Augustin-Louis Cauchy (1789–1857).
11. Karl Theodor Wilhelm Weierstrass (1815–1897).
2. Fonctions numériques d’une variable réelle 201

La fonction f est continue à droite en x ∈ R si

lim f (x + t) = f (x) (2.2)


tց0+

(ii) La fonction f est dérivable à gauche 12 en x ∈ R si la limite


f (x − t) − f (x)
lim+ (2.3)
tց0 t
existe et est finie. On l’écrira df (x; −1).
La fonction f est continue à gauche en x ∈ R si

lim f (x − t) = f (x) (2.4)


tց0+

(iii) La fonction f est dérivable en x ∈ R si la limite


f (x + t) − f (x)
lim (2.5)
t
t→0
existe et est finie où limt→0 signifie que t ∈ R tend vers 0. On utilisera la
notation f ′ (x) de Lagrange, df /dx(x) de Leibniz ou f˙(x) de Newton
Les deux premières notions à droite et à gauche sont ce que l’on peut appeler des
semi-différentielles en x dans les directions +1 et −1, respectivement.

Les dérivées à droite et à gauche sont aussi des cas particuliers des différentielles de
Dini 13 .

Remarque 2.1.
Si f est dérivable à droite en x ∈ R, on a l’homogénéité positive :
déf f (x + αt) − f (x)
∀α ≥ 0, df (x; α) = lim = α df (x; +1), df (x; 0) = 0; (2.6)
tց0+ t
de même, si f est dérivable à gauche en x ∈ R, on a l’homogénéité positive :
déf f (x − αt) − f (x)
∀α ≥ 0, df (x; −α) = lim = α df (x; −1), df (x; 0) = 0. (2.7)
tց0+ t
On remarquera facilement que si f est dérivable en x, alors

f ′ (x) = df (x; +1) = −df (x; −1) (2.8)


déf f (x − αt) − f (x)
⇒ ∀α ≥ 0, df (x; −α) = lim = α df (x; −1) = −α f ′ (x)
t→0 t
et on a l’homogénéité
déf f (x + αt) − f (x)
∀α ∈ R, df (x; α) = lim = α df (x; +1) = α f ′ (x). (2.9)
t→0 t
12. Techniquement parlant, il s’agit de la dérivée définie en (i) dans la direction −1.
13. Ulisse Dini (1845–1918), U. Dini [1].
202 Chapitre 6. Dérivée, dérivées directionnelles et différentielles

f (x) .

f (x) . f (x) .
x x x
f dérivable à droite f dérivable à gauche f dérivable à gauche
en x. en x. et à droite en x.

f (x) .
f (x) .

x x
f dérivable en x. f n’est dérivable ni à gauche
ni à droite en x.

Figure 6.1. Exemples de dérivées à droite et à gauche.

Donc, si f est dérivable en x ∈ R, l’homogénéité positive combinée avec la condition

df (x; −1) = −df (x; 1) (2.10)

entraı̂ne que l’application


f (x + tv) − f (x)
déf
v 7→ df (x; v) = lim+ : R→R (2.11)
tց0 t
est homogène et donc linéaire et continue

∀α, β ∈ R et ∀v, w ∈ R, df (x; αv + βw) = α df (x; v) + β df (x; w)

car la linéarité coı̈ncide avec l’homogénéité en dimension un.

2.1 Continuité et différentiabilité


Théorème 2.1. (i) Si f est dérivable à droite (resp. gauche) en un point
x ∈ R, alors f est continue à droite (resp. gauche) en x.
(ii) Si f est dérivable en x, alors f est continue en x.
Démonstration. Il suffit de démontrer la continuité à droite à partir de la dérivabilité
à droite. En effet, par définition de la dérivée à droite : pour tout ε > 0 il existe
2. Fonctions numériques d’une variable réelle 203

δ(x) > 0 tel que

f (x + t) − f (x)
∀t, 0 < t < δ(x), − df (x; 1) < ε.
t

Ceci implique que

|f (x + t) − f (x)| < t (|df (x; +1)| + ε) .

La quantité c(x, ε) = |df (x; +1)| + ε > 0 ne dépend que de x et ε. Si on prend


 
′ ε
δ (x) = min δ(x), > 0,
c(x, ε)

alors
0 < t < δ ′ (x) entraı̂ne |f (x + t) − f (x)| < t c(ε, x) < ε

et, de là, la continuité de f à droite, puisque ε/c(x, ε) ≤ 1.

Remarque 2.2.
On rappelle que pour les fonctions dérivables en x, les opérations ponctuelles de
somme de deux fonctions, de multiplication par un réel, de multiplication et de
division par une fonction non-nulle sont dérivables en x. De plus, la composition
(f ◦ g)(x) = f (g(x)) est dérivable en x si f ′ (g(x)) et g ′ (x) existent et sa dérivée est
donnée par (f ◦ g)′ (x) = f ′ (g(x)) g ′ (x) (voir l’Exercice 7.1).

Exemple 2.1.
Soit la fonction définie par

x sin 1 , x 6= 0
déf
f (x) = x (2.12)
0, x = 0.

Elle est dérivable pour x 6= 0


1 1 1
f ′ (x) = sin − cos , x 6= 0.
x x x
Lorsque x = 0, on retourne à la définition et l’on considère le quotient différentiel

f (t) − f (0) 1
− 0 = sin , t 6= 0;
t t
qui ne possède pas de limite lorsque t → 0. Ainsi f est dérivable partout dans R
sauf en x = 0. Il n’y a pas non plus de dérivée à droite ou à gauche en x = 0.

En général la dérivée d’une fonction dérivable n’est pas continue comme le


montre l’exemple suivant.
204 Chapitre 6. Dérivée, dérivées directionnelles et différentielles

Exemple 2.2.
Soit la fonction définie par
(
déf x2 sin x1 , x 6= 0
f (x) = (2.13)
0, x = 0.

Elle est dérivable pour x 6= 0


1 1
f ′ (x) = 2x sin − cos , x 6= 0.
x x
Lorsque x = 0, on retourne à la définition et l’on considère le quotient différentiel

f (t) − f (0) 1
− 0 = t sin − 0 ≤ |t|, t 6= 0;
t t

en laissant t → 0 on voit que f ′ (0) = 0. Ainsi f est dérivable partout dans R,


mais f ′ n’est pas une fonction continue puisque cos(1/t) ne tend pas vers une limite
lorsque t tend vers 0. Il n’y a pas non plus de limite à droite ou à gauche.

Cet exemple montre qu’une fonction dérivable en tout point peut avoir une
dérivée qui ne soit pas continue en certains points. Ceci ne veut cependant pas
dire que n’importe quelle fonction puisse être la dérivée d’une fonction continue et
dérivable en tout point. En effet la dérivée d’une fonction continue et dérivable en
tout point d’un intervalle ouvert possède une propriété importante dont jouissent
aussi les fonctions continues sur un intervalle : elles passent par tous les points
intermédiaires (§ 2.3, Théorème 2.5).

2.2 Théorème de la moyenne ou des accroissements finis


Avec la notion de dérivée, on récupère facilement la règle de Fermat de 1638.

Théorème 2.2 (Règle de Fermat). Soit f : [a, b] → R, a < b. Supposons que f


possède un maximum local au point x ∈ ]a, b[ , c’est-à-dire,
(
∃ un voisinage V (x) de x tel que V (x) ⊂ ]a, b[ et
(2.14)
∀y ∈ V (x), f (x) ≥ f (y).

Si f est dérivable en x, on a

f ′ (x) = 0. (2.15)

On obtient la même conclusion pour un minimum local.

Démonstration. Comme x est un point intérieur de [a, b], on peut choisir un δ > 0
tel que ] a, b [ ⊃ V (x) ⊃ Iδ = ] x − δ, x + δ [. On a donc

∀y ∈ Iδ , f (y) ≤ f (x).
2. Fonctions numériques d’une variable réelle 205

Pour t, 0 < t < δ, on a f (x − t) ≤ f (x) ce qui entraı̂ne

f (x − t) − f (x)
≤0 ⇒ df (x; −1) ≤ 0
t

car f est dérivable en x ; de même f (x + t) ≤ f (x) entraı̂ne

f (x + t) − f (x)
≤0 ⇒ df (x; +1) ≤ 0.
t

Mais comme f est dérivable en x, on a 0 ≥ df (x; −1) = −df (x; +1) ≥ 0 et donc
f ′ (x) = df (x; +1) = 0.

Le théorème suivant est une forme généralisée du théorème de la moyenne ou


des accroissements finis impliquant deux fonctions.

Théorème 2.3. Si f et g sont deux fonctions continues sur [a, b] et dérivables sur
]a, b[ , alors il existe un point x ∈ ]a, b[ auquel

[f (b) − f (a)] g ′ (x) = [g(b) − g(a)] f ′ (x). (2.16)

Démonstration. On pose

h(t) = [f (b) − f (a)]g(t) − [g(b) − g(a)]f (t), a ≤ t ≤ b.

Alors h est continue dans [a, b], dérivable dans ] a, b [, et

h(a) = f (b)g(a) − f (a)g(b) = h(b).

Pour démontrer ce théorème, il suffit de montrer que h′ (x) = 0 pour un point


x ∈ ]a, b[ . Si h est constante ceci est vrai pour tout x ∈ ]a, b[ . Si h(t) > h(a) pour
un t ∈ ] a, b [, soit x le point de [a, b] pour lequel h atteint son maximum. Il existe
car f est continue sur l’intervalle compact [a, b]. Comme h(a) = h(b), le point x
appartient à l’intervalle ouvert ]a, b[ et h′ (x) = 0. Si h(t) < h(a) pour un t ∈ ]a, b[ ,
on répète le même raisonnement en choisissant pour x un point de [a, b] où h atteint
son minimum.

Le Théorème de la moyenne ou des accroissements finis est alors un corollaire


au théorème précédent.

Théorème 2.4 (de la moyenne). Si f est econtinue sur [a, b] et dérivable partout
dans ]a, b[ , il existe un point x ∈ ]a, b[ pour lequel

f (b) − f (a) = (b − a)f ′ (x). (2.17)

Démonstration. On prend g(x) = x dans le théorème précédent.


206 Chapitre 6. Dérivée, dérivées directionnelles et différentielles

2.3 Propriété de la dérivée d’une fonction dérivable partout


On revient maintenant à la question soulevée dans le contexte de l’Exemple 2.2.
On sait qu’en général il n’y a pas continuité de la dérivée. On a la propriété sui-
vante connue sous le nom de Théorème des valeurs intermédiaires pour les fonctions
continues.
Théorème 2.5 (W. Rudin [1, Théorème. 5.12, p. 100]). Soit f : R → R une
fonction dérivable dans ]a0 , b0 [ .
(i) Soient a0 < a < b < b0 et λ un nombre tel que
f ′ (a) < λ < f ′ (b) (resp. f ′ (a) > λ > f ′ (b)). (2.18)
Alors il existe un point x ∈ ]a, b[ tel que f ′ (x) = λ.
(ii) La dérivée de f dans ]a0 , b0 [ ne peut avoir de discontinuités de la première
espèce.
Rappelons de la Définition 9.2 du Chapitre 4 que si une fonction f est disconti-
nue en un point x et que sa limite à droite f (x+ ) et sa limite à gauche f (x− ) existent
et ne sont pas égales, on dit que f possède une discontinuité de la première espèce.
Sinon on dit que la discontinuité de f est de la seconde espèce (voir l’Exemple 2.2).
Démonstration. On considère la fonction g(x) = f (x) − λ x. Comme f est dérivable
dans ]a0 , b0 [ , f est continue sur l’intervalle compact [a, b] et il existe un point
minimisant x ∈ [a, b] de g par rapport à [a, b]. Si a < x < b, alors, par la règle de
Fermat du Théorème 2.2, g ′ (x) = 0 et nécessairement f ′ (x) − λ = 0. On montre
maintenant que le minimum ne peut se produire en x = a ou x = b. Si x = a, alors
g(a + t) − g(a)
∀t, 0 < t ≤ b − a, g(a + t) − g(a) ≥ 0 ⇒ ≥0 ⇒ g ′ (a) ≥ 0.
t
Mais, comme g ′ (a) = f ′ (a) − λ et que f ′ (a) − λ < 0, on a une contradiction. De là
même façon, si le minimum se produit en x = b
g(b − t) − g(b)
∀t, 0 < t ≤ b − a, g(b − t) − g(b) ≥ 0 ⇒ ≥0 ⇒ −g ′ (b) ≥ 0.
t
Mais, comme g ′ (b) = f ′ (b) − λ et que f ′ (b) − λ > 0, on a une contradiction.

2.4 Théorème de Taylor


Lorsque f possède une dérivée f ′ dans un intervalle et que f ′ possède aussi
une dérivée dans le même intervalle on écrira cette seconde dérivée f (2) . De la même
façon on notera par f (n) la dérivée de f d’ordre n, n ≥ 1.
On remarque que pour que f (n) (x) existe en un point x, il est nécessaire que
(n−1)
f existe dans un voisinage de x et qu’elle soit dérivable (et donc continue) en
ce point. Puisque f (n−1) doit exister dans un voisinage de x, f (n−2) doit exister et
être dérivable dans ce voisinage et on peut ainsi remonter jusqu’à f . En particulier,
une fonction f pour laquelle f (n) existe en tout point de ] a, b [ est une fonction tel
que f et ses dérivée jusqu’à l’ordre n − 1 sont continues et dérivables dans ] a, b [.
2. Fonctions numériques d’une variable réelle 207

Théorème 2.6 (Taylor 14 ). Soit f : ]a, b[ → R tel que f (n) existe dans ]a, b[ pour
un entier n ≥ 1. Étant donné x, a < x < b, on définit le polynôme de degré n − 1
n−1
X
déf f (k) (x)
Px (y) = (y − x)k , a < y < b. (2.19)
k!
k=0

Pour tout y, a < y < b, il existe θ, 0 < θ < 1, tel que


f (n) (x + θ (y − x))
f (y) = Px (y) + (y − x)n . (2.20)
n!
La formule (2.19) est valide que y soit d’un côté ou de l’autre de x.
Démonstration. Si y = x, il n’y a rien à démontrer puisque Px (x) = f (x). Si y 6= x,
la combinaison convexe x + θ (y − x), 0 ≤ θ ≤ 1, balaie l’intervalle [x, y] si x < y ou
[y, x] si x > y. On considère la fonction suivante paramétrée par M :
n−1
X
déf θk θn
g(θ) = f (x + θ(y − x)) − f (k) (x) (y − x)k − M (y − x)n ,
k! n!
k=0

pour 0 ≤ θ ≤ 1. On voit que g(0) = 0 et que


n−1
X f (k) (x) (y − x)n
g(1) = f (y) − (y − x)k − M
k! n!
k=0 (2.21)
(y − x)n
= f (y) − Px (y) − M .
n!
Comme y 6= x, on peut choisir M tel que g(1) = 0 dans (2.21).
La dérivée ℓ-ième de g, 1 ≤ ℓ ≤ n − 1, est donnée par
g (ℓ) (θ) =f (ℓ) (x + θ(y − x)) (y − x)ℓ
n−1
X θ(k−ℓ) θ(n−ℓ)
− f (k) (x) (y − x)k − M (y − x)n
(k − ℓ)! (n − ℓ)!
k=ℓ

⇒ g ′ (0) = 0, g (2) (0) = 0, ..., g (n−1) (0) = 0.


Comme la dérivée n-ième de θk , 0 ≤ k ≤ n − 1, est zéro, la dérivée n-ième de g est
h i
g (n) (θ) = f (n) (x + θ (y − x)) − M (y − x)n .

Il suffit alors de démontrer qu’il existe θn ∈ ]0, 1[ tel que g(1) = 0 = g (n) (θn ) pour
obtenir que M = f (n) (x+θn (y −x)) et, en substituant dans (2.21), la formule (2.20).
En effet, la fonction g est continue sur [0, 1] et dérivable sur [0, 1] et g(1) = g(0) = 0.
Par le Théorème 2.4, il existe θ1 ∈ ]0, 1[ tel que 0 = g(1)−g(0) = g ′ (θ1 ). De nouveau,
par le Théorème 2.4, il existe θ2 ∈ ]0, θ1 [ tel que 0 = g ′ (θ1 ) − g ′ (0) = θ1 g (2) (θ2 ) et
donc g (2) (θ2 ) = 0. Ainsi de suite jusqu’à la dernière étape : il existe θn ∈ ]0, θn−1 [ tel
que 0 = g (n−1) (θn−1 ) − g (n−1) (0) = θn−1 g (n) (θn ) et donc g (n) (θn ) = 0. Finalement,
g(1) = 0 entraı̂ne g (n) (θn ) = 0 et, comme y 6= x, M = f (n) (x + θn (y − x)).
14. Brook Taylor (1685–1731).
208 Chapitre 6. Dérivée, dérivées directionnelles et différentielles

3 Fonctions de plusieurs variables réelles


Dans ce paragraphe, on procèdera de façon constructive ce qui ne respec-
tera pas la chronologique du dévelopement de la différentielle d’une fonction. On
y reviendra plus tard une fois que ces notions auront été introduites et que leurs
principales propriétés auront été étudiées.
Plusieurs noms reviendront dans ce contexte : Karl Weierstrass (1815–1897)
qui est selon toutes évidences le premier à avoir donné une définition correcte de la
différentielle d’une fonction de plusieurs variables, Otto Stolz (1842–1905), James
Pierpont (1866–1938) et William Henry Young (1863–1942) qui eurent des contacts
avec Weierstrass lorsqu’il donnait ses cours magistraux à Berlin, Jacques Hadamard
(1865–1963), Maurice Fréchet (1873–1973) et René Gateaux (1889–1914) ainsi que
Paul Lévy (1886–1971) qui assura la publication des travaux de Gateaux après sa
mort aux premiers moments de la première guerre mondiale (1914–1918).

3.1 Dérivée directionelle et différentielle au sens de Gateaux


3.1.1 Définitions et propriétés
Il n’y a pas de difficulté à étendre les définitions du paragraphe précédent à
des fonctions vectorielles d’un seule variable t 7→ h(t) : R → Rm , m ≥ 1. La dérivée
h′ (t) et les dérivées à droite dh(t; +1) et à gauche dh(t; −1) au point t sont définies
de la même façon, mais la convergence des quotients différentiels a lieu dans l’espace
Rm au lieu de R ou, de façon équivalente, composante par composante.
Il en va différemment d’une fonction numérique de plusieurs variables f : Rn →
m
R . À première vue, il semblerait naturel de se ramener à une fonction d’une seule
variable réelle de la façon suivante, À partir d’un point x ∈ Rn et d’une direction 15
v ∈ Rn , on peut considérer la nouvelle fonction numérique de la variable réelle t
déf
t 7→ g(t) = f (x + tv) : R → Rm (3.1)

et on se retrouve dans le cadre et les conditions du paragraphe 2. Les notions sui-


vantes pour des fonctionnelles, c’est-à-dire, des fonctions de fonctions plutôt que des
fonctions d’un nombre fini de variables, auraient été inspirées à René Gateaux 16 lors
de son passage chez V. Volterra 17 aux premiers moments du Calcul des variations.
15. On entend souvent par direction un vecteur v ∈ Rn de longueur un. Le terme direction
est utilisé ici dans un sens plus large. Il s’agit d’un vecteur v de Rn et v peut prendre la valeur 0.
16. René Eugène Gateaux (1889–1914). Dans son acte de naissance ainsi que dans ses textes,
lettres et ses publications avant sa mort (R. Gateaux [1, 2, 3, 4, 5]) son nom est orthographié
sans accent circonflexe (cf. L. Mazilak [1], M. Barbut, B. Locker, L. Mazilak et P. Priou-
ret [1], L. Mazilak et R. Tazzioli [1]). L’accent circonflexe est apparu dans ses trois publications
posthumes de 1919 à 1922 au Bulletin de la Société Mathématique de France probablement par
homonymie avec les gâteaux (pâtisserie) (cf. L. Mazilak ]2]). On a retrouvé dans les papiers de
Gateaux des notes qui furent confiées à Jacques Hadamard. Elles furent examinées par Paul Lévy
qui prêta son concours à leur publication dans le Bulletin de la Société Mathématique de France
(cf. R. Gateaux [6, 7, 8]). Ses travaux sur le Calcul fonctionnel méritèrent à Gateaux le prix
Francœur de l’Académie des Sciences en 1916. Paul Lévy (1886–1971) fit connaı̂tre les travaux de
Gateaux dans ses Leçons d’analyse fonctionnelle (1922).
17. Vito Volterra (1860–1940).
3. Fonctions de plusieurs variables réelles 209

Définition 3.1.
Soient f : Rn → Rm , x un point de Rn et v ∈ Rn une direction.
(i) f est dérivable au point x dans la direction v si la limite suivante existe
f (x + tv) − f (x)
lim . (3.2)
t→0 t
Lorsque la limite (3.2) existe, on la désignera par f ′ (x; v). Par définition
f ′ (x; 0) = 0 et on a l’homogénéité

∀α ∈ R, f ′ (x; αv) existe et f ′ (x; αv) = α f ′ (x; v).

(ii) f est directionnellement dérivable en x si f ′ (x; v) existe pour tout v ∈ Rn .


(iii) f est différentiable au sens de Gateaux au point x si f est directionnelle-
ment dérivable en x et que l’application
déf
v 7→ Df (x)v = f ′ (x; v) : Rn → Rm (3.3)

est linéaire. On dira aussi que f est Gateaux différentiable en x et on


appellera Df (x) l’application jacobienne 18 .

Remarque 3.1.
Attention. Dans plusieurs ouvrages on dit que f est Gateaux différentiable si elle
possède une dérivée directionnelle dans toutes les directions v. On retrouve effecti-
vement cette notion dans les articles posthumes de Gateaux. 19 Dans nos notes, ce
terme est réservé à la notion (iii) plus forte où nous imposons en plus la linéarité
par rapport à v.

3.1.2 Opérations algébriques et premiers exemples


On obtient les dérivées directionnelles de fonctions plus complexes à partir de
celles de fonctions simples. C’est la base de tout calcul différentiel. Il est facile de
vérifier les propriétés suivantes.
Théorème 3.1. Soient x ∈ Rn un point et v ∈ Rn une direction.
(i) Soient f, g : Rn → Rm tel que f ′ (x; v) et g ′ (x; v) existent. Alors

(f + g)′ (x; v) = f ′ (x; v) + g ′ (x; v), ∀α ∈ R, (αf )′ (x; v) = αf ′ (x; v), (3.4)
(f · g)′ (x; v) = f ′ (x; v) · g(x) + f (x) · g ′ (x; v), (3.5)
18. Carl Jacobi (1804–1851) frère du physicien Moritz Hermann von Jacobi. Il établit la théorie
des déterminants fonctionnels, appelés depuis jacobiens.
19. ≪. . .Nous allons emprunter au Calcul fonctionnel la notion de variation, qui nous rendra les
services que
h rend la différentielle
i totale dans la théorie des fonctions d’un nombre fini de variables.
d
δF (x) = dλ F (x + λ δx) (cf. R. Gateaux [7, page 83]). . . .≫
λ=0 h i
≪. . .Considérons U (z + λ t1 ). Supposons que
d

U (z + λ t1 ) existe quel que soit t1 . On
λ=0
l’appelle la variation première de U au point z : δU (z, t1 ). C’est une fonction de z et t1 , qu’on
suppose habituellement linéaire, en chaque point z par rapport à t1 . . . .(cf. R. Gateaux [6, page
11]).. . .≫
210 Chapitre 6. Dérivée, dérivées directionnelles et différentielles

en définissant ponctuellement les opérations sur les fonctions


déf déf
∀x ∈ Rn , ∀α ∈ R, (f + g)(x) = f (x) + g(x), (αf )(x) = αf (x), (3.6)
déf
(f · g)(x) = f (x) · g(x), ∀x ∈ Rn . (3.7)

(ii) Soient f, g : Rn → R tel que f ′ (x; v) et g ′ (x; v) existent. Alors


(f g)′ (x; v) = f ′ (x; v) g(x) + f (x) g ′ (x; v) (3.8)
′ ′
f (x; v) g(x) − f (x) g (x; v)
(f /g)′ (x; v) = , g(x) 6= 0, (3.9)
g(x)2
en définissant ponctuellement les opérations sur les fonctions :
déf déf f (x)
∀x ∈ Rn , (f g)(x) = f (x) g(x), (f /g)(x) = , g(x) 6= 0. (3.10)
g(x)
Corollaire 1. Si, en plus des hypothèses du Théorème 3.1, les fonctions sont Ga-
teaux différentiables en x, alors
D(f + g)(x) = Df (x) + Dg(x), ∀α ∈ R, D(αf )(x) = αDf (x) (3.11)
⊤ ⊤
D(f · g)(x) = Df (x) g(x) + Dg(x) f (x) (3.12)
D(f g)(x) = Df (x) g(x) + f (x) Dg(x) (3.13)
Df (x) g(x) − f (x) Dg(x)
D(f /g)(x) = , g(x) 6= 0, (3.14)
g(x)2
où Df (x)⊤ : Rm → Rn et Dg(x)⊤ : Rm → Rn sont les applications linéaires
(matrices) transposées de Df (x) : Rn → Rm et Dg(x) : Rn → Rm .

Exemple 3.1.
Soit la fonction x 7→ fi (x) = xi : Rn → R, 1 ≤ i ≤ n. Alors, pour t 6= 0 et v ∈ Rn
fi (x + tv) − fi (x) (x + tv)i − xi
= = vi
t t
et l’application v 7→ fi′ (x; v) = vi : Rn → R est linéaire. La fonction fi est donc
Gateaux différentiable en tout point x ∈ Rn .
À partir de ce résultat, on peut considérer la fonction x 7→ fi2 (x) = |xi |2 :
n
R → R, 1 ≤ i ≤ n. Comme |xi |2 = xi xi = fi (x) fi (x), il vient de la partie (ii) du
théorème :
∀v ∈ Rn , (fi2 )′ (x; v) = 2 xi vi
et l’application v 7→ (fi2 )′ 2(x; v) = 2 xi vi : Rn → R est linéaire. La fonction fi2 est
donc Gateaux différentiable en tout point x ∈ Rn . P
n
Pour le carré de la norme x 7→ g(x) = kxk2 = i=1 |xi |2 : Rn → R, il vient de
la partie (ii) du théorème :
n
X
∀v ∈ Rn , g(x; v) = 2 xi vi = 2 x · v.
i=1
3. Fonctions de plusieurs variables réelles 211

Maintenant, si l’on considère la fonction x 7→ gi (x) = |xi | : Rn → R, 1 ≤ i ≤ n.


Alors, pour t 6= 0 et v ∈ Rn
gi (x + tv) − gi (x) |(x + tv)i | − |xi | |xi + tvi | − |xi |
= = .
t t t
6 0, alors
Si xi =
gi (x + tv) − gi (x) |xi + tvi |2 − |xi |2 1 1 xi
= → 2 xi vi = vi
t t |xi + tvi | + |xi | 2 |xi | |xi |
et l’application v 7→ gi (x; v) = (xi /|xi |) vi : Rn → R est linéaire. La fonction gi est
donc Gateaux différentiable en tout point x ∈ Rn tel que xi 6= 0.
Cependant si xi = 0, alors le quotient différentiel
gi (x + tv) − gi (x) |xi + tvi | − |xi | |0 + tvi | − |0| |t|
= = = |vi |
t t t t
ne converge pas lorsque t tend vers 0. La fonction gi n’est pas directionnellement
différentiable aux points x ∈ Rn tel que xi = 0.

Le second exemple est celui d’une fonction continue et dérivable dans toutes
les directions mais pas Gateaux différentiable.

Exemple 3.2.
Soit la fonction

 x31
, si (x1 , x2 ) 6= (0, 0)
f (x1 , x2 ) = x21 + x22

0, si (x1 , x2 ) = (0, 0).
Pour x = (x1 , x2 ) 6= (0, 0), la fonction f est continue et Gateaux dérivable en x dans
toutes les directions v car elle est le quotient de deux polynômes et le dénominateur
est différent de zéro. Il suffit d’appliquer les règles du Théorèm 3.1.
On voit que f est continue en (0, 0) :
x31 x21
= |x1 | ≤ |x1 | ≤ kxk → 0 lorsque x = (x1 , x2 ) → (0, 0).
x21 + x22 x21 + x22
Pour la dérivée directionnelle en (0, 0), soient v = (v1 , v2 ) et t 6= 0. Par définition,
 

 1 (tv1 )3 
f (0 + tv) − f (0) 2 + (tv )2
, si (v1 , v2 ) 6= (0, 0)
= t (tv1 ) 2
t 
 0, 
si (v1 , v2 ) = (0, 0)
 

 (v1 )3 
2 2
, si (v1 , v2 ) 6= (0, 0)
= (v1 ) + (v2 ) = f (v1 , v2 )

 0, 

si (v1 , v2 ) = (0, 0)
et donc
∀v ∈ R2 , f ′ (0, 0; v1 , v2 ) = f (v1 , v2 ).
On voit que f n’est pas Gateaux différentiable car v 7→ f ′ (0; v) n’est pas linéaire.
212 Chapitre 6. Dérivée, dérivées directionnelles et différentielles

2.5

z
4
0

-2.5
2

-5

0
y 4

2
-2
0

x
-2
-4

-4

Figure 6.2. Exemples 3.2 et 3.10.

3.1.3 Gateaux différentiabilité n’entraı̂ne pas continuité

L’exemple 3.2 est celui d’une fonction continue et dérivable dans toutes les
directions mais pas Gateaux différentiable.
Le second exemple est très riche et important. On le retrouvera plus tard. C’est
celui d’une fonction Gateaux différentiable en (0, 0) mais pas continue en (0, 0). En
comparant avec le premier exemple, on constate que ce n’est donc pas la linéarité
qui entraı̂ne la continuité de la fonction.

Exemple 3.3 (Figure 6.3).


On montre que la fonction f : R2 → R définie par

x6
déf , si (x, y) 6= (0, 0)
f (x, y) = (y − x2 )2 + x8

0, si (x, y) = (0, 0)

est Gateaux différentiable en x = (0, 0), mais elle n’est pas continue en (0, 0).
La fonction f est continue et dérivable en x = (x1 , x2 ) 6= (0, 0) dans toutes
les directions v car elle est le quotient de deux polynômes dont le dénominateur est
différent de zéro. Il suffit d’appliquer les règles du Théorèm 3.1.
On voit que f est discontinue en x = (0, 0) en approchant de (0, 0) par le
3. Fonctions de plusieurs variables réelles 213

10
10

8
10

6
10

4
10

2
10 0
0.2
0 0.4
10
1 0.8 0.6
0.6 0.4 0.2 0 0.8
! 0.2 ! 0.4 ! 0.6 ! 0.8 1
!1

Figure 6.3. Exemple 3.3 (échelle logarithmique)

chemin (α, α2 ) lorsque α tend vers 0 :

α6 1
|f (α, α2 ) − f (0, 0)| = = 2 → +∞ lorsque α → 0.
α8 α
On calcule d’abord la dérivée directionnelle de f en (0, 0). Pour v = (v1 , v2 ) 6=
(0, 0), on considère deux cas : v2 = 0 et v2 6= 0. Si v2 = 0 et v1 6= 0 pour t 6= 0

f (tv1 , 0) − f (0, 0) 1 (tv1 )6 1 (tv1 )6


= 2 2 8
=
t t (0 − (tv1 ) ) + (tv1 ) t (tv1 )4 + (tv1 )8
v12
=t
1 + (tv1 )4

et lorsque t tend vers 0


f ′ ((0, 0); (v1 , v2 )) = 0.
Si 2 6= 0 pour t 6= 0

f (tv1 , tv2 ) − f (0, 0) 1 (tv1 )6 v16


= = t3
t 2 2
t (tv2 − (tv1 ) ) + (tv1 )8 (v2 − tv12 )2 + t6 v18

et lorsque t tend vers 0

f ′ ((0, 0); (v1 , v2 )) = 0 si v2 6= 0.

Donc

∀v = (v1 , v2 ) ∈ R2 , f ′ ((0, 0); (v1 , v2 )) = 0,


214 Chapitre 6. Dérivée, dérivées directionnelles et différentielles

l’application (v1 , v2 ) 7→ f ′ ((0, 0); (v1 , v2 )) : R2 → R est linéaire, et f est différentia-


ble au sens de Gateaux.
Avec la différentielle de Gateaux, on perd donc la notion intuitive en dimension
un qu’une fonction différentiable en un point est continue en ce point.

3.1.4 Dérivées partielles, gradient, application et matrice jacobiennes


On introduit maintenant la notion de dérivée partielle comme cas particulier
de la dérivée directionnelle.

Définition 3.2.
Soient f : Rn → R et {ei : 1 ≤ i ≤ n}, (ei )j = δij , la base canonique orthonormale
de Rn . La fonction f possède des dérivées partielles en x si pour chaque i, f est
dérivable en x dans la direction ei , c’est-à-dire,
f (x + t ei ) − f (x)
∀i, 1 ≤ i ≤ n, lim existe.
t→0 t
On écrira la limite ∂i f (x) ou ∂f /∂xi (x). Par définition ∂i f (x) = f ′ (x; ei ) et la
fonction α 7→ f ′ (x; α ei ) : R → R est homogène.
′ n
Lorsque f est Gateaux différentiable en x, Pnl’application v 7→ f (x; v) : R → R
est linéaire. Donc, comme v = (v1 , . . . , vn ) = i=1 vi ei , par linéarité
 X n  Xn
′ ′
f (x; v) = f x; vi ei = vi f ′ (x; ei ) = g(x) · v,
i=1 i=1

en introduisant le vecteur
n
X
déf
g(x) = f ′ (x; ei ) ei ∈ Rn .
i=1

Ce vecteur est unique. En effet, s’il existe deux vecteurs g1 et g2 dans Rn tel que

∀v ∈ Rn , g1 · v = f ′ (x; v) = g2 · v,

alors pour tout v ∈ Rn on a (g1 − g2 ) · v = 0 et donc g1 = g2 .

Définition 3.3.
Soit une fonction f : Rn → R Gateaux différentiable en x ∈ Rn . On appelera
gradient de f en x l’unique vecteur ∇f (x) de Rn tel que

∀v ∈ Rn , ∇f (x) · v = f ′ (x; v). (3.15)

En particulier,
n
X
∇f (x) = ∂i f (x) ei ,
i=1

où ∂i f (x) = f ′ (x; ei ) est la dérivée partielle de f en x dans la direction ei .


3. Fonctions de plusieurs variables réelles 215

Remarque 3.2.
On a aussi Df (x)v = f ′ (x; v) = ∇(x) · v. L’application jacobienne Df (x) est
équivalente à une matrice 1 × n ou vecteur ligne et la direction v à un vecteur
colonne n × 1.

L’exemple suivant montre que, même si les dérivées partielles existent, le gra-
dient peut ne pas exister et, a fortiori, la dérivée directionnelle f ′ (x; v) peut ne pas
exister dans certaines directions v.

Exemple 3.4 (Figure 6.4).


Soit la fonction f : R2 → R :
(
(xy)1/3 , si xy ≥ 0
f (x, y) =
−|xy|1/3 , si xy < 0.

Elle est clairement continue.

z
-4
0

-2
-2

0
4 y

2
2
0

x
-2
4

-4

Figure 6.4. Exemple 3.4.

On calcule la dérivée directionnelle en (0, 0) dans la direction v = (v1 , v2 ) 6=


(0, 0). Pour v1 v2 ≥ 0 et t 6= 0,

f (0 + tv) − f (0) (tv1 tv2 )1/3 |t|2/3 |t| 1


= = (v1 v2 )1/3 = (v1 v2 )1/3 ,
t t t t |t|1/3
216 Chapitre 6. Dérivée, dérivées directionnelles et différentielles

puis pour v1 v2 < 0,

f (0 + tv) − f (0) |tv1 tv2 |1/3 |t|2/3 |t| 1


=− =− |v1 v2 |1/3 = − |v1 v2 |1/3 .
t t t t |t|1/3

On voit que ces quotients convergent si et seulement si v1 v2 = 0. Donc

f ′ ((0, 0); (v1 , v2 )) = 0 si v1 v2 = 0

et n’existe pas pour v1 v2 6= 0. Sous la condition v1 v2 = 0, on a plus

f (0 + tv) − f (0)
f ′ (0, v) = lim = 0.
t→0 t
En particulier, si l’on prend comme base orthonormale e1 = (1, 0) et e2 = (0, 1)
de R2 , on a les dérivées partielles

∂f ∂f
(0, 0) = f ′ ((0, 0); e1 ) = 0 et (0, 0) = f ′ ((0, 0); e2 ) = 0.
∂x1 ∂x2

L’exemple montre que pour une direction (v1 , v2 ), v1 v2 6= 0 la dérivée f ′ ((0, 0); v1 , v2 )
n’existe pas et n’est donc pas égale au produit scalaire
 
∂f ∂f
(0, 0), (0, 0) · (v1 v2 ) = 0.
∂x1 ∂x2

Dans le cas d’une fonction à valeurs vectorielles, on introduit les dérivées


partielles de chaque composante fi de la fonction f : Rn → Rm .

Définition 3.4.
Soient {enj : j = 1, . . . , n} et {em
i : i = 1, . . . , m} les bases canoniques orthonormales
respectives dans Rn et Rm , respectivement. Si f : Rn → Rm est Gateaux différen-
tiable en x, on peut associer à l’application (linéaire) jacobienne Df (x) : Rn → Rm
la matrice jacobienne m × n.
déf
Df (x)ij = em n
i · df (x; ej ) = ∂j fi (x), 1 ≤ i ≤ m, 1 ≤ j ≤ n.

Lorsque m = n, la valeur absolue du déterminant de la matrice Df (x) est appelée


jacobien de f en x.

3.2 Approche géométrique à la différentielle


La principale lacune de la différentielle de Gateaux est que, en général, elle
n’entraı̂ne pas la continuité de la fonction. On verra aussi plus tard que la différentielle
de la composition de deux fonctions Gateaux différentiables peut ne pas exister et
que l’on perd aussi la règle de composition des dérivées du calcul différentiel clas-
sique.
3. Fonctions de plusieurs variables réelles 217

La notion de différentielle dans la littérature est en fait plus ancienne et plus


forte que celle de Gateaux. Par exemple, pour une fonction f (x, y) de deux va-
riables, on fait le raisonnement suivant sur l’incrément ou la variation ∆f (x, y) de
la fonction f à partir des variations ∆x et ∆y des variables x et y
∆f (x, y) ∆f (x, y)
∆f (x, y) = ∆x + ∆y.
∆x ∆y
En supposant que, lorsque ∆x et ∆y tendent vers zéro, les quotients
∆f (x, y) ∂f ∆f (x, y) ∂f
→ (x, y) et → (x, y)
∆x ∂x ∆y ∂y
convergent dans R, on écrit formellement la différentielle
∂f ∂f
df (x, y) = (x, y) dx + (x, y) dy (3.16)
∂x ∂y
ce qui sous-tend la notion de dérivée partielle dans les directions des axes des x et
des y.
Mais que signifie (3.16) pour des dx et des dy nuls à la limite ? Pour J. Ha-
damard 20 [2] en 1923, cette expression n’est qu’un symbole d’opérations :
≪Que signifie l’égalité (3.16) ? Que si x, y et dès lors g = f (x, y) sont

exprimés en fonction d’une variable auxiliaire quelconque t, on a, quelles


que soient ces expressions,
dg dg dx dg dy
= + . (3.17)
dt dx dt dy dt
Tel est le sens unique de l’égalité (3.16). L’égalité (3.17) ayant lieu
quelle que soit la variable indépendante en fonction de laquelle les deux
autres variables sont exprimées, on supprime la mention de t. L’avantage
précieux de la notation différentielle consiste précisément en la possibi-
lité de ne pas préciser quelle est la variable que l’on considère comme
indépendante.≫
Cette citation donne un sens précis à la notion de différentielle. En effet, si l’on
considère la fonction vectorielle
déf
t 7→ h(t) = (x(t), y(t)) : R → R2 (3.18)

de la variable auxiliaire réelle t, la fonction g est la composition de f et de h


déf
t 7→ g(t) = f (h(t)) = f (x(t), y(t)) : R → R .

La fonction vectorielle h(t) = (x(t), y(t)) définit un chemin ou une trajectoire dans
R2 en fonction de t. Pour obtenir la différentielle au point (x, y), on peut, sans perte
20. Jacques-Salomon Hadamard (1865–1963). Il obtint d’importants résultats sur les équations
aux dérivées partielles du domaine de la physique mathématique. Il fut aussi l’un des collaborateurs
à l’élaboration de la théorie moderne de l’analyse fonctionnelle.
218 Chapitre 6. Dérivée, dérivées directionnelles et différentielles

de généralité, prendre h(0) = (x, y). On obtient ainsi un chemin (x(t), y(t)) dans
R2 qui passe par le point (x(0), y(0)) = (x, y) avec comme tangente (x′ (0), y ′ (0))
en ce point. La différentielle en (x, y) existe lorsque l’on peut trouver une fonction
linéaire 21 L(x, y) : R2 → R tel que g ′ (0) = L(x, y)(h′ (0)) pour tout chemin h qui
passe par (x, y). La fonction L(x, y) dépend de (x, y), mais est indépendante du
choix du chemin h. C’est ce que l’on appellera le point de vue géométrique. Il se
généralise immédiatement à des fonctions définies sur des variétés en choisissant des
chemins contenus dans celles-ci dont la tangente est tangente à la variété.
Il faut retenir de la citation de Hadamard au moins deux choses :

(a) l’identité (3.17) doit être vérifiée pour tous les chemins h(t) = (x(t), y(t))
et pas seulement le long de droites ;

(b) la différentielle doit être linéaire par rapport au vecteur tangent h′ (0) =
(x′ (0), y ′ (0)).

Enfin, en choisissant le chemin h(t) = (x + tv, y + tw) pour lequel h′ (0) = (v, w),
la différentielle au sens de Hadamard entraı̂ne l’existence de la différentielle au sens
de Gateaux.
La fonction de l’exemple suivant satisfait les points (a) et (b).

Exemple 3.5.
Soit la fonction f (x, y) = x2 + 2 y 2 . On vérifie facilement que
   ′ 
dg 2x x (0)
(0) = 2x x′ (0) + 4y y ′ (0) = · ′
dt 4y y (0)

pour tout chemin h(t) = (x(t), y(t)) donné par (3.18) satisfaisant h(0) = (x, y).

Il existe cependant des fonctions pour lesquelles il n’y a pas linéarité comme le
montre l’Exemple 3.2.

Exemple 3.6 (Exemple 3.2).


Soit la fonction

déf x3 déf
f (x, y) = , si (x, y) 6= (0, 0), f (0, 0) = 0. (3.19)
x2 + y 2

On a montré que la fonction f est continue en tout point de R2 .


Pour la différentielle, on considère le quotient suivant pour t 6= 0 et un chemin

21. Rappel. La fonction L(x, y) : R2 → R est linéaire par rapport au couple (v, w) si pour
tout α, β ∈ R et pour tout (v1 , w1 ), (v2 , w2 ) ∈ R2 ,

L(αv1 + βv2 , αw1 + βw2 ) = α L(v1 , w1 ) + β L(v2 , w2 ).


3. Fonctions de plusieurs variables réelles 219

h(t) = (x(t), y(t)) passant par h(0) = (0, 0)


 

 1 x(t)3 
f (h(t)) − f (h(0)) , si (x(t), y(t)) 6= (0, 0)
= t x(t)2 + y(t)2
t 
 0, 
si (x(t), y(t)) = (0, 0)
 h i3 


x(t)−x(0)   


 t x(t) − x(0) y(t) − y(0) 


 h i 2 h i 2 , si , 6
= (0, 0)

x(t)−x(0) y(t)−y(0) t t
= t + t

   


 x(t) − x(0) y(t) − y(0) 


 0, si , = (0, 0)

t t
 
x(t) − x(0) y(t) − y(0)
=f ,
t t
 

 x′ (0)3 
, si (x (0), y (0)) 6= (0, 0)
′ ′
→ f (x′ (0), y ′ (0)) = x′ (0)2 + y ′ (0)2

 0, 
si (x′ (0), y ′ (0)) = (0, 0)
par continuité de f . On a donc pour tout chemin h de la forme (3.18) satisfaisant
h(0) = (0, 0)


 x′ (0)3
dg , si (x′ (0), y ′ (0)) 6= (0, 0),
(0) = x (0)2 + y ′ (0)2

dt 
 0, si (x′ (0), y ′ (0)) = (0, 0).
On voit qu’il n’y a pas linéarité par rapport à la direction (v, w). Ceci malgré le fait
que les dérivées partielles
∂f ∂f
(0, 0) = 1 et (0, 0) = 0
∂x ∂y
existent. On se serait attendu à obtenir l’identité (3.17)
     
∂f dx ∂f  
 (0, 0)  (0)   (0, 0) v    
dg  ∂x   dt   ∂x    1 v v3
(0) =  · = · = · = v 6= 2
dt  ∂f   dy   ∂f  0 w v + w2
(0, 0) (0, 0) w
(0)
∂y dt ∂y
si w 6= 0 et v 6= 0. La linéarité n’est donc pas une conséquence du fait qu’il existe
une fonction G(x, y) : R2 → R tel que g ′ (0) = G(x, y)(h′ (0)) pour tout chemin h qui
passe par (x, y). Il faut l’imposer. Ce qui restreint la famille des fonctions f pour
lesquelles la différentielle G(x, y) existe.

Si l’on se limite à des chemins le long de droites passant par (x, y), on retrouve
la notion plus faible de dérivée directionnelle dans la direction (v, w) en (x, y) qui
s’obtient en posant
déf
t 7→ h(t) = (x + tv, y + tw) : R → R2 , h(0) = (x, y), h′ (0) = (v, w), (3.20)
220 Chapitre 6. Dérivée, dérivées directionnelles et différentielles

ce qui donne t 7→ g(t) = f (h(t)) = f (x + tv, y + tw) : R → R qu’il suffit de dériver


par rapport à t en t = 0 puisque l’on a une fonction numérique d’une seule variable.
Lorsque f est Gateaux différentiable, l’équation (3.17) devient alors
 
∂f
 ∂x (h(0))  
dg d(f ◦ h) ∂f ∂f   v
(0) = (0) = (h(0)) v + (h(0)) w =  · .
dt dt ∂x ∂y  ∂f  w
| {z } (h(0))
L(h(0)) (v,w) ∂y

Malheureusement, il ne sera pas suffisant de se limiter à des chemins le long de


droites passant par (x, y) et on verra plus loin l’exemple d’une fonction (Exemple
3.9) pour laquelle l’identité (3.17) est vérifée le long de droites mais pas le long de
tous les chemins.
Ces exemples illustrent bien que, lorsque que l’on travaille avec la notion de
différentielle en dimension supérieure à un, on n’obtient pas toujours l’équivalent
de la dérivée en dimension un et du gradient en dimension supérieure à un. Il est
d’usage de dire que la fonction du second exemple n’est pas différentiable en (x, y),
malgré qu’il existe une différentielle quel que soit le chemin menant au point (x, y).
Il va donc falloir revoir avec soin la notion de différentielle et déterminer jusqu’à
quel point elle peut être relaxée tout en préservant les éléments de base d’un bon
calcul différentiel.

3.3 Dérivée directionnelle et différentielle au sens de Hadamard


3.3.1 Formulation équivalente à l’approche de Hadamard
On formalise maintenant l’approche de Hadamard et on en donne une formu-
lation équivalente que l’on pourra plus facilement comparer aux notions de Gateaux
de la Définition 3.1.

Théorème 3.2. Soient f : Rn → Rm et x ∈ Rn . Les conditions suivantes sont


équivalentes :
(a) il existe une application g(x) : Rn → Rm tel que pour toute fonction h :
R → Rn pour laquelle h(0) = x et h′ (0) existent, (f ◦ h)′ (0) existe et

(f ◦ h)′ (0) = g(x)(h′ (0)); (3.21)

(b) il existe une application g(x) : Rn → Rm tel que pour tout v ∈ Rn et toute
suite (tn , wn ) → (0, v), tn 6= 0,

f (x + tn wn ) − f (x)
lim = g(x)(v). (3.22)
n→∞ tn

Remarque 3.3.
(i) Bien que l’on ait parlé de chemin ou de trajectoire, l’application h n’a pas besoin
d’être continue ou dérivable pour t 6= 0. Seul son comportement en t = 0 compte.
3. Fonctions de plusieurs variables réelles 221

(ii) Par définition, l’application g(x) est homogène,


∀α ∈ R, g(x)(α v) = α g(x)(v),
mais pas nécessairement linéaire.

On a immédiatement le corollaire suivant.


Corollaire 1. Soient f : Rn → Rm et x ∈ Rn . Les conditions suivantes sont
équivalentes :
(a) il existe une application linéaire L(x) : Rn → Rm tel que pour toute fonc-
tion h : R → Rn pour laquelle h(0) = x et h′ (0) existent, alors (f ◦ h)′ (0)
existe et
(f ◦ h)′ (0) = L(x) h′ (0); (3.23)

(b) il existe une application linéaire L(x) : Rn → Rm tel que pour tout v ∈ Rn
et toute suite (tn , wn ) → (0, v), tn 6= 0,
f (x + tn wn ) − f (x)
lim = L(x) v. (3.24)
n→∞ tn
Démonstration du Théorème 3.2. (b) ⇒ (a). Soit h une fonction telle que h(0) = x
et h′ (0) existe. Alors pour toute suite {tn 6= 0} tendant vers 0 on a
déf h(tn ) − h(0)
wn = → h′ (0), ⇒ h(tn ) = x + tn wn .
tn
Comme la limite existe et est égale à g(x)(h′ (0)), on a pour toute suite {tn 6= 0}
tendant vers 0,
f (h(tn )) − f (h(0)) f (x + tn wn ) − f (x)
= → g(x)(h′ (0))
tn tn
et (f ◦ h)′ (0) = g(x)(h′ (0)).
(a) ⇒ (b). On voit immédiatement que f est directionnellement dérivable. En
effet, pour v ∈ Rn , on prend la fonction h(t) = x + tv qui vérifie bien h(0) = x et
h′ (0) = v et pour laquelle on a de la propriété (3.23) (f ◦ h)′ (0) = g(x)(h′ (0)) =
g(x)(v). Par définition de la dérivée (f ◦ h)′ (0) en t = 0, pour toute suite {tn },
tn 6= 0, tn → 0, on a
f (x + tn v) − f (x) f (h(tn )) − f (h(0))
= → (f ◦ h)′ (0) = g(x)(h′ (0))
tn tn
⇒ f ′ (x; v) = g(x)(v).
Pour obtenir plus, on procède par l’absurde. L’objectif est de construire une
fonction h qui donnera une contradiction. Supposons qu’il existe v et une suite
(tn , wn ) → (0, v), tn 6= 0, tel que la suite des quotients différentiels
déf f (x + tn wn ) − f (x)
qn =
tn
222 Chapitre 6. Dérivée, dérivées directionnelles et différentielles

ne converge pas vers g(x)(v). Alors, il existe η > 0 tel que, pour tout k ≥ 1, il existe
nk ≥ k tel que |qnk − g(x)(v)| ≥ η. Pour simplifier la notation, on désignera par
(tn , wn ) la sous-suite (tnk , wnk ). On peut partitionner cette dernière suite en deux
suites :
{(t+ + − −
nk , wnk ) : tnk > 0} et {(tnk′ , wnk′ ) : tnk′ < 0}.

L’une d’entre elle contient un nombre infini d’éléments. Supposons, sans perte de
généralité que ce soit {(t+ +
nk , wnk ) : tnk > 0}. Encore pour simplifier la notation, on
écrira cette nouvelle sous-suite {(tn , wn )}. Elle jouit donc de la propriété :
∃η > 0 tel que ∀n ≥ 1, |qn − g(x)(v)| ≥ η.
On construit la nouvelle sous-suite (tnk , wnk ) suivante. Soit n1 le premier
n ≥ 1 tel que tn ≤ 1. Soit n2 le premier n > n1 tel que tn ≤ tn1 /2. À l’étape
k + 1, soit nk+1 le premier n > nk tel que tn ≤ tnk /2. Par construction, nk >
nk+1 and tnk+1 ≤ tnk /2 < tnk . La sous-suite {(tnk , xnk )} est telle que {tnk } soit
monotone strictement décroissante vers 0 et wnk → v. On peut donc supposer, sans
perte de généralité, que, pour la suite initiale {(tn , wn )}, la suite {tn } est monotone
strictement décroissante. Comme wn converge vers v, il existe une constante c tel
que kwn k ≤ c pour tout n et pour tout ε > 0, il existe N tel que
∀n > N, kwn − vk < ε et tn < ε/c.
On introduit maintenant la fonction h : R → Rn :

 x + tv,
 si t ≤ 0
déf
h(t) = x + t wn , si tn ≤ t < tn−1 , n ≥ 2,


x + tw1 , si t1 ≤ t
La fonction vectorielle h est continue en t = 0. En effet, elle est continue à gauche
puisque h(t) = x + tv → x = h(0) lorsque t < 0 tend vers 0. À droite pour
δ = tN +1 > 0 et 0 < t < δ, il existe n > N + 1 tel que tn ≤ t < tn−1 et donc
kh(t) − h(0)k = t kwn k ≤ tn−1 kwn k < tN +1 c < (ε/c) c = ε
et h est continue à droite en 0.
Pour la dérivée à droite, pour δ = tN +1 > 0 et 0 < t < δ, il existe n > N + 1
tel que tn ≤ t < tn−1 et
h(t) − h(0)
− v = kwn − vk < ε
t
et dh(0; +1) = v. Pour la dérivée à gauche on a trivialement dh(0; −1) = −v,
−dh(0; −1) = v = dh(0; +1) et en fait la dérivée existe et h′ (0) = v. Mais, par
hypothèse, pour une telle fonction h, on a l’existence de (f ◦ h)′ (0) et donc de
d(f ◦h)(0; +1) qui est égale à g(x)(v). En particulier, par construction de la fonction
h,
f (x + tn wn ) − f (x) f (h(tn )) − f (h(0))
qn = = → d(f ◦ h)(0; +1) = g(x)(v).
tn tn
Ceci contredit notre hypothèse initiale que qn 6→ g(x)(v).
3. Fonctions de plusieurs variables réelles 223

On lit dans le résumé de l’article intitulé Sur la notion de différentielle de


M. Fréchet [5] en 1937
L’auteur montre que la différentielle totale de Stolz-Young 22 est
équivalente à la definition due à Hadamard (Corollaire au Theorem 3.2).
Par contre, quand on étend cette dernière aux fonctionnelles elle devient
plus générale que celle de l’auteur . . .
car elle s’applique à des espaces de fonctions (de dimension infinie) sans norme ou
même sans métrique. Dans le même article où apparaı̂t la citation, M. Fréchet [5,
p. 239] propose la definition suivante.

Définition 3.5 (Notion proposée par Fréchet en 1937).


La fonction f : Rn → Rm est différentiable au point x ∈ Rn s’il existe une fonction
g(x) : Rn → Rm telle que pour toute application h : R → Rn pour laquelle h(0) = x
et h′ (0) existent, on a

(f ◦ h)′ (0) = g(x)(h′ (0)) (3.25)

(c’est la condition (a) du Théorème 3.2).

Nous verrons que ces fonctions retiennent deux propriétés importantes des fonctions
Hadamard différentiables : elles sont continues en x (Théorème 3.3) et la règle de
dérivation en chaı̂ne des fonctions composées demeure valide (Théorème 3.5).
Malheureusement, cédant à la critique, il ne pousse pas cette nouvelle notion
plus loin.
Mais comme l’a fait observer M. Paul Lévy, une telle définition n’est
pas suffisante, car une fonction différentiable à ce sens peut perdre d’im-
portantes propriétés de la différentielle des fonctions simples et en par-
ticulier la propriété (3) (la linéarité !). Tel est, par exemple, le cas pour
la fonction
s
x2
f (x, y) = x pour (x, y) 6= (0, 0) avec f (0, 0) = 0. (3.26)
x + y2
2

(M. Fréchet [5, p. 239]).


En effet, on peut vérifier que

g((0, 0); (v, w)) = f (v, w)

et que g((0, 0) n’est pas linéaire en (v, w). Loin de discréditer la nouvelle notion, cet
exemple montre qu’il existe de telles fonctions.

3.3.2 Définitions
Les équivalences du Théorème 3.2 et de son corollaire offrent le choix entre
deux définitions de la différentielle et de la dérivée directionnelle au sens de Hada-
mard : la condition (a) qui fait appel à des chemins et la (b) à des suites.
22. Voir la Remarque 3.9 à la page 233.
224 Chapitre 6. Dérivée, dérivées directionnelles et différentielles

Remarque 3.4.
Ces définitions pour Rn sont en fait beaucoup plus générales qu’il n’en paraı̂t.
Par exemple, la fonction pourrait être définie sur un sous-ensemble M de l’espace
vectoriel Rn muni d’un espace tangent de la forme
 
 ∃ 0 6= tn → 0 et M ∋ xn → x
déf
T x M = v ∈ Rn : xn − x
 tel que v = lim 
n→∞ tn
ce qui donne un sens aux suites xn = x + tn wn ∈ M . La différentielle d’une fonction
f : M → R serait alors une application g(x) : Tx M → R. Si l’espace tangent Tx M
est un sous-espace linéaire de Rn , on peut imposer que g(x) soit linéaire auquel cas
on obtiendrait un gradient tangentiel ∇M f (x) ∈ Tx M tel que g(x) v = ∇M f (x) · v
pour le produit scalaire dans le sous-espace linéaire Tx M . On peut penser à la sphère
S n−1 de rayon 1 dans Rn pour laquelle Tx S n−1 = Rn−1 .

De retour dans Rn , on choisit les définitions en termes de suites qui sont plus simples
à utiliser dans un espace vectoriel que celles qui font appel à des chemins.

Définition 3.6.
Soient f : Rn → Rm , x un point de Rn et v ∈ Rn une direction.
(i) f est dérivable au sens de Hadamard au point x dans la direction v si la
limite suivante existe
f (x + tw) − f (x)
lim dans Rm . (3.27)
t→0 t
w→v


Lorsque la limite (3.27) existe, on la désignera par fH (x; v). De la définition,
′ ′
on a fH (x; v) = f (x; v).

(ii) f est directionnellement dérivable au sens de Hadamard en x si fH (x; v)
n
existe pour tout v ∈ R .
(iii) f est différentiable au sens de Hadamard au point x si f est dérivable au
sens de Hadamard et l’application
déf

v 7→ Df (x)v = fH (x; v) : Rn → Rm (3.28)

est linéaire. On dira aussi que f est Hadamard différentiable en x.



Il est clair que si fH (x; v) existe, f ′ (x; v) existe et que fH ′
(x; v) = f ′ (x; v).
′ ′
Cependant, bien que f (x; 0) existe toujours et soit égal à 0, fH (x; 0) n’existe pas
toujours comme le montrera l’Exemple 3.9 (Figure 6.3).
La linéarité entraı̂ne la continuité de v 7→ f ′ (x; v). On peut aussi montrer
que si f est directionnellement dérivable au sens de Hadamard en x, alors cette
application est continue même si elle n’est pas linéaire (voir l’Exercice 7.4).

Remarque 3.5.
La Définition 3.1 (i) que la limite existe est équivalente à sa caractérisation par les
3. Fonctions de plusieurs variables réelles 225

suites : il existe q ∈ R tel que pour toutes suites (tn , wn ) → (0, v), tn 6= 0,
f (x + tn wn ) − f (x)
→ q.
tn
Conformément à la définition de la limite, cela inclut les suites wn → v et la suite
constante wn = v puisque, comme tn 6= 0, on a toujours (tn , wn ) 6= (0, v).

Exemple 3.7. √
On considère le carré f (x) = kxk2 de la norme kxk = x · x de x dans Rn . Elle est
continue dans Rn . Pour tout (t, w) → (0, v), t 6= 0,
f (x + tw) − f (x) kx + twk2 − kxk2 (2x + tw) · tw
= = = (2x + tw) · w → 2x · v
t t t

par continuité du produit scalaire. Donc fH (x; v) existe pour tout x et tout v,

fH (x; v) = 2x · v,

et comme v 7→ fH (x; v) est linéaire, f est Hadamard différentiable et Df (x) = 2x.
La norme n(x) = kxk est aussi Hadamard différentiable en tout point x 6= 0.
Pour tout (t, w) → (0, v), t 6= 0,
n(x + tw) − n(x) kx + twk − kxk 1 kx + twk2 − kxk2
= =
t t kx + twk + kxk t
1 x
→ 2x · v = ·v
2 kxk kxk
et Dn(x) = x/kxk. La dérivée directionnelle n’existe cependant pas en x = 0 car
pour v 6= 0 le quotient différentiel
n(0 + tv) − n(0) k0 + tvk − k0k |t|
= = kvk
t t t
ne converge pas lorsque t tend vers 0 cat il oscille entre ±kvk.

Exemple 3.8.
Soit g : Rm → Rn une application linéaire : g(x) = Ax pour A ∈ L(Rm , Rn ). Alors
A(x + tw) − Ax A(tw)
∀t > 0, ∀w ∈ Rm , = = Aw → Av
t t
lorsque t > 0 → 0 et w → v et

Dg(x) = A ∈ L(Rm , Rn ).

Lorsque n = 1, g peut s’écrire g(x) = a · x pour un a ∈ Rm et Dg(x)v = a · v,


c’est-à-dire, en notation matricielle
     
v1 a1 v1
  .   .   . 
Dg(x)v = a1 . . . am  ..  =  ..  ·  ..  .
vm am vm
226 Chapitre 6. Dérivée, dérivées directionnelles et différentielles

On utilisera les notations


 
a1
   
Dg(x) = a1 . . . am ∈ L(Rm , R) et ∇g(x) =  ...  ∈ Rm .
am

On revient maintenant sur certains des exemples précédents, On commence


par l’Exemple 3.3 de la fonction discontinue et différentiable au sens de Gateaux.
On montre qu’elle n’est pas dérivable au sens de Hadamard au point (0, 0) dans la

direction (0, 0), c’est-à-dire, fH (0, 0; 0, 0) n’existe pas, bien que la dérivée direction-
nelle f ′ (x; 0.0) existe et que f ′ (x; 0, 0) = 0 en tout x ∈ R2 .

Exemple 3.9 (Exemple 3.3, Figure 6.3).


On a montré que la fonction f : R2 → R définie par

 x6
déf , si (x, y) 6= (0, 0)
f (x, y) = (y − x2 )2 + x8

0, si (x, y) = (0, 0)

était Gateaux différentiable en x = (0, 0), mais qu’elle n’est pas continue en (0, 0).
On montre maintenant qu’elle ne possède pas de dérivée directionnelle au sens de
Hadamard en (0, 0) dans les directions (0, 0) et (1, 0).
Pour montrer que la dérivée directionnelle au sens de Hadamard n’existe pas
en (0, 0) dans la direction (0, 0), on choisit les suites suivantes :
 
1 1 1
tn = ց 0 et wn = , 3 → (0, 0) lorsque n → +∞.
n n n
En formant le quotient
déf f ((0, 0) + tn wn ) − f (0, 0)
qn = ,
tn
on peut vérifier que

( n12 )6 5
qn = 1 1 8 = n → +∞
(
n n 2 )

et fH f (0, 0; 0, 0) n’existe pas.

Pour montrer que fH f (0, 0; 1, 0) n’existe pas, on calcule le quotient différentiel
en utilisant la suite (wn , tn ) → (v, 0) suivante
 
1 1
wn = 1, , ∀n et tn = , ∀n
n n
f (tn wn ) − f (0, 0) 1 ( n1 )6 3
1 = 1 1 8 = n → +∞.
n (
n n )
3. Fonctions de plusieurs variables réelles 227

Le dernière fonction est celle de l’Exemple 3.6 déjà considérée au paragraphe 3.2
où la fonction est continue et directionnellement dérivable, mais pas Gateaux diffé-
rentiable.

Exemple 3.10 (Exemple 3.6, Figure 6.2, page 212).


On a montré que la fonction
 3
 x , si (x, y) 6= (0, 0),
f (x, y) = x2 + y 2

0, si (x, y) = (0, 0)
est continue en (0, 0). On montre maintenant qu’elle est directionnellement dérivable
au sens de Hadamard. Pour w = (w1 , w2 ) → v = (v1 , v2 ) et t 6= 0
 

 1 (tw1 )3 
f (tw) − f (0) 2 2
, si (w1 , w2 ) 6= (0, 0)
= t (tw1 ) + (tw2 ) = f (w1 , w2 )
t 
 0, 

si (w1 , w2 ) = (0, 0)
et, par continuité de f , f (w1 , w2 ) → f (v1 , v2 ) et

∀v = (v1 , v2 ), fH (0, 0; v1 , v2 ) = f (v1 , v2 ).
f est directionnellement dérivable au sens de Hadamard, mais n’est pas Hadamard

différentiable car v 7→ fH (0; v) n’est pas linéaire.

3.3.3 Continuité des fonctions Hadamard directionnellement dérivables


En dimension n = 1, les différentielles de Hadamard et de Gateaux coı̈ncident
et correspondent à la notion usuelle de dérivée de la Définition 2.1 (iii) et la fonction
est continue par le Théorème 2.1.
L’Exemple 3.3 établit qu’en dimension n ≥ 2, une fonction différentiable au
sens de Gateaux n’est pas nécessairement continue. Ce n’est donc pas la linéarité de
la dérivée directionnelle qui engendre la continuité. L’exemple 3.10 montre qu’une
fonction qui est dérivable au sens de Hadamard dans toutes les directions, mais pas
Gateaux différentiable (pas linéaire en v) peut être continue. En fait, l’existence de

fH (x; 0) est suffisante pour avoir la continuité de f en x.
Théorème 3.3. Soit f : Rn → Rm , n ≥ 1, m ≥ 1. Si fH ′
(x; 0) existe en x, alors f
est continue en x. De plus, pour tout α ∈ (0, 1) et tout ε > 0,
kf (y) − f (x)kRm
∃δ > 0 tel que ∀y ∈ Bδ (x), < ε.
ky − xkαRn
Corollaire 1. Si f : Rn → Rm est Hadamard différentiable en x, alors f est
continue en x.
′ ′
Démonstration. Si fH (x; 0) existe, alors fH (x; 0) = f ′ (x; 0) = 0. Pour tout y ∈ V (x)
tel que y 6= x
 
α y−x
kf (y) − f (x)kRm f x + ky − xk ky−xk α − f (x)
α = α −0 .
ky − xkRn ky − xkRn
Rm
228 Chapitre 6. Dérivée, dérivées directionnelles et différentielles


Comme fH (x; 0) = 0, lorsque y → x, t = ky − xkα
Rn → 0 et

y−x y−x
w= = ky − xk1−α → 0 lorsque y → x
ky − xkα
R n ky − xkRn
 
y−x
f x + ky − xkα ky−xk α − f (x)
Rn ′
⇒ lim α − fH (x; 0) = 0.
y→x ky − xkRn
Rm

Donc, pour tout ε > 0, il existe δ, 0 < δ < 1 tel que


 
α y−x
kf (y) − f (x)kR m
f x + ky − xk ky−xk α − f (x)
∀y ∈ Bδ (x), α = α
−0 <ε
ky − xkRn ky − xk
Rm
⇒ ∀y ∈ Bδ (x), kf (y) − f (x)kRm < ε ky − xkα
Rn < ε.

On a donc la continuité de f en x.

3.3.4 Opérations algébriques sur les dérivées directionnelles et les différentielles


Il est facile de vérifier les propriétés suivantes.
Théorème 3.4. Soient x ∈ Rn un point et v ∈ Rn une direction.
(i) Soient f, g : Rn → Rm tel que fH
′ ′
(x; v) et gH (x; v) existent. Alors

(f + g)′H (x; v) = fH
′ ′
(x; v) + gH (x; v) (3.29)
′ ′
∀α ∈ R, (αf )H (x; v) = αfH (x; v) (3.30)
(f · g)′H (x; v) = fH
′ ′
(x; v) · g(x) + f (x) · gH (x; v) (3.31)

en définissant ponctuellement les opérations sur les fonctions


déf
(f + g)(x) = f (x) + g(x), ∀x ∈ Rn (3.32)
déf
(αf )(x) = αf (x), ∀x ∈ Rn (3.33)
déf n
(f · g)(x) = f (x) · g(x), ∀x ∈ R . (3.34)

(ii) Soient f, g : Rn → R tel que fH


′ ′
(x; v) et gH (x; v) existent. Alors

(f g)′H (x; v) = fH
′ ′
(x; v) g(x) + f (x) gH (x; v) (3.35)
f ′ (x; v) g(x) − f (x) gH

(x; v)
(f /g)′H (x; v) = H 2
, g(x) 6= 0, (3.36)
g(x)

en définissant ponctuellement les opérations sur les fonctions


déf
(f g)(x) = f (x) g(x), ∀x ∈ Rn . (3.37)
déf f (x)
(f /g)(x) = , ∀x ∈ Rn tel que g(x) 6= 0. (3.38)
g(x)
3. Fonctions de plusieurs variables réelles 229

Corollaire 1. Si, en plus des hypothèses du Théorème 3.4, les fonctions sont Ha-
damard différentiables, alors les fonctions suivantes sont Hadamard différentiables :

D(f + g)(x) = Df (x) + Dg(x) (3.39)


∀α ∈ R, D(αf )(x) = αDf (x) (3.40)
⊤ ⊤
D(f · g)(x) = Df (x) g(x) + Dg(x) f (x) (3.41)
D(f g)(x) = Df (x) g(x) + f (x) Dg(x) (3.42)
Df (x) g(x) − f (x) Dg(x)
D(f /g)(x) = , g(x) 6= 0, (3.43)
g(x)2

où Df (x)⊤ : Rm → Rn et Dg(x)⊤ : Rm → Rn sont les applications linéaires


(matrices) transposées de Df (x) : Rn → Rm et Dg(x) : Rn → Rm .

3.3.5 Dérivation et différentiation en chaı̂ne des fonctions composées


Une des opérations centrales de tout bon calcul différentiel est la règle de
calcul de la différentielle de la composition h de deux fonctions f : Rn → Rk et
g : Rm → Rn , k, m et n des entiers positifs,
g f n
Rm −→ Rn −→ Rk ∂hi X ∂fi ∂gℓ 1 ≤ i ≤ k,
(x) = (g(x)) (x),
déf
x 7→ h(x) = f (g(x)) : Rm → Rk , ∂xj ∂yℓ ∂xj 1 ≤ j ≤ m.
ℓ=1

Un résultat
P analogue demeure vrai pour les dérivées directionnelles : étant
donné v = m j=1 vj ej

Xm Xm X n X n Xm
∂hi ∂fi ∂gℓ ∂f ∂gk
(x) vj = (g(x)) (x) vj = (g(x)) (x) vj
j=1
∂xj j=1 ℓ=1
∂yℓ ∂xj ∂yℓ j=1
∂xj
ℓ=1
n n
!
X ∂fi X
′ ′ ′
hi (x; v) = (g(x)) gℓ (x; v) = fi g(x); ′
gℓ (x; v) eℓ = fi′ (g(x); g ′ (x; v))
∂yℓ
ℓ=1 ℓ=1
⇒ h′ (x; v) = f ′ (g(x); g ′ (x; v)) ,

où g = (g1 , . . . , gn ) et g ′ (x; v) = (g1′ (x; v), . . . , gn′ (x; v)).

Théorème 3.5. Soient n ≥ 1 et m ≥ 1 deux entiers, g : Rm → Rn et f : Rn → Rk


deux fonctions, x un point de Rm , et v une direction dans Rm . On considère la
composition (f ◦ g)(x) = f (g(x)). On fait les hypothèses suivantes :
a) g ′ (x; v) existe dans Rn

b) fH (g(x); g ′ (x; v)) existe dans R.
Alors,
(i) (f ◦ g)′ (x; v) existe et l’on a

(f ◦ g)′ (x; v) = fH

(g(x); g ′ (x; v)); (3.44)
230 Chapitre 6. Dérivée, dérivées directionnelles et différentielles


(ii) si, en plus, gH (x; v) existe, alors (f ◦ g)′H (x; v) existe et l’on a

(f ◦ g)′H (x; v) = fH
′ ′
(g(x); gH (x; v)). (3.45)

Corollaire 1. Si, en plus, f est Hadamard différentiable en g(x) et g est Gateaux


(resp. Hadamard) différentiable en x, alors f ◦ g est Gateaux (resp. Hadamard)
différentiable en x et l’on a

D(f ◦ g)(x) = Df (g(x)) ◦ Dg(x). (3.46)

ou, sous forme matricielle, D(f ◦ g)(x) = Df (g(x)) Dg(x).

Remarque 3.6.
On peut considérer la composition d’un nombre fini de fonctions g1 ◦ g2 ◦ g3 qui
soient toutes dérivables au sens de Hadamard sauf la dernière qui n’a besoin que
d’être directionnellement dérivable, c’est-à-dire,

(g1 ◦ g2 ◦ g3 )′ (x; v) = (g1 )′H (g2 (g3 (x)); (g2 )′H (g3 (x); g3′ (x; v))).

Lorsqu’elles sont toutes Hadamard différentiables,

D(g1 ◦ g2 ◦ g3 )(x) = Dg1 ((g2 ◦ g3 )(x)) ◦ Dg2 (g3 (x)) ◦ Dg3 (x)

ou D(g1 ◦ g2 ◦ g3 )(x) = Dg1 ((g2 ◦ g3 )(x)) Dg2 (g3 (x)) Dg3 (x).

Remarque 3.7.
Si f : Rn → R est une fonction à valeurs réelles, on a

∀v ∈ Rm , ∇(f ◦ g)(x) · v = ∇f (g(x)) · Dg(x)v. (3.47)

On peut aussi écrire le résultat sous forme matricielle

∇(f ◦ g)(x) = [Dg(x)]⊤ ∇f (g(x)), (3.48)


| {z } | {z } | {z }
m×1 m×n n×1

où Dg(x) est la vmatrice jacobienne m × n de g : Rm → Rn

[Dg(x)]ij = ∂j gi (x), 1 ≤ i ≤ n, 1 ≤ j ≤ m, (3.49)

et ∇f (g(x)) est considéré comme un vecteur colonne ou une matrice n × 1. Si


∇f (g(x)) est considéré comme un vecteur ligne ou une matrice 1 × n, la formule
s’écrit

∇(f ◦ g)(x) = ∇f (g(x)) Dg(x).


| {z } | {z } | {z }
1×m 1×n n×m

Démonstration du Théorème 3.5. (i) Pour t 6= 0, on cherche la limite du quotient

déf 1
q(t) = [f (g(x + tv)) − f (g(x))].
t
3. Fonctions de plusieurs variables réelles 231

On remarque que

g(x + tv) − g(x)


g(x + tv) = g(x) + t = g(x) + t v(t)
t
en définissant
déf g(x + tv) − g(x)
v(t) = .
t
On sait par l’hypothèse de l’existence de g ′ (x; v) que

v(t) → g ′ (x; v) lorsque t → 0.

En réécrivant
1
q(t) = [f (g(x) + t v(t)) − f (g(x))],
t

il vient par la définition et l’existence de fH (g(x); g ′ (x; v) que

lim q(t) = fH (g(x); g ′ (x; v)).
t→0

(ii) Pour t → 0, t 6= 0, et w → v, on cherche la limite du quotient différentiel

déf 1
q(t, w) = [f (g(x + tw)) − f (g(x))].
t
On remarque que l’on peut réécrire le terme g(x + tw) sous la forme

g(x + tw) − g(x)


g(x + tw) = g(x) + t = g(x) + t v(t, w)
t
en introduisant le vecteur
déf g(x + tw) − g(x)
v(t, w) = .
t

Comme par hypothèse gH (x; v) existe, on a

v(t, w) → gH (x; v) lorsque t → 0 et w → v.

En réécrivant le quotient différentiel


1
q(t, w) = [f (g(x) + t v(t, w)) − f (g(x))],
t
′ ′
il vient de l’hypothèse de l’existence de fH (g(x); gH (x; v)) et par définition de la
dérivée directionnelle au sens de Hadamard
′ ′
lim q(t, w) = fH (g(x); gH (x; v)).
t→0
w→v
232 Chapitre 6. Dérivée, dérivées directionnelles et différentielles

Remarque 3.8.

Il est important de rappeler que fH (x; v) n’a pas besoin d’être linéaire en v comme
le montre la fonction de l’Exemple 3.10.

L’hypothèse que g ′ (x; v) et f ′ (g(x); g ′ (x; v)) existent n’est pas suffisante pour
démontrer le théorème. La démonstration utilise de fa¸con critique l’hypothèse plus

forte que fH (g(x); g ′ (x; v)) existe aussi. On donne maintenant l’exemple de la com-
position f ◦ g d’une fonction Gateaux différentiable f et d’une fonction infiniment
différentiable 23 g. La composition n’est pas Gateaux différentiable et pas même
simplement différentiable en 0 dans quelque direction v 6= 0.

Exemple 3.11.
Soient les fonctions
x6
f : R2 → R, f (x, y) = si (x, y) 6= (0, 0) et f (0, 0) = 0
(y − x2 )2 + x8
 
x
g : R → R2 , g(x) = 2 .
x

On a vu dans l’Exemple 3.3 que f était Gateaux différentiable en (0, 0) et que


 
0
∇f (0, 0) = .
0

On voit aussi que g est de classe C (∞) dans R et que la matrice jacobienne associée
est donnée par
   
1 1
Dg(x) = et Dg(0) = .
2x 0

La composition f (g(x)) de f et g

1
, si x 6= 0
h(x) = f (g(x)) = f (x, x2 ) = x2
0, si x = 0

donne une fonction réelle d’une variable réelle x qui n’est ni continue en 0 ni continue
en 0 à droite ou à gauche. Elle n’est donc pas différentiable ni même dérivable en
x = 0 dans les directions v 6= 0. En appliquant la règle de dérivation en chaı̂ne des
fonctions composées, il vient
 
′ ⊤
  0
h (0) = [Dg(0)] ∇f (g(0)) = 1 0 = 0.
0

Le résultat donné par la règle de dérivation en chaı̂ne des fonctions composées est
faux. Ceci provient du fait que, la différentiabilité de f au sens de Gateaux n’est pas
suffisante. Il faudrait que f soit différentiable au sens de Hadamard en (0, 0).
23. Une fonction qui est dérivable et dont toutes les dérivées partielles de tout ordre sont
dérivables.
3. Fonctions de plusieurs variables réelles 233

3.4 Différentielle de Fréchet


On donne maintenant la notion de différentielle que l’on retrouve habituelle-
ment dans les livres contemporains d’analyse. En dimension finie, elle est équivalente
à celle de différentielle au sens de Hadamard dont la caractérisation est plus simple
et qui se généralise aux espaces vectoriels topologiques de dimension infinie qui ne
possèdent pas de structure métrique.

Définition 3.7.
f : Rn → Rm est différentiable au sens de Fréchet 24 en x ∈ Rn s’il existe une
application linéaire L(x) : Rn → Rm tel que

f (x + v) − f (x) − L(x)v
lim = 0 dans Rm . (3.50)
v→0 kvk

On dira aussi que f est Fréchet différentiable en x. 25

Remarque 3.9.
Cette définition fut initiallement donnée par M. Fréchet [1] en 1911 dans le
contexte des fonctionnelles, c’est-à-dire, les fonctions de fonctions. Cependant, en
dimension finie, sa définition est équivalente à la notion antérieure de différentielle
totale que l’on trouve chez O. Stolz 26 en 1893, J. Pierpont 27 en 1905, et W. H.
Young 28 en 1908-1909 :
≪En fait, une définition équivalente avait été donnée en 1908 par

M. W.-H. Young [1, p. 157], [2, p. 21], qui avait, en outre, développé
explicitement les conséquences.≫ (M. Fréchet [2])
≪Mais je me suis aperçu qu’on trouve déjà cette définition dans Stolz,

Grundzüge der Differential und Integral-Rechnung, t. I, p. 133, et James


Pierpont, The theory of functions of real variables, t. I, p. 268. Mais c’est
W. H. Young qui en a véritablement montré le premier tous les avantages
dans son petit Livre : The fundamental theorems of Differential Calculus
et dans quelques Mémoires.≫ (M. Fréchet [3])
Selon V. M. Tihomirov [1], ≪les définitions correctes de dérivée et de différentielle
d’une fonction de plusieurs variables furent données par K. Weierstrass dans ses
cours pendant les années quatre-vingt (c’est-à-dire entre 1880 et son décès en 1897).
Ces cours furent publiés dans les années trente de notre siècle (20e). Les définitions
correctes de la dérivée dans le cas multidimensionnel apparaissent aussi au début du
siècle dans quelques manuels de cours allemands ou anglais (Stolz 1893, Pierpont

24. Maurice René Fréchet (1873–1973) apporta d’importantes contributions à l’analyse réelle
et fonda la théorie des espaces abstraits. Il écrivit sa thèse sous la supervision de Hadamard en
1906. Il introduisit le concept d’espace métrique et formula la notion abstraite de la compacité.
25. L’application v 7→ f (x)+ L(x)v peut aussi s’interpréter comme une approximation linéaire
(affine) de f (x + v) au point (x, f (x)) à léchelle infinitésimale.
26. Otto Stolz (1842–1905) (voir O. Stolz [1, p. 133]).
27. James Pierpont (1866–1938) (voir J. Pierpont [1, p. 268]).
28. William Henry Young (1863–1942) (voir W.-H. Young [1, p. 157], [2, p. 21]).
234 Chapitre 6. Dérivée, dérivées directionnelles et différentielles

1905, Young 1908) sous l’influence de Weierstrass.≫ 29 Il ne donne pas de référence


plus précise, mais tous trois avaient eu des contacts avec Weierstrass au cours de
longs séjours en Allemagne.

Il est facile de voir qu’une fonction Fréchet différentiable en un point x est


Gateaux différentiable en x et que

Df (x)v = f ′ (x; v) = L(x)v, ∀v ∈ Rn .

En effet, le résultat est vrai pour v = 0 puisque f ′ (x; 0) = 0 = L(x)0. Pour v 6= 0


et t 6= 0

tv → 0 lorsque t → 0.

Comme f est Fréchet différentiable en x

f (x + tv) − f (x) − L(x)(tv)


lim = 0.
t→0 ktvk

Mais
f (x + tv) − f (x) − L(x)(tv) t 1 f (x + tv) − f (x) − L(x)(tv)
=
ktvk |t| kvk t
f (x + tv) − f (x) − L(x)(tv) 1 f (x + tv) − f (x)
⇒ = − L(x) v .
ktvk kvk t

Comme v 6= 0, on peut éliminer kvk ce qui donne

f (x + tv) − f (x)
lim − L(x)v = 0
t→0 t

et, de là, la dérivée f ′ (x; v) de f en x dans la direction v

f (x + tv) − f (x)
f ′ (x; v) = lim = L(x)v.
t→0 t
Puisque l’application L(x) est linéaire de Rn dans Rm , f est bien Gateaux diffé-
rentiable en x et par la Définition 3.3 de l’application jacobienne

∀v ∈ Rn , Df (x) · v = f ′ (x; v) = L(x)v.

L’exemple suivant montre qu’une fonction f Gateaux différentiable en x n’est


pas Fréchet différentiable en x, ni même continue en x.
29. De l’anglais : ≪the correct definitions of derivative and differential of a function of many
variables were given by K. Weierstrass in his lectures in the eighties of the 19th century. These
lectures were published in the thirties of our century (20th). The correct definitions of the derivative
in the multidimensional case appear also at the beginning of the century in some German and
English text-books (Scholz, Young) under the influence of Weierstrass.≫
3. Fonctions de plusieurs variables réelles 235

Exemple 3.12 (Exemple 3.3 et Exemple 3.9, Figure 6.3).


On reprend l’Exemple 3.3 de la fonction f : R2 → R définie par

 x6
déf , si (x, y) 6= (0, 0)
f (x, y) = (y − x2 )2 + x8

0, si (x, y) = (0, 0).

On a déjà montré que f ′ ((0, 0); (v1 , v2 )) = 0 pour tout (v1 , v2 ), que f est Gateaux
différentiable en (0, 0) et que f est discontinue en (0, 0). On montre maintenant que
f n’est pas Fréchet différentiable en (0, 0). On choisit

v(α) = (α, α2 ), α 6= 0.

Lorsque α tend vers 0, v(α) tend vers (0, 0). On calcule le quotient de Fréchet

f (α, α2 ) − f (0, 0) − f ′ ((0, 0); (α, α2 ))


déf
q(α) =
k(α, α2 )k
1 1
= 3 → +∞ lorsque α → 0.
α (1 + α2 ) 21

La fonction f n’est donc pas Fréchet dérivable en (0, 0).

On donne maintenant l’équivalence de la différentielle au sens de Fréchet et


de celle au sens de Hadamard.
Théorème 3.6. Soient x ∈ Rn et f : Rn → Rm . Les conditions suivantes sont
équivalentes :
(i) f est Fréchet différentiable en x ;
(ii) f est Hadamard différentiable en x.
En dimension n = 1, les différentielles de Fréchet, de Hadamard et de Gateaux en
x coı̈ncident et correspondent à la notion de dérivée en x de la Définition 2.1 (iii).
Démonstration. (i) ⇒ (ii). On pose
déf f (x + h) − f (x) − L(x) h déf
Q(h) = si h 6= 0 et Q(0) = 0. (3.51)
khk

Puisque f est Fréchet différentiable en x, Q(h) → 0 = Q(0) lorsque h → 0 et il y a


continuité de Q en h = 0.
Pour (t, w) → (0, v), t 6= 0, on considère le quotient

déf f (x + tw) − f (x)


q(t, w) = .
t
déf
On a h(t, w) = tw → 0 puisque w → v et t → 0. Alors

|t|
q(t, w) = Q(h(t, w)) kwk + L(x) w → 0 kvk + L(x) v,
t
236 Chapitre 6. Dérivée, dérivées directionnelles et différentielles

puisque kwk → kvk et L(x) w → L(x) v lorsque w → v. Donc

lim q(t, w) = L(x) v,


tց0+
w→v

′ ′
fH (x; v) existe et fH (x; v) = L(x) v est linéaire (et continue) par rapport à v. Par
définition f est Hadamard différentiable en x.

(ii) ⇒ (i). Comme f est Hadamard différentiable, fH (x; v) existe pour tout v
déf

et l’application v 7→ L(x)v = fH (x; v) est linéaire. Soit

déf
Q = lim sup kQ(h)k,
06=khk→0

où Q(h) est définie par (3.51) pour ce choix de L(x). Comme kQ(h)k ≥ 0, Q est
un nombre positif, nul ou +∞. Il existe donc une suite {hn }, 0 6= hn → 0, tel que
kQ(hn )k converge vers Q. Comme {h/khk : ∀h ∈ Rn , h 6= 0} est la sphère S de
rayon 1, S est compacte dans Rn et il existe une sous-suite {hnk } et v ∈ S tel que

déf hnk
wnk = → v ∈ S.
khnk k
On voit que pour h 6= 0
 
  f x + khk h − f (x)
h khk h
Q(h) = Q khk = − L(x) .
khk khk khk
′ ′
Comme fH (x; v) existe et que L(x)wnk → L(x)v = fH (x; v), en prenant tnk = khnk k
qui tend vers 0, il vient

f (x + tnk wnk ) − f (x)


Q(hnk ) = − L(x) wnk
tnk
′ ′ ′
→ fH (x; v) − L(x) v = fH (x; v) − fH (x; v) = 0
⇒ kQ(hnk )k → 0 et Q = lim sup kQ(h)k = 0.
h→0

Comme kQ(h)k ≥ 0 et que la limsup Q est égale à zéro, la limsup est égale à la
limite. En particulier, la limite du quotient Q(h) existe et est 0 lorsque h tend vers
0. Par définition, f est donc Fréchet différentiable en x.

3.5 Fonctions lipschitziennes et différentiabilité


3.5.1 Définitions
On rappelle la Définition 7.1 du Chapitre 4.

Définition 3.8.
Soit f : Rn → Rm , n ≥ 1, m ≥ 1.
3. Fonctions de plusieurs variables réelles 237

(i) f est lipschitzienne en x s’il existe c(x) > 0 et un voisinage V (x) de x tel
que
∀y, z ∈ V (x), kf (z) − f (y)kRm ≤ c(x) kz − ykRn .

(ii) f est lipschitzienne sur une partie U de Rn s’il existe c(U ) > 0 tel que
∀y, z ∈ U, kf (z) − f (y)kRm ≤ c(U ) kz − ykRn .

Exemple 3.13.
La norme f (x) = kxk est lipschitzienne dans Rn puisque
∀y, z ∈ Rn , |f (y) − f (z)| = |kyk − kzk| ≤ ky − zk,
avec une constante de Lipschitz c(Rn ) = 1. La fonction f (x) = kxk2 n’est pas
lipschizienne sur tout Rn , mais elle est lipschitzienne en tout point x ∈ Rn . En effet
pour tout r > 0,
∀y, z ∈ Br (x), |f (y)− f (z)| = kyk2 − kzk2 ≤ ky + zk ky − zk ≤ 2(r + kxk)ky − zk.
On choisit le voisinage Br (x) et la constante c(x) = 2(r + kxk).

3.5.2 Gateaux dérivabilité et Lipschitzité donnent Hadamard dérivabilité


Théorème 3.7. Soit f : Rn → Rm , n ≥ 1, m ≥ 1, une fonction lipschitzienne en
x ∈ Rn .
(i) Si f ′ (x; v) existe, alors fH
′ ′
(x; v) existe. En particulier, fH (x; 0) existe.
′ n
(ii) Si f (x; v) existe pour tout v ∈ R , alors
∀v, w ∈ Rn , ′
kfH ′
(x; v) − fH (x; w)kRm ≤ c(x) kv − wkRn , (3.52)
où c(x) est la constante de Lipschitz associée au voisinage V (x) de x de la
Définition 3.8 (i).

Remarque 3.10.

Ce théorème est presque la réciproque du Théorème 3.3 qui dit que si fH (x; v)
existe, alors f est continue en x.

Démonstration. (i) Soit {wn } une suite tendant vers v et t > 0. Alors il existe N
et t̄ > 0 tel que pour tout n > N et 0 < t < t̄ on ait x + twn ∈ V (x). On forme le
quotient différentiel
f (x + twn ) − f (x) f (x + twn ) − f (x + tv) f (x + tv) − f (x)
= + .
t t t
Par hypothèse, le second terme tend vers f ′ (x; v). Comme f est lipschitzienne en
x
∃c(x), ∀y, z ∈ V (x), kf (y) − f (z)kRm ≤ c(x)ky − zkRn
238 Chapitre 6. Dérivée, dérivées directionnelles et différentielles

et on peut majorer la valeur absolue du premier terme

f (x + twn ) − f (x + tv)
≤ c(x) kwn − vkRn → 0 lorsque n → ∞.
t Rm

Comme la limite est la même pour toute suite wn → v, on en conclut que



fH (x; v) = f ′ (x; v), ∀v ∈ Rn .

Pour v = 0, on a toujours f ′ (x; 0) = 0. Par ce qui précède, fH



(x; 0) existe.
n
(ii) Pour tout v, w ∈ R et t > 0 suffisamment petit, x + tv et x + tw appar-
tiennent à V (x) et

f (x + tv) − f (x) f (x + tw) − f (x)


− ≤ c(x) kv − wkRn .
t t Rm

′ ′
Lorsque t tend vers zéro, il vient kfH (x; v) − fH (x; w)k = kf ′ (x; v) − f ′ (x; w)kRm ≤
c(x) kv − wkRn .

3.6 Théorème de la moyenne pour les fonctions vectorielles


On aura aussi besoin d’une version vectorielle du Théorème 2.4 de la moyenne
ou des accroissements finis. On commence par une fonction à valeurs réelles, puis
on adaptera le résultat pour une fonction à valeurs vectorielles.
déf
Théorème 3.8. Soient f : Rn → R et a, b ∈ Rn , b 6= a. Si la fonction t 7→ g(t) =
f (a + t (b − a)) est continue dans [0, 1] et dérivable dans ]0, 1[ , alors

∃θ ∈ ]0, 1[ tel que f (b) − f (a) = f ′ (a + θ (b − a); b − a). (3.53)

Démonstration. Il suffit de remarquer que pour tout t ∈ ]0, 1[

g ′ (t) = f ′ (a + t (b − a); b − a).

En effet, par définition de g ′ (t) en un point 0 < t < 1 : pour |s| assez petit

g(t + s) − g(t) f (a + (t + s) (b − a)) − f (a + t (b − a))


=
s s
f ((a + t (b − a)) + s (b − a)) − f (a + t (b − a))
=
s
→ f ′ (a + t (b − a); b − a) lorsque s → 0.

Pour compléter la démonstration, il suffit d’appliquer le Théorème 2.4 de la moyenne


à g(t) = f (a + t (b − a)) : il existe θ ∈ ]0, 1[ tel que g(1) = g(0) + g ′ (θ).

Dans le cas vectoriel, on a un θ pour chaque composante, mais pas un θ unique


pour toutes les composantes.
3. Fonctions de plusieurs variables réelles 239

Théorème 3.9. Soit une application f : Rn → Rm , m ≥ 1, n ≥ 1, et deux points


a, b ∈ Rn , b 6= a. On suppose que f est continue en chaque point du segment fermé
{a + t (b − a) : 0 ≤ t ≤ 1}
et Gateaux différentiable en chaque point du segment ouvert
{a + t (b − a) : 0 < t < 1}.
Alors, il existe θ, 0 < θ < 1, tel que
kf (b) − f (a)kRm ≤ kb − akRn kDf (a + θ(b − a))kL(Rn ,Rm ) . (3.54)
Démonstration. On définit la fonction
déf
t 7→ ϕ(t) = [f (b) − f (a)] · f (a + t (b − a)) : [0, 1] → R .
Comme ϕ est continue sur [0, 1] et dérivable dans ]0, 1[
ϕ′ (t) = [f (b) − f (a)] · f ′ (a + t (b − a); b − a)
= [f (b) − f (a)] · Df (a + t (b − a)) [b − a].
Il existe θ ∈ ]0, 1[ tel que ϕ(1) − ϕ(0) = ϕ′ (θ) par le Théorème 2.4 de la moyenne.
En explicitant,
2
ϕ(1) − ϕ(0) = kf (b) − f (a)kRm
⇒ kf (b) − f (a)k2 = [f (b) − f (a)] · Df (a + θ (b − a)) [b − a]
≤ kf (b) − f (a)kRm kDf (a + θ(b − a))kL(Rn ,Rm ) kb − akRn
⇒ kf (b) − f (a)kRm ≤ kb − akRn kDf (a + θ(b − a))kL(Rn ,Rm ) .

De ce théorème, on déduit plusieurs résultats importants.


Théorème 3.10. Soit f : Rn → Rm une application Gateaux différentiable dans
un ouvert convexe U ⊂ Rn telle qu’il existe M ≥ 0 vérifiant
∀x ∈ U, kDf (x)kL(Rn ,Rm ) ≤ M. (3.55)
Alors
∀a, b ∈ U, kf (b) − f (a)kRm ≤ M kb − akRn , (3.56)

f possède un prolongement lipschitzien sur U de constante M et f est Fréchet


différentiable sur U .
Démonstration. On applique le Théorème 3.9. Pour toute paire a, b ∈ U
kf (b) − f (a)kRm ≤ kb − akRn kDf (a + θ(b − a))kL(Rn ,Rm ) ≤ M kb − akRn
puisque U est convexe entraı̂ne a+θ(b−a) ∈ U . La fonction f est donc lipschitzienne
sur U possède un prolongement lipschitzien sur U de constante M . De plus, comme
f est Gateaux différentiable et lipschitzienne sur U , elle est Fréchet différentiable
sur l’ouvert U par le Théorème 3.7 (i).
240 Chapitre 6. Dérivée, dérivées directionnelles et différentielles

Remarque 3.11.
Le Théorème 3.10 semble contredire l’Exemple 3.3 d’une fonction Gateaux diffé-
rentiable f (x, y) au point (0, 0), mais discontinue en ce point. En effet la fonction
f (x, y) est Gateaux différentiable non seulement en (0, 0), mais aussi dans tout R2 .
Cependant, la fonction et son gradient ne sont bornées dans aucune boule Bδ (0, 0),
δ > 0, autour de (0, 0). 30 Il est facile de vérifier que pour (x, y) 6= (0, 0),

∂f 2 x6 (y − x2 ) ∂f (y − x2 )(3y − x2 ) − x8
=− , = 2x5 .
∂y [(y − x2 )2 + x8 ]2 ∂x [(y − x2 )2 + x8 ]2

Lorsque l’on prend y = x2 , x 6= 0,

∂f ∂f 2
(x, x2 ) = 0, (x, x2 ) = − 3
∂y ∂x x

et ∇f (x, x2 ) n’est pas borné lorsque x tend vers 0.

Corollaire 1. Soit f : Rn → Rm une application Gateaux différentiable sur un


ouvert connexe U de Rn . Si

∀x ∈ U, Df (x) = 0,

alors f est égale à un vecteur constant sur U .

Démonstration. Soit x0 ∈ U et U1 = {x ∈ U : f (x) = f (x0 )}. Par définition


U1 6= ∅. Soit x ∈ U1 . Comme U est ouvert, il existe r > 0 tel que Br (x) ⊂ U . On
peut alors appliquer le Théorème 3.10 avec M = 0 et l’ouvert convexe Br (x). Il
vient
∀y ∈ Br (x), f (y) = f (x) = f (x0 ).
D’où Br (x) ⊂ U1 . Ceci montre que U1 est une partie ouverte de Rn . On considère
maintenant l’ensemble complémentaire

U \U1 = {x ∈ U : f (x) 6= f (x0 )}.

Pour tout point x1 ∈ U \U1 , il existe r > 0 tel que Br (x1 ) ⊂ U et par le même
argument que précédemment f (x) = f (x1 ) 6= f (x0 ) pour tout x ∈ Br (x1 ). De là
Br (x1 ) ⊂ U \U1 et U \U1 est ouvert.
Si U \U1 6= ∅, alors U est l’union de deux ensembles ouverts non-vides et
disjoints U1 et U \U1 de l’espace euclidien Rn . Mais ceci est impossible puisque U
est sous-ensemble connexe de Rn . Donc U \U1 = ∅ et U = U1 .

Remarque 3.12.
H. Whitney [1] a donné l’exemple d’une partie convexe U ⊂ R2 et d’une fonction
f différentiable tel que ∇f (x, y) = 0 pour tout (x, y) ∈ U , mais f (x, y) n’est pas
constante dans U . Cet ensemble n’a pas de points intérieurs.
30. Voir aussi l’Exercice 7.7.
3. Fonctions de plusieurs variables réelles 241

3.7 Fonctions de classes C (p) , p ≥ 0, et matrice hessienne


3.7.1 Classes C (0) et C (1)
Lorsque f est Gateaux (resp. Fréchet) différentiable en x, on a vu que le gra-
dient peut s’exprimer en fonction des dérivées partielles de f en x. La réciproque
n’est en général pas vraie car même l’existence de dérivées dans toutes les direc-
tions n’est pas suffisante pour assurer la différentiabilité au sens de Gateaux et
encore moins au sens de Fréchet. Cependant, lorsque l’on impose des conditions de
continuité sur les dérivées partielles, on peut montrer que la différentielle au sens de
Fréchet existe et que le gradient est complètement spécifié par les dérivées partielles.
L’essentiel des démonstrations de ce paragraphe est emprunté à W. Rudin [1].

Définition 3.9.
Soient f : Rn → R, U ⊂ Rn ouvert.
(i) f est de classe C (0) sur U si f est continue sur U . On écrira f ∈ C (0) (U ).
(ii) f est de classe C (1) sur U si les dérivées partielles ∂i f (x), 1 ≤ i ≤ n,
existent et sont continues sur U . On écrira f ∈ C (1) (U ). 31
Ces définitions et les résultats qui suivent s’étendent aux fonctions à valeurs vecto-
rielles f : U ⊂ Rn → Rm .

Théorème 3.11. Soient f : Rn → R et {ei }ni=1 la base orthonormale canonique.


(i) Si f possède des dérivées partielles ∂i f , i = 1, . . . , n, dans un voisinage
V (x) d’un point x qui sont continues en x, alors f est Fréchet différentiable
en x (et donc continue en x) et
Xn Xn
∀v ∈ Rn , L(x)v = ∂i f (x) ei vi , ∇f (x) = ∂i f (x) ei .
i=1 i=1

(ii) Si f possède des dérivées partielles ∂i f , i = 1, . . . , n, qui sont continues


sur un ouvert U de , Rn , alors f est Fréchet différentiable dans U (et donc
continue sur U ) et pour tout y ∈ U ,
Xn Xn
∀v ∈ Rn , L(y)v = ∂i f (y) vi , ∇f (y) = ∂i f (y) ei ,
i=1 i=1
et les applications
y 7→ ∇f (y) : U → Rn et (y, w) 7→ f ′ (y; w) : U × Rn → R (3.57)
sont continues.
Corollaire 1. Si f est de classe C (1) sur un ouvert U , alors f est Fréchet diffé-
rentiable sur U et donc de classe C (0) sur U . De plus ∇f est de classe C (0) sur U .
Réciproquement, si f est Fréchet différentiable sur U et si
x 7→ ∇f (x) : U → Rn (3.58)
31. Il ne faut pas confondre les espaces C (0) (U ) et C (1) (U ) avec les espaces de Banach C (0) (U )
et C (1) (U ) de fonctions uniformément continues et bornées sur U . Lorsque U n’est pas borné il
existe des métriques complètes sur C (0) (U ) et C (1) (U ) qui en font des espaces appelés espaces de
Fréchet.
242 Chapitre 6. Dérivée, dérivées directionnelles et différentielles

est continue, alors f est de classe C (1) sur U .


Démonstration du Théorème 3.11. (i) Il suffit de démontrer que f est Fréchet dif-
férentiable en x. La continuité suit par le Théorème 3.3 et les autres propriétés
des discussions suivant les définitions des différentielles aux sens de Gateaux et
de Fréchet. Pour montrer que f est Fréchet différentiable, on démontre que f est

Hadamard directionnellement dérivable et que fH (x; v) est linéaire par rapport à v,
et on applique le Théorème 3.6.
Tout élément v = (v1 , . . . , vn ) de Rn peut s’écrire dans la base orthonormale,
n
X
v= vi ei .
i=1

Pour chaque y ∈ V (x), on définit l’application linéaire


n
X
déf
v 7→ L(y)v = ∂i f (y) vi : Rn → R.
i=1
Soit v ∈ Rn et les suites wk → v et tk → 0. Il existe N tel que
∀k > N, x + tk wk ∈ V (x).
Soient les points suivants
déf déf
x0k = x, xik = xi−1
k + tk (wk )i ei , 1 ≤ i ≤ n.
On veut montrer que le quotient différentiel moins L(x)v
déf f (x + tk wk ) − f (x)
qk = − L(x)v
tk
tend vers 0 lorsque k tend vers l’infini. On peut le réécrire sous la forme
n
X f (xi ) − f (xi−1 )
k k
qk = − ∂i f (x) vi .
i=1
tk

Puisque f est dérivable dans la direction ei pour tout point de V (x), la fonction
gi (α) = f (xi−1
k + α tk (wk )i ei ) est continue dans [0, 1] et différentiable dans ]0, 1[ .
Par le théorème de la moyenne (Théorème 3.8)

∃αik ∈ ] 0, 1 [ , f (xik ) − f (xi−1 ′ i−1


k ) = f (xk + αik tk (wk )i ei ; tk (wk )i ei )
= tk (wk )i ∂i f (xi−1
k + αik tk (wk )i ei )
par homogénéité et finalement
f (xik ) − f (xi−1
k )
= (wk − v)i ∂i f (xi−1
k + αik tk (wk )i ei ) + vi ∂i f (xi−1
k + αik tk (wk )i ei )
tk
f (xik ) − f (xi−1
k )
− ∂i f (x) vi = (wk − v)i ∂i f (xi−1k + αik tk (wk )i ei )
tk
 
+ vi ∂i f (xi−1
k + αik tk (wk )i ei ) − ∂i f (x) .
3. Fonctions de plusieurs variables réelles 243

Mais, par construction, pour tout i

i−1
X
kxi−1
k + αik tk (wk )i ei − xk = (xjk − xj−1 i
k ) + αk tk (wk )i ei
j=1
 1/2
i−1
X Xi−1 
= tk (wk )j ej + αik tk (wk )i ei = |tk | |(wk )j |2 + |αik (wk )i |2
 
j=1 j=1
 1/2  1/2
Xi  Xn 
≤ |tk | |(wk )j |2 ≤ |tk | |(wk )j |2 = |tk | kwk k
   
j=1 j=1

qui tend vers zéro lorsque wk → v et tk ց 0 et puisque ∂i f (y) est continue en x,


∂i f (xki−1 + αik tk (wk )i ei ) → ∂i f (x), et qk tend vers zéro lorsque k tend vers l’infini.
On a donc montré que, pour tout v ∈ Rn , fH ′
(x; v) = L(x)v qui est linéaire en v
par définition de L(x). f est donc Hadamard (Fréchet) différentiable en x.
(ii) Les résultats dans U sont une conséquence des résultats de (i) en x. Il
ne reste qu’à démontrer la continuité des applications (3.57). Comme le gradient
∇f (y) a pour expression
Xn
∇f (y) = f ′ (y; ei ) ei ,
i=1

il est continu dans U comme la somme de n fonctions continues dans U par hy-
pothèse sur les dérivées partielles est Fréchet différentiable dans tout U , pour tout
y dans U ,
∀w ∈ Rn , f ′ (y; w) = ∇f (y) · w = L(y)w.
Soit (x, v) un point arbitraire de U × Rn et (y, w) un autre point de U × Rn . On
évalue
f ′ (y; w) − f ′ (x; v) = f ′ (y; w) − f ′ (x; w) + f ′ (x; w) − f ′ (x; v)
= [∇f (y) − ∇f (x)] · w + ∇f (x) · (w − v)
′ ′
⇒ |f (y; w) − f (x; v)| ≤ k∇f (y) − ∇f (x)k kwk + k∇f (x)k kw − vk.

Puisque x est fixe, il existe une constante c > 0 tel que k∇f (x)k ≤ c et pour tout
ε > 0 et tout w tel que kw − vk ≤ ε/(2c) on a

k∇f (x)k kw − vk ≤ ε/2 et kwk ≤ kvk + ε/(2c).

Mais, par continuité des n dérivées partielles dans U , il existe un δ(x) > 0 tel que
X
n 1/2
2 ε
ky − xk < δ(x) ⇒ |∂j f (y) − ∂j f (x)| ≤
j=1
2(kvk + ε/(2c))
⇒ k∇f (y) − ∇f (x)k kwk ≤ ε/2.
244 Chapitre 6. Dérivée, dérivées directionnelles et différentielles

Finalement, pour tout ε > 0, il existe δ ′ = min{δ(x), ε/(2c)} tel que


ky − xk < δ ′ et kw − vk ≤ δ ′ ⇒ |f ′ (y; w) − f ′ (x; v)| ≤ ε
et donc la continuité lorsque (y, w) tend vers (x, v).

Remarque 3.13.
Les définitions et résultats précédents s’appliquent aussi à des fonctions à valeurs
vectorielles en procédant composante par composante.

Remarque 3.14.
Les opérations habituelles sont permises dans la classe des fonctions de classe C (1) .
Si f et g sont des fonctions de classe C (1) dans le même ouvert U , alors la somme
(f + g)(x) = f (x) + g(x) et la multiplication par un scalaire (α f )(x) = αf (x)
sont de classe C (1) dans U . De la même façon, le produit (f g)(x) = f (x)g(x) est de
classe C (1) puisque D(f g)(x) = f (x)Dg(x)+ g(x)Df (x). La composition g ◦ f d’une
fonction f : U ⊂ Rn → Rm et d’une fonction g : V ⊂ Rm → Rp , f (U ) ⊂ V , pour
deux ouverts U et V est de classe C (1) puisque D(g ◦ f )(x) = Dg(f (x)) ◦ Df (x).

3.7.2 Classe C (2) , matrice hessienne et classe C (p)


On définit les dérivées du second ordre de la même façon que les dérivée di-
rectionnelles du premier.

Définition 3.10.
Soient f : Rn → R, x ∈ Rn , et deux directions v et v dans Rn . On suppose que
f ′ (y; v) existe pour tout y dans un voisinage V (x) de x. On dit que f possède une
dérivée directionnelle du second ordre dans les directions (v, v) au point x si la limite
f ′ (x + t v; v) − f ′ (x; v)
lim
t→0 t
existe. Dans ce cas on écrira cette limite d2 f (x; v; v).

En général, l’ordre des directions (v, v) est important.


Théorème 3.12. Si f : Rn → R est Gateaux différentiable dans un voisinage V (x)
de x, et que ∇f (y) est Gateaux différentiable en x, alors l’application
(v, v) 7→ d2 f (x; v; v) : Rn × Rn → R (3.59)
est bilinéaire, c’est-à-dire
∀v ∈ Rn , v 7→ d2 f (x; v; v) : Rn → R est linéaire, (3.60)
n 2 n
∀v ∈ R , v 7→ d f (x; v; v) : R → R est linéaire. (3.61)
De plus, il existe une application linéaire unique Hf (x)
Hf (x) : Rn → Rn tel que ∀v, v ∈ Rn , d2 f (x; v; v) = Hf (x)v · v (3.62)
ou encore, sous forme compacte, Hf (x) = D(∇f (x)).
3. Fonctions de plusieurs variables réelles 245

Toute paire de directions v = (v1 , . . . , vn ) et v = (v 1 , . . . , v n ) peut s’écrire


n
X n
X
v= vi ei , v= v i ei ,
i=1 i=1

en terme de la base orthonormale canonique {ei }ni=1 . Sous les hypothèses du Thé-
orème 3.12, l’application (v, v) 7→ d2 f (x; v; v) : Rn × Rn → R est bilinéaire. Donc
 X n n
X  X n Xn
2 2
d f (x; v; v) = d f x; vi ei ; v j ej = d2 f (x; ei ; ej )vi v j .
i=1 j=1 i=1 j=1

2
Les éléments d f (x; ei ; ej ) sont les éléments de la matrice associée à l’application
linéaire Hf (x) de Rn . À la lumière du théorème et de cette discussion, on peut
donner les définitions suivantes.

Définition 3.11.
On se place dans le cadre des hypothèses du Théorème 3.12.
(i) On appellera application hessienne 32 de f en x l’application linéaire Hf (x) :
Rn → Rn définie par (3.62).
(ii) La matrice hessienne de f en x est la matrice n × n formée des éléments
déf
Hf (x)ij = d2 f (x; ei ; ej ) = ∂j (∂i f (x))
pour la base orthonormale canonique {ei }ni=1 de Rn .
Par abus de notation, on utilisera la même notation Hf (x) pour l’application et la
matrice qui lui est associée.

Démonstration du Théorème 3.12. Par hypothèse, pour tout y ∈ V (x), f est Ga-
teaux différentiable en y et
f ′ (y; v) = ∇f (y) · v
et comme ∇f est Gateaux différentiable en x
(∇f )′ (x; v) = D(∇f )(x) v,
où D(∇f )(x) : Rn → Rn est l’application (linéaire) jacobienne de la fonction
vectorielle y 7→ ∇f (y).
Pour v et v dans Rn et t 6= 0, considérons le quotient
f ′ (x + tv; v) − f ′ (x; v) ∇f (x + tv) − ∇f (x)
= · v.
t t
Lorsque t → 0
∇f (x + tv) − ∇f (x)
→ D(∇f )(x) v
t
′ ′
f (x + tv; v) − f (x; v) ∇f (x + tv) − ∇f (x)
= · v → D(∇f )(x) v · v
t t
⇒ d2 f (x; v; v) = D(∇f )(x) v · v.
32. La matrice hessienne fut développée au XIXe siècle par Ludwig Otto Hesse (1811–1874)
et plus tard appelée hessienne d’après lui. Hesse utilisait le terme déterminant fonctionnel.
246 Chapitre 6. Dérivée, dérivées directionnelles et différentielles

On a donc bien la bilinéarité et l’application Hf (x) coincide avec l’application


linéaire D(∇f )(x).

On insiste sur le fait que la définition de la matrice hessienne est compatible


avec la définition de la matrice jacobienne DF pour une fonction vectorielle F :
Rn → Rn . En effet,
déf ∂Fi
DF (x)ij = (x),
∂xj
où Fi est la i-ème composante de la fonction F . En prenant F = ∇f , il vient
 
∂ ∂f
D(∇f (x))ij = (x) = d2 f (x; ei ; ej ) = Hf (x)ij .
∂xj ∂xi
2
On utilisera aussi les notations ∂ji f (x).
Les dérivées secondes seront importantes pour caractériser la convexité de la
fonction et par là les points minimisants. En général, la matrice hessienne n’est pas
symétrique, mais elle le devient pour les fonctions de classe C (2) .

Théorème 3.13. Soient f : Rn → R et la base orthonormale canonique {ei }ni=1 .


(i) Si f possède des dérivées partielles premières ∂i f (y) et secondes ∂j (∂i f )(y)
pour tout y ∈ Br (x), r > 0, et que, pour chaque paire (i, j), l’application

y 7→ ∂j (∂i f (y)) est continue en x. (3.63)

Alors, ∂i f , 1 ≤ i ≤ n, et f sont Fréchet différentiables et continues en x,


et

∀i, j, ∂j (∂i f (x)) = ∂i (∂j f (x)) ou Hf (x)⊤ = Hf (x)..

(ii) Soit U un ouvert de Rn . Si f possède des dérivées partielles premières


∂i f (y) et secondes ∂j (∂i f )(y) pour tout y ∈ U , et que, pour chaque paire
(i, j), l’application

y 7→ ∂j (∂i f (y)) est continue sur U. (3.64)

Alors, ∂i f , 1 ≤ i ≤ n, et f sont Fréchet différentiables et continues sur U ,


et

∀y ∈ U, ∀i, j, ∂j (∂i f (y)) = ∂i (∂j f (y)) ou Hf (y)⊤ = Hf (y). (3.65)

Remarque 3.15.
En général, la matrice hessienne des dérivées secondes n’est pas symétrique si l’on
n’a pas la continuité (3.64). Voir l’Exercice 7.8 pour un contre-exemple à (3.65).
déf
Démonstration. (i) Pour chaque i, la fonction y 7→ hi (y) = ∂i f (y) possède des
dérivées partielles ∂j hi sur Br (x) qui sont continues en x. Les hypothèses du Théo-
rème 3.9 (i) sont donc vérifiées et hi est Fréchet différentiable et continue en x.
3. Fonctions de plusieurs variables réelles 247

En conséquence, les dérivées partielles ∂i f sont continues en x. Toujours par le


Théorème 3.9 (ii), la fonction f est Fréchet différentiable et continue en x.
On définit
déf
Cs,t = f (x + sei + tej ) − f (x + sei ) − f (x + tej ) + f (x).
On donne deux expressions différentes de Cs,t . Pour s > 0 et t > 0 assez petits, x,
x + sei , x + sei + tej sont dans Br (x). Nous avons
déf
Cs,t = g(x + tej ) − g(x) où g(z) = f (z + sei ) − f (z).
Par le théorème de Taylor (Théorème 2.6) en faisant un développement d’ordre un,
il existe α1 ∈ ]0, 1[ tel que
Cs,t = g ′ (x + α1 tej ; tej ).

Par définition de g, cette identité peut se réécrire en fonction de f ′


Cs,t = f ′ (x + α1 tej + sei ; tej ) − f ′ (x + α1 tej ; tej ).
Une nouvelle application du théorème de Taylor (Théorème 2.6) donne pour un
α2 ∈ ]0, 1[
Cs,t = d2 f (x + α1 tej + α2 sei ; tej ; sei )
= s t d2 f (x + α1 tej + α2 sei ; ej ; ei )
en utilisant l’homogénéité positive. De façon analogue, en interchangeant les rôles
de s et de t, on obtiendra
∃α3 , α4 ∈ ] 0, 1 [ , Cs,t = s t d2 f (x + α3 tej + α4 sei ; ei ; ej ).
D’où
d2 f (x + α1 tej + α2 sei ; ej ; ei ) = d2 f (x + α3 tej + α4 sei ; ei ; ej ).
Lorsque s → 0 et t → 0, il vient, par continuité des dérivées partielles secondes en
x, d2 f (x; ej ; ei ) = d2 f (x; ei ; ej ).
déf
(ii) Pour chaque i, la fonction y 7→ hi (y) = ∂i f (y) possède des dérivées
partielles ∂j hi sur U qui sont continues dans U . Les hypothèses du Théorème 3.9
(ii) sont donc vérifiées et hi est Fréchet différentiable sur U et continue sur U .
En conséquence, les dérivées partielles ∂i f sont continues sur U . Toujours par le
Théorème 3.9 (ii), la fonction f est Fréchet différentiable et continue sur U .
Par le Théorème 3.11, pour tout y ∈ U , l’application v, w 7→ d2 f (y; v; w) est
bilinéaire et
 X n n
X  X n Xn
2 2
d f (y; v; w) = d f y; vi ei ; wj ej = vi wj d2 f (y; ei ; ej ).
i=1 j=1 i=1 j=1

Démontrer que d2 f (y; v; w) = d2 f (y; w; v) revient donc à démontrer que


d2 f (y; ei ; ej ) = d2 f (y; ej ; ei ).
Mais, de la partie (i), ceci est vrai pour tout y ∈ U .
248 Chapitre 6. Dérivée, dérivées directionnelles et différentielles

Les dérivées partielles d’ordre supérieur à 2 sont définies de la même façon


∂ m f (x)
= dm f (x; ei1 ; . . . ; eim ). (3.66)
∂xim ··· ∂xi1
On utilisera aussi la notation ∂imm ···i1 f (x).

Définition 3.12.
Soient f : Rn → R et U un ouvert de Rn . La fonction f est de classe C (p) dans U si
toutes les dérivées partielles d’ordre p de f existent et sont continues dans U .

On peut montrer par les résultats précédents (cf. Corollaire 1 au Théorème 3.11)
que les fonctions de classe C (p) sont de classe C (p−1) et ainsi de suite.

3.8 Généralisation et perspectives : les semi-différentielles


Avant de clore la question de la définition de la dérivée directionnelle,
√ il est
utile de revenir sur l’Exemple 3.7 de la norme f (x) = kxk = x · x de Rn . Pour
x 6= 0, elle est Hadamard différentiable et
′ x
fH (0, v) = · v, (3.67)
kxk
mais pour x = 0 le quotient différentiel
k0 + t wk − k0k |t|
= kwk
t t
ne converge pas lorsque w → v et t → 0 car le terme |t|/t a des sous-suites qui
convergent vers 1 ou −1.
Si l’on modifie légèrement la définition des dérivées dans la direction v pour
les transformer en semi-différentielles de la forme
déf f (x + tv) − f (x) déf f (x + tw) − f (x)
df (x; v) = lim et dH f (x; v) = w→v
lim ,
tց0 t tց0
t
(3.68)
où t tend vers 0 par valeurs positives, alors la norme devient semi-différentiable en
0 dans les sens de Gateaux et de Hadamard puisque
k0 + t vk − k0k t
lim = lim kvk = kvk (3.69)
tց0 t tց0 t
k0 + t wk − k0k t
lim lim kwk = lim kwk = kvk.
= w→v (3.70)
w→v
tց0
t tց0
t w→v

Les notions de semi-différentielles sont à la fois plus intéressantes et plus


générales que celles de dérivées directionnelles tout en conservant les deux pro-
priétés importantes des fonctions différentiables : la continuité de la fonction et la
règle de dérivation en chaı̂ne des fonctions composées. Un exposé complet des semi-
différentielles dans le cadre de l’optimisation se trouve, par exemple, dans le récent
livre de M. C. Delfour [1, 2].
4. Fonctions convexes et optimisation 249

3.9 Tableau des notions de dérivabilité et de différentiabilité


Ce paragraphe résume les différentes notions de dérivée directionnelles et de
différentielles introduites dans ce chapitre. Les notions de base sont la dérivée di-
rectionnelle f ′ (x; v) et celle plus forte au sens de Hadamard fH ′
(x; v) qui jouent
un rôle central puisque les règles du calcul différentiel classique demeurent valides
pour cette famille de fonctions. Avec la linéarité en v, on obtient, respectivement,
les différentielles de Gateaux et de Hadamard et la notion de gradient.

déf f (x + tv) − f (x)


f ′ (x; v) = lim ∀v ∈ Rn , f ′ (x; v) existe et
t→0 t
v 7→ f ′ (x; v) : Rn → Rn est linéaire
f dérivable
f Gateaux différentiable en x
en x dans la direction v

′ déf f (x + tw) − f (x)


fH (x; v) = lim ∀v ∈ Rn , fH ′
(x; v) existe et
t→0 t
w→v
v 7→ fH (x; v) : Rn → Rn est linéaire

f Hadamard dérivable
f Hadamard différentiable en x
en x dans la direction v

On a une caractérisation géométrique en termes de chemins de la dérivabilité au


sens de Hadamard.
f Hadamard ∃ g(x, v) ∈ R tel que
dérivable ⇐⇒ ∀ h : R → Rn , h(0) = x et h′ (0) = v,
en x dans la direction v (f ◦ h)′ (0) existe et (f ◦ h)′ (0) = g(x, v)

Les notions de différentielles aux sens de Hadamard et de Fréchet coı̈ncident et on


a aussi une caractérisation géométrique en termes de chemins.

f Fréchet différentiable en x : ∃ L(x) : Rn → R linéaire


⇐⇒ f (x + v) − f (x) − L(x)v
f Hadamard tel que lim =0
v→0 kvk
différentiable
en x ∃ L(x) : Rn → R linéaire tel que
⇐⇒ ∀ h : R → Rn , h(0) = x et h′ (0) existe,
(f ◦ h)′ (0) existe et (f ◦ h)′ (0) = L(x) h′ (0)

4 Fonctions convexes et optimisation


4.1 Fonctions convexes
Définition 4.1. (i) Une partie U de Rn est convexe si
∀λ ∈ [0, 1], ∀x, y ∈ U, λx + (1 − λ)y ∈ U.
Par convention, ∅ est convexe.
250 Chapitre 6. Dérivée, dérivées directionnelles et différentielles

(ii) Soit ∅ 6= U ⊂ Rn convexe. La fonction f : Rn → R est convexe sur U si

∀λ ∈ ]0, 1[ , ∀x, y ∈ U, f (λx + (1 − λ)y) ≤ λf (x) + (1 − λ)f (y);

f : Rn → R est dite strictement convexe sur U si

∀λ ∈ ]0, 1[ , ∀x, y ∈ U, x 6= y, f (λx + (1 − λ)y) < λf (x) + (1 − λ)f (y).

(iii) Soit U , ∅ 6= U ⊂ Rn , convexe. La fonction f : Rn → R est concave (resp.


strictement concave) sur U si −f est convexe (resp. strictement convexe)
sur U (cf. Figure 6.5).

f (x) f (x)

x x
Fonction convexe Fonction concave
Figure 6.5. Fonction convexe et fonction concave

Théorème 4.1. Soit U ⊂ Rn .


(i) L’intérieur, int U , et l’adhérence, U , d’un convexe U sont convexes.
(ii) Soit {Uα }α∈A une famille de parties convexes de Rn , où l’ensemble A
des indices est arbitraire et pas nécessairement fini. Alors, ∩α∈A Uα est
convexe.
(iii) Soit U un convexe tel que int U 6= ∅. Alors int U = U .

Démonstration. (i) Si U = ∅, ∅ = ∅ est convexe par convention. Si x, y ∈ U , il


existe des suites {xn } ⊂ U et {yn } ⊂ U tel que xn → x et yn → y. Par convexité
de U , pour tout λ ∈ [0, 1],

U ∋ λxn + (1 − λ)yn → λx + (1 − λ)y.

Ainsi, λx + (1 − λ)y ∈ U et U est convexe.


Si int U = ∅, alors il est convexe par convention. Pour x, y ∈ int U , il existe
Bε (x) et Bη (y) tel que Bε (x) ⊂ U et Bη (y) ⊂ U et, pour tout λ ∈ [0, 1],

λx + (1 − λ)y ∈ λBε (x) + (1 − λ)Bη (y).


4. Fonctions convexes et optimisation 251

Mais,

λx + (1 − λ)y ∈ Bmin{ε,η} (λx + (1 − λ)y) ⊂ λBε (x) + (1 − λ)Bη (y) ⊂ U

et λx + (1 − λ)y ∈ int U .
(ii) Posons U = ∩α∈A Uα . Si U est vide, alors il est convexe par définition. Si
U n’est pas vide, on prend

x et y ∈ U = ∩α∈I Uα ⇒ ∀α ∈ A, x ∈ Uα , y ∈ Uα .

Pour tout λ ∈ [0, 1] et par convexité de Uα

∀α ∈ I, λx + (1 − λ)y ∈ Uα ⇒ λx + (1 − λ)y ∈ ∩α∈A Uα = U.

(iii) Comme int U 6= ∅, on prend un point x ∈ int U . Par convexité, pour tout
y ∈ ∂U , le segment [x, y] = {λx + (1 − λ)y : 0 ≤ λ ≤ 1} est dans U et [x, y[ =
{λx + (1 − λ)y : 0 < λ ≤ 1} ⊂ int U . Il existe donc une suite yn = x + (y − x)/(n + 1)
dans int U qui converge vers y, d’où le résultat.

4.2 Fonctions convexes directionnellement dérivables


Théorème 4.2. Soient U une partie convexe ouverte de Rn et f une fonction
dérivable dans toutes les directions en tout point de U .
(i) f est convexe sur U si et seulement si

∀x, y ∈ U, f (y) ≥ f (x) + f ′ (x; y − x). (4.1)

(ii) Si, en plus, f est Gateaux différentiable en tout point de U , alors f est
convexe sur U si et seulement si

∀x, y ∈ U, f (y) ≥ f (x) + ∇f (x) · (y − x). (4.2)

Démonstration. (i) (⇒) Pour tout λ ∈ ]0, 1[ ,

f (λy + (1 − λ)x) ≤ λf (y) + (1 − λ)f (x)


f (x + λ(y − x)) − f (x) ≤ λ(f (y) − f (x)).

En divisant par λ > 0 et en passant à la limite lorsque λ → 0, il vient

f ′ (x; y − x) ≤ f (y) − f (x).

(⇐) Réciproquement, on applique la condition de deux façons pour λ ∈ [0, 1] et


x, y ∈ U

f (x) ≥ f (x + λ(y − x)) + f ′ (x + λ(y − x); −λ(y − x))


f (y) ≥ f (x + λ(y − x)) + f ′ (x + λ(y − x); (1 − λ)(y − x)).
252 Chapitre 6. Dérivée, dérivées directionnelles et différentielles

On multiplie la première inégalité par 1 − λ et la seconde par λ. On les additionne.


Comme U est convexe, x + λ(y − x) ∈ U , et, par homogénéité, f ′ (x + λ(y − x); −(y −
x)) = −f ′ (x + λ(y − x); y − x). Il vient

(1 − λ)f (x) + λf (y) ≥ f (x + λ(y − x))

et la convexité de f sur U .
(ii) Comme f est Gateaux différentiable, il y a un gradient et f ′ (x; v) =
∇f (x) · v. Il suffit alors de substituer dans la partie (i).

Théorème 4.3. Soient U une partie convexe ouverte de Rn et f une fonction


dérivable dans toutes les directions en tout point de U .
(i) f est strictement convexe sur U si et seulement si

∀x, y ∈ U, x 6= y, f (y) > f (x) + f ′ (x; y − x). (4.3)

(ii) Si, en plus, f est Gateaux différentiable en tout point de U , alors f est
strictement convexe sur U si et seulement si

∀x, y ∈ U, x 6= y, f (y) > f (x) + ∇f (x) · (y − x). (4.4)

Démonstration. (i) Si f est strictement convexe sur U on a (4.1) par le Théorè-


me 4.2. Donc pour x et y dans U tel que x 6= y et t ∈ ] 0, 1 [,

f ′ (x; t(y − x)) ≤ f (x + t(y − x)) − f (x).

Par homogénéité positive t f ′ (x; y − x) = f ′ (x; t(y − x)). Comme f est strictement
convexe,

f (x + t(y − x)) − f (x) =f ((1 − t)x + ty) − f (x)


< (1 − t)f (x) + tf (y) − f (x) = t [f (y) − f (x)]
⇒ tf ′ (x; (y − x)) < t [f (y) − f (x)].

En divisant par t on obtient (4.3). La démonstration de la réciproque est la même


que celle du Théorème 4.2 mais avec λ ∈ ]0, 1[ et x 6= y.
(ii) Comme f est Gateaux différentiable, le gradient existe et f ′ (x; v) = ∇f (x)·
v. Il suffit alors de substituer dans la partie (i).

Pour le théorème suivant, on rappelle la définition suivante.

Définition 4.2.
Une matrice symétrique A est définie positive (resp. semi-définie positive) si

∀x ∈ Rn , x 6= 0, (Ax) · x > 0 (resp. ∀x ∈ Rn , (Ax) · x ≥ 0).

On écrira A > 0 (resp. A ≥ 0).

Théorème 4.4. Soit f : U → R de classe C (2) dans un ouvert U de Rn .


4. Fonctions convexes et optimisation 253

(i) Si U est convexe, alors f est convexe sur U si et seulement si Hf (y) ≥ 0


en tout point y ∈ U .
(ii) S’il existe x ∈ U tel que Hf (x) > 0, alors il existe un voisinage convexe
V (x) de x tel que f soit strictement convexe sur V (x).

Remarque 4.1.
La réciproque de la partie (ii) du Théorème 4.4 n’est pas vraie. En effet, considérons
la fonction f (x) = x4 définie sur R. Sa dérivée seconde est donnée par f (2) (x) =
12x2 . Au point x = 0, f s’annule bien que f soit strictement convexe dans tout
voisinage de x = 0.

Démonstration du Théorème 4.4. On fera encore appel au Théorème de Taylor


(Théorème 2.6) appliqué à la fonction g(t) = f (x + t(y − x)). Pour tout x et y
dans U , il existe α ∈ ] 0, 1 [ tel que
1
f (y) = f (x) + ∇f (x) · (y − x) + Hf (x + α(y − x))(y − x) · (y − x).
2

(i) Si f est convexe sur U , on en conclut par le Théorème 4.2 que


1
0 ≤ f (y) − f (x) − ∇f (x) · (y − x) =Hf (x + α(y − x))(y − x) · (y − x).
2
Mais, comme U est ouvert, il existe r > 0 tel que Br (x) ⊂ U . Donc
Hf (x + αrb)b · b ≥ 0, ∀b ∈ B1 (0).
Comme f est de classe C (2) et que |αrb| < r, lorsque r tend vers 0,
Hf (x)b · b ≥ 0, ∀b ∈ B1 (0) ⇒ ∀v ∈ Rn , Hf (x)v · v ≥ 0,
et l’on a Hf (x) ≥ 0 pour tout x ∈ U . Réciproquement, pour tout x et y dans U ,
il existe α ∈ ]0, 1[ tel que
1
f (y) − f (x) − ∇f (x) · (y − x) = Hf (x + α(y − x))(y − x) · (y − x) ≥ 0
2
puisque x + α(y − x) ∈ U et que, par hypothèse, Hf (x + α(y − x)) ≥ 0. La fonction
f est donc convexe par le Théorème 4.2.
(ii) Si Hf (x) > 0 pour x ∈ U , alors par continuité, il existe r > 0 tel que
Br (x) ⊂ U et ∀y ∈ Br (x), Hf (y) > 0.
On utilise maintenant le théorème de Taylor (Théorème 2.6) dans Br (x). Alors
pour tout y et z dans Br (x), y 6= z, il existe α ∈ ]0, 1[ tel que
1
f (y) − f (z) − ∇f (z) · (y − z) = Hf (z + α(y − z))(y − z) · (y − z) > 0
2
puisque z + α(y − z) ∈ Br (x) et que, par hypothèse, Hf (z + α(y − z)) > 0. Donc
pour tout y et z dans Br (x), y 6= z,
f (y) − f (z) − ∇f (z) · (y − z) > 0
et, par le Théorème 4.3, f est strictement convexe sur Br (x).
254 Chapitre 6. Dérivée, dérivées directionnelles et différentielles

4.3 Optimisation convexe : condition nécessaire et suffisante


Il est maintenant possible de traiter complètement le cas du minimum d’une
fonction objectif convexe Gateaux différentiable par rapport à un convexe. La condi-
tion nécessaire et suffisante sera ensuite spécialisée au cas des sous-espaces linéaire
et affine.
Théorème 4.5. Soient ∅ 6= U ⊂ Rn convexe et f : Rn → R une fonction convexe
et Gateaux différentiable dans U . Il existe un point minimisant de f dans U si et
seulement si

∃x ∈ U tel que ∀y ∈ U, ∇f (x) · (y − x) ≥ 0. (4.5)

Comme U est une partie convexe de Rn , la condition (4.5) signifie que U est
contenu dans le demi espace fermé défini par (cf. Figure 6.6)

{y ∈ Rn : ∇f (x) · (y − x) ≥ 0}.

Ensembles de niveau de f

x
1
2
∇f (x) 3

Figure 6.6. Tangence du convexe U à l’ensemble de niveau de f passant


par x ∈ U .

Démonstration. Si la condition (4.5) est vérifiée, alors on sait, par le Théorème 4.2,
que pour une fonction convexe Gateaux différentiable

∀y ∈ U, f (y) − f (x) ≥ ∇f (x) · (y − x) ≥ 0


⇒ ∀y ∈ U, f (y) ≥ f (x).

Le point x ∈ U minimise donc f par rapport à U . Réciproquement, s’il existe un


point x ∈ U qui minimise f par rapport à U , alors par convexité, pour tout y ∈ U
4. Fonctions convexes et optimisation 255

et t ∈ ]0, 1],
f (x + t(y − x)) − f (x)
f (x + t(y − x)) − f (x) ≥ 0 ⇒ ≥0 (4.6)
t
et comme f est Gateaux différentiable, en passant à la limite,
f (x + t(y − x)) − f (x)
∇f (x) · (y − x) = f ′ (x; y − x) = lim ≥0 (4.7)
tց0 t
ce qui complète la démonstration.
Corollaire 1. Sous les conditions du Théorème 4.5, on a les résultats suivants.
(i) Si U = S, un sous-espace linéaire, alors la condition (4.5) est équivalente
à :

∃x ∈ S tel que ∀y ∈ S, ∇f (x) · y = 0. (4.8)

En particulier, ∇f (x) ∈ S ⊥ .
(ii) Si U = A, un sous-espace affine, alors la condition (4.5) est équivalente
à :

∃x ∈ A tel que ∀y ∈ A, ∇f (x) · (y − x) = 0 (4.9)

ou, de façon équivalente,

∃x ∈ A tel que ∀y ∈ S, ∇f (x) · y = 0, (4.10)

où S est le sous-espace linéaire associé au sous-espace affine A. En parti-


culier, ∇f (x) ∈ S ⊥ (cf. Figure 6.7).

Remarque 4.2.
L’égalité (4.8) qui doit être vérifiée pour chaque y ∈ S est le prototype d’une
équation variationnelle qui implique ici que ∇f (x) ∈ S ⊥ et pas nécessairement
l’équation ∇f (x) = 0. Une équation variationnelle est donc une forme plus faible
d’équation.

Démonstration. (i) Si U = S, un sous-espace linéaire, alors pour tout y ∈ S, x ± y ∈


S. En substituant dans (4.5), il vient

∀y ∈ S, ±∇f (x) · y ≥ 0 ⇒ ∇f (x) · y = 0.

Réciproquement, on a

∇f (x) · x = 0 et ∀y ∈ S, ∇f (x) · y = 0 ⇒ ∀y ∈ S, ∇f (x) · (y − x) = 0 ≥ 0.

(ii) Comme U = A, un sous-espace affine, pour tout y ∈ A et α ∈ R, αy +


(1 − α)x ∈ A et

α∇f (x) · (y − x) = ∇f (x) · (αy + (1 − α)x − x) ≥ 0


256 Chapitre 6. Dérivée, dérivées directionnelles et différentielles

Ensembles de niveau de f

x
1
U = A ou S 2
3
∇f (x)

Figure 6.7. Tangence du sous-espace affine A ou linéaire S à un ensemble


de niveau de f .

et ceci entraı̂ne ∇f (x)·(y − x) = 0 pour tout y ∈ A. Puisque A est affine, S = A− x


est un sous-espace linéaire par le Théorème 9.4 du Chapitre 3 et pour tout s ∈ S,
∇f (x) · s = 0. Donc, ∇f (x) ∈ S ⊥ . Réciproquement, S = A − x et pour tout y ∈ A,
∇f (x) · (y − x) = 0 ≥ 0.

Remarque 4.3.
Lorsque U est donné par

{x ∈ Rn : gj (x) ≤ 0, 1 ≤ j ≤ m}

pour des fonctions gj : Rn → R, 1 ≤ j ≤ m, convexes (et continues), alors U est


convexe (et fermé). De plus, si la fonction objectif f satisfait les hypothèses du
Théorème 4.5, alors la condition (4.5) est nécessaire et suffisante.

4.4 Optimisation différentiable sans contraintes : conditions


nécessaires
Par sans contraintes on entend le fait que les points minimisants se trouvent
dans l’intérieur de U , c’est-à-dire, que les contraintes imposées par U sont inactives.
Dans ces cas, seules intervienent les propriétés locales de la fonction et de ses dérivées
et l’on récupère la règle de Fermat qui dit que le gradient de f est zéro aux points de
U correspondant à des infima locaux. Le signe de la matrice hessienne complètera
la caractérisation de l’extremum en précisant par exemple s’il s’agit d’un minimum,
d’un maximum, ou d’autre chose.
Ce paragraphe donne les principales caractérisations des points réalisant un
minimum à l’aide du gradient et de la matrice hessienne. On considère une fonction
numérique f : Rn → R dont on cherche l’infimum par rapport à un ouvert U ⊂ Rn .
On pourra déduire les résultats pour le problème de maximisation en remplaçant f
par −f et en considérant l’infimum inf −f (U ).
4. Fonctions convexes et optimisation 257

Définition 4.3.
Soit U , ∅ 6= U ⊂ Rn .
(i) On dit que f : Rn → R a un minimum global dans U si

∃x ∈ U tel que ∀y ∈ U, f (x) ≤ f (y) (4.11)

(ii) On dit que f : Rn → R a un minimum local dans U s’il existe x ∈ U et un


voisinage V (x) de x tel que

∀y ∈ U ∩ V (x), f (x) ≤ f (y), (4.12)

c’est-à-dire, x est un minimum global dans U ∩ V (x).

Le théorème suivant donne des conditions pour l’existence d’un minimum local.
Elles deviennent nécessaires et suffisantes dans le cas quadratique.
Théorème 4.6. Soit f : Rn → R de classe C (2) dans une ouvert non vide U ⊂ Rn .
(i) Si f a un minimum local dans U , alors

∃x ∈ U, ∇f (x) = 0 et Hf (x) ≥ 0. (4.13)

(ii) Si
∃x ∈ U tel que ∇f (x) = 0
et s’il existe un voisinage convexe V (x) ⊂ U de x tel que

∀y ∈ V (x), Hf (y) ≥ 0, (4.14)

alors x est un minimum de f global dans V (x) et local dans U .


(iii) Si

∃x ∈ U, ∇f (x) = 0 et Hf (x) > 0, (4.15)

alors x est un minimum local de f dans U et il existe un voisinage V (x)


de x où x est l’unique minimum global de f .
Démonstration. (i) Si x est un minimum local de f dans U , alors il existe r > 0 tel
que
Br (x) ⊂ U et ∀y ∈ Br (x), f (y) ≥ f (x).
Donc, pour tout y dans Br (x) et t ∈ ]0, 1[ , x + t(y − x) ∈ Br (x) et

f (x + t(y − x)) ≥ f (x). (4.16)

Soit la fonction g(t) = f (x + t(y − x)). Alors pour y ∈ Br (x), |t| < 1 et |s| < 1, les
points x + s(y − x) et x + t(y − x) appartiennent à Br (x) et pour s 6= t,
g(s) − g(t) f (x + s(y − x)) − f (x + t(y − x))
=
s−t s−t
f (x + t(y − x) + (s − t)(y − x)) − f (x + t(y − x))
=
s−t
258 Chapitre 6. Dérivée, dérivées directionnelles et différentielles

et, comme f est de classe C (1) dans U , la dérivée directionnelle de f en x + t(y − x)


dans la direction y − x existe et
g(s) − g(t)
g ′ (t) = lim
(s−t)→0 s−t
s6=t
f (x + t(y − x) + (s − t)(y − x)) − f (x + t(y − x))
= lim
(s−t)→0 s−t
s6=t

= f (x + t(y − x); y − x) = ∇f (x + t(y − x)) · (y − x).

Comme f est de classe C (2) , on obtient par le même processus que


g (2) (t) = d2 f (x + t(y − x); y − x; y − x) = Hf (x + t(y − x))(y − x) · (y − x).
Donc, de (4.16) pour t > 0,
g(t) − g(0) f (x + t(y − x)) − f (x)
= ≥0
t t
g(t) − g(0)
⇒ g ′ (0) = lim ≥ 0 ⇒ f ′ (x; y − x) = ∇f (x) · (y − x) ≥ 0
tց0 t
et donc
∀y ∈ Br (x), ∇f (x) · (y − x) ≥ 0.
Pour tout v ∈ Rn , v 6= 0, et
r v r
y = x± ∈ Br (x) ⇒ ± ∇f (x) · v ≥ 0 ⇒ ∀v ∈ Rn , ∇f (x) · v = 0
2 |v| 2|v|
et donc ∇f (x) = 0. Par le théorème de Taylor (Théorème 2.6), pour tout y ∈ Br (x),
il existe α ∈ ]0, 1[ tel que
1
g(1) = g(0) + g ′ (0) + g (2) (α).
2
Mais on a vu que
g (2) (α) = d2 f (x + α(y − x); y − x; y − x) = Hf (x + α(y − x))(y − x) · (y − x).
Il vient alors
1
f (y) = f (x) + ∇f (x) · (y − x) + Hf (x + α(y − x))(y − x) · (y − x).
2
Mais comme f (y) ≥ f (x) et ∇f (x) = 0, il reste
∀y ∈ Br (x), Hf (x + α(y − x)) (y − x) · (y − x) ≥ 0.
En prenant v 6= 0 dans Rn et y = x + r v/(2|v|),
 
r v v v
∀0 6= v ∈ Rn , Hf x + α · ≥0
2 |v| |v| |v|
 
r v
⇒ ∀v ∈ Rn , Hf x + α v · v ≥ 0.
2 |v|
4. Fonctions convexes et optimisation 259

Par continuité de Hf en x, en faisant tendre r vers 0, on obtient, pour tout v ∈ Rn ,


Hf (x) v · v ≥ 0 et la matrice hessienne Hf (x) est semi-définie positive.
(ii) Il suffit d’utiliser le théorème de Taylor (Théorème 2.6 comme dans la
partie (i). Pour tout y ∈ V (x), il existe α ∈ ]0, 1[ tel que

1
f (y) = f (x) + ∇f (x) · (y − x) + Hf (x + α(y − x))(y − x) · (y − x).
2
Mais ∇f (x) = 0 et comme V (x) est convexe, x+α(y −x) ∈ V (x) et, par hypothèse,
Hf (x + α(y − x)) ≥ 0 est semi-définie positive. Ceci entraı̂ne

f (y) ≥ f (x), ∀y ∈ V (x) ⊂ U.

Le point x ∈ U est donc un minimum de f global dans V (x) et local dans U .


(iii) En effet si Hf (x) > 0, alors comme f est de classe C (2) la matrice hes-
sienne Hf est continue et il existe une boule Br (x) ⊂ U tel que

∀y ∈ Br (x), Hf (y) > 0.

Comme ∇f (x) = 0 et que (4.14) est vérifiée dans Br (x), x est un minimum global
dans Br (x). De plus, pour tout y ∈ Br (x), y 6= x, il existe α ∈ ]0, 1[ tel que

1
f (y) = f (x) + ∇f (x) · (y − x) + Hf (x + α(y − x))(y − x) · (y − x)
2
⇒ ∀y ∈ Br (x) tel que y 6= x, f (y) > f (x).

Il y a donc bien unicité dans Br (x).

Les conditions du Théorème 4.6 deviennent nécessaires et suffisantes pour des


fonctions quadratiques.

Théorème 4.7. Soit f une fonction quadratique

déf 1
f (x) = Ax · x + b · x + c (4.17)
2
pour une matrice n × n symétrique A, b ∈ Rn et c ∈ R.
(i) f possède un minimum par rapport à Rn si et seulement si

∃x ∈ Rn tel que ∇f (x) = Ax + b = 0 et A ≥ 0. (4.18)

(ii) Il existe une solution minimisante unique de f dans Rn si et seulement si


A > 0.

Démonstration. (i) La condition est nécessaire par le Théorème 4.6 (i) et suffisante
par le Théorème 4.6 (ii) puisque Hf (y) = A = Hf (x) ≥ 0 dans V (x) = Rn .
(ii) On sait déjà de la partie (ii) qu’il existe x∗ minimisant si et seulement
si Ax∗ + b = 0 et A ≥ 0. Si A > 0, alors A ≥ 0, A est inversible et pour tout b
260 Chapitre 6. Dérivée, dérivées directionnelles et différentielles

l’équation Ax∗ + b = 0 a pour unique solution x∗ = −A−1 b. Réciproquement, par


le théorème de Taylor (Théorème 2.6 en tenant compte du fait que Hf (x) = A,
1
f (x) − f (x∗ ) = ∇f (x∗ ) · (x − x∗ ) + A(x − x∗ ) · (x − x∗ ).
2
Si x∗ est l’unique point minimisant, ∇f (x∗ ) = 0 et
1
∀x 6= x∗ , 0 < f (x) − f (x∗ ) = ∇f (x∗ ) · (x − x∗ ) + A(x − x∗ ) · (x − x∗ )
2
1
= A(x − x∗ ) · (x − x∗ ).
2
En prenant x = x∗ + y, y 6= 0, il vient
1
∀y 6= 0, 0 < f (x∗ + y) − f (x∗ ) = Ay · y ⇒ A > 0.
2

5 Théorèmes de la fonction inverse, de la fonction


implicite et du rang
5.1 Théorème de la fonction inverse
Soit g : Rn → Rm une application arbitraire. Alors, si y ∈ Rm , on peut se
proposer de chercher l’ensemble des x ∈ Rn tels que
g(x) = y, (5.1)
c’est-à-dire, l’image réciproque g −1 {y}. Cela s’appelle aussi résoudre l’équation
(5.1). Si l’on considère maintenant (5.1) quelque soit la donnée y, il se peut que pour
chaque y l’équation (5.1) admette une solution et une seule. Dans ce cas l’équation
(5.1) définit x comme une fonction h(y) de y. Cette fonction est appelée la fonction
implicite définie par l’équation (5.1). Elle est caractérisée par la propriété
g(h(y)) = y. (5.2)
Naturellement, il est bien rare que d’aussi bonnes conditions soient réalisées.
Il arrivera souvent que, pour certaines valeurs de y, il n’y ait pas de solution en x,
et que, pour d’autres valeurs de y, il y ait plusieurs solutions en x, voire une infinité.
Le cas particulier que nous nous proposons d’étudier est le suivant : on suppose que
l’on ait une solution particulière de l’équation (5.1) x = x0 , y = y0 = g(x0 ). On
se propose de savoir si, pour les points suffisamment voisins du point y0 , l’équation
ne possèderait pas une solution et une seule en x, pourvu que l’on astreigne cette
solution x à être suffisamment voisine de x0 . Lorsqu’il en sera ainsi, on aura bien
implicitement défini une application inverse x = h(y) à partir de l’équation, tout
au moins dans un voisinage de (x0 , y0 ). L’interprétation géométrique est simple.
L’équation
g(x) − y = 0
5. Théorèmes de la fonction inverse, de la fonction implicite et du rang 261

définit une variété de Rn × Rm , et nous nous proposons d’exprimer cette “courbe”


sous la forme résolue habituelle en calculant x en fonction de y, au moins au voisi-
nage du point (x0 , y0 ).
Théorème 5.1 (Théorème de la fonction inverse). Soient f : Rn → Rn une appli-
cation de classe C (1) dans un ouvert O de Rn et a ∈ O tel que Df (a) soit inversible.
(i) Il existe des ouverts U et V dans Rn tels que
a ∈ U ⊂ O, f (a) ∈ V et f : U → V soit bijective. (5.3)

(ii) L’application réciproque (ou inverse) f −1 : V → U (qui existe selon (i)),


f −1 (f (x)) = x, x ∈ U, (5.4)

est de classe C (1) sur V et Df −1 (y) = [Df (f −1 (y))]−1 ou sous forme


condensée
Df −1 = [Df ◦ f −1 ]−1 sur V.

Remarque 5.1.
On peut aussi montrer que, sous les hypothèses du Théorème 5.1, f −1 est de classe
C (k) , k ≥ 2, si f est de classe C (k) .

Démonstration. (i) Dans un premier temps, on cherche une boule centrée en a


de rayon assez petit pour qu’elle soit contenue dans O et que la restriction de
l’application f à cette boule soit injective. On montre ensuite que l’image de cette
boule par f est un ouvert.
On pose b = f (a) et A = Df (a). Puisque A ∈ GL(n), on peut prendre α > 0
tel que
2α kA−1 kL(Rn ) = 1 (5.5)

(voir le Théorème 7.1 (i) du Chapitre 5). Comme f est de classe C (1) dans l’ouvert
O et que a ∈ O, il existe r > 0 assez petit pour que
Br (a) ⊂ O et ∀x ∈ Br (a), kDf (x) − Df (a)kL(Rn ) < α. (5.6)

À chaque y ∈ Rn , on associe la fonction


déf
x 7→ ϕy (x) = x + A−1 (y − f (x)) : Br (a) → Rn . (5.7)

Par défintion ϕy ∈ C (1) (Br (a)) et pour tout x ∈ Br (a)


Dϕy (x) = I − A−1 Df (x) = A−1 [A − Df (x)]
α 1
⇒ ||Dϕy (x)kL(Rn ) ≤ kA−1 kL(Rn ) kA − Df (x)kL(Rn ) < = .
2α 2
Par le Théorème 3.10
1
∀x1 , x2 ∈ Br (a), kϕy (x1 ) − ϕy (x2 )kRn ≤ kx1 − x2 kRn
2
262 Chapitre 6. Dérivée, dérivées directionnelles et différentielles

et ϕy est lipschitzienne dans Br (a). Cette dernière propriété s’étend à Br (a) par le
Théorème 7.2 du Chapitre 4. On en déduit que f est injective sur Br (a). En effet,
s’il existe x1 , x2 ∈ Br (a) tel que f (x1 ) = f (x2 ), alors on a

ϕy (x1 ) − ϕy (x2 ) = x1 + A−1 (y − f (x1 )) − [x2 + A−1 (y − f (x2 ))] = x1 − x2


1
⇒ kx1 − x2 kRn = kϕy (x1 ) − ϕy f (x2 )kRn ≤ kx1 − x2 kRn
2
et nécessairement x1 = x2 . On a donc bien une bijection
déf déf
f : U = Br (a) → V = f (Br (a)). (5.8)

Puisque b = f (a) ∈ f (Br (a)), il ne reste plus qu’à montrer que V est ouvert.
Pour établir que V = f (Br (a)) est ouvert, on va montrer que tout point
y0 ∈ V est un point intérieur de V . Comme f est bijective, il existe x0 ∈ Br (a) tel
que f (x0 ) = y0 et il existe ρ > 0 tel que Bρ (x0 ) ⊂ Br (a).
On montre maintenant que Bαρ (y0 ) ⊂ V . Soient y ∈ Bαρ (y0 ) et la restriction
de l’application ϕy : Bρ (x0 ) ⊂ Br (a) → Rn . On a alors
ρ
kϕy (x0 ) − x0 kRn = kA−1 (y − f (x0 ))kRn = kA−1 (y − y0 )kRn < kA−1 kL(Rn ) αρ = .
2
Pour tout x ∈ Bρ (x0 ) ⊂ Br (a),
1 ρ
kϕy (x) − x0 kRn ≤ kϕy (x) − ϕy (x0 )kRn + kϕy (x0 ) − x0 kRn < kx − x0 kRn + < ρ
2 2
et ϕy (x) ∈ Bρ (x0 ). Donc ϕy (Bρ (x0 )) ⊂ Bρ (x0 ) ⊂ Bρ (x0 ) et
1
∀x1 , x2 ∈ Bρ (x0 ), kϕy (x1 ) − ϕy (x2 )kRn ≤ kx1 − x2 kRn .
2
Comme Bρ (x0 ) est un espace métrique complet et que ϕy est contractante, elle
possède un point fixe unique

x ∈ Bρ (x0 ), ϕy (x) = x,

par le Théorème 8.1 du Chapitre 4. Mais, par définition de ϕy , on voit que x = ϕy (x)
entraı̂ne y = f (x) ∈ f (Bρ (x0 )). Finalement

Bαρ (y0 ) ⊂ f (Bρ (x0 )) ⊂ f (Br (a)) = V

et tout point y0 ∈ V est un point intérieur de V . Ce qui conclut la démonstration


que V est ouvert.
(ii) On montre maintenant que f −1 est Fréchet différentiable et, a fortiori
continue, en b = f (a). Comme V = f (Br (a)) est ouvert, il existe β > 0 tel que
Bβ (b) ⊂ f (Br (a)). Pour v ∈ Bβ (0), v 6= 0, b + v ∈ f (Br (a)). On pose
déf
h = f −1 (b + v) − f −1 (b) 6= 0 ⇒ v = f (a + h) − f (a).
5. Théorèmes de la fonction inverse, de la fonction implicite et du rang 263

Avec cette définition, on obtient


f (a + h) − f (a) − Df (a)h = v − Df (a)h
 
= v − Df (a) f −1 (b + v) − f −1 (b)
 
= −Df (a) f −1 (b + v) − f −1 (b) − Df (a)−1 v
f −1 (b + v) − f −1 (b) − Df (a)−1 v khk f (a + h) − f (a) − Df (a)h
⇒ =− Df (a)−1 .
kvk kvk khk
On obtient finalement l’inégalité
kf −1 (b + v) − f −1 (b) − Df (a)−1 vk khk −1 kf (a + h) − f (a) − Df (a)hk
≤ kA k .
kvk kvk khk
Pour passer à la limite lorsque v → 0, il faut contrôller le quotient kvk/khk. On a
ϕb+v (a + h) − ϕb+v (a) = a + h + A−1 (b + v − f (a + h)) − a + A−1 (b + v − f (a))
= h − A−1 (f (a + h) − f (a)) = h − A−1 v
1 1 1
⇒ khk ≥ khk − kA−1 k kvk ⇒ kvk = kA−1 k kvk ≥ khk
2 2α 2
et khk ≤ kvk/α. À l’aide de cette dernière inégalité, h → 0 lorsque v → 0 et
kf −1 (b + v) − f −1 (b) − Df (a)−1 vk khk −1 kf (a + h) − f (a) − Df (a)hk
≤ kA k
kvk kvk khk
1 1 kf (a + h) − f (a) − Df (a)hk
≤ → 0.
α 2α khk
 −1
Donc, f −1 est Fréchet différentiable en b et Df −1 (b) = Df (a)−1 = Df (f −1 (b)) .
(iii) On a démontré en (ii) qu’en tout point a ∈ O tel que Df (a) est inversible,
f −1 est Fréchet différentiable et, a fortiori continu, en b = f (a) et Df −1 (b) =
 −1
Df (f −1 (b)) . De (5.5) et (5.6), pour tout x ∈ Br (a),
2αkA−1 kL(Rn ) = 1 et kDf (x) − Ak < α
1
⇒ kDf (x) − AkL(Rn ) kA−1 kL(Rn ) < < 1.
2
Par le Théorème 7.1 (i) du Chapitre 5, comme Df (x) ∈ L(Rn ) et A ∈ GL(n),
Df (x) ∈ GL(n) et, a fortiori, Df (x) est inversible pour tout x ∈ Br (a). Donc,
pour tout y ∈ V = f (Br (a)), f −1 est Fréchet différentiable en y et Df −1 (y) =
 −1
Df (f −1 (y)) . L’application inverse f −1 est donc continue sur V .
Comme x 7→ Df (x) est continue et que l’application A 7→ A−1 : GL(n) →
GL(n) est continue par le Théorème 7.1 (ii) du Chapitre 5, l’application x 7→
Df (x) 7→ Df (x)−1 : U = Br (a) → L(Rn ) est continue. Il s’ensuit que l’application
résultant des trois applications continues
y 7→ f −1 (y) 7→ Df (f −1 (y)) 7→ Df −1 (y) = [Df (f −1 (y))]−1 : V → L(Rn )
| {z }
y7→Df −1 (y)

est continue sur V et que f −1 est de classe C (1) sur V .


264 Chapitre 6. Dérivée, dérivées directionnelles et différentielles

5.2 Théorème de la fonction implicite


Étant donnée la fonction de deux variables

f (x, y) = x2 + y 2 − 1,

on cherche les points x ∈ R tel que f (x, y) = 0. Si |y| > 1, il n’y a pas de solution ;
si |y| = 1, il n’y a une solution x = 0 ; si |y| < 1, il n’y a deux solutions. Ceci induit
une fonction multivoque
( )
déf 0, si |y| = 1
y 7→ g(y) = p : [−1, 1] → P([−1, 1]).
± 1 − y2, si |y| < 1

Si le couple (a, b) est une solution de f (a, b) = 0 telle que ∂f /∂x(a, b) = 2a 6= 0,


alors |b| < 1 et il existe un voisinage V (a, b) de (a, b) assez petit pour que l’équation

f (x, y) = 0 dans V (a, b)

possède une solution unique x pour chaque y tel que (x, y) ∈ V (a, b). L’application
multivoque g devient alors univoque d’où la terminologie application implicite.
Dans un premier temps, on considère une fonction linéaire A : Rn+m → Rn
puis ensuite une fonction vectorielle f : Rn+m → Rn de classe C (1) dans un ouvert
O ⊂ Rn+m . Dans ce contexte, il est important de préciser la notation qui sera
utilisée.

Notation 5.1. (i) Si x = (x1 , . . . , xn ) ∈ Rn et y = (y1 , . . . , ym ) ∈ Rm , on


notera par (x, y) le point
déf
(x, y) = (x1 , . . . , xn , y1 , . . . , ym ) ∈ Rn+m .

Le premier élément de (x, y) sera toujours dans Rn et le second dans Rm .


(ii) On adoptera aussi la décomposition suivante d’un application linéaire A ∈
L(Rn+m , Rn ) en la somme de deux applications linéaires Ax ∈ L(Rn , Rn )
et Ay ∈ L(Rm , Rn ) :
déf déf
h 7→ Ax h = A(h, 0) : Rn → Rn et k 7→ Ay k = A(0, k) : Rm → Rn (5.9)
⇒ A(h, k) = Ax h + Ay k ou A = [Ax Ay ]. (5.10)

Théorème 5.2. Soit A ∈ L(Rn+m , Rn ) telle que Ax soit inversible. Alors, pour
tout k ∈ Rm , il existe une solution unique h ∈ Rn à l’équation A(h, k) = 0 ce qui
définit implicitement la fonction solution
déf m n
k 7→ g(k) = −A−1
x Ay k : R → R (5.11)

qui appartient à L(Rm , Rn ).


5. Théorèmes de la fonction inverse, de la fonction implicite et du rang 265

Démonstration. De la décomposition de A, l’équation A(h, k) = 0 est équivalente à

Ax h + Ay k = 0 ⇒ h = −A−1
x Ay k

puisque Ax est inversible.


Théorème 5.3 (Théorème de la fonction implicite). Soit f : Rn+m → Rn une
application de classe C (1) dans un ouvert O ⊂ Rn+m tel qu’il existe (a, b) ∈ O
vérifiant f (a, b) = 0. On suppose que l’application linéaire

h 7→ Df (a, b)(h, 0) : Rn → Rn

est inversible.
(i) Il existe des ouverts U ⊂ Rn+m et V ⊂ Rm tel que (a, b) ∈ U et b ∈ V
vérifiant :

∀y ∈ V, ∃x ∈ Rn unique tel que (x, y) ∈ U et f (x, y) = 0. (5.12)

Ceci induit l’ application implicite y 7→ g(y) = x : V → Rn .


(ii) L’application g vérifie g(b) = a et

∀y ∈ V, (g(y), y) ∈ U et f (g(y), y) = 0. (5.13)

Elle est de classe C (1) sur V , et


−1
∀y ∈ V, Dg(y) = − [Df (g(y), y)x ] Df (g(y), y)y , (5.14)

où [Df (g(y), y)x Df (g(y), y)y ] est la décomposition de Df (g(y), y) selon la
notation 5.1.
Démonstration. On pose A = Df (a, b) avec la notation A = [Ax Ay ], où en fait
Ax = Dx f (a, b) et Ay = Dy f (a, b). On se ramene au théorème précédent en intro-
duisant l’application
déf
(x, y) 7→ F (x, y) = (f (x, y), y) : Rn+m → Rn+m (5.15)

pour laquelle F (a, b) = (0, b). Elle est, comme f , de classe C (1) sur O et
 
Df (x, y)x Df (x, y)y
DF (x, y) = ,
0 Im

où Im est la transformation identité sur Rm . Il faut montrer que DF (a, b) est in-
versible :
   
Df (a, b)x Df (a, b)y Ax Ay
DF (a, b) = = ∈ GL(n + m).
0 Im 0 Im

Cela revient à montrer que DF (a, b) est injective :


    
Ax Ay h 0 Ax h + Ay k = 0 h = −A−1
x Ay k = 0
= ⇒ ⇒
0 Im k 0 k=0 k = 0.
266 Chapitre 6. Dérivée, dérivées directionnelles et différentielles

On peut donc invoquer le Théorème 5.1. Il existe deux ouverts U et U ′ dans Rn+m
tels que (a, b) ∈ U et (0, b) = (f (a, b), b) ∈ U ′ pour lesquels F : U → U ′ = F (U ) est
une bijection. Soit
déf
V = {y ∈ Rm : (0, y) ∈ U ′ }

qui est ouvert et contient b puisque U ′ est ouvert et contient (0, b). Donc, pour
tout y ∈ V , il existe x ∈ Rn tel que (x, y) ∈ U et F (x, y) = (0, y), c’est-à-dire,
f (x, y) = 0 et y = y. Ce point x est unique, car s’il existait un autre x′ ∈ Rn avec
ces propriétés, on aurait F (x, y) = F (x′ , y) et, comme F est injective, x = x′ . On a
donc implicitement construit l’application
déf
y 7→ g(y) = x : V → Rn tel que f (g(y), y) = 0 sur V. (5.16)

Toujours du Théorème 5.1, l’application inverse

(g(y), y) = F −1 (0, y)

est de classe C (1) sur U ′ = F (U ). L’application g est donc aussi de classe C (1) sur
V . Comme F est bijective, F (g(b), b) = (0, b) = F (a, b) entraı̂ne g(b) = a. Enfin,
en faisant appel à la règle de différentiation de la composition, la différentielle de
l’équation F (g(y), y) = (0, y) par rapport à y donne
    
Dg(y) Df (g(y), y)x Df (g(y), y)y Dg(y)
DF (g(y), y) =
Im 0 Im Im
⇒ Df (g(y), y)x Dg(y) + Dyf (g(y), y)= 0
⇒ Dg(y) = − [Df (g(y), y)x ]−1 Df (g(y), y)y .

En particulier, Dg(b) = −A−1


x Ay comme dans le cas linéaire.

5.3 Théorèmes du rang et des multiplicateurs de Lagrange


Il existe plusieurs versions du théorème du rang (cf. W. Rudin [1], A. Dont-
chev et R. T. Rockafellar [1]). Nous en donnons une version simple qui convient
à l’optimisaton différentiable en présence de contraintes de type égalité, c-à-d., le
théorème des multiplicateurs de Lagrange.
On rappelle qu’une application f : Rn → Rm peut s’écrire sous la forme
m
X
déf n m
x 7→ f (x) = (f1 (x), . . . , fm (x)) = fi (x) em
j :R →R ,
i=1

où fi : Rn → R, 1 ≤ i ≤ m, sont les composantes de f et {em


i : 1 ≤ i ≤ m} est la
base canonique orthonormale dans Rm . Lorsque f est Fréchet différentiable en x,
l’application

v 7→ Df (x)v : Rn → Rm
5. Théorèmes de la fonction inverse, de la fonction implicite et du rang 267

est linéaire. En introduisant la base orthonormale canonique {enj : 1 ≤ j ≤ n} de


Rn , on a la dérivée partielle par rapport à la j-ème composante de x de la i-ème
composante de f

∂j fi (x) = em n
i · Df (x)ej , 1 ≤ i ≤ m, 1 ≤ j ≤ n.

On utilisera aussi la notation ∂fi /∂xj (x). On pourra vérifier que


 
m
X n
X n
X Xm
v= vj em
j 7→ Df (x)v = [Df (x)v]i em
i =  ∂j fi (x) vj  em
i . (5.17)
j=1 i=1 i=1 j=1

On associe à Df (x) la matrice jacobienne [Df (x)] des dérivées partielles premières
des composantes de f :
 
∂f1 ∂f1
(x) ... ... (x)
 ∂x1 ∂xn 
 
 ∂f2 .. ∂f2 
déf  (x) . (x) 
[Df (x)]ij = [Df (x)ej ]i , c-à-d., [Df (x)] = 
n ∂x
 1.
∂xn  . (5.18)

 .. .. .. 
 . . 
 ∂f ∂fm 
m
(x) ... ... (x)
∂x1 ∂xn

C’est une matrice m × n. On utilisera la même notation Df (x) pour l’application


jacobienne dans L(Rn , Rm ) et la matrice jacobienne [Df (x)] de dimension m×n qui
lui est associée. On rappelle que l’on peut associer à l’application linéaire Df (x0 ) ∈
L(Rn , Rm ) l’application transposée Df (x0 )⊤ ∈ L(Rm , Rn ) pour laquelle

∀h ∈ Rn , ∀α ∈ Rm , Df (x)h · α = h · Df (x)⊤ α

ce qui permet d’exprimer Df (x)⊤ en termes des gradients des composantes de f :


m
X
α = (α1 , . . . , αm ) 7→ Df (x)⊤ α = αj ∇fj (x) : Rm → Rn . (5.19)
j=1

Définition 5.1.
Lorsque f : Rn → Rm est Gateaux différentiable en un point x0 , on dira que x0 est
un point régulier de f si l’application Df (x0 ) : Rn → Rm est surjective 33 (ou, de
façon équivalente, si la matrice jacobienne est de rang maximum m). Sinon, on dit
que x0 est un point singulier de f .

Remarque 5.2.
Pour que f : Rn → Rm ait des points réguliers, il est nécessaire que n ≥ m. Dans le
cas m = 1, un point x0 sera régulier si et seulement si le gradient ∇f (x0 ) 6= 0.
33. On dit aussi que f est une submersion au point x0 .
268 Chapitre 6. Dérivée, dérivées directionnelles et différentielles

Remarque 5.3.
Lorsque f est un point régulier de f , Df (x) est surjective et donc Df (x)⊤ est
injective. De là, la composée Df (x)Df (x)⊤ ∈ L(Rm , Rm ) est inversible puisque

Df (x)Df (x)⊤ α = 0 ⇒ 0 = α · Df (x)Df (x)⊤ α = kDf (x)⊤ αk2


⇒ Df (x)⊤ α = 0 ⇒ α = 0.

La matrice associée à Df (x)Df (x)⊤ est non seulement inversible mais aussi définie
positive.

Théorème 5.4 (Théorème du rang). Soit f : Rn → Rm , n ≥ m, une fonction de


classe C (1) dans un voisinage d’un point régulier x0 (c.-à-d., Df (x0 ) ∈ L(Rn , Rm )
est surjective). Alors pour tout h ∈ Rn , il existe t0 > 0 et une fonction x : ]−t0 , t0 [ →
Rn de classe C (1) tel que
(
x(0) = x0
et f (x(t)) = f (x0 ) + tDf (x0 )h, −t0 < t < t0 . (5.20)
x′ (0) = h

Démonstration. On se ramène au Théorème 5.3 en introduisant pour α ∈ Rm et


t ∈ R la fonction γ : Rm × R → Rm définie par
déf 
γ(α, t) = f x0 + Df (x0 )⊤ α + th − f (x0 ) − Df (x0 )(th), (5.21)

où Df (x0 )⊤ α est donnée par (5.19). Par construction, γ(0, 0) = 0 et

Dα γ(α, t) = Df (x0 + Df (x0 )⊤ α + th)Df (x0 )⊤ , Dα γ(0, 0) = Df (x0 )Df (x0 )⊤ ,


Dt γ(α, t) = Df (x0 + Df (x0 )⊤ α + th) h − Df (x0 ) h.

Comme Df (x0 ) est surjective, la matrice Df (x0 ) Df (x0 )⊤ est définie positive et
donc inversible.
Pour compléter la définition de γ, il faut s’assurer prendre des paires (α, t)
suffisamment proches de (0, 0) pour que x0 + Df (x0 )⊤ α + th soit dans le voisinage
V (x0 ) de x0 où f est définie. Il existe r > 0 tel que B2r (x0 ) ⊂ V (x0 ). On peut alors
prendre
déf déf r déf r
(α, t) ∈ O = Bρ (0) × (−δ, δ), ρ = , δ = ,
kDf (x0 ) Df (x0 )⊤ k1/2 khk + 1

puisque Df (x0 ) Df (x0 )⊤ 6= 0.


On est donc dans les conditions du Théorème 5.3 : il existe des ouverts U ⊂ O
et V ⊂ (−δ, δ) tel que (0, 0) ∈ U et 0 ∈ V vérifiant :

∀t ∈ V, ∃x = g(t) ∈ Rm unique tel que (g(t), t) ∈ U et γ(g(t), t) = 0. (5.22)

L’application implicite g : V → Rm est de classe C (1) sur V , g(0) = 0 et


−1
g ′ (t) = Dg(t) = − [Dγ(g(t), t)α ] Dγ(g(t), t)t . (5.23)
5. Théorèmes de la fonction inverse, de la fonction implicite et du rang 269

Donc, en explicitant

0 = γ(g(t), t) = f x0 + Df (x0 )⊤ g(t) + th − f (x0 ) − Df (x0 )(th),
g ′ (0) = −[Df (x0 ) Df (x0 )⊤ ]−1 (Df (x0 ) h − Df (x0 ) h) = 0.
On pose
déf déf
x(t) = x0 + Df (x0 )⊤ g(t) + th ⇒ x(0) = x0 + Df (x0 )⊤ g(0) = x0 .

Comme g(0) = 0 et g ′ (0) = 0, il vient


déf déf
x′ (t) = Df (x0 )⊤ g ′ (t) + h ⇒ x′ (0) = Df (x0 )⊤ g ′ (0) + h = h
0 = f (x(t)) − f (x0 ) − t Df (x0 )h.
Enfin, comme V est un voisinage de 0, il existe t0 > 0 tel que (−t0 , t0 ) ⊂ V . Donc,
comme g ∈ C (1) (V ), x ∈ C (1) ((−t0 , t0 )).
Comme application directe du dernier théorème, on considère la minimisation
d’une fonction f : Rn → R par rapport à m contraintes de type égalité de la forme
déf
U = {x ∈ Rn : gj (x) = 0, 1 ≤ j ≤ m} = {x ∈ Rn : g(x) = 0} (5.24)
pour une fonction vectorielle g = (g1 , . . . , gm ) : Rn → Rm . On cherche à caractériser
un minimum local
∃x ∈ U et ∃V (x) tel que ∀y ∈ U ∩ V (x), f (y) ≥ f (x).
Afin d’obtenir une condition nécessaire d’optimalité pour un U arbitraire, on
aura besoin d’une approximation locale de U en un point x ∈ U . Elle prendra la
forme d’un ensemble de demi-tangentes à U aux points de la frontière de U . En
effet, soit U un ensemble connexe et x ∈ U un point localement minimisant de f
par rapport à U : il existe un voisinage V (x) de x tel que f (y) ≥ f (x) pour tout
y ∈ U ∩ V (x). Chaque chemin ou trajectoire t 7→ h(t) : [0, t0 ) → Rn contenu dans
U ∩ V (x) se terminant en h(0) = x sera tel que f (h(t)) ≥ f (h(0)) = f (x). Si f est
Fréchet différentiable en h(0) = x et si le chemin est dérivable à droite en t = 0+ ,
c’est-à-dire, dh(0; +1) existe, alors
f (h(t)) − f (h(0))
0 ≤ lim = d(f ◦ h)(0; +1) = ∇f (x) · dh(0; +1)
tց0 t t=0+

par la règle de composition des différentielles des fonction composées. Le produit


scalaire du gradient de f avec la demi-tangente dh(0; +1) en t = 0+ à tous les
chemins h dans U ∩ V (x) est donc positif. La taille de la vitesse le long du che-
min peut être augmentée ou diminuée en introduisant la nouvelle paramétrisation
hλ (t) = h(λt) du chemin pour un λ > 0. On obtient alors dhλ (0; +1) = λdh(0; +1)
et ainsi toute la demi-droite tangente au chemin h au point x. Ceci engendre un cône
de demi-tangentes en x à l’ensemble U . La définition suivante étend cette notion de
cône tangent à des ensembles U arbitraires (pas nécessairement connexes).
270 Chapitre 6. Dérivée, dérivées directionnelles et différentielles

demi-tangente . x
dh(0; +1)
TU (x)

chemin h(t)

Figure 6.8. Demi-tangente dh(0; +1) au chemin h(t) dans U au point h(0) = x.

Définition 5.2.
Soient U ⊂ Rn et x ∈ U .
(i) On dit que h ∈ Rn est une direction admissible pour U en x (ou demi-
tangente en x à U ) s’il existe une suite {tn > 0}, tn ց 0 lorsque n → ∞,
pour laquelle
xn − x
∀n, ∃xn ∈ U tel que lim = h. (5.25)
n→∞ tn

(ii) TU (x) désignera l’ensemble 34 35 36 des directions admissibles de U en x.

Remarque 5.4.
S’il existe une fonction t 7→ x(t) : [0, t0 ) → U , t0 > 0, tel que x(0) = x et dx(0; +1) =
h, alors h ∈ TU (x). En effet, par hypothèse,

x(t) − x
lim = h. (5.26)
tց0 t

Il suffit de prendre les suites tn = t0 /(2n) et xn = x(t0 /(2n)).

Théorème 5.5. Soient ∅ = 6 U ⊂ Rn , f : Rn → R, et x ∈ U un minimisant local


de f par rapport à U . Si f est Fréchet différentiable en x, alors

∀h ∈ TU (x), ∇f (x) · h ≥ 0. (5.27)


34. TU (x) semble avoir été introduit indépendamment en 1930 par G. Bouligand [1] et
F. Severi [1] dans le même volume 9 des Annales de la Société Polonaise de Mathématiques
(Krakóv) fondées en 1921 par Stanislaw Zaremba. Bouligand l’appelle cône contingent du latin
contingere qui signifie toucher de tous les côtés. Chez Bouligand une direction admissible est
appelée une demi-tangente et chez M. R. Hestenes [1, p. 264] une tangente séquentielle. TU (x)
intervient dans plusieurs contextes comme celui de la géométrie où il est l’espace tangent en x à
U ou en théorie de la viabilité pour les équations différentielles ordinaires (cf. M. Nagumo [1].
35. Georges Louis Bouligand (1889–1979).
36. Francesco Severi (1879–1961).
5. Théorèmes de la fonction inverse, de la fonction implicite et du rang 271

Démonstration. Soit h ∈ TU (x) et {xn } ⊂ U et {tn > 0} les suites tel que (xn −
x)/tn → h. Comme xn → x, il existe N tel que
∀n > N, f (xn ) − f (x) ≥ 0.
Comme tn > 0,

f (xn ) − f (x) f (x + tn xntn−x ) − f (x)


0≤ =
tn tn
et comme f est Fréchet différentiable en x, en passant à la limite
f (x + tn xntn−x ) − f (x)
0≤ → ∇f (x) · h.
tn

Il reste à caractériser TU (x) pour U donné par (5.24). L’objectif est de démontrer
que pour des gj de classe C (1) dans un voisinage de x et une hypothèse sur la ma-
trice jacobienne de la fonction vectorielle g = (g1 , . . . , gm ) : Rn → Rm en un point
x0 ∈ U ,
TU (x0 ) = {h ∈ Rn : ∇gj (x0 ) · h = 0, 1 ≤ j ≤ m} = Ker Dg(x0 ). (5.28)
De là, comme Ker Dg(x0 ) est un sous-espace linéaire, l’inégalité ∇f (x0 ) · h ≥ 0 pour
h ∈ Ker Dg(x0 ) devient
∇f (x0 ) · h = 0, ∀h ∈ Ker Dg(x0 )
⇒ ∇f (x0 ) ∈ [Ker Dg(x0 )]⊥ = Im Dg(x0 )⊤
⇒ ∃λ ∈ Rm tel que ∇f (x0 ) + Dg(x0 )⊤ λ = 0
m
X
⇒ ∃λ = (λ1 , . . . , λm ) tel que ∇f (x0 ) + λj ∇gj (x0 ) = 0.
j=1

L’élément central de la démonstration de ce résultat est donc l’identité (5.28)


que l’on cherchera à établir sous des hypothèses raisonnables. On peut démontrer
facilement le résultat dans un sens.
Lemme 5.1. Soit x0 ∈ Rn , les fonctions gj : Rn → R, 1 ≤ j ≤ m, et
déf
U0 = {x ∈ Rn : gj (x) = gj (x0 ), 1 ≤ j ≤ m} .
Si les gj sont Fréchet différentiables en x0 , alors
TU0 (x0 ) ⊂ {h ∈ Rn : ∇gj (x0 ) · h = 0, 1 ≤ j ≤ m} = Ker g(x0 ). (5.29)
Démonstration. Par définition d’une direction admissible h de U0 en x0 , il existe
une suite {tn > 0}, tn ց 0 lorsque n → ∞, pour laquelle
xn − x0
∀n, ∃xn ∈ U0 , et lim = h.
n→∞ tn
272 Chapitre 6. Dérivée, dérivées directionnelles et différentielles

Comme xn ∈ U0 , gj (xn ) = gj (x0 ), 1 ≤ j ≤ m, on peut écrire


 
gj (xn ) − gj (x0 ) gj (xn ) − gj (x0 )
∇gj (x0 ) · h = − − ∇gj (x0 ) · h
tn tn
   
gj x0 + tn xnt−x 0
− g j (x0 )
= − − ∇gj (x0 ) · h .
n

tn

Puisque (xn − x0 )/tn → h et que gj est Hadamard différentiable en x0 , le membre


de droite tend vers zéro et ∇gj (x0 ) · h = 0. On a donc bien (5.29).
Nous allons maintenant utiliser le Théorème 5.4 pour compléter le Lemme 5.1
Lemme 5.2. Soient x0 ∈ Rn , gj : Rn → R, 1 ≤ j ≤ m, des fonctions de classe
C (1) dans un voisinage de x0 et l’ensemble
déf
U0 = {x ∈ Rn : gj (x) = gj (x0 ), 1 ≤ j ≤ m} .
(i) Si x0 est un point régulier pour g, alors
TU0 (x0 ) = {h : ∇gj (x0 ) · h = 0, 1 ≤ j ≤ m} = Ker Dg(x0 ). (5.30)

(ii) Lorsque x0 est un point singulier de g, il existe λ = (λ1 , . . . , λm ) 6=


(0, . . . , 0) tel que
m
X
Dg(x0 )⊤ λ = λj ∇gj (x0 ) = 0. (5.31)
j=1

Démonstration. (i) Par le Lemme 5.1, TU0 (x0 ) ⊂ Ker Dg(x0 ). On montre mainte-
nant que tout h ∈ Ker Dg(x0 ) est une direction admissible. Comme x0 est un point
régulier, on a par le Théorème 5.4,
∃t0 > 0, ∃x : ] − t0 , t0 [ → Rn de classe C (1) tel que
x(0) = x0 , x′ (0) = h et g(x(t)) = g(x0 ) + tDg(x0 )h, −t0 < t < t0 .
Donc, si h ∈ Ker Dg(x0 ), alors Dg(x0 )h = 0,
∀t ∈ ] − t0 , t0 [ , g(x(t)) = g(x0 ) ⇒ x(t) ∈ U0
et
x(t) − x(0)
lim = x′ (0) = h.
t→0 t
Par définition d’un élément de TU0 (x0 ), h ∈ TU0 (x0 ) et Ker Dg(x0 ) ⊂ TU0 (x0 ).
(ii) Lorsque x0 est un point singulier pour g, l’application Dg(x0 ) n’est pas
surjective et il existe λ = (λ1 , . . . , λm ) 6= (0, . . . , 0) tel que
m
X
∀h ∈ Rn , (λ1 , . . . , λm ) · Dg(x0 )h = 0 ⇒ λj ∇gj (x0 ) = 0,
j=1

ou de façon équivalente Dg(x0 )⊤ λ = 0.


5. Théorèmes de la fonction inverse, de la fonction implicite et du rang 273

On donne maintenant plusieurs formes du théorème. 37

Théorème 5.6 (des multiplicateurs de Lagrange). Soient la fonction objectif f :


Rn → R et l’ensemble de contraintes
déf
U = {x ∈ Rn : gj (x) = 0, 1 ≤ j ≤ m} (5.32)

défini par des fonctions gj : Rn → R, 1 ≤ j ≤ m. On suppose que


a) f possède un minimum local au point x0 ∈ U par rapport à U ,
b) f est Fréchet différentiable au point x0 ,
c) gj : Rn → R, 1 ≤ j ≤ m, sont de classe C (1) dans un voisinage de x0 .
Alors, on a les propriétés suivantes.
(i) Si x0 est un point régulier de g, alors il existe λ ∈ Rm tel que

∇f (x0 ) + Dg(x0 )⊤ λ = 0 et g(x0 ) = 0. (5.33)

(ii) Si x0 est un point singulier de g, alors il existe 0 6= λ ∈ Rm tel que

Dg(x0 )⊤ λ = 0 et g(x0 ) = 0. (5.34)

(iii) Il existe (λ0 , (λ1 , . . . , λm )) ∈ R × Rm , pas tous nuls, tel que

λ0 ∇f (x0 ) + Dg(x0 )⊤ λ = 0 et g(x0 ) = 0. (5.35)

(iv) Il existe (λ0 , (λ1 , . . . , λm )) ∈ R × Rm ,, pas tous nuls, tel que


m
X
λ0 ∇f (x0 ) + λj ∇gj (x0 ) = 0 et gj (x0 ) = 0, 1 ≤ j ≤ m, (5.36)
j=1

ou, de façon équivalente,

∂L ∂L
(x0 , λ) = 0, 1 ≤ i ≤ n, et (x0 , λ) = 0, 1 ≤ j ≤ m, (5.37)
∂xi ∂λj

en introduisant le lagrangien
m
X
déf
L(x, λ) = λ0 f (x) + λj gj (x) (5.38)
j=1

pour x ∈ Rn et λ = (λ0 , λ1 , . . . , λm ) ∈ R × Rm .
37. Lagrange contribua considérablement à la théorie, et Legendre (Sur la manière de dis-
tinguer les maxima des minima dans le calcul des variations) en 1786 jeta les bases de la
détermination des maxima et minima. Dans son traité innovateur Mécanique analytique (J. L. La-
grange [1]) en 1788, Lagrange résuma tous les travaux faits dans le domaine de la mécanique
classique depuis Newton. C’est dans ce livre que Lagrange expose clairement la règle des multipli-
cateurs dans sa forme contemporaine.
274 Chapitre 6. Dérivée, dérivées directionnelles et différentielles

(v) Les conditions des parties (i)-(iv) seront aussi vérifiées pour tout point x0
de U qui réalise un maximum local de f par rapport à U .

Remarque 5.5.
Comme l’indique la partie (v) du Théorème 5.6, son application donnera non seule-
ment les minima locaux, mais aussi les maxima locaux. Il faudra faire le tri et ne
retenir que les minima ou les maxima selon le problème envisagé.

Démonstration. (i) Par le Théorème 5.5, lorsque f est Fréchet différentiable dans
un voisinage d’un point x0 réalisant un minimum local, on a

∇f (x0 ) · h ≥ 0, ∀h ∈ TU (x0 ). (5.39)

Comme x0 ∈ U est un point régulier de g = (g1 , . . . , gm ), alors g(x0 ) = 0, et il vient,


par l’identité (5.30) du Lemme 5.2 (i), TU (x0 ) = Ker Dg(x0 ). Comme Ker Dg(x0 )
est un sous-espace linŕaire,

±∇f (x0 ) · h = ∇f (x0 ) · (±)h ≥ 0, ∀h ∈ Ker Dg(x0 ) (5.40)



⇒ ∇f (x0 ) · h = 0, ∀h ∈ Ker Dg(x0 ) ⇒ ∇f (x0 ) ∈ [Ker Dg(x0 )] (5.41)

Enfin, comme [Ker Dg(x0 )]⊥ = Im Dg(x0 )⊤ , il existe α ∈ Rm tel que

∇f (x0 ) − Dg(x0 )⊤ α = 0.

En prenant λ = −α, on obtient la première identité de (5.33). Comme x0 ∈ U ,


g(x0 ) = 0, et on obtient la seconde d’identité de (5.33). (ii) Lorsque x0 est un
point singulier pour g, on sait par le Lemme 5.2 (ii) qu’il existe λ = (λ1 , . . . , λm ) 6=
(0, . . . , 0) tel que
Dg(x0 )⊤ λ = 0.

(iii) On combine (i) en prenant λ0 = 1 dans les identitiés (5.35) et (ii) en


prenant λ0 = 0 dans les identitiés (5.35).
(iv) On explicite les identités (5.35) de la partie (iii) en utilisant l’expression
explicite de Dg(x0 )⊤ :
m
X
m ⊤
∀λ = (λ1 , . . . , λm ) ∈ R , Dg(x0 ) λ = λj ∇gj (x0 ).
j=1

(v) Si x0 ∈ U réalise un maximum local de f , il suffit de remplacer f par −f


pour se ramener au cas du minimum local. Par exemple pour la partie (iii), il existe
λ0 ≥ 0 et (λ1 , . . . , λm ) ∈ Rm , pas tous nuls, tel que
m
X
−λ0 ∇f (x0 ) + λj ∇gj (x0 ) = 0 et gj (x0 ) = 0, 1 ≤ j ≤ m. (5.42)
j=1
6. ◮ Déterminants et formules de changement de variable 275

En multipliant par −1,

m
X
λ0 ∇f (x0 ) + (−λj )∇gj (x0 ) = 0 et gj (x0 ) = 0, 1 ≤ j ≤ m. (5.43)
j=1

La condition de la partie (i) (pour un minimisant local) est donc vérifée avec λ′0 = λ0
et λ′j = −λj ∈ R, 1 ≤ j ≤ m, pour un maximisant local.

6 ◮ Déterminants et formules de changement de


variable
Dans son sens originel, le déterminant ≪détermine≫ l’existence et l’unicité de
la solution d’un système d’équations linéaires. Les déterminants furent introduits
en Occident à partir du XVIe siècle, soit bien avant les matrices, qui n’apparaissent
qu’au XIXe siècle. Il convient de rappeler que les Chinois furent les premiers à
utiliser des tableaux de nombres et à appliquer un algorithme maintenant connu
sous le nom de procédé d’élimination de Gauss-Jordan.
Une interprétation géométrique peut aussi être donnée au déterminant d’une
matrice carrée n×n à coefficients réels : sa valeur absolue donne le facteur par lequel
la surface (n = 2) ou le volume (n = 3) est multiplié suite à une transformation
de Rn par une application linéaire, alors que son signe indique si la transformation
préserve l’orientation. Ainsi une matrice 2 × 2 de déterminant −2, lorsqu’appliquée
à une région du plan d’aire finie, transformera cette région en une d’aire double tout
en changeant son orientation. Le déterminant apparait donc naturellement dans la
formule de changement de variables T : Rn → Rn de l’intégrale sur Rn sous la
forme de la valeur absolue du déterminant de la matrice jacobienne associée à la
transformation T .
Il y a plusieurs façons de développer la théorie des déterminants. Les unes sont
très élégantes d’autres moins. Que ce soit une approche combinatoire ou géométrique,
en faire un dévelopement complet avec toutes les connections et équivalences se-
rait trop lourd dans le cadre de ce cours. On en donnera donc que les principaux
résultats. On renvoie le lecteur à des traités d’algèbre comme, par exemple, ceux de
S. Lang [1] ou I. N. Herstein [1].
Le déterminant d’une matrice A de dimension n × n peut être défini par la
formule de Leibniz ou par la formule de Laplace.

6.1 Formule de Leibniz


Cette première formule et le dévelopement qui lui est associé plairont sûrement
aux amateurs de combinatoire.

Définition 6.1.
Soit un entier n ≥ 1.
276 Chapitre 6. Dérivée, dérivées directionnelles et différentielles

(i) À chaque application τ : {1, . . . , n} → {1, . . . , n}, on associe sa signature


déf
Y
sgn (τ ) = signe (τ (j) − τ (i)) ,
1≤i<j≤n

où signe (x) est la fonction signe égale à −1, 0 ou +1 selon que x < 0,
x = 0 ou x > 0. On écrira aussi τ comme une suite (τ1 , . . . , τn ))
(ii) On appelera permutation de l’ensemble {1, . . . , n} une bijection

σ : {1, . . . , n} → {1, . . . , n} (6.1)

(on écrira aussi σ comme une suite (σ1 , . . . , σn )). On dénotera par Sn
l’ensemble de toutes les permutations de {1, . . . , n}. Sn est appelé le groupe
symétrique à n éléments 38
(ii) Une transposition est une permutation qui ne change que deux éléments.
(ii) On dit que la paire (i, j), 1 ≤ i < j ≤ n, est en inversion pour σ lorsque
σi > σj .
(iii) Une permutation σ est dite paire quand elle présente un nombre pair d’in-
versions (sgn (σ) = +1), impaire sinon (sgn (σ) = −1).

Remarque 6.1.
Par définition, sgn (τ ) 6= 0 si et seulement si τ ∈ Sn .

Exemple 6.1.
Pour n = 4, σ = (2, 4, 1, 3) est une permutation de (1, 2, 3, 4) avec σ1 = 2, σ2 = 4,
σ3 = 1, et σ4 = 3 ou sous la forme d’une matrice

i 1 2 3 4
σi 2 4 1 3

Il y a trois inversions (1, 3), (2, 3), (2, 4)


     
1 2 3 4 1 2 3 4 1 2 3 4
.
2 4 1 3 2 4 1 3 2 4 1 3

C’est une permutation impaire et la signature de σ est −1. S4 a 24 éléments.

Exemple 6.2.
Pour n = 4, σ = (1, 4, 3, 2), σ1 = 1, σ2 = 4, σ3 = 3, et σ4 = 2, ou
 
1 2 3 4
1 4 3 2

est une transposition de (1, 2, 3, 4) qui interchange 2 et 4. On peut montrer qu’une


transposition est toujours impaire.
38. Soit E un ensemble. On appelle groupe symétrique de E l’ensemble des applications bi-
jectives de E sur E muni de la composition d’applications (◦). On le note S(E) ou S(E). Le cas
E = {1, . . . , n} est un cas particulier pour lequel card Sn = n!.
6. ◮ Déterminants et formules de changement de variable 277

Définition 6.2.
Étant donnée une matrice A de dimension n × n dont les entrées sont notées {ai,j },

X n
Y X
déf
dét (A) = sgn (σ) ai,σi = sgn (σ) a1,σ1 . . . an,σn (6.2)
σ∈Sn i=1 σ∈Sn

est applelé déterminant de A.

Exemple 6.3.
Le déterminant d’une matrice A de dimension 2 × 2 est

X 2
Y 2
Y 2
Y
sgn (σ) ai,σi = sgn ([1, 2]) ai,[1,2]i + sgn ([2, 1]) ai,[2,1]i
σ∈S2 i=1 i=1 i=1
2
Y 2
Y
= ai,[1,2]i − ai,[2,1]i = a1,1 a2,2 − a1,2 a2,1
i=1 i=1

Exemple 6.4.
Le déterminant d’une matrice A de dimension 3 × 3 est

X 3
Y
sgn (σ) ai,σi
σ∈S3 i=1
3
Y 3
Y
= sgn ([1, 2, 3]) ai,[1,2,3]i + sgn ([1, 3, 2]) ai,[1,3,2]i
i=1 i=1
3
Y 3
Y
+ sgn ([2, 1, 3]) ai,[2,1,3]i + sgn ([2, 3, 1]) ai,[2,3,1]i
i=1 i=1
Y3 Y3
+ sgn ([3, 1, 2]) ai,[3,1,2]i + sgn ([3, 2, 1]) ai,[3,2,1]i
i=1 i=1
3
Y 3
Y 3
Y
= ai,[1,2,3]i − ai,[1,3,2]i − ai,[2,1,3]i
i=1 i=1 i=1
3
Y 3
Y n
Y
+ ai,[2,3,1]i + ai,[3,1,2]i − ai,[3,2,1]i
i=1 i=1 i=1
= a1,1 a2,2 a3,3 − a1,1 a2,3 a3,2 − a1,2 a2,1 a3,3
+ a1,2 a2,3 a3,1 + a1,3 a2,1 a3,2 − a1,3 a2,2 a3,1
= a1,1 [a2,2 a3,3 − a2,3 a3,2 ] − a1,2 [a2,1 a3,3 − a2,3 a3,1 ] + a1,3 [a2,1 a3,2 − a2,2 a3,1 ].
278 Chapitre 6. Dérivée, dérivées directionnelles et différentielles

Définition 6.3. (i) Une application


(a1 , . . . , an ) 7→ f (a1 , . . . , an ) : Rn × · · · × Rn → R (6.3)
| {z }
n fois

est multilinéaire si elle est linéaire par rapport à chaque vecteur ai (les
autres restant fixes).
(ii) Une application multilinéaire est alternée si f (a1 , . . . , an ) = 0 lorsqu’il
existe un indice i, 1 ≤ i ≤ n − 1, tel que ai = ai+1 .

Théorème 6.1. Soit f une application multilinéaire alternée.


(i) Changer l’ordre de deux vecteurs consécutifs, change le signe de f : par
exemple pour i < j
f (. . . , ai , ai+1 , . . . ) = −f (. . . , ai+1 , ai , . . . ). (6.4)
(ii) Ajouter un multiple α aj , α ∈ R, du vecteur ai en position j, i 6= j, au
vecteur ai en position i ne change pas f :
f (. . . , ai + α aj , . . . , aj , . . . ) = f (. . . , ai , . . . , aj , . . . ). (6.5)
| {z }
i-ème terme

(iii) Soit une suite (v1 , . . . , vn ) de Rn , une matrice B de dimension n × n et la


nouvelle suite (w1 , . . . , wn ) :
n
X
déf
wj = bj,i vi , 1 ≤ j ≤ n. (6.6)
i=1

Alors,
X
f (w1 , . . . , wn ) = b1,σ1 . . . bn,σn f (vσ1 , . . . , vσn )
σ∈Sn
X
= sgn (σ) b1,σ1 . . . bn,σn f (v1 , . . . , vn ) (6.7)
σ∈Sn

= dét (B) f (v1 , . . . , vn ).


(iv) Soit A = {ai,j } et B = {bi,j } deux matrices de dimension n × n. On leur
associe les suites de vecteurs (v1 , . . . , vn ) et (w1 , . . . , wn ) de Rn suivantes
n
X n
X
déf déf
wj = bj,i vi , 1 ≤ j ≤ n, vj = aj,i ei , 1 ≤ j ≤ n. (6.8)
i=1 i=1

Alors, pour toute forme multilinéaire alternée f ,


n
X
wj = (AB)j,i ei , f (w1 , . . . , wn ) = dét (AB) f (e1 , . . . , en ) (6.9)
i=1
f (w1 , . . . , wn ) = dét (B) f (v1 , . . . , vn ) = dét (B) dét (A) f (e1 , . . . , en ) (6.10)
dét (AB) f (e1 , . . . , en ) = dét (BA) f (e1 , . . . , en ). (6.11)
6. ◮ Déterminants et formules de changement de variable 279

Démonstration. (i) Par définition d’une application multilinéaire alternée,

0 = f (. . . , ai + ai+1 , ai+1 + ai , . . . )
| {z } | {z }
terme i terme i+1

= f (. . . , ai , ai+1 , . . . ) + f (. . . , ai+1 , ai , . . . ).
|{z} |{z} |{z} |{z}
terme i terme i+1 terme i terme i+1

(ii) Par linéarité par rapport au i-ème vecteur

f (. . . , ai + α aj , . . . , aj , . . . ) = f (. . . , ai , . . . , aj , . . . ) + α f (. . . , aj , . . . , aj , . . . )
= f (. . . , ai , . . . , aj , . . . )

puisque, de la partie (i), on peut ramener dans f (. . . , aj , . . . , aj , . . . ) le second terme


qui contient aj à côté du premier f (. . . , aj , , aj , . . . ) à un signe près et que ce terme
est nul pour une application multilinéaire alternée.
(iii) En substituant et en développant par multilinéarité
n
X n
X n
X
f (w1 , . . . , wn ) = f ( b1,j1 vj1 , b2,j2 vj2 , . . . , bn,jn vjn )
j1 =1 j2 =1 jn =1
n
X X n Xn
= b1,j1 f (vj1 , b2,j2 vj2 , . . . , bn,jn vjn ) (6.12)
j1 =1 j2 =1 jn =1
X n n
X
= ... b1,j1 . . . bn,jn f (vj1 , . . . , vjn ).
j1 =1 jn =1

Comme l’application multilinéaire est alternée, f (vj1 , . . . , vjn ) = 0 sauf dans le cas
où il existe σ ∈ Sn telle que σi = ji , 1 ≤ i ≤ n. On peut donc remplacer les n
sommes par une somme sur σ ∈ Sn
X
f (w1 , . . . , wn ) = b1,σ1 . . . bn,σn f (vσ1 , . . . , vσn )
σ∈Sn
X
= sgn (σ) b1,σ1 . . . bn,σn f (v1 , . . . , vn ) (6.13)
σ∈Sn

= dét (B) f (v1 , . . . , vn ),

puisque, par définition de sgn (σ), on a

f (vσ1 , . . . , vσn ) = sgn (σ) f (v1 , . . . , vn ). (6.14)

(iv) Par définition,


n n n n
" n # n
X X X X X X
wj = bj.i vi = bj,i ai,ℓ eℓ = bj,i ai,ℓ eℓ = (BA)j,ℓ eℓ
i=1 i=1 ℓ=1 ℓ=1 i=1 ℓ=1
⇒ f (w1 , . . . , wn ) = dét (BA) f (e1 , . . . , en )
280 Chapitre 6. Dérivée, dérivées directionnelles et différentielles

de la partie (iii). On applique ensuite encore deux fois les résultats de la partie (iii) :

f (w1 , . . . , wn ) = dét (B) f (v1 , . . . , vn ) = dét (B) dét (A) f (e1 , . . . , en ).

Les autres propriétés découlent de ces dernières.


Théorème 6.2. (i) Si In est la matrice identité et A une matrice n×n, alors

dét In = 1 et dét (A⊤ ) = dét (A). (6.15)

(ii) L’application
déf
(a1 , . . . , an ) 7→ dét (a1 , . . . , an ) = dét ([a1 . . . an ]) : Rn × · · · × Rn → R,
| {z }
n fois
(6.16)

où [a1 . . . an ] est la matrice formée des n éléments ai rangés sous forme
de vecteurs colonnes, est multilinéaire. De plus, comme dét ([a1 . . . an ]) =
dét ([a1 . . . an ]⊤ ), il est équivalent de former la matrice à partir des n
éléments ai rangés sous forme de vecteurs lignes
 ⊤ 
a1
 .. 
dét (a1 , . . . , an ) = dét ([a1 . . . an ]) = dét  .  .
a⊤
n

(iii) dét (a1 , . . . , an ) change de signe si l’on permute deux de ses vecteurs consécutifs.
(iv) dét (a1 , . . . , an ) est nul si deux de ses vecteurs sont égaux.
Démonstration. (i) Si A = In , alors aii = 1 et aij = 0, i 6= j. Comme la seule
permutation pour laquelle le produit des ai,σi est non nul est la permutation identité
σi = i pour laquelle sgn (σ) = 1 et a1,σ1 . . . an,σn = a1,1 . . . an,n = 1. Il vient donc
dét (In ) = 1. Par définition,
X X
dét (A) = sgn (σ) a1,σ1 . . . an,σn , dét (A⊤ ) = sgn (σ) aσ1 ,1 . . . aσn ,n .
σ∈Sn σ∈Sn
(6.17)

Dans un produit aσ1 ,1 . . . aσn ,n , chaque entier i, 1 ≤ i ≤ n, apparait préciment une


fois parmi les entiers σ1 , . . . , σn . On peut donc réécrire ce produit sous la forme

a1,σ−1 . . . an,σn−1 .
1

−1
Puisque sgn (σ ) = sgn (σ), on obtient
X X
dét (A⊤ ) = sgn (σ −1 ) a1,σ−1 . . . an,σn−1 = sgn (σ) a1,σ1 . . . an,σn = dét (A)
1
σ∈Sn σ∈Sn

car, comme la sommation est par rapport à toutes les permutations σ ∈ Sn , elle
l’est aussi par rapport à toutes les permutations σ −1 ∈ Sn .
6. ◮ Déterminants et formules de changement de variable 281

(ii) Chacun des n! termes de la sommation de l’expression (6.2)


X
dét ([a1 . . . an ]) = sgn (σ) a1,σ1 . . . an,σn (6.18)
σ∈Sn

contient exactement un élément de chaque colonne ai , d’où la linéarité.


(iii) Cette propriété se déduit du fait que changer l’ordre de deux de vecteurs
consécutifs revient à une inversion de deux termes consécutifs de chaque permuta-
tion σ ce qui produit un signe moins.
(iv) Si deux vecteurs colonnes sont égaux, on peut à un signe près supposer
que ces deux vecteurs colonnes égaux sont conécutifs. De (iii) en changeant l’orde
de ces deux vecteurs colonnes égaux, il vient trivialement
dét (. . . , ai , ai , . . . ) = −dét (. . . , ai , ai , . . . )
ce qui bien entendu donne zéro.
On peut maintenant compléter les propriétés du déterminant.
Théorème 6.3. Soit {ei } la base orthonormale canonique de Rn .
(i) Le déterminant
(a1 , . . . , an ) 7→ dét (a1 , . . . , an ) : Rn × · · · × Rn → R (6.19)
| {z }
n fois

est l’unique application multilinéaire alternée f telle que


f (e1 , . . . , en ) = 1. (6.20)

(ii) Pour toutes matrices A et B de dimension n × n


det(AB) = dét (A) dét (B) = dét (BA) (6.21)
et, si A est inversible, dét (A) 6= 0 et
1
dét (A−1 ) = .
dét (A)
(iii) (Règle de Cramer) Si A est inversible, pour tout b ∈ Rn , il existe x =
(x1 , . . . , xn ) ∈ Rn tel que Ax = b et
dét (a1 , . . . , ai−1 , b, ai+1 , . . . , an )
xi =
dét (A)
X n 1 ≤ i ≤ n. (6.22)
1
= dét (a1 , . . . , ai−1 , ej , ai+1 , . . . , an ) bj ,
dét (A) j=1

(iv) Les vecteurs {ai } de Rn sont linéairement dépendants si et seulement si


dét (a1 , . . . , an ) = 0.
En particulier, une matrice A de dimension n × n est inversible si et seule-
ment si dét (A) 6= 0.
282 Chapitre 6. Dérivée, dérivées directionnelles et différentielles

Démonstration du Théorème 6.3. (i) On a montré au Théorème 6.2 que dét (A)
avait les propriétés désirées. L’unicité est maintenant la conséquence du Théorème
6.1 (iii).
(ii) Conséquence du Théorème 6.1 (iv) avec f (e1 , . . . , en ) = 1.
(iii) En utilisant les vecteurs colonnes a1 , . . . , an de A, l’équation Ax = b
devient

dét (a1 , . . . , ai−1 , b, ai+1 , . . . , an )


n X n
X
xj aj = b ⇒ = xj dét (a1 , . . . , ai−1 , aj , ai+1 , . . . , an )
j=1 j=1

= xi dét (a1 , . . . , ai−1 , ai , ai+1 , . . . , an ) = xi dét (A).

(iv) Si les vecteurs a1 , . . . , an sont linéairement dépendants, alors il existe


x = (x1 , . . . , xn ) ∈ Rn non nul tel que

n
X
xi ai = 0.
i=1

Si xj 6= 0, alors
X
aj = − xi ai ⇒ dét (a1 , . . . , an ) = 0.
1≤i≤n
i6=j

Réciproquement, si les vecteurs a1 , . . . , an sont linéairement indépendants, alors la


base orthonormale peut s’exprimer en fonction de ceux-ci

e1 = b11 a1 + · · · + b1n an
...
en = bn1 a1 + · · · + bnn an

Du Théorème 6.1 (iii)

1 = dét (e1 , . . . , en ) = dét (B) dét (a1 , . . . , an ) ⇒ dét (a1 , . . . , an ) 6= 0.

6.2 Formule de Laplace ou formule de récurrence


On peut aussi calculer le déterminant d’une matrice de dimension n à l’aide
de n déterminants de matrices de dimension n − 1 obtenues en enlevant à la matrice
de départ une ligne et une colonne. Si A est la matrice, pour tout i et j, on note
6. ◮ Déterminants et formules de changement de variable 283

Ai,j la matrice obtenue en lui enlevant sa i-ème ligne et sa j-ème colonne :


 
a1,1 ... a1,j−1 a1,j+1 ... a1,n
 .. .. .. .. .. .. 
 . . . . . . 
 
a
déf  i−1,1 . . . a i−1,j−1 a i−1,j+1 . . . a 
i−1,n 
Ai,j =  .
a
 i+1,1 . . . a i+1,j−1 a i+1,j+1 . . . a i+1,n 
 . .. .. .. .. .. 
 .. . . . . . 
an,1 ... an,j−1 an,j+1 ... an,n
On a vu que si a1 , . . . , an sont les vecteurs colonnes de la matrice A
X
dét (a1 , . . . , an ) = sgn (σ) a1,σ1 . . . an,σn . (6.23)
σ∈Sn

Si on substitue pour aj sa représentation dans la base {ei }


n
X
aj = ai,j ei ,
i=1

il vient
dét (a1 , . . . , aj−1 , aj , aj+1 , . . . , an )
X n
= ai,j dét (a1 , . . . , aj−1 , ei , aj+1 , . . . , an )
i=1
n
X X
= ai,j sgn (σ) a1,σ1 . . . aj−1,σj−1 (ei )σj aj+1,σj+1 . . . an,σn
i=1 σ∈Sn
Xn X Y
= ai,j sgn (σ) aℓ,σℓ .
i=1 σ∈Sn 1≤ℓ≤n
σj =i ℓ6=j
σℓ 6=i

Pour chaque (i, j), les produits qui apparaissent dans le terme
X Y
sgn (σ) aℓ,σℓ
σ∈Sn 1≤ℓ≤n
σj =i ℓ6=j
σℓ 6=i

correspondent aux termes du déterminant de dét (Aj,i ) et seulement à ceux là


puisque la ligne j et la collonne i sont éliminées. Il ne reste plus qu’à vérifier que
les termes de la somme ont les bons signes.
Lemme 6.1. Pour toute paire (i, j),
X Y
dét (a1 , . . . , aj−1 , ei , aj+1 , . . . , an ) = sgn (σ) aℓ,σℓ
σ∈Sn 1≤ℓ≤n
σj =i ℓ6=j
σℓ 6=i

= (−1)i+j dét (Aj,i ) = (−1)i+j dét (Ai,j ).


284 Chapitre 6. Dérivée, dérivées directionnelles et différentielles

Démonstration. Pour i = j = 1, on fait la somme par rapport à toutes les permu-


tations telles que σ1 = 1 ce qui revient à faire la somme par rapport à toutes les
permutations τ de {2, . . . , n}. Donc, sgn (σ) = sgn (τ ) et
X Y
sgn (σ) aℓ,σℓ = dét (A1,1 ).
σ∈Sn 1≤ℓ≤n
σ1 =1 ℓ6=1
σℓ 6=1

Pour (i, j), on fait remonter la ligne j de la matrice A en position 1 ce qui change le
signe de sgn (σ) par le facteur (−1)j−1 ; on déplace ensuite la colonne i de la matrice
résultante en position 1 ce qui change le signe de sgn (σ) par le facteur (−1)i−1 . On
obtient donc une nouvelle matrice A′ telle que a′1,1 = ai,j et comme les lignes et
colonnes restantes sont restées dans le même ordre on obtient la matrice Aj,i une
fois que la première ligne et la première colonne ont été envlevées. Enfin,
X Y X Y
sgn (σ) aℓ,σℓ = sgn (τ ) (−1)i−1+j−1 a′ℓ,τℓ .
σ∈Sn 1≤ℓ≤n τ ∈Sn 1≤ℓ≤n
σj =i ℓ6=i τ1 =1 ℓ6=1
σℓ 6=1 τℓ 6=1

De nouveau, comme on fait la somme par rapport à toutes les permutations telles
que τ1 = 1 cela revient à faire la somme par rapport à toutes les permutations τ ′
de {2, . . . , n} et
X Y X Y
sgn (σ) aℓ,σℓ = (−1)i+j sgn (τ ) (Aj,i )ℓ,τℓ
σ∈Sn 1≤ℓ≤n τ ∈Sn 1≤ℓ≤n
σj =i ℓ6=i τ1 =1 ℓ6=1
σℓ 6=1 τℓ 6=1

= (−1)i+j dét (Aj,i ).

Ce lemme mène à la formule de Laplace qui est itérative dans le sens que, une
fois connu la formule du déterminant des matrices de taille (n − 1) × (n − 1), on
obtient celle des matrices de taille n × n.
Théorème 6.4 (Formule de Laplace). On peut développer le calcul du déterminant
de A suivant une ligne ou une colonne d’une matrice A de dimension n × n :
(i) formule de développement par rapport à la colonne j
n
X
dét A = ai,j (−1)i+j dét (Ai,j );
i=1

(ii) formule de développement par rapport à la ligne i


n
X
dét (A) = ai,j (−1)i+j dét (Ai,j ).
j=1
6. ◮ Déterminants et formules de changement de variable 285

Pour bien s’en convaincre. on peut vérifier que la formule de Laplace donne
bien le même résultat que la formule de Leibniz pour n = 3 dans l’Exemple 6.4 :
 
a11 a12 a13
dét a21 a22 a23 
a31 a32 a33
 
a a23
= a11 (−1)1+1 dét 22
a32 a33
   
1+2 a21 a23 1+3 a21 a22
+ a12 (−1) dét + a13 (−1) dét .
a31 a33 a31 a32

6.3 Comatrice ou matrice des cofacteurs et calcul de l’inverse


On introduit encore quelques définitions et notations.

Définition 6.4.
Le terme
déf
[M (A)]ij = dét (Ai,j ) (6.24)

est appelé le mineur de ai,j et le terme

déf
[Cof (A)]ij = (−1)i+j dét (Ai,j ) (6.25)

est appelé le cofacteur de ai,j . La matrice Cof (A) de dimension n × n est appelée
matrice des cofacteurs ou comatrice et est aussi dénotée com A.

Les formules du Théorème 6.4 portent le nom de développement suivant une ligne
(ou une colonne), méthode de Laplace ou méthode des cofacteurs ou des mineurs.
Avec ces définitions, il vient

A (Cof A)⊤ = (Cof A)⊤ A = (dét A) In . (6.26)

La matrice transposée de la comatrice est appelée matrice complémentaire de A.


Notamment, si A est inversible, l’inverse de A est un multiple de la matrice com-
plémentaire. Cette approche offre une formule de la matrice inverse ne nécessitant
que des calculs de déterminants.

Théorème 6.5. Soit A une matrice de dimension n × n.


(i) dét A⊤ = dét A et Cof A⊤ = (Cof A)⊤ .
(ii) dét A 6= 0 si et seulement si A est inversible. Dans ce cas

1 1
A−1 = Cof A⊤ = (Cof A)⊤ . (6.27)
dét A dét A

(iii) Cof (AB) = Cof (A) Cof (B).


286 Chapitre 6. Dérivée, dérivées directionnelles et différentielles

6.4 Aire, volume et leur généralisation en dimension n > 3


Soient A une matrice de dimension n × n et {ei : i = 1, 2, . . . , n} la base ortho-
normale canonique de Rn . On représente les {ei } sous forme de vecteurs colonnes :
     
1 0 0
0 1 0
     
     
~e1 = 0 , ~e2 = 0 , . . . , ~en =  ...  . (6.28)
 ..   ..   
. . 0
0 0 1
La matrice identité I de dimension n × n est obtenue à partir de ces vecteurs :
 
I = ~e1 . . . ~en . (6.29)
Soient ~a1 , . . . , ~an les n vecteurs colonnes suivants
~ai = A ~ei , 1 ≤ i ≤ n, (6.30)
qui correspondent aux n colonnes de A, c’est-à-dire,
     
A = AI = A ~e1 . . . ~en = A~e1 . . . A~en = ~a1 . . .~an . (6.31)
L’ensemble convexe
( n
)
déf
X
C = αi ~ei : 0 ≤ αi ≤ 1
1=1

est l’hypercube dans Rn dont la longueur des arêtes est 1 et dont le volume est 1.
L’hypercube C est transformé par A en un hyper-parallélépipède
( n )
déf
X
AC = αi ~ai : 0 ≤ αi ≤ 1, 1 ≤ i ≤ n . (6.32)
1=1

On veut montrer que


Théorème 6.6. Soit A une matrice de dimension n × n, n ≥ 1, un entier. Alors,
le volume n-dimensionnel Vol(AC) de l’hyper-parallélépipède AC est égal à |détA|.
On aura besoin du lemme suivant.
Lemme 6.2. Soit a ∈ Rn et S un sous-espace linéaire de Rn . Il existe un point
unique â ∈ S tel que
déf
ka − âk = dS (a) = inf ka − sk (6.33)
s∈S

qui est complètement caractérisé par l’équation


∃â ∈ S, ∀s ∈ S, (a − â) · s = 0. (6.34)
n
L’application a →7 πS (a) = â : R → S est la projection de a sur S et le vecteur
b = a − â ∈ S ⊥ est orthogonal à S.
6. ◮ Déterminants et formules de changement de variable 287

Démonstration du Lemme 6.2. (i) Existence et unicité. Comme la fonction x 7→


déf
f (x) = ka−xk : Rn → R est bornée inféreurement par 0, l’infimum m = inf s∈S ka−
sk sur S est un nombre positif ou nul. Le sous-ensemble S1 = {x ∈ S : ka − xk ≤
m + 1} est non vide et compact et m = inf s∈S ka − sk = inf s∈S1 ka − sk. Comme
l’image f (S1 )du compact S1 par la fonction continue f est compacte, m ∈ f (S1 ) et
il existe â ∈ S1 ⊂ S tel que m = f (â). Pour l’unicité, on utilise l’identité

kx + yk2 + kx − yk2 = 2(kxk2 + kyk2 )

de l’Exercice 10.3 du Chapitre 3. En effet, soient deux solutions minimisantes â1 et


â2 dans S :

ka − â1 k = m = ka − â2 k.

Le point (â2 + â1 )/2 ∈ S et en prenant x = a − â1 et y == a − â2

ka − â1 + a − â2 k2 + kâ1 − â2 k2 = 2(ka − â1 |2 + ka − â1 k2 ) = 4 m2


2
â1 + â2
4 m2 ≤ 4 a − = ka − â1 + a − â2 k2 + kâ1 − â2 k2 = 4 m2
2

ce qui entraı̂ne â1 = â2 et donc l’unicité.


(ii) Caractérisation. Par le Corollaire 1 au Théorème 4.5, il existe un point
minimisant si et seulement si la condition (6.34) est vérifiée.

Démonstration du Théorème 6.6. (i) Si les vecteurs ~a1 , . . . , ~an sont linéairement
dépendants, alors AC se trouve dans le sous-espace linéaire Lin (~a1 , . . . , ~an ) de di-
mension inférieure ou égale à n − 1. Le volume n-dimensionnel (n-volume) de AC
est donc 0 et le déterminant de la matrice A est aussi zéro car une de ses colonnes
est la combinaison linéaire des autres colonnes. Il est donc suffisant de démontrer le
théorème pour une famille de n vecteurs ~a1 , . . . , ~an linéairement indépendants (et
donc non nuls) dans Rn .
(ii) Pour le vecteur ~a1 , le 1-volume Vol(~a1 ) = k~a1 k, la longueur du vecteur ~a1 .
On pose ~b1 = ~a1 .
Pour deux vecteurs {~a1 , ~a2 }, le 2-volume Vol(~a1 , ~a2 ) = k~a1 k dLin (~a1 ) (~a2 ). Comme
Lin (~a1 ) = {α~a1 : α ∈ R} = Lin (~b1 ), la projection πLin (~b1 ) (~a2 ) = α̂1 ~b1 est ca-
ractérisée par

~a2 · ~b1 déf ~a2 · ~b1 ~


(~a2 − α̂1 ~b1 ) · ~b1 = 0 ⇒ α̂1 = ⇒ ~b2 = ~a2 − b1 .
k~b1 k2 k~b1 k2

Comme les ~ai sont linéairement indépendants, ~b2 6= 0, ~b2 · ~b1 = 0 et Vol(~a1 , ~a2 ) =
k~b1 k k~b2 k.
On considère trois vecteurs {~a1 , ~a2 , ~a3 }. Puisque Lin (~a1 , ~a2 ) = Lin (~b1 , ~b2 ) =
{α1~b1 + α2~b2 : αi ∈ R}, le 3-volume Vol(~a1 , ~a2 , ~a3 ) = Vol(~a1 , ~a2 ) dLin (~b1 ,~b2 ) (~a3 ). La
288 Chapitre 6. Dérivée, dérivées directionnelles et différentielles

projection πLin (~b1 ,~b2 ) (~a3 ) = α̂1 ~b1 + α̂2 ~b2 est caractérisée par

~a3 · ~bi
(~a3 − α̂1 ~b1 − α̂2 ~b2 ) · ~bi = 0, i = 1, 2, ⇒ α̂i = , i = 1, 2,
k~bi k2
déf ~a3 · ~b1 ~ ~a3 · ~b2 ~
⇒ ~b3 = ~a3 − b1 − b2 .
k~b1 k2 k~b2 k2

Comme les ~ai sont linéairement indépendants, ~b3 6= 0 et ~b3 · ~bi = 0, i = 1.2.
À l’étape i ≥ 3, on construit le vecteur
i−1
X i
Y
~bi déf ~ai · ~bj ~bj , ~bi 6= 0, ~bi · ~bj = 0, 1 ≤ j ≤ i − 1,
= ~ai − Vol(~a1 , . . . , ~ai ) = k~bj k
j=1 k~bj k2 j=1
n
Y
Vol(AC) = Vol(~a1 , . . . , ~an ) = k~bj k.
j=1

Dans le processus de construction d’un ensemble de vecteurs orthogonaux


{~bi }, le déterminant de A n’a pas changé car, à chaque étape, on retranchait une
combinaison linéaire de colonnes de A de la colonne i, c’est-à-dire,

dét A = dét [~a1 . . . ~an ] = dét [~b1 . . . ~bn ]. (6.35)

D’autre part, pour la matrice B = [~b1 . . . ~bn ], la matrice B ⊤ B est diagonale puisque
(B ⊤ B)ij = ~bi · ~bj et que les vecteurs ~bi sont orthogonaux entre eux. Il vient donc
n
Y
B ⊤ B = diag{kb1 k2 , . . . , |bn k2 } ⇒ dét (B ⊤ B) = dét B ⊤ dét B = k~bj k2
j=1
 2
n
Y n
Y
⇒ |dét B| = 2
k~bj k ⇒ |dét A| = |dét B| = k~bj k = Vol(AC)
j=1 j=1

ce qui conclut la démonstration.

6.5 Formule de changement de variable pour l’intégrale de


volume
C’est cette propriété du déterminant qui mène à la formule de changement de
variables x 7→ x′ = T (x) : Rn → Rn dans l’intégrale sur Rn puisque localement, en
chaque point x, on aura

dx′ = |dét DT (x)| dx,

où apparaı̂t la valeur absolue du déterminant de la matrice jacobienne DT (x)


au point x qui est une approximation linéaire locale de la transformation T . Par
6. ◮ Déterminants et formules de changement de variable 289

exemple, pour un domaine ouvert borné Ω dans Rn , cela donnera la formule


Z Z
f dx′ = f ◦ T |dét DT | dx (6.36)
T (Ω) Ω
Z Z
′ ′
f (x ) dx = f (T (x)) |dét DT (x)| dx, (6.37)
T (Ω) Ω

où T transforme le domaine Ω en un domaine Ω′ = T (Ω) et f : T (Ω) → Rn est une


fonction intégrable dans un sens approprié. En géométrie
déf
ωT (x) = |dét DT (x)| (6.38)

est appelée densité canonique (voir, par exemple, M. Berger et B. Gostiaux [1]).
Enfin, attention, il y a des hypothèses à vérifier sur T et f . En particulier, dét DT
ne doit pas changer de signe sur Ω.

6.6 Intégrale de ligne, de surface et de sous-variétés de


dimension supérieure
Un façon de définir une courbe dans le plan est d’introduite une application
continue T : R → R2 qui transformera l’intervalle [0, 1] en une courbe planaire
déf
C = {T (x) : 0 ≤ x ≤ 1} ⊂ R2 .

On dit que la courbe est simple si T est injective, c’est-à-dire, la courbe ne s’inter-
secte pas avec elle-même. Lorsque T est linéaire
   
a1 a
x 7→ T (x) = x : R → R , DT (x) = 1 ∈ L(R, R2 ),
2
(6.39)
a2 a2
pour un vecteur
 
a
~a = 1 ∈ R2 .
a2

Lorsque ~a n’est pas nul, la courbe est simple et correspond au vecteur partant de
l’origine dans R2 et se terminant au point ~a. Sa longueur est donc
s   s    q
q     a1
a1
a21 + a22 = a1 a2 = dét a1 a2 = dét (DT (x)⊤ DT (x)).
a2 a2

On obtient ainsi une formule de changement de variable de la forme


Z Z 1 q
′ ′
f (x ) dx = f (T (x)) |dét [DT (x)⊤ DT (x)]| dx
C=T ([0,1]) 0

pour une fonction f : C → R où l’on a donné un sens à l’intégrale le long de la


courbe simple C dans le plan paramétrisée par T . Cette formule demeure valide
290 Chapitre 6. Dérivée, dérivées directionnelles et différentielles

pour une application T différentiable et injective. Dans ce cas la densité canonique


de M. Berger et B. Gostiaux [1] devient
q
déf
ωT (x) = |dét [DT (x)⊤ DT (x)]| (6.40)

qui se reduit à |dét DT (x)| si T : Rn → Rn car |dét [DT (x)]| = |dét [DT (x)⊤ ]|.
Elle demeure vraie pour des courbes simples non-planaires dans Rn , n ≥ 3, en
introduisant une application différentiable et injective T : R → Rn .
On peut passer des courbes aux surfaces dans R3 ou en dimensions supérieures
en introduisant une application continue T : R2 → Rn , n ≥ 3, qui transformera le
carré [0, 1] × [0, 1] en une surface
déf
S = {T (x) : x ∈ [0, 1] × [0, 1]} ⊂ Rn .
Lorsque T est linéaire
   
a11 a12   a11 a12

x 7→ T (x) =  ... ..  x1 : R2 → Rn ,  ..
DT (x) =  . ..  ∈ L(R2 , Rn ),
.  x2 . 
an1 an2 an1 an2
pour une matrice n × 2
 
a11 a12
 ..  .
A =  ... . 
an1 an2
On obtient alors un parallélépipède P dans Rn généré par les deux vecteurs
   
a11 a12
   
~a1 =  ...  ~a2 =  ...  .
an1 an2
L’aire de P est alors donnée par la formule
r  q
⊤  
aire (P ) = dét ~a1 ~a2 ~a1 ~a2 = |dét (A⊤ A)|,

où A⊤ A est une matrice de dimension 2 × 2 et la densité canonique est


q
déf
ωT (x) = |dét [DT (x)⊤ DT (x)]|. (6.41)

On peut continuer ainsi et considérer une application injective différentiable


T : Rn → Rm , n ≤ m, et un domaine ouvert borné Ω dans Rn . On aura de nouveau
la formule de changement de variables
Z Z q
f (x′ ) dx′ = f (T (x)) |dét [DT (x)⊤ DT (x)]| dx
T (Ω) Ω

pour l’intégration d’une fonction f : T (Ω) → R sur la variété T (Ω) de dimension n


dans l’espace Rm , m ≥ n.
7. Exercices 291

7 Exercices
Exercice 7.1.
déf
Soient deux fonctions f, g : R → R et leur composition x 7→ (f ◦ g)(x) = f (g(x)) :
R → R. Montrer que si f (g(x)) et g (x) existent au point x alors la dérivée (f ◦g)′ (x)
′ ′

existe et est donnée par

(f ◦ g)′ (x) = f ′ (g(x)) g ′ (x).

Exercice 7.2.
Soit f : [a, b] → R telle que f ′ (x) existe et soit uniformément continue sur ]a, b[ .
Montrer que, pour tout ε > 0, il existe δ > 0 tel que

f (y) − f (x)
∀x, y ∈ ]a, b[ , 0 < |y − x| < δ, − f ′ (x) < ε.
y−x

On dit que f est uniformément dérivable sur ]a, b[ .

0.5

0.25

z
4
0

-0.25
2

-0.5

0
y 4

2
-2
0

x
-2
-4

-4

Figure 6.9. Fonction de l’Exercice 7.3.

Exercice 7.3.
Montrer que la fonction numérique (voir Figure 6.9)
 2
 xy , si x 6= 0
déf
f (x, y) = x2 + y 4

0, si x = 0
292 Chapitre 6. Dérivée, dérivées directionnelles et différentielles

est dérivable en (x, y) = (0, 0) dans toutes les directions v = (v1 , v2 ), mais qu’elle
n’est ni différentiable au sens de Gateaux ni continue au point (x, y) = (0, 0).
Remarquer que l’on a les propriétés suivantes

x<0 ⇒ f (x, y) ≤ 0 et x>0 ⇒ f (x, y) ≥ 0


f (−x, y) = −f (x, y) et f (x, −y) = f (x, y).

Exercice 7.4.
Montrer que si f : Rn → Rm est directionnellement dérivable au sens de Hadamard
en x, alors l’application

v 7→ dH f (x, v) : Rn → Rm (7.1)

est homogène et continue.

Exercice 7.5.
Soient f, g : Rn → Rm deux applications Fréchet différentiables sur Rn et la nouvelle
application
déf
x 7→ h(x) = f (x) · g(x) : Rn → R . (7.2)

Démontrer que h est Fréchet différentiable et que

Dh(x) = Df (x)⊤ g(x) + Dg(x)⊤ f (x) (7.3)

ou, si ∇h(x) est interprété comme un vecteur colonne (ou matrice n × 1) et f (x) et
g(x) comme des vecteurs colonnes (ou matrice m × 1),

∇h(x) = g(x)⊤ Df (x) + f (x)⊤ Dg(x), (7.4)

où Df (x) et Dg(x) sont des matrices m × n.

Exercice 7.6.
Soit f : Rn → Rm une application Fréchet différentiable telle que kf (x)kRm = 1
pour la norme euclidienne. Montrer que

Df (x)⊤ f (x) = 0.

Y-a-t-il une interprétation géométrique de cette identité ?

Exercice 7.7.
Soit f : Rn → R admettant des dérivées partielles d’ordre un bornées dans un
ouvert U de Rn .
(i) Montrer que f est continue sur U et lipschizienne en chaque point de U .
Indication. S’inspirer de la démonstration du Théorème 3.11.
(ii) Est-ce que, en général, f est Gateaux différentiable en tout point de U ?
7. Exercices 293

Exercice 7.8 (W. Rudin [1, Exercice 27, p. 242]).


On considère la fonction
 2 2 
 xy (x − y ) , si (x, y) 6= (0, 0)
déf
(x, y) 7→ f (x, y) = x2 + y 2 : R2 → R . (7.5)
 
0, si (x, y) = (0, 0)

Montrer que
(i) f , ∂x f et ∂y f existent et sont continues sur R2 ;
2
(ii) ∂xy 2
f = ∂x (∂y f ) et ∂yx f = ∂y (∂x f ) existent dans R2 et sont continues sauf
en (0, 0) ;
2 2
(iii) ∂xy f (0, 0) = 1 et ∂yx f (0, 0) = −1.
Rappel. La notation (3.66) :
 
2 ∂ ∂f
∂ji f (x) = (x) = d2 f (x; ei ; ej ) = Hf (x)ij .
∂xj ∂xi

Exercice 7.9.
Soit l’application linéaire A : Rn → Rn (ou une matrice n × n) et b ∈ Rn (ou un
n-vecteur). On construit la fonction

déf 1
f (x) = (Ax) · x + b · x, x ∈ Rn .
2
(i) Calculer f ′ (x; v) (ou le gradient de f ) et d2 f (x; v; w) (ou la hessienne de
f ).
(ii) Donner des conditions nécessaires et suffisantes sur A et b pour que f soit
convexe dans tout Rn .
(iii) Donner des conditions nécessaires et suffisantes sur A et b pour que f soit
strictement convexe dans tout Rn .
(iv) Est-ce que les fonctions f associées aux matrices et vecteurs
       
3 1 −2 2 4 1
(a) A = ,b= , et (b) A = ,b= ,
−1 2 1 4 1 1

sont convexes ?

Exercice 7.10.
Soient f (x) = kxkn , n ≥ 1, et kxk la norme euclidienne de x ∈ Rk , k ≥ 1.
(i) Déterminer les n ≥ 1 pour lesquels f est Hadamard (Fréchet) différentiable
en tout point de Rk .
(ii) Déterminer les n ≥ 1 pour lesquels Hf (x) existe en tout point de Rk
(iii) Déterminer les valeurs de n ≥ 1 pour lesquelles f est convexe dans Rk .
294 Chapitre 6. Dérivée, dérivées directionnelles et différentielles

Exercice 7.11.
Montrer que la fonction f (x) = sin x+(1+x)2 est convexe dans l’intervalle [0, 1].

Exercice 7.12.
On dit que C ⊂ Rn est un cône de sommet 0 si
∀x ∈ C, ∀λ > 0, λx ∈ C. (7.6)
(i) Soit f : Rn → R une fonction convexe Gateaux différentiable en tout point
d’un cône convexe C. Montrer que argminf (C) 6= ∅ si et seulement si
∃x ∈ C, ∇f (x) · x = 0 et ∀y ∈ C, ∇f (x) · y ≥ 0. (7.7)

(ii) Trouver le ou les points minimisants pour


C = {(x1 , x2 ) : x1 ≥ 0 et x2 ≥ 0} et f (x1 , x2 ) = (x1 + 1)2 + (x2 − 1)2 .

Exercice 7.13.
Pour ε > 0, une matrice m × n et un vecteur c ∈ Rm on considère le problème :
déf
inf f (x) + εkxk2Rn , f (x) = kAx − ck2Rm . (7.8)
x∈Rn

(i) Montrer que f est convexe sur Rn ,


(ii) Donner les conditions nécessaires et suffisantes pour l’existence d’une so-
lution au problème (7.8) et montrer qu’il y a toujours existence et unicité
lorsque ε > 0.
(iii) Donner les conditions nécessaires et suffisantes pour l’existence d’une so-
lution au problème (7.8) pour ε = 0. Sont-elles toujours vérifées ?

Exercice 7.14.
Soit B une matrice n × n symétrique et définie positive. On associe à B la fonction
déf Bx · x
f (x) = , x 6= 0, (7.9)
kxk2
où kxk est la norme euclidienne dans Rn .
(i) Montrer qu’il existe x∗ ∈ Rn tel que kx∗ k = 1 et
Bx · x
f (x∗ ) = inf . (7.10)
06=x∈Rn kxk2

(ii) Montrer qu’il existe une constante β > 0 tel que


∀x ∈ Rn , Bx · x ≥ β kxk2 . (7.11)

(iii) Montrer que f est Hadamard/Fréchet différentiable en x 6= 0 et donner


l’expression de son gradient. En déduire que la plus petite constante β
vérifiant (7.11) est la plus petite valeur propre de la matrice B.
7. Exercices 295

Exercice 7.15.
Soient A et B deux matrices symétriques n× n. On suppose B définie positive. Pour
x ∈ Rn , x 6= 0, on définit la fonction

déf Ax · x
f (x) = . (7.12)
Bx · x
déf
(i) Montrer que l’ensemble U = {x ∈ Rn : Bx · x = 1} est non-vide et
compact.
(ii) Montrer qu’il existe x̂ ∈ Rn tel que B x̂ · x̂ = 1 et

Ax · x
f (x̂) = inf . (7.13)
06=x∈Rn Bx · x

(iii) Calculer ∇f (x) pour x 6= 0 et caractériser x̂. Montrer que pour tout λ tel
que dét (A − λB) = 0, on a f (x̂) ≤ λ.
296 Chapitre 6. Dérivée, dérivées directionnelles et différentielles
Annexe A. Corrigés des exercices 297

Annexe A. Corrigés des exercices

1 Exercices du Chapitre 1
Exercice 5.1
Montrer que si r ∈ Q et s ∈ R \ Q, alors r + s ∈ R \ Q et rs ∈ R \ Q i ∪ {0}.
Solution. (i) (addition.) Par l’absurde. On suppose que r + s ∈ Q. Ce qui donne
s = (r + s) − r ∈ Q ce qui contredit le fait que s ∈ R \ Q.
(ii) (produit.) Si r = 0, alors rs = 0. Si 0 6= r ∈ Q, alors
rs
s= ∈Q
r
comme quotient de deux rationnels ce qui contredit le fait que s ∈ R \ Q.

Exercice 5.2
Soit A, ∅ 6= A ⊂ R et
déf
−A = {−a : a ∈ A} .

Montrer que inf A = − sup(−A).


Solution. Soit b0 = inf A. Par définition de l’infimum, b0 est une borne inférieure
de A et

∀a ∈ A, b0 ≤ a ⇒ ∀a ∈ A, −a ≤ −b0

et −b0 est une borne supérieure de −A. Donc c0 = sup (−A) ∈ R et c0 ≤ −b0 . Ceci
entraı̂ne

∀a ∈ A, −a ≤ c0 ≤ −b0
⇒ ∀a ∈ A, b0 ≤ −c0 ≤ a

et −c0 est une borne inférieure de A. Mais comme b0 est la plus grande borne
supéreure de A, on a b0 ≥ −c0 et finalement b0 = −c0 . Par définition de b0 et c0 ,

inf A = b0 = −c0 = − sup (−A).

2 Exercices du Chapitre 2
Exercice 5.1
Montrer qu’il est impossible de définir sur l’ensemble des nombres complexes
C un ordre total qui lui confère une structure de corps ordonné. (Indication : −1
est un carré.
298 Annexe A. Corrigés des exercices

Solution. S’il y a un ordre total sur C qui en fasse un corps ordonné, alors de la
Proposition 3.4 (d), on a 1 > 0 et pour tout x ∈ C, x 6= 0, on a x2 > 0. Comme
i 6= 0 on a ou bien i > 0 ou −i > 0 ce qui donne −1 = i2 > 0 et −1 = (−i)2 > 0.
On obtient donc une contradiction dans chaque cas.

Exercice 5.2
Démontrer les résultats suivants.
(i) L’ensemble des irrationnels R \ Q n’est pas dénombrable.
(ii) Le segment ]a, b[ et le segment ]c, d[ ont le même cardinal.
(iii) Le segment ]0, 1[ et R ont le même cardinal.
Démonstration. (i) On a déjà démontré que R n’est pas dénombrable (Théorème
2.5 du Chapitre 2) et que Q est dénombrable (Exemple 2.3). On peut partionner R
en deux ensembles disjoints

R = Q ∪(R \ Q), Q ∩(R \ Q = ∅.

Comme Q est dénombrable, il existe une bijection f : Q → N. Si R \ Q était


dénombrable, alord il existerait une bijection g : R \ Q et N. Ceci nous permet-
trait de construire la bijection suivante
( )
déf (0, f (x)), si x ∈ Q
x 7→ F (x) = : R → {0, 1} × N
(1, g(x)), si x ∈ R \ Q
( −1 )
−1 déf f (y), si i = 0
(i, y) 7→ F (i, y) = : {0, 1} × N → R .
g −1 (y)), si i = 1

Comme {0, 1} × N est dénombrable en tant que sous-ensemble infini de N × N (cf.


Théorème 2.3), on en concluerait que R est dénpmbrable ce qui contredit le fait
qu’il ne l’est pas. Donc R \ Q n’est pas dénombrable.
(ii) Il suffit de prendre un polynôme de degré un de la forme f (x) = α x + β
et d’imposer les conditions suivantes en f (a) = c et f (b) = d pour déterminer les
deux constantes :
d−c
αa + β = c et α b + β = d ⇒ f (x) = c + (x − a)
b−a
b−a
⇒ f −1 (y) = a + (y − c).
d−c
Comme f est une bijection entre ]a, b[ et ]c, d[ , les deux intervalles ont le même
cardinal.
(iii) On choisit la bijection
 
déf 1 x 2y − 1
f (x) = 1+ : R → ]0, 1[ d’inverse f −1 (y) = .
2 1 + |x| 1 − |2y − 1|
3. Exercices du Chapitre 3 299

3 Exercices du Chapitre 3
Exercice 10.1
Soient x, y ∈ Rk . Établir que

kx + yk2 + kx − yk2 = 2 kxk2 + 2 kyk2.

Interpréter géométriquement ce résultat.

Solution. Par définition de la norme



kxk = x · x.

Ceci donne donc

kx + yk2 + kx − yk2 = (x + y) · (x + y) + (x − y) · (x − y)
= x · x + y · y + 2x · y + x · x + y · y − 2x · y
= 2 x · x + 2 y · y = 2 kxk2 + 2 kyk2.

La somme des carrés des côtés d’un parallèlogramme est égale à la somme des carrés
de ses deux diagonales.

Exercice 10.2
Soit x ∈ Rk , k ≥ 2. Démontrer qu’il existe y ∈ Rk , y 6= 0, tel que x · y = 0.

Solution. Si x = 0 on peut prendre n’importe quel y 6= 0. Si x = (x1 , . . . , xk ) 6= 0,


il existe i tel que xi 6= 0. On considère deux cas :

k
X k
X
x2j = 0 et x2j > 0.
j=1 j=1
j6=i j6=i

Dans le premier cas xj = 0 pour j 6= i et on prend

yi = 0 et yj = 1 pour j 6= i;

dans le second cas, on prend

k
1 X 2
yj = xj pour j 6= i et yi = − x .
xi j=1 j
j6=i
300 Annexe A. Corrigés des exercices

Exercice 10.3
Soit R+ = {x ∈ R : x ≥ 0}.
(i) Montrer que, pour tout espace métrique (X, d) et pour toute constante
α > 0, la fonction
déf
(x, y) 7→ (αd)(x, y) = α d(x, y)

est une métrique sur X.


(ii) Si d1 et d2 sont deux métriques sur X, montrer que la fonction
déf
(x, y) 7→ (d! + d2 )(x, y) = d1 (x, y) + d2 (x, y)

est une métrique sur X.


(iii) Montrer que, pour tout espace métrique (X, d), la fonction

déf d(x, y)
(x, y) 7→ d(x, y) =
1 + d(x, y)

est une métrique sur X.


(iv) Soit {dn : n ≥ 1} une suite de fonctions dn : X × X → R+ tel que pour
tout entier n ≥ 1

∀x, y ∈ X, dn (x, y) = dn (y, x) (3.1)


∀x, y, z ∈ X, dn (x, z) ≤ dn (x, y) + dn (y, z) (3.2)
x=y ⇒ dn (x, y) = 0 (3.3)

et, en plus,

d1 (x, y) = 0 ⇒ x = y. (3.4)

Montrer que la fonction


X∞
déf 1 dn (x, y)
(x, y) 7→ d∞ (x, y) = n 1 + d (x, y)
n=1
2 n

est bien définie et qu’elle est une métrique sur X.


Solution. On doit dans chaque cas vérifier les trois axiomes de la Définition 2.1 :
une métrique dans un ensemble X est une fonction
déf
(x, y) 7→ d(x, y) : X × X → R+ , R+ = {x ∈ R : x ≥ 0}

qui satisfait les trois axiomes suivants :


(M1) d(x, y) = 0 ⇐⇒ x = y;
(M2) d(x, y) = d(y, x) ;
3. Exercices du Chapitre 3 301

(M3) d(x, y) ≤ d(x, z) + d(z, y).


(i) Pour α > 0, α d : X × X → R+ et
(M1) α d(x, y) = 0 ⇐⇒ d(x, y) = 0 ⇐⇒ x = y ;
(M2) α d(x, y) = α d(y, x) ;
(M3) α d(x, y) ≤ α d(x, z) + α d(z, y).
(ii) Par définition des métriques d1 et d2 , d1 + d2 : X × X → R+ et
(M1) (d1 + d2 )(x, y) = 0 ⇐⇒ d1 (x, y) = 0 et d2 (x, y) = 0 ⇐⇒ x = y ;
(M2) d1 (x, y) + d2 (x, y) = d1 (y, x) + d2 (y, x) ;
(M3) d1 (x, y) ≤ d1 (x, z) + d1 (z, y) et d2 (x, y) ≤ d2 (x, z) + d2 (z, y) entraı̂ne
d1 (x, y) + d2 (x, y) ≤ d1 (x, z) + d2 (x, z) + d1 (z, y) + +d2 (z, y)) .
(iii) Par définition, d : X × X → R+ et
(M1) d(x, y) = 0 ⇐⇒ d(x, y) = 0 ⇐⇒ x = y ;
Pour (M2)
d(x, y) d(y, x)
d(x, y) = = = d(y, x)
1 + d(x, y) 1 + d(y, x)
Pour (M3), on réécrit
d(x, y) 1
d(x, y) = =1−
1 + d(x, y) 1 + d(x, y)
Maintenant, puisque d(x, y) ≤ d(x, z) + d(z, y), il vient
1 + d(x, y) ≤ 1 + d(x, z) + d(z, y)
1 1 1
≥ ≥
1 + d(x, y) 1 + d(x, z) + d(z, y) 1 + d(x, z) + d(z, y) + d(x, z) d(z, y)
1
= .
(1 + d(x, z)) (1 + d(z, y))
Donc
d(x, y) 1 1
=1− ≤1 −
1 + d(x, y) 1 + d(x, y) (1 + d(x, z)) (1 + d(z, y))
d(x, z) + d(z, y) + d(x, z) d(z, y)
=
(1 + d(x, z)) (1 + d(z, y))
d(x, z) + d(z, y) + 2 d(x, z) d(z, y)

(1 + d(x, z)) (1 + d(z, y))
d(x, z) d(z, y)
= + .
1 + d(x, z) 1 + d(z, y)
(iv) Pour (M1), si x = y alors pour chaque n ≥ 0, dn (x, y) = 0 et
X∞
1 dn (x, y)
d∞ (x, y) = n 1 + d (x, y)
= 0.
n=1
2 n
302 Annexe A. Corrigés des exercices

Réciproquement, si d∞ (x, y) = 0, alors pour chaque n ≥ 0, dn (x, y) = 0. En parti-


culier, d0 (x, y) = 0 et, par hypothèse sur d0 , x = y.
Comme chaque dn vérifie (M2), alors, par définition de d∞ , d∞ vérifie (M2).
Enfin (M3) est une conéquence directe de la partie (iii).

Exercice 10.4 (page 102)


Soient (Xi , di ), 1 ≤ i ≤ n, des espaces métriques et
déf
X1 × · · · × Xn = {(x1 , . . . , xn ) : xi ∈ Xi } (3.5)

l’espace produit des Xi . Alors la fonction


déf
(x, y) = ((x1 , . . . , xn ), (y1 , . . . , yn )) 7→ d∞ (x, y) = max di (xi , yi )
1≤i≤n (3.6)
: (X1 × · · · × Xn ) × (X1 × · · · × Xn ) → R+

est une métrique sur X1 × · · · × Xn . De la même façon, pour tout p, 1 ≤ p < ∞, la


fonction
( n )1/p
déf
X
p
dp (x, y) = di (xi , yi ) (3.7)
i=1

est une métrique sur X1 × · · · × Xn .


Solution. À compléter en suivant la démonstration du Théorème 1.2 page 51.

Exercice 10.5
Soit E un espace vectoriel normé au sens des Définitions 1.1 et 1.4 du Chapitre
2. Montrer que
déf
d(x, y) = kx − yk

est une métrique sur E.


Solution. À partir des propriétés de la norme (Définition 1.4 page 50).

Exercice 10.6 (page 103)


Soient A1 , A2 , . . . des sous-ensembles d’un espace métrique. On pose

Bn = ∪ni=1 Ai et B = ∪∞
i=1 Ai .

Démontrer que

∀n ≥ 1, Bn = ∪ni=1 Ai et B ⊃ ∪∞
i=1 Ai .

Donner un exemple où l’inclusion est stricte.


3. Exercices du Chapitre 3 303

Solution. (i) On a clairement Ai ⊂ Ai et donc

Bn = ∪ni=1 Ai ⊂ ∪ni=1 Ai ⇒ Bn ⊂ ∪ni=1 Ai .

Dans l’autre sens,

Ai ⊂ ∪ni=1 Ai ⇒ Ai ⊂ ∪ni=1 Ai = Bn ⇒ ∪ni=1 Ai ⊂ Bn .

(ii) On reprend le dernier argument avec n = ∞ :

Ai ⊂ ∪∞
i=1 Ai ⇒ Ai ⊂ ∪∞
i=1 Ai = B ⇒ ∪∞
i=1 Ai ⊂ B.

En général, on n’a pas l’égalité. Il suffit de considérer l’exemple

∀i ≥ 1, Ai = {1/i} ⇒ B = {1/i : i ≥ 1} et B = B ∪ {0}

ce qui donne Ai = Ai et

∪∞
i=1 Ai = B $ B ∪ {0} = B.

Exercice 10.7
Donner un exemple d’un ensemble borné de R ayant exactement trois points
d’accumulation.
Solution. L’ensemble
     
1 1 1
: n ≥1 ∪ 1+ : n ≥ 1 ∪ 2+ : n ≥ 1
n n n

a pour points d’accumulation exactement 0,1 et 2.

Exercice 10.8
On désigne par E ′ l’ensemble des points d’accumulation d’un sous-ensemble
d’un espace métrique (X, d). Établir que E ′ est fermé et que E et E ont les mêmes
points d’accumulation. E et E ′ ont-ils toujours les mêmes points d’accumulation ?
Solution. Soit (X, d) l’espace métrique sousjacent et E ⊂ X.
(i) (E ′ )′ ⊂ E ′ . Pour montrer que E ′ est fermé dans (X, d), il suffit d’établir
que (E ′ )′ ⊂ E ′ , c’est-à-dire, tout point d’accumulation x′ ∈ X de E ′ est un point
d’accumulation de E ce qui revient à démontrer que

∀r > 0, Br′ (x′ ) ∩ E 6= ∅.

On fixe r > 0. Par définition du point d’accumulation x′ ∈ (E ′ )′ ,



Br/2 (x′ ) ∩ E ′ 6= ∅.
304 Annexe A. Corrigés des exercices

Il existe donc x′1 ∈ E ′ , x′1 6= x′ , tel que d(x′1 , x′ ) < r/2. Comme x′1 ∈ E ′ ,
′ ′
Bd(x ′ ,x′ )/3 (x1 ) ∩ E 6= ∅
1

et il existe x1 ∈ E, x1 6= x′1 , tel que d(x′1 , x1 ) < d(x′1 , x′ )/3. Donc, par l’inégalité du
triangle,

d(x′1 , x′ )
d(x1 , x′ ) ≤ d(x′1 , x′1 ) + d(x′1 , x′ ) < + d(x′1 , x′ ) < r ⇒ x1 ∈ Br (x′ ) ∩ E
3
d(x′1 , x′ )
d(x1 , x′ ) ≥ d(x′1 , x′ ) − d(x′1 x1 ) > d(x′1 , x′ ) − > 0 ⇒ x1 6= x′
3
⇒ Br′ (x′ ) ∩ E ⊃ {x1 } 6= ∅.

Comme ceci est vrai pour tout r > 0, x′ ∈ E ′ et (E ′ )′ ⊂ E ′ . Comme E ′ contient


tous ses points d’accumulation, il est fermé.
(ii) E ′ = (E)′ . Comme E ⊂ E, si x′ ∈ E ′ , alors, par définition,

∀r > 0, Br′ (x′ ) ∩ E 6= ∅ ⇒ ∀r > 0, Br′ (x′ ) ∩ E 6= ∅

et E ′ ⊂ (E)′ .
Dans l’autre sens, on veut montrer que pour x′ ∈ (E)′ , on a x′ ∈ E ′ , c-à-d.,

∀r > 0, Br′ (x′ ) ∩ E 6= ∅. (3.8)


On fixe r > 0. Comme Br/2 (x′ ) ∩ E 6= ∅, soit x̄ ∈ Br/2

(x′ ) ∩ E. Comme x̄ ∈ E est

un point d’adhérence de E et que d(x̄, x ) > 0, il vient

Bd(x̄,x′ )/3 (x̄) ∩ E 6= ∅.

Soit un point y ∈ Bd(x̄,x′ )/3 (x̄) ∩ E. Par l’inégalité du triangle

d(x̄, x′ ) r r
d(y, x′ ) ≤ d(y, x̄) + d(x̄, x′ ) < + d(x̄, x′ ) < + < r
3 6 2
d(x̄, x′ ) 2
d(y, x′ ) ≥ d(x̄, x′ ) − d(y, x̄) > d(x̄, x′ ) − = d(x̄, x′ ) > 0
3 3
⇒ y ∈ Br (x′ ) ∩ E ⇒ x′ ∈ E ′

puisque, pour tout r > 0, Br (x′ ) ∩ E 6= ∅.


(iii) (E ′ )′ = E ′ ? De la partie (i), on sait que (E ′ )′ ⊂ E ′ . Cependant, en
général, l’égalité n’est pas vérifiée. On considère, par exemple, l’ensemble
     
1 1 1
E= : n ≥1 ∪ 1+ : n ≥ 1 ∪ 2+ : n ≥ 1
n n n

qui a pour points d’accumulation exactement E ′ = {0, 1, 2}. Comme E ′ n’a que
des points isolés, (E ′ )′ = ∅. Donc, en général, (E ′ )′ $ E ′ .
3. Exercices du Chapitre 3 305

Exercice 10.9
Tout point d’un ensemble fermé E ⊂ R2 est-il point d’accumulation de E ?
Reprendre le problème en supposant E ouvert.

Solution. (i) Tout point d’un ensemble fermé n’est pas un point d’accumulation. Il
suffit de prendre E = {0} dans R.
(ii) Cependant, pour tout point x d’un ensemble ouvert E, il existe r > 0 tel
que Br (x) ⊂ E et pour tout ρ, 0 < ρ ≤ r, Bρ (x) ⊂ E, Donc

∀ρ, 0 < ρ ≤ r, Bρ′ (x) ∩ E = Bρ′ (x) 6= ∅


⇒ ∀ρ > 0, Bρ′ (x) ∩ E 6= ∅

et x ∈ E ′ . Pour un ouvert E, on a donc E ⊂ E ′ .

Exercice 10.10
Soit (X, d) un espace métrique et E un sous-ensemble de X. Montrer que
(a) ∁ int E = ∁E.
(b) Est-ce que E et int E ont le même intérieur ?
(c) Est-ce que E et int E ont la même adhérence ?

Solution. (a) ∁ int E = ∁E. Comme int E ⊂ E, on a ∁E ⊂ ∁ int E. De plus, comme


int E est ouvert, ∁ int E est fermé et

∁E ⊂ ∁ int E.

Dans l’autre sens, on montre que ∁∁E ⊂ int E ce qui implique ∁ int E ⊂ ∁E. Comme
∁∁E est ouvert, pour tout x ∈ ∁∁E, il existe r > 0 tel que

Br (x) ⊂ ∁∁E ⇒ Br (x) ∩ ∁E = ∅ ⇒ Br (x) ∩ ∁E = ∅ ⇒ Br (x) ⊂ E

et x ∈ int E.
(b) Est-ce que E et int E ont le même intérieur ? Oui car, par le Théorème 3.1
(ii) et (iii) du Chapitre 3, int E est ouvert et, si E est ouvert, alors E = int E. On
a donc int (int E) = int E.
(c) Est-ce que E et int E ont la même adhérence ? Par définition, int E ⊂ E
entraı̂ne int E ⊂ E. En général, on n’a pas l’égalité. Par exemple,

déf
E = {0} ∪ [1, 2], E = E, int E = ]1, 2[ , int E = [1, 2].

Donc, int E = [1, 2] $ {0} ∪ [1, 2], = E.


306 Annexe A. Corrigés des exercices

Exercice 10.11
Donner un exemple d’un recouvrement ouvert de l’intervalle ]0, 1[ dont on ne
peut extraire de sous-recouvrement fini.

Solution. On prend
   
déf 1 déf 1 1
Gn = ,1 , n≥1 ou Gn = ,1 − , n ≥ 1.
n n n

Exercice 10.12
Si X est un ensemble infini, on pose pour tout x, y ∈ X
(
1, si x 6= y
d(x, y) =
0, si x = y.

Montrer que d est une métrique sur X. Quels en sont les ouverts ? les fermés ? les
compacts ?

Solution. (i) d est une métrique. On voit que d : X × X → R+ . Par définition


d(x, y) = 0 si et seulement si x = y et (M1) est vérifié. L’axiome (M2) de symétrie
l’est aussi par définition. Pour l’axiome (M3), si x = y, alors d(x, y) = 0 ≤ d(x, z) +
d(z, y) pour tout z ∈ X. Si x 6= y, alors pour tout z ∈ X, ou bien x 6= z et d(x, z) = 1
ou bien y 6= z et d(y, z) = 1 :

d(x, y) = 1 ≤ d(x, z) + d(y, z).

(ii) Soit x ∈ X. En prenant r = 1/2, il vient B1/2 (x) = {x}. Par définition
tout singleton {x} de X est un ouvert. Comme les unions arbitraires d’ouverts sont
ouvertes, alors tout sous-ensemble de X est ouvert.
De même, pour tout sous-ensemble E de X, ∁E est un ouvert ce qui entraı̂ne
E = ∁(∁E) est fermé.
Pour un compact K ⊂ X, pour tout recouvrement ouvert Gα de K, il existe
un sous-recouvrement fini :

K ⊂ ∪ni=1 Gαi .

En particulier, la famille {Gx : x ∈ X}, Gx = {x}, est un recouvrement ouvert de


K. Donc

K ⊂ ∪ni=1 Gxi = {x1 , . . . , xn }

et K ne contient qu’un nombre fini de point. Réciproquement si K est fini, il a la


propriété et K est compact. On en conclut que tous les singletons sont ouvert, fermé
et compact.
3. Exercices du Chapitre 3 307

Exercice 10.13
On considère l’ensemble à deux éléments {0, 1} dans R équipé d’une métrique
arbitraire d (il en existe au moins une : d(x, y) = |x − y|).
(i) Énumérer tous les ouverts de ({0, 1}, d). Justifier.
(ii) Énumérer tous les compacts de ({0, 1}, d). Justifier.
(iii) Est-ce que ({0, 1}, d) est complet ? Justifier.
(iv) Énumérer tous les fermés de X = {0, 1, 2} pour une métrique arbitraire
dX sur X. Justifier.

Démonstration. (i) Les ensembles ∅ et X sont ouverts. Par définition de la métrique,


d(1, 0) > 0. Les ensembles {0} et {1} sont des ouverts. En effet, la boule Bd(1,0)/2 (0) =
{0} et trivialement Bd(1,0)/2 (0) ⊂ {0}. De même pour {1}.
(ii) Comme tous les sous-ensembles de X n’ont qu’un nombre fini d’éléments,
ils sont recouvrables par un sous-recouvrement fini de n’importe quel recouvrement
ouvert. Donc ils sont tous compacts et fermés.
(iii) Comme X est compact, il est complet.
(iv) Tous les sous-ensembles de X n’ont qu’un nombre fini d’éléments, ils sont
recouvrables par un sous-recouvrement fini de n’importe quel recouvrement ouvert.
Donc ils sont tous compacts et fermés.

Exercice 10.14
Soit {xn } une suite de Cauchy d’une espace métrique (X, d) ayant une valeur
d’adhérence x ∈ X. Montrer que xn → x.

Solution. Soit {xnk } la sous-suite telle que xnk → x. Par l’inégalité du triangle

d(xn , x) ≤ d(xn , xnk ) + d(xnk , x). (3.9)

Pour ε > 0, il existe N tel que


ε
∀m, n > N, d(xm , xn ) <
2
et il existe K > N tel que
ε
∀k > K, d(xnk , x) < .
2
Comme, par définition d’une sous-suite,

n1 < n2 < n3 < · · · < nk < nk+1 < . . . ,

nk ≥ k et lim nk = +∞, on a pour k > K et n > N


k→∞

ε
nk ≥ k > K > N ⇒ d(xn , xnk ) < .
2
308 Annexe A. Corrigés des exercices

Par l’inégalité du triangle (3.9)


ε ε
d(xn , x) ≤ d(xn , xnk ) + d(xnk , x) < + (3.10)
2 2
⇒ ∀n > N, d(xn , x) < ε (3.11)

et toute la suite converge vers x.

Exercice 10.15
Soit X = R muni de la métrique d(x, y) = |x − y|.
(i) Montrer que l’application
déf x
x 7→ ϕ(x) = : R → ] − 1, 1[ (3.12)
1 + |x|
est une bijection.
(ii) Vérifier que

déf x y
dϕ (x, y) = d(ϕ(x), ϕ(y)) = − (3.13)
1 + |x| 1 + |y|
est une métrique sur R.
(iii) Vérifier que la suite {n}, n ≥ 1, est dϕ -Cauchy, mais pas d-Cauchy.
Démonstration. (i) La fonction ϕ est bien définie. Pour x, y ∈ R tel que ϕ(x) = ϕ(y),
on a
x y
=
1 + |x| 1 + |y|
ce qui veut dire que x et y ont le même signe. Si x ≥ 0
x y
= ⇒ x = y;
1+x 1+y
si x < 0
x y
= ⇒ x = y.
1−x 1−y
La fonction ϕ est injective. Pour la surjectivité, on se donne y ∈ ] − 1, 1[ et on
cherche s ∈ R tel que x/(1 + |x|) = y. On voit que x doit être du même signe que
y. Il y a de nouveau deux cas. Si x ≥ 0
x y y
=y ⇒ x= = ;
1+x 1−y 1 − |y|
si x < 0
x y y
=y ⇒ x= = .
1−x 1+y 1 − |y|
3. Exercices du Chapitre 3 309

La fonction inverse
y
ϕ−1 (y) =
1 − |y|
est donc bien définie et ϕ est bijective.
(ii) Par définition, dϕ (x, y) = d(ϕ(x), ϕ(y)) ≥ 0 puisque d est une métrique.
Comme ϕ est une bijection, on a M1

dϕ (x, y) = d(ϕ(x), ϕ(y)) = 0 ⇐⇒ ϕ(x) = ϕ(y) ⇐⇒ x = y.

Pour M2

dϕ (x, y) = d(ϕ(x), ϕ(y)) = d(ϕ(y), ϕ(x)) = dϕ (y, x).

Pour M3

d(ϕ(x), ϕ(z)) ≤ d(ϕ(x), ϕ(y)) + d(ϕ(y), ϕ(z))


⇒ dϕ (x, z) ≤ dϕ (x, y) + dϕ (y, z).

(iii) On considère la suite d’entiers naturels {n} pour laquelle

n+m n m 1
dϕ (n + m, n) = − = < .
1+n+m 1+n (1 + n + m)(1 + n) 1+n

Pour ε > 0, soit N un entier naturel plus grand que 1/ε − 1, Alors, pour tout n > N
et tout m ≥ 1
1 1
dϕ (n + m, n) < < <ε
1+n 1+N
et {n} est dϕ -Cauchy.

Exercice 10.16
Soient (X, d) un espace métrique complet et {En } une suite décroissante de
fermés bornés non-vides tel que

lim diam (En ) = 0.


n→∞

Montrer que ∩∞
n=1 En est un singleton.

Solution. Comme limn→∞ diam (En ) = 0, il existe une sous-suite {Enk } telle que
1
∀k ≥ 1, diam (Enk ) < .
2k
Pour chaque k on choisit un point xk ∈ Enk . Comme Enk+1 ⊂ Enk , on a

1
∀k ≥ 1, d(xk+1 , xk ) ≤ diam (Enk ) < .
2k
310 Annexe A. Corrigés des exercices

La suite {xk } est Cauchy : pour tout k ≥ 1 et tout m ≥ 1


m−1
X 1 1
d(xk+m , xk ) ≤ ≤ k−1 .
i=0
2k+i 2

Comme X est complet, il existe x ∈ X tel que xk → x. Étant donné que nk ≤ k, on


a Enk ⊂ Ek et la suite {xk } se retrouve donc dans chaque Ek à partir d’un certain
rang et comme chaque Ek est fermé, x ∈ Ek . Donc
déf
x ∈ E = ∩∞
n=1 En .

Si E n’est pas un singleton, alors diam E > 0 et comme E ⊂ En

∀n ≥ 1, diam En ≥ diam E > 0,

ce qui contredirait l’hypothèse que diam En → 0.

Exercice 10.17
On dit qu’un espace métrique est séparable s’il contient un sous-espace dé-
nombrable et dense. Montrer que Rk est séparable.
Solution. Il suffit de prendre le sous-espace Qk . Comme Q est dénombrable, Qk est
dénombrable par le Théorème 2.3 du Chapitre 2. De la même façon, comme Q est
dense dans R, Qk est dense dans Rk .

Exercice 10.18
On dit qu’une famille d’ouverts {Oα } est une base de X si tout ouvert de X
est la réunion d’ouverts de cette famille. Montrer qu’un espace métrique séparable
posssède une base dénombrable.
Solution. Soit S le sous-espace dénombrable dense de (X, d). On associe à chaque
s ∈ S la famille de boules ouvertes
déf
{Bq (s) : 0 < q ∈ Q} et B = {Bq (s) : 0 < q ∈ Q et s ∈ S} (3.14)

Comme il y a bijection
déf
(s, q) 7→ Bq (s) : S × Q+ , Q+ , = {q ∈ Q : q > 0

la famille d’ouverts B = {Bq (s)} est dénombrable.


Si O est un ouvert de (X, d), alors pour tout point x ∈ O, il existe r ∈ R+
tel que Br (x) ⊂ O. Par densité de S, il existe sx ∈ S tel que d(x, sx ) < r/3. Donc
Br/2 (sx ) ⊂ Br (x) ⊂ O et x ∈ Br/2 (sx ) puisque
r r
∀z ∈ Br/2 (sx ), d(x, z) ≤ d(x, sx ) + d(sx , z) < + <r
2 3
r r
d(x, sx ) < < ⇒ x ∈ Br/2 (sx ) ⊂ Br (x) ⊂ O.
3 2
3. Exercices du Chapitre 3 311

Enfin, par densité de Q dans R, il existe qr ∈ Q+ tel que r/3 < qr < r/2. On a donc
r r r
∀z ∈ Bqr (sx ), d(x, z) ≤ d(x, sx ) + d(sx , z) < + qr < + < r
3 3 2
r
d(x, sx ) < < qr ⇒ x ∈ Bqr (sx ) ⊂ Br (x) ⊂ O.
3
On a montré que, pour chaque x ∈ O, il existe sx ∈ S et qx ∈ Q+ tel que
x ∈ Bqx (sx ) ⊂ Br (x) ⊂ O
⇒ O⊂∪ s∈S et ∃q∈Q+ Bq (s) ⊂ O.
tel que Bq (s)⊂O

La famille B est donc bien une base séparable de (X, d).

Exercice 10.19
Soit un espace métrique (X, d) dans lequel tout sous-ensemble infini possède
au moins un point d’accumulation. Démontrer que X est séparable. Indication :
Soit r > 0 et x1 ∈ X ; ayant déterminé x1 . . . . , xj ∈ X, choisir, s’il existe, un point
xj+1 tel que d(xj , xj+1 ) ≥ r pour tout i = 1, . . . , j. Montrer que cette construction
s’arrête au bout d’un nombre fini de boules ouvertes de rayon r. Prendre r = 1/n
(n = 1, 2, 3, . . . ) et considérer les centres des boules correspondantes.
Solution. Soit r > 0 et x1 ∈ X ; ayant déterminé x1 . . . . , xj ∈ X, choisir, s’il existe,
un point xj+1 tel que d(xj , xj+1 ) ≥ r pour tout i = 1, . . . , j.
Si la construction ne s’arrète pas après un nombre fini d’étapes, on obtient
une suite infinie de points distincts S = {xi : i ∈ N}. Par hypothèse, cet ensemble
possède au moins un point d’accumulation x ∈ X :
∀ρ > 0, Bρ′ (x) ∩ S 6= ∅.
Pour ρ = r/4, Bρ′ (x) ∩ S contient une infinité de points de S et
r
∀s ∈ Bρ′ (x) ∩ S, d(s, x) < .
4
Donc pour tous points s1 et s2 de Bρ′ (x) ∩ S, s1 6= s2 ,
r r r
d(s1 , s2 ) ≤ d(s1 , x) + d(s2 , x) < + = < r
4 4 2
ce qui contredit le fait que par construction tous les points de S sont distants d’au
moinst r.
Pour r = 1, soit x1,1 , . . . , x1,N1 } la suite finie associée ; pour r = 1/2, soit
x2,1 , . . . , x2,N2 } la suite finie associée ; pour r = 1/n, soit xn,1 , . . . , xn,Nn } la suite
finie associée. L’union E de toutes ces suites est au plus dénombrable.
Cet ensemble est dense dans X. En effet, supposons qu’il existe x ∈ X et ε > 0
tel que pour tout xn,jn ∈ S, d(x, xn,jn ) ≥ ε. Soit n ∈ N tel que 1/n < ε. Donc,
1
∀jn , 1 ≤ jn ≤ Nn , d(x, xn,jn ) ≥ ε >
n
et ceci contredit la construction des points xn,jn pour r = 1/n car on pourrait y
ajouter x qui est à une distance plus grande que 1/n de tous les autres.
312 Annexe A. Corrigés des exercices

Exercice 10.20
Démontrer que tout espace métrique compact K a une base dénombrable et
qu’il est donc séparable. Indication : pour tout entier n > 0, il existe un nombre
fini de boules ouvertes de rayon 1/n recouvrant K.

Solution. Si K ne possède qu’un nombre fini de points {x1 , x2 , . . . , xn }, ils sont


isolés et l’on peut associer à chacun d’entre eux la boule ouverte de rayon
déf
ri = inf d(xj , xi ) > 0.
1≤j≤
j6=i

Si K possède un nombre de points infini, alors comme K est compact, il contient


un point d’accumulation par le Théorème 7.3 du Chapitre 3 et on peut appliquer
les résultats de l’Exercice 10.19.

4 Exercices du Chapitre 4
Exercice 10.1
Soit f : X → Y . Alors l’application induite f −1 : P(Y ) → P(X) préserve les
opérations élémentaires suivantes :
(1) f −1 (∪α Bα ) = ∪α f −1 (Bα ).
(2) f −1 (∩α Bα ) = ∩α f −1 (Bα ).
(3) f −1 (B1 \B2 ) = f −1 (B1 )\f −1 (B2 ).

Démonstration. (1) Bα ⊂ ∪α Bα implies

f −1 (Bα ) ⊂ f −1 (∪α Bα ) ⇒ ∪α f −1 (Bα ) ⊂ f −1 (∪α Bα ).

Si x ∈ f −1 (∪α Bα ), alors f (x) ∈ ∪α Bα et il existe α tel que f (x) ∈ Bα . Donc,


x ∈ f −1 (Bα ) et x ∈ ∪α f −1 (Bα ). Même type d’argument pour (2).
Pour (3), on peut faire le raisonnement suivant en utilisant (2) :

B1 \B2 = B1 ∩ (Y \B1 ) ⇒ f −1 (B1 \B2 ) = f −1 (B1 ) ∩ f −1 (Y \B2 )


f −1 (Y \B2 ) = {x ∈ X : f (x) ∈ Y \B2 }
= {x ∈ X : f (x) ∈ / f −1 (B2 )}
/ B2 } = {x ∈ X : x ∈
= X\f −1 (B2 ).

On obtient donc

f −1 (B1 \B2 ) = f −1 (B1 ) ∩ f −1 (Y \B2 )


= f −1 (B1 ) ∩ (X\f −1 (B2 )) = f −1 (B1 )\f −1 (B2 )

puisque f −1 (B1 ) ⊂ X.
4. Exercices du Chapitre 4 313

Exercice 10.2
Soit f : X → Y . Alors l’application induite f : P(X) → P(Y ) préserve les
opérations suivantes :
(1) f (∪α Bα ) = ∪α f (Bα ).
(2) f (∩α Bα ) ⊂ ∩α f (Bα ).
Démonstration. Même type d’argument que pour l’Exercice 10.1.

Exercice 10.3
Soit f : X → Y . Alors
(1) pour chaque A ⊂ X, f −1 [f (A)] ⊃ A.
(2) pour chaque A ⊂ X et B ⊂ Y ,
 
f A ∩ f −1 (B) = f (A) ∩ B (4.1)
et, en particulier,
 
f f −1 (B) = f (X) ∩ B. (4.2)
Démonstration. (1) Par définition,
f −1 (f (A)) = {x ∈ X : f (x) ∈ f (A)} ⊃ {x ∈ A : f (x) ∈ f (A)} = A.
(2) Par définition,
A ∩ f −1 (B) = A ∩ {x ∈ X : f (x) ∈ B} = {x ∈ A : f (x) ∈ B}
⇒ f (A ∩ f −1 (B)) = {f (x) : x ∈ A et f (x) ∈ B} = f (A) ∩ B.
Enfin, on applique la formule avec A = X.

Exercice 10.4
Soit f : X → Y et g : Y → Z. Alors (g ◦ f )−1 = f −1 ◦ g −1 .
Démonstration. Comme chaque application inverse induite est bien définie
f −1 : P(Y ) → P(X) et g −1 : P(Z) → P(Y ),
la composition g −1 ◦ f −1 : P(Z) → P(X) est bien définie. De même la composition
des applications induites est bien définie
f : P(X) → P(Y ) et g : P(Y ) → P(Z) ⇒ f ◦ g : P(X) → P(Z).
Pour C ∈ P(Z)
(g ◦ f )−1 (C) = {x ∈ X : g(f (x)) ∈ C}
= {x ∈ X : f (x)) ∈ g −1 (C)}
= f −1 (g −1 (C)) = (f −1 ◦ g −1 )(C)).
Donc (g ◦ f )−1 = f −1 ◦ g −1 .
314 Annexe A. Corrigés des exercices

Exercice 10.5
(i) Soit un ensemble arbitraire X et soit {Aα } un recouvrement de X par des
sous-ensembles de X.
(ii) Soit Y un autre ensemble et une famille fα : Aα → Y d’applications tel
que

∀α, β, fα |Aα ∩Aβ = fβ |Aα ∩Aβ .

Alors, il existe une application unique f : X → Y qui est un prolongement de


chaque fα :

∀α, f |A α = f α .

Démonstration. Soit x ∈ X. Comme {Aα } est un recouvrement de X, on pose


déf
f (x) = fα (x)

pour un α tel que x ∈ Aα . La fonction f est bien définie car s’il existe un β 6= α tel
que x ∈ Aβ , alors, par hypothèse, f (x) = fα (x) = fβ (x). L’application f est unique
car s’il y en avait une seconde f ′ , on aurait

f ′ | A α = f α = f |A α ⇒ f ′ = f sur X = ∪Aα .

Exercice 10.6
Soit f : X → Y et g : Y → X tel que g ◦ f = IX où IX est la fonction identité
sur X. Alors f est injective et g est surjective.
Démonstration. L’application f est injective puisque, pour tous x, x′ ∈ X,

f (x) = f (x′ ) ⇒ x = g(f (x)) = g(f (x′ )) = x′ .

L’application g est surjective puisque, pour tout z ∈ X,

z = g(f (z)),

c-à-d., il existe f (z) ∈ Y tel que z = g(f (z)).

Exercice 10.7
Soit f : (X, dX ) → R une application continue. Montrer que
déf
f −1 {0} = {x ∈ X : f (x) = 0} (4.3)

est fermé dans (X, d).


Démonstration. Comme l’ensemble {0} est fermé dans R, son image inverse pour
une fonction continue est fermée par le Théorème 3.3.
4. Exercices du Chapitre 4 315

Exercice 10.8
Soient f, g : (X, dX ) → (Y, dY ) deux applications continues entre deux espaces
métriques et E un sous-ensemble dense dans (X, d). Montrer que
(i) f (E) est dense dans (f (X), dY ) ;
(ii) f = g sur E entraı̂ne f = g sur X.

Démonstration. (i) De la Définition 6.6 du Chapitre 3, E ⊂ X est dense dans X si


tout point de X est un point d’adhérence de E (ou encore E = X). Par le Théorème
3.3 du Chapitre 4, pour une fonction continue on a

f (E) ⊂ f (X) = f (E) ⊂ f (E).

Comme f (E) est fermé, f (X) = f (E) et f (E) est dense dans f (X).
(ii) Soit x ∈ X. Par densité de E dans X, il existe une suite {xn } dans E qui
dX -converge vers x. Par continuité de f , f (xn ) → f (x) dans (Y, dY ). Comme f = g
sur E, g(xn ) = f (xn ) et, par continuité de g, g(xn ) → g(x). Par unicité de la limite
dans (Y, dY ), f (x) = g(x).

Exercice 10.9
(i) On se donne la fonction f : R2 → R
 
xy 2
déf , si (x, y) 6= (0, 0)
f (x, y) = x2 + y 4
 
0, si (x, y) = (0, 0)

Montrer que f est bornée sur R2 et n’est pas continue en (0, 0), mais que
sa restriction à toute droite passant par (0, 0) est continue.
(ii) On se donne la fonction g : R2 → R
 
 xy 2
déf , si (x, y) 6= (0, 0)
g(x, y) = x2 + y 6
 
0, si (x, y) = (0, 0)

Montrer que g n’est bornée sur aucun voisinage de (0, 0) et n’est pas conti-
nue en (0, 0), mais que sa restriction à toute droite passant par (0, 0) est
continue.

Démonstration. (i) Pour (x, y) 6= (0, 0), on a

xy 2 1 xy 2 1
0 ≤ (x ± y 2 )2 = x2 + y 4 ± 2 x y 2 ⇒ ∓ 2 4
≤ ⇒ 2 4
≤ .
x +y 2 x +y 2

Comme f (0, 0) = 0, on a |f (x, y)| ≤ 1/2 sur R2 .


316 Annexe A. Corrigés des exercices

Si l’on se donne la droite D = {t (v, w) : t ∈ R passant par (0, 0) de direction


(v, w), on a pour t 6= 0
 
2

 (tv) (tw) , 
si (v, w) 6= (0, 0)
f (tv, tw) − f (0, 0) = (tv)2 + (tw)4

 0, 
si (v, w) = (0, 0)
 
 v w2
, si (v, w) 6= (0, 0)
=t v 2 + t2 w 4 .
 
0, si (v, w) = (0, 0)

Si w = 0 ou v = 0, cette différence est 0, f (tv, tw) = f (0, 0) et pour toute suite


tn → 0, tn =
6 0, f (tn v, tn w) → f (0, 0). Si v 6= 0 et w 6= 0, alors

v w2 w2
t →0 = 0.
v2 2
+t w 4 v
On a donc bien la continuité en (0, 0) le long de droites passant par (0, 0).
Pour montrer que f est discontinue en (0, 0), on suit le chemin x = y 2 ce qui
donne
 4 
 y 1
= , si y 6= 0
f (y 2 , y) = y 4 + y 4 2 .
 
0, si y = 0

Donc, pour la suite (xn , yn ) = (1/n2 , 1/n) → (0, 0),

1
f (1/n2 , 1/n)) = 6→ 0 = f (0, 0).
2
(ii) Pour montrer que que f n’est pas continue en (0, 0), on suit le chemin
x = y 2 ce qui donne
 
 y4 1
2 4 6
= , si y 6= 0
g(y , y) = y + y 1 + y2
 
0, si y = 0
⇒ g(y 2 , y) → 1 6= 0 = f (0, 0) lorsque y → 0.

Pour la bornitude, on prend le chemin x = y 3 ce qui donne


 
 y5 1 
= , si y 6
= 0
g(y 3 , y) = y 6 + y 6 2y
 
0, si y = 0
n
⇒ g((1/n)3 , 1/n) = → +∞ = 6 0 = f (0, 0) lorsque n → ∞.
2
g n’est donc bornée dans aucun voisinage de (0, 0).
4. Exercices du Chapitre 4 317

Enfin le long de la droite D = {t (v, w) : t ∈ R passant par (0, 0) de direction


(v, w), on a pour t 6= 0
 

 tv (tw)2 
, si (v, w) 6= (0, 0)
g(tv, tw) − g(0, 0) = (tv)2 + (tw)6

 0, 
si (v, w) = (0, 0)
 
 v w2
, si (v, w) 6= (0, 0)
=t v 2 + t4 w 6 ,
 
0, si (v, w) = (0, 0)

En examinant chaque cas, il vient g(tv, tw) → g(0, 0) lorsque t → 0, t 6= 0.

Exercice 10.10
Démontrer que l’on peut remplacer la définition de la continuité uniforme sur
X par : pour tout ε > 0, il existe δ > 0 tel que

∀E ⊂ X tel que diam (E) < δ, diam f (E) < ε. (4.4)

Démonstration. De la Définition 6.1, une fonction f : (X, dX ) → (Y, dY ) entre deux


espaces métriques est uniformément continue sur X si, pour tout ε > 0, il existe
δ > 0 tel que

∀x, x′ ∈ X pour lesquels dX (x′ , x) < δ, dY (f (x′ ), f (x)) < ε.

Pour tout E ⊂ X tel que diam (E) < δ, on a, par définition du diamètre,

diam (E) = sup{dX (x′ , x) : x, x′ ∈ E} < δ ⇒ ∀x, x′ ∈ E, dX (x, x′ ) < δ



⇒ dY (f (x), f (x )) < ε ⇒ diam f (E) = sup{dY (f (x′ ), f (x)) : x, x′ ∈ E} < ε.

Dans l’autre sens, on part de (4.4). On a

X = ∪x∈X Bδ/2 (x) et diam Bδ/2 (x) < δ.

Donc

∀x′ ∈ X tel que dX (x′ , x) < δ/2, diam f (E) < ε


⇒ dY (f (x′ ), f (x)) ≤ diam f (E) < ε.

Mais ceci est vrai pour tout x ∈ X :

∀x, ∀x′ ∈ X tel que dX (x′ , x) < δ/2, dY (f (x′ ), f (x)) < ε

et f est uniformément continue sur X.


318 Annexe A. Corrigés des exercices

Exercice 10.11
Démontrer.
(i) La composition g◦f de deux fonctions f : (X, dX ) → (Y, dY ) uniformément
continue sur E ⊂ X et g : (Y, dY ) → (Z, dZ ) uniformément continue sur
f (E) ⊂ Y est uniformément continue sur X
(ii) La composition g ◦ f de deux fonctions f : (X, dX ) → (Y, dY ) lipschit-
zienne en x ∈ X et g : (Y, dY ) → (Z, dZ ) lipschitzienne en f (x) ∈ Y est
lipschitzienne en x ∈ X.
Démonstration. (i) Par hypothèse, pour tout ε > 0 il existe η > 0 tel que

∀y, y ′ ∈ f (E), dY (y, y ′ ) < η, dZ (g(y), g(y ′ )) < ε


et il existe δ > 0 tel que

∀x, x′ ∈ E, dX (x, x′ ) < δ, dY (f (x), f (x′ )) < η ⇒ dZ (g(f (x)), g(f (x′ ))) < ε.

(ii) Par définition, il existe c(f (x)) et r(f (x)) > 0 tel que
∀y,1 y2 ∈ Br(f (x)) (f (x)), dZ (g(y1 ), g(y2 )) ≤ c(f (x)) dY (y1 , y2 )

et il existe c(x) et r(x) > 0 tel que


∀x1 , x2 ∈ Br(x) (x), dY (f (x1 ), f (x2 )) ≤ c(x) dX (x1 , x2 ).

On réduit le rayon de Br(x) (x) ⊂ X pour que son image tombe dans la boule
Br(f (x)) (f (x)) ⊂ Y . On choisit le rayon ρ(x) = min{r(x), r(f (x))/c(x)}

∀x1 , x2 ∈ Bρ(x) (x), dY (f (xi ), f (x)) ≤ c(x) dX (xi , x)


< min{r(x) c(x), r(f (x))} ≤ r(f (x))
⇒ f (xi ) ∈ Br(f (x)) (f (x)), i = 1, 2
⇒ dZ (g(f (x1 )), g(f (x2 ))) ≤ c(f (x)) dY (f (x1 ), f (x2 )).
⇒ dZ (g(f (x1 )), g(f (x2 ))) ≤ c(f (x)) dY (f (x1 ), f (x2 )) ≤ c(f (x)) c(x) dX (x1 , x2 )
et g◦f est lipschitzienne en x pour la boule Bρ(x) (x) et la constante c(f (x)) c(x).

Exercice 10.12
On dit qu’une application f : (X, dX ) → (Y, dY ) est ouverte si l’image f (O)
de tout ouvert O dans X est ouverte dans Y . Montrer qu’une application f : R → R
continue et ouverte est monotone.
Démonstration. On montre d’abord que f est injective. Soit x1 et x2 tel que f (x1 ) =
f (x2 ). Supposons sans perte de généralité que x1 < x2 . Comme [x1 , x2 ] est compact
et que f est continue
∃a ∈ [x1 , x2 ] tel que f (a) = inf f ([x1 , x2 ])
∃b ∈ [x1 , x2 ] tel que f (b) = sup f ([x1 , x2 ]).
4. Exercices du Chapitre 4 319

Si f (a) < f (x1 ), alors x1 < a < x2 et f (a) ∈ f ((x1 , x2 )). Comme f est ouverte,
l’image f ((x1 , x2 )) est ouverte et il existe r > 0 tel que Br (f (a)) ⊂ f ((x1 , x2 )) ce
qui signifierait qu’il existe z ∈ (x1 , x2 ) tel que f (z) = f (a) − r/2 ce qui contredirait
la minimalité de f (a). Donc f (x1 ) = f (a). Par le même argument appliqué au sup, il
vient f (x1 ) = f (b). La fonction f est donc constante et égale à f (x1 ) sur l’intervalle
(x1 , x2 ). Mais ceci contredit le fait que f est ouverte car f ((x1 , x2 )) = {f (x1 )} serait
fermée. f est donc injective.
Soit x1 < x2 . Comme f est injective f (x1 ) 6= f (x2 ). Supposons que f (x1 ) <
f (x2 ). On démontre d’abord que f est strictement croissante sur [x1 , x2 ]. Par le
raisonnement pécédent on a

f (x1 ) = inf f ([x1 , x2 ]) et f (x2 ) = sup f ([x1 , x2 ]).

Soient deux points x, y tel que x1 ≤ x < y ≤ x2 . On veut démontrer que f (x) <
f (y). Par injectivité de f , f (x) 6= f (y). Supposons que f (x) > f (y). Par injectivité
de f , ceci implique que f (x1 ) < f (y) < f (x) < f (x2 ) et x1 < x < y < x2 . Par le
théorème des valeurs intermédiaires, il existe z ∈ (y, x2 ) tel que f (z) = f (x) ce qui
contredit le fait que f est injective.
Il reste à démontrer que f est croissante sur R. Il suffit de démontrer qu’elle
est strictement croissante sur tout intervalle [a, b] tel que a < x1 < x2 < b. Ceci
découle des inégalités suivantes :

inf f ([a, b]) ≤ inf f ([x1 , x2 ]) = f (x1 ) < f (x2 ) = sup f ([x1 , x2 ]) ≤ sup f ([a, b]).

Par le même raisonnement que sur [x1 , x2 ], on démontre que f (a) = inf f ([a, b]) et
que f (b) = sup f ([a, b]). De là, f est strictement croissante sur [a, b].
Si l’on avait supposé que f (x1 ) > f (x2 ), on aurait obtenu que f est décroissante
sur R. Dans les deux cas f est monotone sur R.

Exercice 10.13
Soient deux espaces métriques (X, dX ) et (Y, dY ) et leur produit
déf
X × Y = {(x, y) : x ∈ X et y ∈ Y } . (4.5)

(i) Montrer que


déf
((x, y), (x′ , y ′ )) 7→ dX×Y ((x, y), (x′ , y ′ )) = dX (x, x′ ) + dY (y, y ′ )
(4.6)
: (X × Y ) × (X × Y ) → R+

définit une métrique sur X × Y .


(ii) Montrer que la projection sur X
déf
(x, y) 7→ pX (x, y) = x : (X × Y, dX×Y ) → (X, dX )

est lipschitzienne sur X × Y .


320 Annexe A. Corrigés des exercices

Démonstration. (i) Voir l’Exercice 10.4 du Chapitre 3.


(ii) En effet,

dX (pX (x, y), pX (x′ , y ′ ))


= dX (x, x′ ) ≤ dX (x, x′ ) + dY (y, y ′ ) = dX×Y ((x, y), (x′ , y ′ )).

La projection est donc lipschitzienne de constante 1.

Exercice 10.14
On dénote par dn (y, x) = ky − xkRn la métrique euclidienne sur Rn , n ≥ 1 un
entier. Soit le pole nord p = (0, 0, 1) ∈ R3 de la sphère de rayon un
 q 
déf déf
S (2) = x = (x1 , x2 , x3 ) : kxkR3 = x21 + x22 + x23 = 1 ⊂ R3 .

(i) Montrer que l’application


 
déf x1 x2
x = (x1 , x2 , x3 ) 7→ ϕ(x) = , : S (2) \{p} → R2 (4.7)
1 − x3 1 − x3

est une bijection et donner l’expression de l’application inverse ϕ−1 .


(ii) Montrer que ϕ : (S (2) \{p}, d3 ) → (R2 , d2 ) est un homéomorphisme. (On
peut supposer que toute fonction polynômiale est continue et utiliser les
théorèmes sur le produit et le quotient d’applications continues.)
(iii) Montrer que la fonction
déf
(x, y) 7→ ρ(x, y) = d3 (ϕ−1 (x), ϕ−1 (y)) : R2 × R2 → R+ (4.8)

est une métrique sur R2 .


(iv) Montrer que l’application ϕ : (S (2) \{p}, d3) → (R2 , ρ) est une isométrie et
c2 , ρ̂) de (R2 , ρ).
donc une isométrie de (S (2) \{p}, d ) dans le complété (R
3
c2 , ρ̂) de (R2 , ρ) est compact.
(v) Montrer que le complété (R
Solution. (i) En effet, ϕ est injective car pour ϕ(x) = ϕ(x′ ) tel que x21 + x22 + x23 =
1 = (x′1 )2 + (x′2 )2 + (x′3 )2 , on a
x1 x′1 x2 x′2
= et = (4.9)
1 − x3 1 − x′3 1 − x3 1 − x′3
 2  2  2  2
1 − x23 x1 x2 x′1 x′2 1 − (x′3 )2
2 = 1 − x3
+
1 − x3
=
1 − x3′ +
1 − x3′ = 2
(1 − x3 ) (1 − x′3 )
1 + x3 1 − x23 1 − (x′3 )2 1 + x′3
⇒ = 2 = 2 =
1 − x3 (1 − x3 ) (1 − x′3 ) 1 − x′3
⇒ (1 + x3 ) (1 − x′3 ) = (1 + x′3 ) (1 − x3 ) (4.10)
⇒ 1 + x3 − x′3 − x3 x′3 =1+ x′3 − x3 − x3 x′3 ⇒ x′3 = x3 .
4. Exercices du Chapitre 4 321

Enfin, de (4.9), il vient x′2 = x2 et x′1 = x1 .


L’application ϕ est aussi surjective. Soit y = (y1 , y2 ) ∈ R2 . On cherche x =
(x1 , x2 , x3 ) tel que
x1 x2
= y1 = y2 et x21 + x22 + x23 = 1
1 − x3 1 − x3
 2  2
1 + x3 1 − x23 x1 x2
= = + = y12 + y22
1 − x3 (1 − x3 )2 1 − x3 1 − x3
y12 + y22 − 1 2
⇒ x3 = et 1 − x3 = 2
y12 + y22 + 1 y1 + y22 + 1
2 y1 2 y2
⇒ x1 = 2 2 et x2 = 2 .
y1 + y2 + 1 y1 + y22 + 1
On remarque aussi que x = (x1 , x2 , x3 ) 6= (0, 0, 1) = p puisque cela donnerait
y1 = y2 = 0 et la contradiction −1 = +1.
La fonction inverse est donc
 
−1 2 y1 2 y2 y12 + y22 − 1
(y1 , y2 ) 7→ ϕ (y1 , y2 ) = , ,
y12 + y22 + 1 y12 + y22 + 1 y12 + y22 + 1 (4.11)
: (R2 , d2 ) → (S (2) \{p}, d3 )

(ii) Les applications ϕ et ϕ−1 sont continues comme quotients de polynômes


puisque les dénominateurs sont différents de 0 : ϕ est donc un homéomorphisme.
(iii) On vérifie les trois axiomes d’une métrique. Pour (M1), si x = y, alors
ρ(x, y) = d3 (ϕ−1 (x), ϕ−1 (y)) = 0. Réciproquement, si ρ(x, y) = 0, on a (ϕ−1 (x) =
ϕ−1 (y) et x = y. Pour (M2), comme d3 est une métrique,

ρ(x, y) = d3 (ϕ−1 (x), ϕ−1 (y)) = d3 (ϕ−1 (y), ϕ−1 (x)) = ρ(y, x).

Pour (M3) et x, y, z

d3 (ϕ−1 (x), ϕ−1 (z)) ≤ d3 (ϕ−1 (x), ϕ−1 (y)) + d3 (ϕ−1 (y), ϕ−1 (z))
⇒ ρ(x, z) ≤ ρ(x, y) + ρ(y, z).

(iv) Avec la nouvelle métrique, la fonction ϕ : (S (2) \{p}, d3 ) → (R2 , ρ) est


toujours une bijection. Par définition, ρ, il vient pour tout x, y dans (S (2) \{p}

ρ(ϕ(x), ϕ(x)) = d3 (ϕ−1 (ϕ(x)), ϕ−1 (ϕ(y))) = d3 (x, y)

ce qui caractérise bien une isométrie.


c2 , ρ̂) le complété de (R2 , ρ) et i : (R2 , ρ) → (R
Soit (R c2 , ρ̂) l’injection isométrique
c2 , ρ̂) (cf. Théorème 6.5 du Chapitre 3). La composition i ◦ ϕ
dense de (R2 , ρ) dans (R
ϕ i c2 , ρ̂)
(S (2) \{p}, d3 ) −→ (R2 , ρ) −→ (R

est donc aussi une isométrie qui possède un prolongement uniformément continu ϕ b
à l’adhérence (S (2) \{p}, d3 ) qui est égale à S (2) (Théorème 6.3 du Chapitre 4).
322 Annexe A. Corrigés des exercices

Soit j : (S (2) \{p}, d3 ) → (S (2) , d3 ) l’injection de (S (2) \{p}, d3) dans son
adhérence (S (2) \{p}, d3 ) qui est égale à S (2) . La composition j ◦ ϕ−1
ϕ−1 j
(R2 , ρ) −→ (S (2) \{p}, d3) −→ S (2)

est donc aussi une isométrie qui possède un prolongement uniformément continu ψb
c2 , ρ̂) (Théorème 6.3 du Chapitre 4).
au complété (R
Les compositions ϕ c2 , ρ̂) → (R
b ◦ ψb : (R c2 , ρ̂) et ψb ◦ ϕb : S (2) → S (2) coincı̈dent
2 (2)
avec l’identité sur les sous-ensembles denses R et S \{p}. Par l’Exercice 10.8,
elles sont donc égales à l’identité et ϕ b est une bijection. Son inverse et elle sont
uniformément continues. En fait, comme ρ̂(x, y) = ρ(x, y) = d3 (ϕ−1 (x), ϕ−1 (y)),
sur R2 , il vient ρ̂(x, y) = d3 (ϕb−1 (x), ϕb−1 (y)) par densité et ϕ b est une isométrie.
(v) Comme ϕ̂ : S (2) c2
→ (R , ρ̂) est un homéomorphisme, elle est continue.
Enfin, comme la sphère S (2) est compacte dans (R3 , d3 ), son image par ϕ̂ :
c2 = ϕ(S
R b (2) )

c2 , ρ̂) (cf. Théorème 4.1 du Chapitre 4).


est compacte dans (R

5 Exercices du Chapitre 5
Exercice 8.1
Soit {fn } une suite de fonctions dans C 0 (K), K ⊂ Rn compact. Montrer que
si {fn } est uniformément équicontinue et que pour chaque x ∈ K, la suite {fn (x)}
dans R converge vers une fonction f : K → R,

fn (x) → f (x),

alors {fn } converge uniformément vers f . (Une famille de fonctions {fα }, fα : K →


R, est uniformément équicontinue si, pour chaque ε > 0, il existe δ > 0 tel que

∀α, ∀y, ky − xk < δ, |fα (y) − fα (x)| < ε.)

Solution. (i) On montre d’abord que f est uniformément continue sur K. Par hy-
pothèse la famille {fn } est uniformément équicontinue sur K si

∀ε > 0, ∃δ > 0, ∀n ≥ 1, ∀x, y ∈ K tel que kx − yk < δ, |fn (x) − fn (y)| < ε/3.

Pour x, y ∈ K tel que kx − yk < δ et tout n ≥ 1, on a

|f (x) − f (y)| ≤ |f (x) − fn (x)| + |fn (x) − fn (y)| + |f (y) − fn (y)|


≤ |f (x) − fn (x)| + ε/3 + |f (y) − fn (y)|.

Comme fn converge simplement vers f , il existe Nx et Ny tels que

∀n > Nx , |f (x) − fn (x)| < ε/3 et ∀n > Ny , |f (y) − fn (y)| < ε/3.
5. Exercices du Chapitre 5 323

Donc, pour tous x, y ∈ K tel que kx − yk < δ et tout n ≥ max{Nx , Ny }, on a

|f (x) − f (y)| < ε/3 + ε/3 + ε/3 = ε


⇒ ∀x, y ∈ K tel que kx − yk < δ, |f (x) − f (y)| < ε

et f est uniformément continue sur K.


(ii) Pour la convergence uniforme de {fn } vers f sur K, on part de la continuité
uniforme de f sur K :

∀ε > 0, ∃δ > 0, ∀x, y ∈ K tel que kx − yk < δ, |f (x) − f (y)| < ε/3

et on veut montrer qu’il existe N tel que

∀n > N, ∀x ∈ K, |fn (x) − f (x)| < ε.

La famille de boules ouvertes {Bδ (x) : x ∈ K} est un recouvrement ouvert de


K. Comme K est compact, il existe une suite finie x1 , . . . , xm dans K tel que K ⊂
∪m
i=1 Bδ (xi ). Comme, il y a convergence simple, fn (xi ) → f (xi ) et il existe Ni tel que
pour tout n > Ni , |fn (xi ) − f (xi )| < ε/3. Donc, pour n > N = max{N1 , . . . , Nm }

∀n > N, ∀i, |fn (xi ) − f (xi )| < ε/3. (5.1)

Par équicontinuité uniforme de la famille {fn } sur K et continuité uniforme de f


sur K
kx − xi k < δ ⇒ ∀n ≥ 1, |fn (x) − fn (xi )| < ε/3
(5.2)
et |f (x) − f (xi )| < ε/3.

Enfin, en utilisant (5.2), pour chaque x ∈ K, il existe i tel que kx − xi k < δ et on a


pour le premier et le troisième terme

|fn (x) − f (x)| ≤ |fn (x) − fn (xi )| + |fn (xi ) − f (xi )| + |f (xi ) − f (x)|
< ε/3 + |fn (xi ) − f (xi )| + ε/3

par équicontinuité uniforme de la famille {fn } sur K et continuité uniforme de f


sur K. Enfin, de (5.1), on a pour le second terme

∀n > N, ∀x ∈ K |fn (x) − f (x)| < ε/3 + |fn (xi ) − f (xi )| + ε/3
< ε/3 + ε/3 + ε/3 = ε.

Par définition, {fn } converge uniformément vers f sur K.

Exercice 8.2
Soit (X, d) un espace métrique compact, l’ensemble
déf
X = {A : ∅ 6= A ⊂ X et A fermé}
déf
et ∀A ∈ X , ∀x ∈ X, dA (x) = inf d(a, x).
a∈A
324 Annexe A. Corrigés des exercices

(i) Montrer que les fonctions x 7→ dA (x) : X → R+ et


déf
(A, B) 7→ ρX (A, B) = sup |dA (x) − dB (x)| : X × X → R+
x∈X

sont bien définies.


(ii) Montrer que pour tout A ∈ X , d−1
A {0} = A.
(iii) Montrer que ρX est une métrique sur X .
(iv) Montrer que (X , ρX ) est un espace métrique complet.

Solution. (i) Pour x ∈ X, on a

∀a ∈ A, d(a, x) ≥ 0

et le sous-ensemble {d(a, x) : a ∈ A} de R est borné inférieurement par 0. Donc


déf
0 ≤ dA (x) = inf{d(a, x) : a ∈ A} ∈ R

est l’application dA : X → R+ est bien définie.


Les sous-ensembles fermés A et B du compact X sont des compacts. Comme
les applications dA et dB sont lipschitziennes, elles sont continues et leur images
dA (X) et dB (X) sont compactes et donc bornées. En particulier,

sup dA (x) ≤ MA et sup dB (x) ≤ MB


x∈X x∈X
⇒ ∀x ∈ X, 0 ≤ |dA (x) − dB (x)| ≤ dA (x) + dB (x)
≤ sup dA (x) + sup dB (x) ≤ MA + MB .
x∈X x∈X

Comme |dA (x) − dB (x)| est borné supérieurement


déf
0 ≤ ρX (A, B) = sup |dA (x) − dB (x)| ∈ R
x∈X

et l’application ρX : X × X → R+ est bien définie.


(ii) Par définition, d−1 −1
A {0} = {x ∈ X : dA (x) = 0}. En particulier A ⊂ dA {0}.
Par définition de l’infimum, pour tout n ≥ 1, il existe an ∈ A tel que
1
dA (x) ≤ d(an , x) < dA (x) + .
n
La suite {an } ⊂ A est donc d-Cauchy dans X. Comme X est compact, X est
complet et il existe y ∈ X tel que an → y. Pour tout r > 0, il existe N tel que

∀n > N, d(an , y) < r ⇒ Br (y) ∩ A 6= ∅ ⇒ y ∈ A.


−1
On a démontré que A ⊂ dA {0} ⊂ A. Comme A est fermé, A = A et d−1
A {0} = A =
A.
5. Exercices du Chapitre 5 325

(iii) Pour montrer que ρX est une métrique, on doit vérifier les trois axiomes.
Pour (M1). Si A = B, alors dA = dB et ρX (A, B) = 0. Si ρX (A, B) = 0, alors

∀x ∈ X, dA (x) = dB (x).

En utilisant le fait que d−1 −1


A {0} = A et dB {0} = B, il vient
( −1
)
∀a ∈ A, dB (x) = 0 ⇒ A ⊂ dB {0} = B
⇒ A = B.
∀b ∈ B, dA (x) = 0 ⇒ B ⊂ d−1
A {0} = A

Pour (M2)

ρX (A, B) = sup |dA (x) − dB (x)| = sup |dB (x) − dA (x)| = ρX (B, A).
x∈X x∈X

Pour (M3) et A, B, C dans X ,

|dC (x) − dA (x)| ≤ |dC (x) − dB (x)| + |dB (x) − dA (x)|


⇒ |dC (x) − dA (x)| ≤ sup |dC (x) − dB (x)| + sup |dB (x) − dA (x)|
x∈X x∈X
⇒ sup |dC (x) − dA (x)| ≤ sup |dC (x) − dB (x)| + sup |dB (x) − dA (x)| .
x∈X x∈X x∈X

(iv) Soit une suite de Cauchy {dAn } pour des fermés An , ∅ 6= An ⊂ X.


Comme X est compact, C 0 (X) est un espace de Banach par le Théorème 2.3 (iv).
Il existe donc f ∈ C 0 (X) tel que dAn → f . On veut démontrer qu’il existe un fermé
A, ∅ 6= A ⊂ X tel que f = dA . On prend comme fermé
déf
A = {x ∈ X : f (x) = 0}.

On fixe x ∈ X. Alors, comme An est compact non-vide

∀n, ∃an ∈ An , d(an , x) = inf d(z, x) = dAn (x)


z∈An

⇒ lim d(an , x) = lim dAn (x) = f (x).


n→∞ n→∞

Donc la suite {an } ⊂ X est bornée. Par compacité de X, il existe une sous-suite,
encore indicée par n, qui converge vers un point y ∈ X :

an → y ⇒ d(y, x) = f (x).

En particulier, f (y) = 0, puisque dans l’inégalité

f (y) ≤ [f (y) − dAn (y)] + [dAn (y) − dAn (an )] + dAn (an ),
| {z } | {z }
≤ d(y,an ) =0

le dernier terme est zéro et dAn est Lipschitz continue de constante 1. En passant à
la limite

|f (y)| ≤ |f (y) − dAn (y)| + d(y, an ) → 0 ⇒ f (y) = 0 ⇒ y ∈ A.


326 Annexe A. Corrigés des exercices

Par définition of A, A n’est donc pas vide. Donc,

∀x ∈ X, ∃y ∈ A tel que f (x) = d(y, x) ≥ inf d(z, x) = dA (x)


z∈A

⇒ ∀x ∈ X, f (x) ≥ dA (x).

On démontre maintenant l’inégalité dans l’autre sens. Soit x ∈ X et le y ∈ A


tel que f (x) = d(y, x) :

|f (x) − f (y)| ≤ |f (x) − dAn (x)| + |dAn (x) − dAn (y)| + |dAn (y) − f (y)|,
| {z } | {z } | {z }
→0 ≤ d(x,y) →0

puisque dAn est Lipschitz de constante un. Enfin, le premier et troisième termes
tendent vers 0 par convergence uniforme. Comme f (y) = 0, il vient

f (x) ≤ f (y) + d(x, y) = d(x, y) ≥ inf d(x, a) = dA (x)


a∈A

⇒ ∀x ∈ X, f (x) ≤ dA (x).

Comme la fonction limite f est égale à dA pour un A, ∅ 6= A ⊂ X, X est bien


complet.

Exercice 8.3
Soit Ω un sous-ensemble ouvert non-vide de Rn . Montrer qu’il existe une suite
croissante de compacts non vides Kk tel que Ω = ∪k≥1 Kk et, pour tout compact
K ⊂ Ω, il existe k ≥ 1 tel que K ⊂ Kk .

Solution. (i) Si ∂Ω = ∅, alors, comme Ω est ouvert, ∁Ω = ∁Ω et

∅ = Ω ∩ ∁Ω = Ω ∩ ∁Ω ⇒ Ω⊂Ω⊂Ω ⇒ Ω = Ω.

Ω est donc un sous-ensemble non-vide à la fois fermé et ouvert de l’espace connexe


Rn . Ce n’est possible que si Ω = Rn . Dans ce cas on prend la suite de compacts
déf
∀k ≥ 1, Kk = {x ∈ Rn : kxk ≤ k}

qui satisfait toutes les conditions.


(ii) Si ∂Ω 6= ∅, alors Ω ∩ ∁Ω 6= ∅, ∁Ω et Ω ne sont pas vides et ∁Ω est fermé.
La fonction distance d∁Ω (x) de x à ∁Ω est bien définie. On prend
déf
∀k ≥ 1, Kk = {x ∈ Rn : kxk ≤ k et d∁Ω (x) ≥ 1/k} .

Comme la norme et la fonction distance sont des fonctions continues, Kk est fermé.
Par définition, Kk est contenu dans la boule compacte Bk (0) de Rn . Les ensembles
Kk sont donc compacts comme sous-ensembles fermés de compacts. Enfin, pour
tout k ≥ 1,

∀x ∈ Kk , d∁Ω (x) ≥ 1/k > 0 / ∁Ω


⇒ x∈ ⇒ x∈Ω ⇒ Kk ⊂ Ω.
5. Exercices du Chapitre 5 327

La suite est croissante. Soit k ′ ≥ k ≥ 1 et x ∈ Kk . Alors kxk ≤ k ≤ k ′ , d∁Ω (x) ≥


1/k ≥ 1/k ′ et Kk ⊂ Kk′ .
Enfin, soit K ⊂ Ω un compact. Comme la norme et la fonction distance sont
des fonctions continues sur le compact K :

∃xM ∈ K tel que kxM k = sup kx|| et ∃xm ∈ K tel que d∁Ω (xm ) = inf d∁Ω (x)
x∈K x∈K

et, comme xm ∈ K ⊂ Ω, d∁Ω (xm ) > 0. Il suffit enfin de prendre un entier k ≥


max{1, kxM k, 1/d∁Ω (xm )} ce qui entraı̂ne K ⊂ Kk .

Exercice 8.4
Soit Ω un ouvert non-vide de Rn et
déf
C(Ω) = {f : Ω → R |f continue sur Ω}

l’espace des fonctions continues sur Ω, où Ω n’est pas nécessairement borné. Soit
{Kk } la famille des sous-ensembles compacts construite dans l’Exercice 8.3 et pour
tout f ∈ C(Ω) et k ≥ 1 on pose
déf
qk (f ) = sup |f (x)|.
x∈Kk

Montrer que la fonction



X
déf 1 qk (f − g)
d(f, g) =
2k 1 + qk (f − g)
k=1

est une métrique sur C(Ω).


Solution. On vérifie les trois propriétés d’une métrique. Pour (M1), si f = g, alors
pour tout k, qk (f − g) = 0 et d(f, g) = 0. Dans l’autre sens, d(f, g) = 0 entraı̂ne
qk (f ) = supx∈Kk |f (x)| = 0 et f = g sur ∪k≥1 Kk = Ω. (M2) est vérifiée par
définition. Pour (M3) il suffit de reprendre la démonstration de l’Exercice 10.3 (iii)
et (iv) du Chapitre 3. Par définition, qk (f − g) = supx∈Kk |f (x) − g(x)| et

qk (f − g) 1
=1− .
1 + qk (f − g) 1 + qk (f − g)
Maintenant, puisque qk (f − g) ≤ qk (f − h) + qk (h − g), il vient

1 + qk (f − g) ≤ 1 + qk (f − h)) + qk (h − g)
1 1

1 + qk (f − g) 1 + qk (f − h) + qk (h − g)
1

1 + qk (f − h) + qk (h − g) + qk (f − h) qk (h − g)
1
= .
(1 + qk (f − h)) (1 + qk (h − g))
328 Annexe A. Corrigés des exercices

Donc
qk (f − g) 1
=1 −
1 + qk (f − g) 1 + qk (f − g)
1
≤ 1−
(1 + qk (f − h)) (1 + qk (h − g))
qk (f − h) + qk (h − g) + qk (f − h) qk (h − g)
=
(1 + qk (f − h)) (1 + qk (h − g))
qk (f − h) + qk (h − g) + 2 qk (f − h) qk (h − g)

(1 + qk (f − h)) (1 + qk (h − g))
qk (f − h) qk (h − g)
= + .
1 + qk (f − h)) 1 + qk (h − g)

Finalement on somme des deux côtés



X ∞
X ∞
X
1 qk (f − g) 1 qk (f − h) 1 qk (h − g)
≤ +
2k 1 + qk (f − g) 2k 1 + qk (f − h)) 2k 1 + qk (h − g)
k=1 k=1 k=1

et d(f, g) ≤ d(f, h) + d(h, g).

Exercice 8.5
(i) Montrer que si A ∈ L(Rn ) est inversible, alors A−1 ∈ L(Rn ).
(ii) Montrer que si A ∈ L(Rn , Rm ) est injective, alors A⊤ A ∈ L(Rn ) est inver-
sible, où A⊤ ∈ L(Rm , Rn ) est l’application transposée de A.
(iii) Montrer que pour A ∈ L(Rn , Rm ), Ker A et Im A sont des sous-espaces
linéaires (espaces vectoriels).

Solution. (i) Soient α, β ∈ R et y1 , y2 ∈ Rn . Comme A est inversible, il existe


x1 , x2 ∈ Rn tel que yi = Axi . On montre que A−1 est linéaire

α x1 + β x2 = A−1 (A(α x1 + β x2 )) = A−1 (α A(x1 ) + β A(x2 )))


⇒ α A−1 y1 + β A−1 y2 = A−1 (α y1 + β y2 ).

Comme on est dans Rn , la linéarité entraı̂ne la continuité et A−1 ∈ L(Rn ).


(ii) Par définition, A⊤ A ∈ L(Rn ) et l’inversibilité est équivalente à l’injectivité,
c’est-à-dire, A⊤ Ax = 0 entraı̂ne x = 0. En effet,

A⊤ Ax = 0 ⇒ 0 = (A⊤ Ax) · x = Ax · Ax = kAxk2 = 0 ⇒ x=0

puisque A est injective.


(iii) Ker A = {x ∈ Rn : Ax = 0} est fermé comme image inverse du fermé {0}.
Il est linéaire car pour tout α, β ∈ R et x, y ∈ Ker A,

A(αx + βy) = α Ax + β Ay = α 0 + β 0 = 0.
5. Exercices du Chapitre 5 329

Im A = {Ax : x ∈ Rn } est un sous-espace linéaire puisque tout α, β ∈ R et x, y ∈ Rn

α Ax + β Ay = A(αx + βy) ∈ Im A.

Soit y ∈ (Im A)′ un point d’accumulation de Im A. Il existe donc une suite {yk =
Axk } dans Im A tel que yk 6= y et yk → y dans Rm . On a aussi vu que Im A =
[Ker A⊤ ]⊥ , Donc, pour tout z ∈ Ker A⊤

0 = yk · z → y · z ⇒ ∀z ∈ Ker A⊤ , y · A⊤ z = 0
⇒ y ∈ [Ker A⊤ ]⊥ = Im A.

et Im A est fermée.

Exercice 8.6
(i) Trouver et caractériser tous les A ∈ GL(n) tels que

∀x, y ∈ Rn , kAx − Ayk = kx − yk (5.3)

pour la norme euclidienne kxk sur Rn .


(ii) Est ce que l’ensemble

{A ∈ GL(n) : kAx − Ayk = kx − yk ∀x, y ∈ Rn } (5.4)

forme un groupe ?
Solution. (i) Pour tout x ∈ Rn , on a

kAxk = kAx − A0k = kx − 0k = kxk


n
⇒ ∀x ∈ R , kAxk2 = kxk2 ⇒ ∀x ∈ Rn , Ax · Ax = x · x.

En particulier,

4 Ax · Ay = A(x + y) · A(x + y) − A(x − y) · A(x − y)


= (x + y) · (x + y) − (x − y) · (x − y) = 4 x · y
⇒ ∀x, y ∈ Rn , A⊤ Ax · y = x · y ⇒ ∀x ∈ Rn , A⊤ Ax = x ⇒ A⊤ A = I.

Comme A est inversible, A−1 A = I et, de ce qui pécède, A−1 A = I = A⊤ A ce qui


donne A−1 = A⊤ et AA⊤ = I.
(ii) On introduit la définition suivante
déf 
O(N)(n) = A ∈ Gl(n) : A⊤ A = I = AA⊤ .

On a montré en (i) que tout A ∈ GL(n) vérifant la propriété (8.1), on a A ∈


O(N)(n). Dans l’autre sens si A ∈ O(N)(n), alors

∀x, y ∈ Rn , AA⊤ (x − y) = x − y
⇒ kA(x − y)k2 = A⊤ A(x − y) · (x − y) = x − y · (x − y) = kx − yk2
330 Annexe A. Corrigés des exercices

et la propriété (8.1) kA(x − y)k = kx − yk. On montre maintenant que O(N)(n) est
un groupe pour la composition. Pour A, B ∈ O(N)(n), (AB)⊤ AB = B ⊤ A⊤ AB =
B ⊤ B = I et (BA)⊤ BA = A⊤ B ⊤ BA = A⊤ A = I. Donc A ◦ Bin O(N)(n). L’iden-
tité appartient à AB ∈ O(N)(n). Pour l’inverse, on a vu dans la partie (i) que
A−1 = A⊤ et donc (A−1 )⊤ = (A⊤ )⊤ = A. Donc
(A−1 )⊤ A−1 = A A−1 = I et A−1 (A−1 )⊤ = A−1 A = I.
O(N)(n) est donc bien un sous-groupe de GL(n). C’est le groupe des isométries
linéaires de Rn : les transformations qui prérvent la distance dans Rn . De plus, par
continuité de la composition, O(N)(n) est un sous-groupe fermé de GL(n).

Exercice 8.7
Soit X = R \{0} et la fonction

déf 1 1
x, y 7→ d(x, y) = |x − y| + − .
x y
Montrer que (X, d) est un espace métrique complet.
Solution. Par définition de d, d(x, y) = 0 ⇐⇒ x = y et d(x, y) = d(y, x). Pour
x, y, z ∈ X
1 1 1 1 1 1
|x − y| + − ≤ |x − z| + |z − y| + − + −
x y x z z y
1 1 1 1
≤ |x − z| + − + |z − y| + − .
x z z y
Soir {xn } une suite de Cauchy dans X. Pour tout ε > 0, il existe N tel que pour
tout m, n > N
1 1
|xn − xm | + − < ε.
xn xm
Les suites {xn } et {1/xn } sont donc Cauchy dans R. Comme R est complet, il existe
x, y ∈ R tel que
1 1 1
xn → x et →y ⇒ 1 = xn → xy ⇒ x 6= 0 et y =
xn xn x
et x ∈ X.

Exercice 8.8
On considère l’ensemble P(X) des sous-ensembles d’un ensemble arbitraire X
y compris l’ensemble vide ∅ muni de l’opération différence symétrique △
déf
A △ B = [A\B] ∪ [B\A] .
Montrer que (P(X), △) vérifie les propriétés d’un groupe abélien :
5. Exercices du Chapitre 5 331

(i) pour tous A, B ∈ P(X), A △ B ∈ P(X) ;


(ii) pour tous A, B, C ∈ P(X), (A △ B) △ C = A △ (B △ C) ;
(iii) ∅ est l’élément neutre pour lequel A △ ∅ = A = A △ ∅ pour tout
A ∈ P(X) ;
(iv) chaque A ∈ P(X) possède un inverse puisque A △ A = ∅ (ici A est son
propre inverse, c’est-à-dire, A−1 = A) ;
(v) (commutativité) A △ B = B △ A ;
(vi) pour A, B, C ∈ P(X), (A △ B) ∩ C = (A ∩ C) △ (B ∩ C).
Solution. On écrira ∁A pour X\A. (i) Par définition.
(ii) On observe d’abord que, pour A, B ∈ P(X),
∁(A △ B) = ∁A △ B = ∁B △ A.
En effet,
∁(A △ B) = ∁([A ∩ ∁B] ∪ [B ∩ ∁A])
= ∁[A ∩ ∁B] ∩ ∁[B ∩ ∁A]
= (∁A ∪ B]) ∩ (∁B ∪ A]) = (∁A ∩ ∁B) ∪ (A ∩ B) = ∁A △ B
Soient A, B, C ∈ P(X). On écrira ∁A pour X\A. On a
(A △ B) △ C = [(A △ B) ∩ ∁C] ∪ [C ∩ ∁(A △ B)]
 
= [ [A ∩ ∁B] ∪ [B ∩ ∁A] ∩ ∁C] ∪ [C ∩ [∁A ∩ ∁B] ∪ [B ∩ A] ]
= [A ∩ ∁B ∩ ∁C] ∪ [B ∩ ∁A ∩ ∁C] ∪ [C ∩ ∁A ∩ ∁B] ∪ [C ∩ B ∩ A]
 
= A ∩ [∁B ∩ ∁C] ∪ [C ∩ B] ∪ ∁A ∩ [B ∩ ∁C] ∪ [C ∩ ∁B]
 
= A ∩ ∁(B △ C) ∪ ∁A ∩ (B △ C) = A △ (B △ C) .
(iii) Par définition, A △ ∅ = [A ∩ ∁∅] ∪ [∅ ∩ ∁A] = A ∩ X = A.
(iv) Par définition, A △ A = [A ∩ ∁A] ∪ [A ∩ ∁A] = ∅.
(v) Par définition, A △ B = [A ∩ ∁B] ∪ [B ∩ ∁A] = [B ∩ ∁A] ∪ [A ∩ ∁B] = B △ A.
(vi) (distributivité) Par définition,

(A △ B) ∩ C = [A ∩ ∁B] ∪ [B ∩ ∁A] ∩ C
= [A ∩ ∁B ∩ C] ∪ [B ∩ ∁A ∩ C]
= [(A ∩ C) ∩ ∁B] ∪ [(B ∩ C) ∩ ∁A]
= [(A ∩ C) ∩ (∁B ∪ ∁C)] ∪ [(B ∩ C) ∩ (∁A ∪ ∁C)]
= [(A ∩ C) ∩ ∁(B ∩ C)] ∪ [(B ∩ C) ∩ ∁(A ∩ C)]
= (A ∩ C) △ (B ∩ C).

Exercice 8.9
Soit X un ensemble arbitraire et P(X) l’ensemble de tous les sous-ensembles
de X incluant ∅. Soit l’ensemble
déf
{0, 1}X = {toutes les applications f : X → {0, 1}}
332 Annexe A. Corrigés des exercices

de toutes les applications définies sur X à valeurs dans l’ensemble à deux éléments
{0, 1}. On associe à chaque A ∈ P(X) la fonction caractéristique
(
déf 1, si x ∈ A
χA (x) =
0, si x ∈ X\A.

(i) Montrer que l’application

A 7→ χA : P(X) → {0, 1}X

est bien définie et bijective.


(ii) Montrer que {0, 1}X est un groupe abélien pour l’opération
déf
(f1 △ f2 )(x) = |f1 (x) − f2 (x)| (5.5)

et en déduire que

(χA △ χB )(x) = |χA (x) − χB (x)| = χA△B (x). (5.6)

pour la différence symétrique entre A et B dans P(X)


déf
A △ B = [A\B] ∪ [B\A]. (5.7)

(iii) Montrer que la fonction


déf
d(f, g) = sup |f (x) − g(x)| (5.8)
x∈X

définit une métrique sur {0, 1}X et que ({0, 1}X , d) est complet.
(iv) Montrer que (P(X), ρ) est un espace métrique complet pour la métrique
déf
ρ(A, B) = sup |χA (x) − χB (x)| .
x∈X

(v) En supposant démontré que P(X) est un groupe abélien pour l’opération
binaire différence symétrique (5.7) (voir la section 7.1 du Chapitre 5), mon-
trer que △ est continue par rapport à la métrique ρ.
Solution. (i) L’application A 7→ χA : P(X) → {0, 1}X est clairement bien définie.
Elle est injective. En effet, si χA = χB , alors pour tout x ∈ A, χB (x) = 1 et A ⊂ B
et, réciproquement, pour tout x ∈ B, χA (x) = 1 et B ⊂ A, d’où A = B. Elle est
surjective puisque que pour tout f ∈ {0, 1}X , on a, pour A = f −1 {1} ∈ P(X),
f −1 {0} = X\A et χA = f .
(ii) L’ensemble {0, 1}X est un groupe pour l’opération (5.5). En effet, la valeur
absolue |f1 (x) − f2 (x)| de deux fonctions ne prenant que les valeurs 0 ou 1 est égale
à 0 ou 1. Donc, f1 △ f2 ∈ {0, 1}X et, par définition, f1 △ f2 = f2 △ f1 . L’élément
neutre est la fonction f = 0 et l’inverse de f est f car f △ 0 = 0 = 0 △ f . C’est
donc bien un groupe.
5. Exercices du Chapitre 5 333

Pour A, B ∈ P(X),
(
1, si x ∈ [A\B] ∪ [B\A]
|χA (x) − χB (x)| =
0, si x ∈ [A ∩ B] ∪ [X\B ∩ X\A].

Mais [X\B ∩ X\A] = X\(A ∪ B) et A ∩ B = X\[X\A ∪ X\B] et

X\(A ∪ B) ∪ X\(X\A ∪ X\B) = X\[(A ∪ B) ∩ (X\A ∪ X\B)] = X\(A\B ∪ B\A)


⇒ (χA △ χB )(x) = |χA (x) − χB (x)| = χA△B (x).

qui correspond à prendre la différence symétrique (5.7) de A et de B dans P(X).


(iii) La fonction (5.8) est bien définie. C’est une métrique. Pour (M1), f = g
donne d(f, g) = 0 et si d(f, g) = 0, alors pour tout x ∈ X, |f (x) − g(x)| = 0 et
f = g. (M2) est vérifiée car d est symétrique par définition. Enfin, on a l’inégalité
du triangle (M3) car ponctuellement pour f, g, h ∈ {0, 1}X

|f (x) − h(x)| ≤ |f (x) − g(x)| + |g(x) − h(x)|


≤ sup |f (x) − g(x)| + sup |g(x) − h(x)|.
x∈X x∈X

L’espace {0, 1}X est complet. Soit {fn } une suite d-Cauchy :

∀ε > 0, ∃N tel que ∀n, m > N, d(fn , fm ) < ε.

En raison de la métrique du supremum, pour chaque x ∈ X la suite {fn (x)} est


Cauchy dans R et il existe f (x) ∈ R tel que fn (x) → f (x). Pour avoir la complétude,
il faut montrer que f (x) ∈ {0, 1}. Soit S = ∪∞ n=1 {fn (x)} l’ensemble des éléments
de la suite {fn (x)}. S est fini car S ⊂ {0, 1}. En particulier, il existe s ∈ S et une
sous-suite fnk (x) = s telle que fnk (x) → s, c’est-à-dire,

∃s ∈ S, ∀k ≥ 1, ∃nk ≥ k tel que fnk (x) = s.

Sinon,

∃N0 , ∀n ≥ N0 , fn (x) 6= 0 et ∃N1 , ∀n ≥ N1 , fn (x) 6= 1


⇒ ∀s ∈ S, ∀n ≥ max{N0 , N1 }, fn (x) 6= s
⇒ ∀n ≥ max{N0 , N1 }, ∀s ∈ S, fn (x) 6= s.

Ceci voudrait dire que la suite {fn (x)} est finie ce qui est une contradiction. Comme
toute sous-suite de la suite initiale {fn (x)} converge vers la même limite on en
conclut que f (x) ∈ {0, 1}. La fonction limite f appartient donc à {0, 1}X qui est
complet.
(iv) En utilisant la bijection (5.6) et le fait que {0, 1}X soit complet, on peut
maintenant définir la métrique ρ(A, B) = d(χA , χB ) sur P(X) via les fonctions
caractéristiques puisque de la partie (i)

{0, 1}X = {χA : A ∈ P(X)} .


334 Annexe A. Corrigés des exercices

Le groupe (P(X), ρ) est donc un espace métrique complet.


Enfin, pour la continuité au point (A, B), on prend un autre point (C, D)
ρ(C △ D, A △ B)
= sup |χC△D (x) − χA△B (x)|
x∈X
≤ sup ||χC (x) − χD (x)| − |χA (x) − χB (x)||
x∈X
≤ sup |(χC (x) − χD (x)) − (χA (x) − χB (x))|
x∈X
≤ sup |(χC (x) − χA (x)) − (χD (x) − χB (x))|
x∈X
≤ sup |χC (x) − χA (x)| + sup |χD (x) − χB (x)| = ρ(C, A) + ρ(D, B).
x∈X x∈X

La fonction est donc non seulement ρ-continue en (A, B), mais aussi lipschitzienne
sur P(X).

Exercice 8.10
Soit (X, d) un espace métrique compact et C 0 (X; Rk ) pour k ≥ 1 muni de la
norme
k
!1/2
déf
X
2
kf kC 0 = sup kf (x)k, kyk = |yi | . (5.9)
x∈X i=1

Démontrer les énoncés suivants.


(i) Si S est un sous-ensemble compact de C 0 (X; Rk ), alors S est fermé,
(a) S est uniformément équicontinu et
(b) S est uniformément borné, c’est-à-dire, ∃M > 0, ∀f ∈ S, ∀x ∈
X, kf (x)k ≤ M .
(ii) Réciproquement, si S est un sous-ensemble de C 0 (X; Rk ) vérifiant (a) et
(b), alors l’adhérence S de S est compacte dans C 0 (X; Rk ).
Solution. (i) Si S est compact, il est fermé.
(a) (S est équicontinue). Pour ε > 0, la famille de boules ouvertes {Bε (f ) :
f ∈ S} est un recouvrement ouvert du compact S. Il existe donc f1 , . . . , fm ∈ S tel
que
S ⊂ ∪m
i=1 Bε (fi ).

Donc, pour tout f ∈ S, il existe i tel que


sup kf (x) − fi (x)k < ε/3. (5.10)
x∈X

Comme les éléments f de C 0 (X; Rk ) sont uniformément continus,


∀i, ∃δi > 0, ∀x, y ∈ X, d(x, y) < δ, kfi (y) − fi (x)k < ε/3.
6. Exercices du Chapitre 6 335

On prend δ = min{δ1 , . . . , δm } > 0 et x, y ∈ X tel que d(x, y) < δ

kf (y) − f (x)k ≤ kf (y) − fi (y)k + kfi (y) − fi (x)k + kfi (x) − f (x)k
| {z } | {z } | {z }
ε/3 ε/3 ε/3

⇒ ∀x, y ∈ X, d(x, y) < δ, ∀f ∈ S, kf (y) − f (x)k < ε.

(b) Comme S est compact dans C 0 (X; Rk ), il est fermé et borné. Il existe donc
M > 0 tel que

∀f ∈ S, sup kf (x)k = kf kC 0 ≤ M.
x∈X

(ii) On montre maintenant la réciproque. Étant donné la famille S qui vérifie (a) et
(b), il faut montrer la compacité séquentielle de S : pour toute suite {fn } ⊂ S, il
existe f ∈ S et une sous-suite {fnk } tel que fnk → f dans C 0 (X; Rk ), c’est-à-dire,
uniformément dans X.
Par uniforme équicontinuité de S,

∀ε > 0, ∃δ > 0, ∀n, ∀x, y ∈ X, d(y, x) < δ, kfn (x) − fn (y)k < ε/3.

Par compacité de X, il peut être couvert par un nombre fini de boules Bδ (xj ),
x1 , . . . , xℓ ∈ X. Comme, pour chaque j et n, la suite {fn (xj )} est bornée, il existe
une sous-suite {fnk } de {fn } que l’on écrira {fn } et il existe N tel que

∀j, 1 ≤ j ≤ ℓ, ∀n, m > N, kfn (xj ) − fm (xj )k < ε/3.

Cette sous-suite est Cauchy dans C 0 (X; Rk ). En effet, pour tout x ∈ X, il existe xj
tel que d(x, xj ) < δ et pour tous m, n > N

kfm (x) − fn (x)k ≤ kfm (x) − fm (xj )k + kfm (xj ) − fn (xj )k + kfn (xj ) − fn (x)k
< ε/3 + ε/3 + ε/3 = ε.

Comme les fonctions de la sous-suite {fn } sont uniformément continues, il existe f ∈


C 0 (X; Rk ) tel que fn converge uniformément vers f et ce f appartient à l’adhérence
S de S. Donc, S est compact dans C 0 (X; Rk ).

6 Exercices du Chapitre 6
Exercice 7.1
Soit t 6= 0 et la fonction

 f (g(x + t)) − f (g(x)) , si g(x + t) − g(x) 6= 0
déf
q(t) = g(x + t) − g(x) (6.1)
 ′
f (g(x)), si g(x + t) − g(x) = 0.
336 Annexe A. Corrigés des exercices

Comme f ′ (g(x)) existe,

f (g(x) + θ) − f (g(x))
∀ε > 0, ∃η tel que ∀0 < |θ| < η, − f ′ (g(x)) < ε.
θ

Comme g ′ (x) existe, g est continue en x et

∃δ > 0 tel que ∀0 < |t| < δ, |g(x + t) − g(x)| < η.

Donc, pour 0 < |t| < δ,


( )
ε, si g(x + t) − g(x) 6= 0
|q(t) − f ′ (g(x))| ≤ ≤ε
0, si g(x + t) − g(x) = 0
⇒ lim q(t) = f ′ (g(x)).
t→0

Finalement,

f (g(x + t)) − f (g(x))


 t

 f (g(x + t)) − f (g(x)) g(x + t) − g(x)
 si g(x + t) 6= g(x)
g(x + t) − g(x) t
=

 g(x + t) − g(x)
 f ′ (g(x)) si g(x + t) = g(x)
t
g(x + t) − g(x)
= q(t) → f ′ (g(x)) g ′ (x)
t

lorsque t → 0 puisque q(t) → f ′ (g(x)) et g(x+t)−g(x)


t → g ′ (x). On obtient donc à la

fois l’existence de (f ◦ g) (x) et son expression.

Exercice 7.2
Soit f : [a, b] → R telle que f ′ (x) existe et soit uniformément continue sur
]a, b[ . Montrer que, pour tout ε > 0, il existe δ > 0 tel que

f (y) − f (x)
∀x, y ∈ ]a, b[ , 0 < |y − x| < δ, − f ′ (x) < ε.
y−x

On dit que f est uniformément dérivable sur ]a, b[ .

Solution. Pour tous x, y ∈ [a, b], par le Théorème 2.3 de la moyenne du Chapitre 6,

∃θ ∈ ]0, 1[ tel que f (y) − f (x) = (y − x) f ′ (x + θ(y − x))

et pour x 6= y

f (y) − f (x)
− f ′ (x) = |f ′ (x + θ(y − x)) − f ′ (x)| .
y−x
6. Exercices du Chapitre 6 337

Comme f ′ est uniformément continue sur ]a, b[ , pour tout ε > 0, tel que

∃δ > 0 tel que ∀z, x ∈ ]a, b[ , |z − x| < δ, |f ′ (z) − f ′ (x)| < ε.

Il vient donc pour tous y, x ∈ ]a, b[ tel que |y − x| < δ,

|x + θ(y − x) − x| = θ |y − x| < |y − x| < δ


f (y) − f (x)
⇒ − f ′ (x) = |f ′ (x + θ(y − x)) − f ′ (x)| < ε.
y−x

Exercice 7.3
Montrer que la fonction numérique (voir Figure 6.9)
 2
 xy , 6 0
si x =
déf
f (x, y) = x + y 42

0, si x = 0

est dérivable en (x, y) = (0, 0) dans toutes les directions v = (v1 , v2 ), mais qu’elle
n’est ni différentiable au sens de Gateaux ni continue au point (x, y) = (0, 0).
Remarquer que l’on a les propriétés suivantes

x<0 ⇒ f (x, y) ≤ 0 et x>0 ⇒ f (x, y) ≥ 0


f (−x, y) = −f (x, y) et f (x, −y) = f (x, y).

Solution. Par définition,

x1 x22
f (x1 , x2 ) = si x1 6= 0, f (0, x2 ) = 0
x21 + x42

et pour tout t 6= 0, le quotient différentiel est donné par


 

 1 tv1 (tv2 )2 
f (tv) − f (0) 2 4
, si v1 6= 0
q(t) = = t (tv1 ) + (tv2 )
t 
 0, 
si v1 = 0
   2 
2

 v1 v2 , si v 6= 0    v2 , si v = 
1 1 6 0
= v12 + t2 v24 → v1

 0,   
si v1 = 0. 0, si v1 = 0.
 2 
 v2 , si v 6= 0 
1
⇒ f ′ (x; v) = v1
 
0, si v1 = 0.

La fonction f est dérivable en x = 0 dans toutes les directions. Elle n’est cependant
pas Gateaux différentiable en 0 puisque pour v1 6= 0,

(v1 , v2 ) 7→ f ′ (0, v) = v22 / v1


338 Annexe A. Corrigés des exercices

n’est pas linéaire.


Pour montrer que f est discontinue en x = 0, il suffit de suivre le chemin
x1 = x22 , x2 6= 0, lorsque x2 tend vers 0. En effet
x42 1
f (x22 , x2 ) = 4 4 = 6= 0 = f (0, 0).
x2 + x2 2
Exercice 7.4
On a déjà vu que par définition, l’application v 7→ dH f (x, v) : Rn → Rm est
homogène. Toujours par définition de dH f (x; v), pour tout ε > 0, il existe δ > 0 tel
que
f (x + tw) − f (x)
∀t, 0 < t < δ, ∀w, kw − vkRn < δ, − dH f (x; v) < ε.
t Rm

On peut donc passer à la limite lorsque t ց 0 pour obtenir df (x; w)


f (x + tw) − f (x)
∀w, kw − vkRn < δ, lim − dH f (x; v) <ε
tց0 t Rm
⇒ ∀w, kw − vkRn < δ, kdf (x; w) − dH f (x; v)kRm < ε.
Comme df (x; w) = dH f (x; w), on a la continuité en tout point v ∈ Rn .

Exercice 7.5
Soient f, g : Rn → Rm deux applications Fréchet différentiables sur Rn et la
nouvelle application
déf
x 7→ h(x) = f (x) · g(x) : Rn → R . (6.2)
Démontrer que h est Fréchet différentiable et que
Dh(x) = Df (x)⊤ g(x) + Dg(x)⊤ f (x) (6.3)
ou, si ∇h(x) est interprété comme un vecteur colonne (ou matrice n × 1) et f (x) et
g(x) comme des vecteurs colonnes (ou matrice m × 1),
∇h(x) = g(x)⊤ Df (x) + f (x)⊤ Dg(x), (6.4)
où Df (x) et Dg(x) sont des matrices m × n.
Solution. On démontre que h est Hadamard différentiable. Pour t → 0, t 6= 0, et
w → v, on a
h(x + tw) − h(x) f (x + tw) − f (x) g(x + tw) − g(x)
= · g(x + tw) + f (x) ·
t t t
Comme f et g sont Hadamard différentiables et continues, il vient
h′H (x; v) = fH
′ ′
(x; v) · g(x) + f (x) · gH (x; v)
 
= Df (x)v · g(x) + f (x) · Dg(x)v = Df (x)⊤ g(x) + Dg(x)⊤ f (x) · v
et, comme cette application est linéaire par rapport à v, h est Hadamard et donc
Fréchet différentiable et Dh(x) = Df (x)⊤ g(x) + Dg(x)⊤ f (x).
6. Exercices du Chapitre 6 339

Exercice 7.6
Soit f : Rn → Rm une application Fréchet différentiable telle que, pour tout
x, kf (x)kRm = 1. Montrer que
Df (x)⊤ f (x) = 0.

Y-a-t-il une interprétation géométrique de cette identité ?


Solution. On est dans le cadre de l’Exercice 7.5 avec f = g et, en plus, la condition
f (x) · f (x) = kf (x)k2 = 1. Il vient
Df (x)⊤ f (x) + Df (x)⊤ f (x) = 0 ⇒ Df (x)⊤ f (x) = 0.

Exercice 7.7
Soit f : Rn → R admettant des dérivées partielles d’ordre un bornées dans un
ouvert U de Rn .
(i) Montrer que f est continue sur U et lipschizienne en chaque point de U .
Indication. S’inspirer de la démonstration du Théorème 3.11 du Chapitre
6 des notes.
(ii) Est-ce que, en général, f est Gateaux différentiable en tout point de U ?
Démonstration. (i) Soit M la constante tel que
∀y ∈ U, ∀i, 1 ≤ i ≤ n, |∂i f (y)| < M. (6.5)

Soit x ∈ U . Comme U est ouvert, il existe une boule B3r (x), r > 0, telle que
B3r (x) ⊂ U . Soient deux points y, z ∈ Br (x). On leur associe les points suivants
déf déf
x0 = z, xi = xi−1 + (y − z)i ei , 1 ≤ i ≤ n,
où (y − z)i est la ieme composante du vecteur y − z ∈ Rn .
On considère la différence

f (y) − f (z)
que l’on peut réécrire sous la forme
n
X
f (y) − f (z) = f (xi ) − f (xi−1 ).
i=1

Pour chaque i, la fonction f varie le long d’une ligne de direction ei passant par les
points xi−1 et xi où la dérivée partielle ∂i f existe. Puisque f est dérivable dans la
direction ei en tout point de B3r (x), la fonction gi (α) = f (xi−1 + α (y − z)i ei ) est
continue sur [0, 1] et dérivable sur ]0, 1[ . Par le théorème de la moyenne (Théorème
3.8, Chapitre 6) et par homogénéité positive

∃αi ∈ ]0, 1[ , f (xi ) − f (xi−1 ) = f ′ (xi−1 + αi (y − z)i ei ; (y − z)i ei )


(6.6)
= (y − z)i ∂i f (xi−1 + αi (y − z)i ei ).
340 Annexe A. Corrigés des exercices

Par construction, pour tout i


kxi−1 + αi (y − z)i ei − xkRn ≤ kxi−1 + αi (y − z)i ei − zkRn + kz − xkRn
et
kxi−1 + αi (y − z)i ei − zkRn
i−1
X
= (xj − xj−1 ) + αi (y − z)i ei
j=1
Rn
v
i−1 u i−1
X uX
= (y − z)j ej + αi (y − z)i ei =t |(y − z)j |2 + |αi (y − z)i |2
j=1 n j=1
R
v v
u i u n
uX uX
≤ t |(y − z)j |2 ≤ t |(y − z)j |2 = ky − zkRn
j=1 j=1

≤ ky − xkRn + kz − xkRn < 2r.


Donc, pour tout i,
kxi−1 + αi (y − z)i ei − xkRn ≤ kxi−1 + αi (y − z)i ei − zkRn + kz − xkRn
< 2r + r = 3r
⇒ ∀i, ∂i f (xi−1 + αik (y − x)i ei ) ≤ M.
De l’identité (6.6)
f (xi ) − f (xi−1 ) ≤ ∂i f (xi−1 + αik (y − x)i ei ) |(y − x)i | ≤ M |(y − x)i | .
Finalement, par l’inégalité du triangle,
n
X n
X
|f (y) − f (z)| ≤ f (xi ) − f (xi−1 ) ≤ M |(y − z)i |
i=1 i=1
v
u n
√ uX √
≤ 2M t
2
|(y − z)i | = 2 M ky − zkRn .
i=1

On a montré que, pour chaque x ∈ U , il existe r > 0 tel que



∀y, z ∈ Br (x), |f (y) − f (z)| ≤ 2 M ky − zkRn .
Par définition, f est lipschitzienne en chaque point x ∈ U et donc continue sur U .
Cependant, f n’est pas nécessairement lipschitzienne sur tout U .
(ii) En général, f n’est pas Gateaux différentiable. Considérons la fonction f
de l’Exemple 3.2 et 3.6 du Chapitre 6
 3
 x si (x, y) 6= (0, 0)
f (x, y) = x2 + y 2

0, si (x, y) = (0, 0).
6. Exercices du Chapitre 6 341

On a vu que f est continue en (0, 0) et Hadamard dérivable dans toutes les directions
 
3

 v1 , 
2 ′ 2 + v2 si (v1 , v2 ) 6= (0, 0)
∀v ∈ R , fH (0; v) = v 1 2 = f (v1 , v2 ).

 0, 
si (v1 , v2 ) = (0, 0)

Cependant, f n’est pas Gateaux différentiable car v 7→ fH (0; v) n’est pas linéaire.
Les dérivées partielles existent et sont bornées dans tout R2 . En effet,
∂x f (0, 0) = 1 et ∂y f (0, 0) = 0.
Pour (x, y) 6= (0, 0),
x4 + 3 x2 y 2 yx3
∂x f (x, y) = et ∂y f (x, y) = −
(x2 + y 2 )2 (x2 + y 2 )2
et l’on a les majorations suivantes
2
x4 + 3 x2 y 2 x4 + 3 x2 y 2 x2 3 2 x2 y 2 3 5
2 2 2
= 2 2 2
≤ 2 2
+ 2 2 2
≤1+ =
(x + y ) (x + y ) x +y 2 (x + y ) 2 2
3 2
yx x 1 2yx 1 1
− 2 = 2 ≤1 = .
(x + y 2 )2 x + y 2 2 x2 + y 2 2 2

Les dérivées partielles existent et sont bornées dans U = R2 , mais f n’est pas
Gateaux différentiable en (0, 0).

Exercice 7.8
On considère la fonction f : R2 → R suivante
 2 2
 xy (x − y ) , si (x, y) 6= (0, 0)
déf 2 2
f (x, y) = x +y (6.7)

0, si (x, y) = (0, 0).
Montrer que
(i) f , ∂x f et ∂y f existent et sont continues sur R2 ;
2
(ii) ∂xy 2
f = ∂x (∂y f ) et ∂yx f = ∂y (∂x f ) existent dans R2 et sont continues sauf
en (0, 0) ;
2 2
(iii) ∂xy f (0, 0) = 1 et ∂yx f (0, 0) = −1.
Rappel de la notation (3.66) du Chapitre 6 :
 
2 ∂ ∂f
∂ji f (x) = (x) = d2 f (x; ei ; ej ) = Hf (x)ij .
∂xj ∂xi

Démonstration. (i) f est continue sur R2 . En (0, 0), on a l’estimé


xy (x2 − y 2 ) x2 + y 2
|f (x, y) − f (0, 0)| = 2 2
≤ |xy| 2 = |x| |y|.
x +y x + y2
342 Annexe A. Corrigés des exercices


Pour ε > 0, on prend δ = ε:
√ √
∀(x, y) ∈ Bδ (0, 0), |f (x, y) − f (0, 0)| < ε ε = ε.

Pour (x̂, ŷ) 6= (0, 0)), k(x̂, ŷ)k > 0. On prend r = k(x̂, ŷ)k/2 : pour tout (x, y) ∈
Br (x̂, ŷ)

1 3
k(x̂, ŷ)k ≤ k(x, y)k ≤ k(x̂, ŷ)k
2 2
et le dénominateur ne s’annule pas. La fonction f est donc continue en (x̂, ŷ) en
tant que quotient de deux fonctions polynômiales.
Dérivées partielles d’ordre un. En un point (x̂, ŷ) 6= (0, 0)), il existe t̄ > 0 tel
que (x̂, ŷ) + t ei ∈ Br (x̂, ŷ) et (x̂, ŷ) + t ei 6= (0, 0)) pour tout t, 0 ≤ t ≤ t̄. On calcule

d d (x̂ + t)2 − ŷ 2
∂x f ((x̂, ŷ)) = f (x̂ + t, ŷ) = (x̂ + t) ŷ
dt t=0 dt (x̂ + t)2 + ŷ 2 t=0
x̂2 − ŷ 2 4 x̂2 ŷ 2 x̂4 − ŷ 4 + 4 x̂2 ŷ 2
= ŷ 2 + ŷ = ŷ .
x̂ + ŷ 2 (x̂2 + ŷ 2 )2 (x̂2 + ŷ 2 )2

Comme f (x, y) = −f (y, x), on obtient de ce premier calcul

ŷ 4 − x̂4 + 4 x̂2 ŷ 2
∂y f ((x̂, ŷ)) = −∂x f ((ŷ, x̂)) = −x̂ .
(x̂2 + ŷ 2 )2

Comme le dénominateur est différent de 0 dans la boule Br (x̂, ŷ), ces expressions
sont continues en (x̂, ŷ). Il reste maintenant le point (0, 0) autour duquel f (t, 0) =
0 = f (0, t), t 6= 0. Donc

∂x f ((0, 0)) = ∂y f ((0, 0)) = 0.

Pour la continuité en (0, 0)

x4 − y 4 + 4 x2 y 2
|∂x f ((x, y)) − ∂x f ((0, 0))| = y −0
(x2 + y 2 )2
 
x4 y4 4 x2 y 2
≤ |y| + +
(x2 + y 2 )2 (x2 + y 2 )2 (x2 + y 2 )2
≤ |y| (1 + 1 + 2)

et

y 4 − x4 + 4 x2 y 2
|∂y f ((x, y)) − ∂y f ((0, 0))| = −x − 0 ≤ |x| (1 + 1 + 2) .
(x2 + y 2 )2

Il y a donc bien continuité en (0, 0). On en conclut par le Théorème 3.11 du Chapitre
6 que f est Fréchet différentiable partout dans R2 .
6. Exercices du Chapitre 6 343

(ii) Dérivées partielles croisées d’ordre 2. On a obtenu les expressions suivantes


4 4 2 2

y x −y +4x y , si (x, y) 6= (0, 0)
∂x f (x, y) = (x2 + y 2 )2

 0, si (x, y) = (0, 0)

4 4 2 2

 −x y −x +4x y ,
2 2 2
si (x, y) 6= (0, 0)
∂y f (x, y) = (x + y )

 0, si (x, y) = (0, 0).

Comme il s’agit de quotients de polynômes ∂y (∂x f (x, y)) et ∂y (∂x f (x, y)) existent et
sont continues sur R2 \(0, 0). Par le Théorème 3.13 du Chapitre 6, ∂y (∂x f (x, y)) =
∂y (∂x f (x, y)). On calcule maintenant les dérivées partielles croisées au point (0, 0).
On forme le quotient différentiel pour t 6= 0

 
∂x f (0, t) − ∂x f (0, 0) 1 −t4
= t 2 2 − 0 = −1 ⇒ ∂y (∂x f (0, 0)) = −1
t t (t )
∂y f (t, 0) − ∂y f (0, 0) 1 t4
= t 2 2 = +1 ⇒ ∂x (∂y f (0, 0)) = +1.
t t (t )

On observe que pour tous (x, y) ∈ R2 , on a ∂y (∂x f (x, y)) = −∂x (∂y f (y, x)).

Si les dérivées secondes étaient continues en (0, 0), on aurait ∂y (∂x f (0, 0)) =
∂y (∂x f (0, 0)). Comme ce n’est pas le cas, au moins une des deux (et en fait les deux)
dérivées secondes n’est pas continue en (0, 0).
344 Annexe A. Corrigés des exercices

On calcule les dérivées partielles croisées pour (x, y) 6= (0, 0)

∂y (∂x f (x, y))


x4 − y 4 + 4 x2 y 2
=
(x2 + y 2 )2
(−4y 3 + 8 x2 y) (x2 + y 2 )2 (x4 − y 4 + 4 x2 y 2 ) 4y (x2 + y 2 )
+y − y
(x2 + y 2 )4 (x2 + y 2 )4
4 4 2 2 2 2
(x − y + 4 x y ) (x + y )
=
(x2 + y 2 )3
4y [(−y 2 + 2 x2 ) (x2 + y 2 ) − (x4 − y 4 + 4 x2 y 2 )]
2
+
(x2 + y 2 )3
(x − y + 4 x y ) x + (x4 − y 4 + 4 x2 y 2 ) y 2
4 4 2 2 2
=
(x2 + y 2 )3
4y [−y x + 2 x4 − y 4 + 2 x2 y 2 − x4 + y 4 − 4 x2 y 2 )]
2 2 2
+
(x2 + y 2 )3
(x − y x + 4 x y ) + (x4 y 2 − y 6 + 4 x2 y 4 )
6 4 2 4 2
=
(x2 + y 2 )3
−4y x + 8 x y − 4 y 6 + 8 x2 y 4 − 4 x4 y 2 + 4 y 6 − 16 x2 y 4
4 2 4 2
+
(x2 + y 2 )3
6 6 2 4 4 2
x −y −9x y +9x y
= .
(x2 + y 2 )3

Enfin

x6 − y 6 − 9 x2 y 4 + 9 x4 y 2
∂y (∂x f (x, y)) − ∂y (∂x f (0, 0)) = − (−1)
(x2 + y 2 )3
x6 − y 6 − 9 x2 y 4 + 9 x4 y 2 + (x2 + y 2 )3
=
(x2 + y 2 )3
2 x2 x4 − 3 y 4 + 6 x2 y 2
= 2 .
x + y2 (x2 + y 2 )2

Si on prend deux chemins différents, (0, y) → (0, 0) et (x, 0) → (0, 0), on obtient
deux limites différentes

2 02 04 − 3 y 4 + 6 02 y 2
∀y 6= 0, =0
02 + y 2 (02 + y 2 )2
2 x2 x4 − 3 04 + 6 x2 02
∀x 6= 0, =2
x2 + 02 (x2 + 02 )2

et il n’y a pas continuité en (0, 0).


6. Exercices du Chapitre 6 345

Exercice 7.9
Soit l’application linéaire A : Rn → Rn (ou une matrice n × n) et b ∈ Rn (ou
un n-vecteur). On construit la fonction

déf 1
f (x) = (Ax) · x + b · x, x ∈ Rn .
2
(i) Calculer f ′ (x; v) (ou le gradient de f ) et d2 f (x; v; w) (ou la hessienne de
f ).
(ii) Donner des conditions nécessaires et suffisantes sur A et b pour que f soit
convexe dans tout Rn .
(iii) Donner des conditions nécessaires et suffisantes sur A et b pour que f soit
strictement convexe dans tout Rn .
(iv) Est-ce que les fonctions f associées aux matrices et vecteurs
       
3 1 −2 2 4 1
(a) A = ,b= , et (b) A = ,b= ,
−1 2 1 4 1 1

sont convexes ?
Démonstration. (i) Pour t 6= 0 et w → v
 
f (x + tw) − f (x) 1 1 1
= A(x + tw) · (x + tw) − Ax · x + b · tw
t t 2 2
1
= (Ax · w + Aw · x + t Aw · w) + b · w
2
 
′ 1 A + A⊤
⇒ fH (x; v) = (Ax · v + Av · x) + b · v = x + b · v.
2 2
f est Hadamard et donc Fréchet différentiable. Pour les dérivées secondes, avec
t 6= 0 et w → v,
′ ′
fH (x + t w; v) − fH (x; v)
t
    
1 A + A⊤ A + A⊤
= (x + t w + b) · v − x+b ·v
t 2 2
   
A + A⊤ A + A⊤
= w ·v → v ·v
2 2
 
A + A⊤ A + A⊤
⇒ d2 f (x; v; v) = v · v ⇒ Hf (x) = .
2 2

(ii) Première démonstration. Du Théorème 4.4 (i) du Chapitre 6, f est convexe


sur Rn si et seulement si Hf (x) ≥ 0 pour tout x ∈ Rn ce qui est équivalent à

A + A⊤ A + A⊤
≥ 0, c’est-à-dire, semi-définie positive.
2 2
346 Annexe A. Corrigés des exercices

Deuxière démonstration. On remarque d’abord que la matrice A peut être


remplacée par sa symétrisée (A + A⊤ )/2 sans changer la fonction f . On peut donc
supposer que A est symétrique pour les besoins de la démonstration.
Par définition, f est convexe si pour tout λ ∈ [0, 1] et tout x et y dans Rn ,

f (λx + (1 − λ)y) − λf (x) − (1 − λ)f (y) ≤ 0.

Comme le terme b·x est linéaire en x, il disparaı̂t et la condition sur f est équivalente
à la condition suivante sur A :
f (λx + (1 − λ)y) − λf (x) − (1 − λ)f (y)
= A(λx + (1 − λ)y) · (λx + (1 − λ)y) − λ(Ax) · x − (1 − λ)(Ay) · y
 
= (λ2 − λ)Ax · x + (1 − λ)2 − (1 − λ) Ay · y + 2λ(1 − λ)Ax · y
= − λ(1 − λ) [Ax · x + Ay · y − 2Ax · y] = −λ(1 − λ)A(x − y) · (x − y) ≤ 0.

Comme l’inéquation

−λ(1 − λ)A(x − y) · (x − y) ≤ 0

doit être vérifiée pour tout λ ∈ [0, 1] et tout x, y ∈ Rn , en prenant λ = 1/2 et y = 0,


il vient

∀x ∈ Rn , Ax · x ≥ 0

et A ≥ 0 est semi-définie positive. Il n’y a donc pas de condition sur le terme linéaire
b · x. Réciproquement, si A ≥ 0 est semi-définie positive, alors, du calcul précédent

f (λx + (1 − λ)y) − λf (x) − (1 − λ)f (y) = −λ(1 − λ)A(x − y) · (x − y) ≤ 0

et f est convexe.
(iii) Première démonstration. Par le Théorème 4.4 (i) du Chapitre 6, si Hf (x) =
(A + A⊤ )/2 est définie positive, alors f est strictement convexe dans un voisinage
de x. Comme la matrice hessienne est constante, on peut prendre tout Rn comme
voisinage et f est strictement convexe sur Rn .
Deuxière démonstration. On reprend le calcul de la partie (ii) : pour tous
λ ∈ [0, 1] et x, y ∈ Rn ,

f (λx + (1 − λ)y) − λf (x) − (1 − λ)f (y) = −λ(1 − λ)A(x − y) · (x − y).

Par définition, f est strictement convexe sur Rn si pour tous λ ∈ ]0, 1[ et x, y ∈ Rn ,


x 6= y, f (λx + (1 − λ)y) − λf (x) − (1 − λ)f (y) < 0, ce qui est équivalent à

λ(1 − λ)A(x − y) · (x − y) > 0.

En prenant v 6= 0, y = x + v 6= x et λ = 1/2, il vient

∀v 6= 0, Av · v > 0
6. Exercices du Chapitre 6 347

et (A + A⊤)/2 > 0 est définie positive. Dans l’autre sens, comme λ > 0, (1 − λ > 0
et y 6= x,

f (λx + (1 − λ)y) − λf (x) − (1 − λ)f (y) = −λ(1 − λ)A(x − y) · (x − y) < 0

et f est strictement convexe sur Rn .


(iv) Pour déterminer la convexité de f , on considére la symétrisée de A :
   
3 1 A + A⊤ 3 0
A= , = >0
−1 2 2 0 2

et f est convexe et même strictement convexe. Pour le second cas, comme la matrice
symétrisée
   
2 4 A + A⊤ 2 4
A= , =
4 1 2 4 1

n’est pas diagonale, on considère la forme quadratique

A + A⊤
v · v = 2v12 + 8v1 v2 + v22
2
= (v2 + 4v1 )2 − 16v12 + 2v12
= (v2 + 4v1 )2 − 14v12 .

Pour v2 +4v1 = 0 et v1 6= 0, (A+A⊤ )/2  0, (il suffit de prendre v1 = 1 et v2 = −4).


La fonction f associée n’est donc pas convexe.

Exercice 7.10
Soient f (x) = kxkn , n ≥ 1, et kxk la norme euclidienne de x ∈ Rk , k ≥ 1.
(i) Déterminer les n ≥ 1 pour lesquels f est Hadamard (Fréchet) différentiable
en tout point de Rk .
(ii) Déterminer les n ≥ 1 pour lesquels Hf (x) existe en tout point de Rk
(iii) Déterminer les valeurs de n ≥ 1 pour lesquelles f est convexe dans Rk .

Solution. (i) On observe d’abord que pour n = 2, f (x) = x · x et t → 0, t 6= 0, et


w→v
kx + twk2 − kxk2
= (2x + tw) · w → 2 x · v ⇒ ∇f (x) = 2x
t
et f est Hadamard et a fortiori Fréchet différentiable sur tout Rn .
On considère maintenant le cas n = 1 pour x 6= 0. Soit t → 0, t 6= 0, et w → v :

kx + twk − kxk 1 kx + twk2 − kxk2


= .
t kx + twk + kxk t
348 Annexe A. Corrigés des exercices

Le premier terme tend vers 1/(2kxk). Quant au second terme


kx + twk2 − kxk2
→ 2 x · v,
t
ce qui donne finalement
1 x x
f ′ (x; v) = 2x·v = ·v ⇒ ∇f (x) =
2kxk kxk kxk

et f est Hadamard, et donc Fréchet, différentiable dans Rk \{0}.


Pour n > 1, on fait appel à la règle de dérivée de la composition des applica-
tions x 7→ kxk : Rn → R et y 7→ y n : R → R, ce qui donne directement
x x
f ′ (x; v) = n kxkn−1 ·v ⇒ ∇f (x) = n kxkn−1 (6.8)
kxk kxk

et f est Hadamard, et donc Fréchet, différentiable dans Rk \{0}.


(ii) Si l’on veut déterminer la convexité à l’aide des dérivées secondes, on
continue. Pour n = 1, x 6= 0, f ′ (x; v) = x · v/kxk. Pour t → 0, t 6= 0, et w → v
 
′ ′ x + tw x x + tw x
f (x + tw; v) − f (x; v) = ·v− ·v = − ·v
kx + twk kxk kx + twk kxk
 
kxk (x + tw) − kx + twk x
= ·v
kx + twk kxk
 
kxk (tw) + (kxk − kx + twk) x
= ·v
kx + twk kxk
Donc
 
f ′ (x + tw; v) − f ′ (x; v) kxk (tw) + (kxk − kx + twk) x
= ·v
t t kx + twk kxk
  
w kx + twk − kxk 1 x
= − ·v
kx + twk t kx + twk kxk
  
v x 1 x
→ − ·v ·v
kxk kxk kxk kxk
 
1 x x
= v·v− ·v ·v
kxk kxk kxk
 
2 1 x x
⇒ d f (x; v; v) = v·v− ·v ·v .
kxk kxk kxk

Le hessien est donc bien bilinéaire et continue sur Rk \{0}.


Pour n ≥ 2, on peut utiliser la formule (6.8) du gradient et la règle de
dérivation du produit de deux fonctions
x
n kxkn−1 et · v.
kxk
6. Exercices du Chapitre 6 349

On a
 
x x 1 x x
n (n − 1) kxkn−2 ·v · v + n kxkn−1 v·v− ·v ·v
kxk kxk kxk kxk kxk
 
x x x x
= n kxkn−2 (n − 1) ·v ·v+v·v− ·v ·v
kxk kxk kxk kxk
 
x x
= n kxkn−2 (n − 2) ·v ·v+v·v
kxk kxk
 
x x
d2 f (x; v; v) = n kxkn−2 (n − 2) ·v ·v+v·v .
kxk kxk

Le hessien est donc bien bilinéaire et continue sur Rk \{0}.


Il peut cependant y avoir un problème en x = 0 : en effet le quotient

f (tw) − f (0) ktwkn |t| n−1


q(t) = = = |t| kwk.
t t t
Pour n ≥ 2,
lim q(t) = 0 et f ′ (0; v) = 0.
t→0

Donc, pour n ≥ 2, f est Hadamard différentiable partout dans R , et

∇f (x) = n |x|n−2 x, ∀x ∈ Rk .

Pour n = 1, la limite n’existe pas lorsque t → 0 puisque l’on peut tendre vers
des limites différentes par valeurs t > 0 ou t < 0 :

lim q(t) = +kvk, lim q(t) = −kvk.


t>0 t<0
t→0 t→0

Donc pour n = 1, f n’est pas dérivable en 0 pour les directions v 6= 0.


Pour n ≥ 2, on a f ′ (0; v) = 0 et donc pour t → 0 et w → v

f ′ (tw; v) − f ′ (0; v) 1 tw
= n ktwkn−1 ·v
t t ktwk
= n ktwkn−2 w · v
= |t|n−2 n kwkn−2 w · v
(
2 v · v, si n = 2
⇒ d2 f (0; v; v) =
0, si n > 2.

Le hessien est donc bien bilinéaire et continue en 0 et donc sur Rk . où il est donné
par la formule
 
x x
d2 f (x; v; v) = n kxkn−2 (n − 2) ·v ·v+v·v .
kxk kxk
350 Annexe A. Corrigés des exercices

(iii) Pour n = 1, f (x) = kxk. Comme nous n’avons pas de dérivabilité, on


utilise la définition d’une fonction convexe

∀x, y ∈ R, ∀λ ∈ [0, 1], kλx + (1 − λ)yk ≤ |λxk + k(1 − λ)yk = λkxk + (1 − λ)kyk.

Pour n = 2,
df
f (x) = kxk2 , (x) = 2x et d2 f (x; v; v) = 2 kvk2 ≥ 0, ∀v ∈ Rk .
dx
f est de classe C (2) et la dérivée seconde est positive. Elle est donc convexe.
Pour n ≥ 3, on a
" #
2
x
d2 f (x; v; v) = n kxkn−2 (n − 2) · v + kvk2 ≥ 0, ∀v ∈ Rk .
kxk

Pour n ≥ 2, la fonction f est de classe C (2) dans R et comme la hessienne est


semi-définie positive, f est convexe dans Rk .

Exercice 7.11
Montrer que la fonction f (x) = sin x + (1 + x)2 est convexe dans l’intervalle
[0, 1].
Solution. C’est une fonction de classe C (2) dans R et pour tout x ∈ R,

df d2 f
(x) = cos x + 2(1 + x) et (x) = − sin x + 2 ≥ 1.
dx dx2
Elle est donc convexe sur tout R et sa restriction à [0, 1] est aussi convexe.

Exercice 7.12
On dit que C ⊂ Rn est un cône de sommet 0 si

∀x ∈ C, ∀λ > 0, λx ∈ C. (6.9)

(i) Soit f : Rn → R une fonction convexe Gateaux différentiable en tout point


d’un cône convexe C. Montrer que argminf (C) 6= ∅ si et seulement si

∃x ∈ C, ∇f (x) · x = 0 et ∀y ∈ C, ∇f (x) · y ≥ 0. (6.10)

(ii) Trouver le ou les points minimisants pour

C = {(x1 , x2 ) : x1 ≥ 0 et x2 ≥ 0} et f (x1 , x2 ) = (x1 + 1)2 + (x2 − 1)2 .

Solution. On sait qu’une condition nécessaire et suffisante est

∃x ∈ C, ∀y ∈ C, ∇f (x) · (y − x) ≥ 0.
6. Exercices du Chapitre 6 351

En prenant y = 2x et y = x/2, il vient


 
1
∇f (x) · (2x − x) ≥ 0 et ∇f (x) · x − x ≥ 0 ⇒ ∇f (x) · x = 0
2
⇒ ∀y ∈ C, ∇f (x) · y = ∇f (x) · (y − x) + ∇f (x) · x ≥ 0 + 0 = 0.

Réciproquement, si 6.10 est vérifiée, alors

∀y ∈ C, ∇f (x) · (y − x) = ∇f (x) · y − ∇f (x) · x ≥ 0 − 0 = 0.

(ii) On applique la partie (i) f est strictement convexe car sa matrice hessienne
est définie positive
   
x +1 1 0
∇f (x) = 2 1 Hf (x) = > 0.
x2 − 1 0 1

La solution sera donc unique. Des conditions (6.10)

x1 ≥ 0, x2 ≥ 0, 2(x1 + 1) x1 + 2(x2 − 1) x2 = 0
2(x1 + 1) y1 + 2(x2 − 1) y2 ≥ 0, ∀y1 ≥ 0, y2 ≥ 0.

En faisant y1 = 0 puis y2 = 0, il vient

∀y1 ≥ 0, 2(x1 + 1) y1 ≥ 0, ∀y2 ≥ 0, 2(x2 − 1) y2 ≥ 0


⇒ x1 + 1 ≥ 0, x2 − 1 ≥ 0
( )
x1 + 1 ≥ 0, x1 ≥ 0, x2 − 1 ≥ 0, x2 ≥ 0

(x1 + 1) x1 = 0, (x2 − 1) x2 = 0.

Il y a 4 solutions possible : x2 = 0 viole la condition x2 − 1 ≥ 0 et x1 = −1 viole la


condition x1 ≥ 0. Donc (x1 , x2 ) = (0, 1).

Exercice 7.13
Pour ε > 0, une matrice m × n et un vecteur c ∈ Rm on considère le problème
suivant :
déf
inf f (x) + εkxk2Rn , f (x) = kAx − ck2Rm . (6.11)
x∈Rn

(i) Montrer que f est convexe sur Rn ,


(ii) Donner les conditions nécessaires et suffisantes pour l’existence d’une so-
lution au problème (6.11) et montrer qu’il y a toujours existence et unicité
lorsque ε > 0.
(iii) Donner les conditions nécessaires et suffisantes pour l’existence d’une so-
lution au problème (6.11) pour ε = 0. Sont-elles toujours vérifées ?
352 Annexe A. Corrigés des exercices

Solution. (i) Soit fε (x) = f (x) + εkxk2 . Une condition nécessaire et suffisante pour
la convexité est Hfε (y) ≥ 0 sur Rn :

fε′ (x; v) = 2(Ax − c) · Av + 2ε x · v = 2 [A⊤ A + εI]x − A⊤ c · v

∇fε (x) = 2 [A⊤ A + εI]x − A⊤ c , Hfε (x) = 2 [A⊤ A + εI].

On vérifie que Hfε (x) est définie positive. Elle est symétrique. Pour 0 6= v ∈ Rn ,

[A⊤ A + εI]v · v = kAvk2 + ε kvk2 ≥ ε kvk2 > 0.

Comme [A⊤ A + εI] est inversible, il existe un x ∈ Rn unique tel que

[A⊤ A + εI]x = A⊤ c ⇒ x = [A⊤ A + εI]−1 A⊤ c



⇒ ∇fε (x) = 2 [A⊤ A + εI]x − A⊤ c = 0.

Par Taylor le développement est exact et pour tout y 6= x


1
fε (y) − fε (x) = ∇fε (x) + [A⊤ A + εI](y − x) · (y − x) > 0
| {z } 2 | {z }
=0 >0

et x est l’unique point minimisant sur Rn .


(iii) Si ε = 0, on n’a pas néxessairement l’inversibilité de A⊤ A qui reste quand
même au moins semi-définie positive. Dans ce cas la condition nécessaire et suffisante
devient

∃x ∈ Rn tel que ∇f (x) = 0 et A⊤ A ≥ 0

Comme on sait déjà que A⊤ A ≥ 0, il reste la condition nécessaire et suffisante


suivante

∃x ∈ Rn tel que A⊤ A x = A⊤ c.

Pour avoir l’existence nous allons utiliser la partie (ii). Pour tout εn = 1/n, il existe
un point unique xn tel que
1 1
A⊤ Axn + xn = A⊤ c, kAxn k2 + kxn k2 = Axn · c ≤ kAxn k kck
n n
1 √
⇒ kAxn k ≤ kck, kxn k2 ≤ kAxn k kck ≤ kck2 , kxn k ≤ nkck.
n
Comme la suite {Axn } est bornée, il existe y ∈ Rm et une sous-suite {Axnk } tel
que Axnk → y. et y ∈ Im A = Im A car c’est un sous-espace linéaire (donc fermé).
Il existe donc x tel que Ax = y Finalement, en passant à la limite
1 xn
A⊤ Axnk + √ √ k = A⊤ c → A⊤ Ax = A⊤ c
| {z } nk nk
→Ax | {z }
xn
√ k ≤kck
nk

et il y a bien toujours existence d’une solution dans le cas ε = 0.


6. Exercices du Chapitre 6 353

Exercice 7.14
Soit B une matrice n × n symétrique et définie positive. On associe à B la
fonction
déf Bx · x
f (x) = , x 6= 0, (6.12)
kxk2

où kxk est la norme euclidienne dans Rn .


(i) Montrer qu’il existe x∗ ∈ Rn tel que kx∗ k = 1 et

Bx · x
f (x∗ ) = inf . (6.13)
06=x∈Rn kxk2

(ii) Montrer qu’il existe une constante β > 0 tel que

∀x ∈ Rn , Bx · x ≥ β kxk2 . (6.14)

(iii) Montrer que f est Hadamard/Fréchet différentiable en x 6= 0 et donner


l’expression de son gradient. En déduire que la plus petite constante β
vérifiant (6.14) est la plus petite valeur propre de la matrice B.

Solution. (i) Pour x 6= 0, on observe que


x x
f (x) = B · ⇒ inf f (x) = inf Bx · x.
kxk kxk 06=x∈Rn x∈Rn , kxk=1

Comme S = {x ∈ Rn : kxk = 1} est non-vide et compact et que la fonction


x 7→ Bx · x : Rn → R est continue, il existe un x∗ ∈ S qui minimise f et un x∗ ∈ S
qui maximise f .
(ii) Comme x∗ ∈ S et que B est définie positive, Bx∗ · x∗ > 0 et

Bx · x| déf
∀x 6= 0, 2
≥ β = Bx∗ · x∗ > 0 ⇒ ∀x ∈ Rn , Bx · x ≥ β kxk2 .
kxk

(iii) La fonction f est le quotient de deux fonctions polynômiales qui sont


Hadamard diférentiables. Par les règles de calcul au point x dans la direction v, on
a pour le numérateur 2 Bx · v et pour le dénominateur 2 x · v ce qui donne

2 Bx · v kxk2 − 2 x · v Bx · x 2
fh′ (x; v) = 4
= [B − f (x) I] · v,
kxk kxk2
2
⇒ ∇f (x) = [B − f (x) I] x,
kxk2

où I est la matrice identité dans Rn . Au point x∗ on a nécessairement


2
0 = ∇f (x∗ ) = [B − f (x∗ ) I] x∗ , kx∗ k = 1.
kxk2
354 Annexe A. Corrigés des exercices

La matrice B − f (x∗ ) I n’est donc pas injective et dét [[B − f (x∗ ) I] = 0. On en


conclut que f (x∗ ) > 0 est une valeur propre de la matrice B. Si λ est une autre
valeur propred de B, alors dét (B − λI) = 0, la matrice B − λI n’est pas injective
et il existe xλ 6= 0 tel que (B − λI) xλ = 0 ce qui implique
Bxλ · xλ
λ= ≥ f (x∗ )
kxλ k2
par définition du minimum. La valeur propre f (x∗ ) est donc la plus petite.

Exercice 7.15
Soient A et B deux matrices symétriques n× n. On suppose B définie positive.
Pour x ∈ Rn , x 6= 0, on définit la fonction
déf Ax · x
f (x) = . (6.15)
Bx · x
déf
(i) Montrer que l’ensemble U = {x ∈ Rn : Bx · x = 1} est non-vide et
compact.
(ii) Montrer qu’il existe x̂ ∈ Rn tel que B x̂ · x̂ = 1 et
Ax · x
f (x̂) = inf . (6.16)
06=x∈Rn Bx · x

(iii) Calculer ∇f (x) pour x 6= 0 et caractériser x̂. Montrer que pour tout λ tel
que dét (A − λB) = 0, on a f (x̂) ≤ λ.
Solution. (i) Pour tout 0 6= z ∈ Rn , Bz · z > 0 puisque B est définie positive. On
associe à z le point
z z z Bz · z
x= √ ⇒ Bx · x = B √ ·√ = =1 ⇒ x ∈ U.
Bz · z Bz · z Bz · z Bz · z
L’ensemble U n’est donc pas vide et comme x 7→ Bx · x est continue, l’image inverse
de 1 qui est U est fermée. Enfin, de l’exercice 7.14, il existe β > 0 tel que
1
1 = Bx · x ≥ βkxk2 ⇒ kxk ≤ √
β
et U est borné. Donc U est compact non-vide.
(ii) Étant donné 0 ≤ x ∈ Rn , Bx · x > 0 puisque B est définie positive et
Ax · x x x
f (x) = = A√ ·√ ⇒ inf f (x) = inf Ax · x.
Bx · x Bx · x Bx · x 06=x∈Rn x∈U

Comme la fonction Ax · x ≥ 0 est continue et que U est compact, il existe x̂ ∈ U tel


que

f (x̂) = inf Ax · x = inf f (x) et B x̂ · x̂ = 1.


x∈U 06=x∈Rn
6. Exercices du Chapitre 6 355

(iii) Même technique que pour l’exercice 7.14. On obtient


2
∇f (x) = [A − f (x) B] x
Bx · x
et
2
∇f (x̂) = [A − f (x̂) B] x̂ = 0 ⇒ dét [A − f (x̂) B] = 0
B x̂ · x̂
et f (x̂) est une valeur propre généralisée de la paire (A, B).
356 Annexe A. Corrigés des exercices
Éléments de bibliographie

R. A. Adams et J. J. F. Fournier
[1], Sobolev spaces, Second Edition, Academic Press, Elsevier Science, Amsterdam,
Boston, Heidelberg, London, New York, 2003.
E. Asplund et L. Bungart
[1], A first cource in integration, Holt, Rinehart and Winston, New York, Chicago,
San Francisco, Toronto, London, 1966.
J. P. Aubin et A. Cellina
[1], Set-Valued Maps And Viability Theory, Grundl. der Math. Wiss., vol. 264,
Springer - Verlag, Berlin, 1984.
J. P. Aubin et H. Frankowska
[1], Set-Valued Analysis, Birkhäuser, Basel, 1990.
R. Azencott
[1], Random and deterministic deformations applied to shape recognition, Cortona
workshop, Italy 1994.
[2], Geodesics in diffeomorphisms groups : Deformation distance between shapes,
Int. Conf. Stoch. Structures and Monte-Carlo Optim., Cortona, Italy, 1994.
M. Barbut, B. Locker, L. Mazilak et P. Priouret
[1], Cinquante ans de correspondance mathématique en 107 lettres, Paul Lévy -
Maurice Fréchet, Birkhäuser, Boston, 1990.
C. Berge
[1], Espaces topologiques, fonctions multivoques, Collection Universitaire de Math-
matiques, Vol. III, Dunod, Paris 1959.
M. Berger et B. Gostiaux
[1], Géométrie différentielle : variétés, courbes et surfaces, 2e édition Presses uni-
versitaires de France, Paris 1992.
G. Bouligand
[1], Sur les surfaces dépourvues de points hyperlimités, Ann. Soc. Polon. Math. 9
(1930), 32–41.
[2], Introduction à la géométrie infinitésimale directe, Gauthier-Villars, Paris, 1932.
D. Burton
[1], The History of Mathematics : An introduction, 3e édition, McGraw-Hill, New
York, 1997.
G. Cantor

357
358 Éléments de bibliographie

[1], Über die Ausdehnung eines Satzes aus der Theorie der trigonometrischen Rei-
hen, Math. Annalen 5 (1872), 123–132.
[2], Über eine Eigenschaft des Inbegriffes aller reellen algebraischen Zahlen, Journal
für die reine und angwandte Mathematik, 77 (1874), 258–262.
C. Cassidy et M. L. Lavertu
[1], Introduction à l’analyse : fonction d’une variable réelle, Les Presses de l’Uni-
versité Laval, Sainte-Foy, Canada, 1994.
R. Dedekind
[1], Stetigkeit und irrational Zahlen, Friedrich Vieweg und Sohn, Braunschweig
1872. Traduction anglaise par W. W. Beman Essays on the Theory of Numbers,
I. Continuity and Irrational Numbers, The Open Court Publishing Co., Chicago
1901. Aussi Dover Publications, New York 1963.
M. C. Delfour
[1], Introduction à l’optimisation et au calcul semi-différentiel, Collection Sciences
Sup., Mathématiques appliquées pour le Master/SMAI, Dunod, Paris 2012.
[2], Introduction to optimization and semidiferential calculus, SIAM-MOS series,
Society for Industrial and Applied Mathematics, Philadelphia, USA, 2012.
M. C. Delfour et J.-P. Zolésio
[1], Shapes and geometries : Metrics, analysis, differential calculus and optimiza-
tion, SIAM series on Advances in Design and Control, SIAM, Philadelphia, PA 2011,
second edition.
U. Dini
[1], Fondamenti per la teorica delle funzioni di variabili reali, T. Nistri, Pisa 1878
[Fondements de la théorie des fonctions d’une variable réelle] (traduction allemande :
Grundlagen für eine Theorie der Funktionen einer veränderlichen reellen Grösse,
Teubner, 1892).
A. Dontchev et R. T. Rockafellar
[1], Implicit functions and solution mappings. A view from variational analysis,
Springer Monographs in Mathematics, Springer, Dordrecht, 2009.
J. Dugundji
[1], Topology, Allyn and Bacon, Boston, 1966.
R. Engelking
[1], General topology, Heldermann Verlag, Berlin, 1989.
L. Euler
[1], Methodus inveniendi lineas curvas maximi minimive proprietate gaudentes, sive
solutio problematis isoperimetrici latissimo sensu accepti, 1744 [Une méthode pour
trouver des lignes courbes jouissant de propriétés de maximum ou de minimum, ou
la solution de problèmes isopérimétrique dans le sens le plus large], Opera Omnia :
Series 1, Volume 24 (1952), 1–308.
P. de Fermat
[1], Methodus ad disquirendam Maximam et Minimam, Varia opera mathematica,
1679 (D’abord consigné dans une lettre à Mersenne en 1638, la première version
imprimée de la méthode se retrouve dans le cinquième volume de Supplementum
Cursus Mathematici (1642) écrit par Herigone, et ce n’est qu’en 1979 qu’elle ap-
paraı̂t dans Varia opera mathematica.). Version électronique du manuscrit en latin :
http ://fr.wikisource.org/wiki/Œuvres de Fermat - Livre I - Maxima et Minima.
Éléments de bibliographie 359

[2], De tangentibus linearum curvarum, Varia opera mathematica, 1679.


M. Fréchet
[1], Sur la notion de différentielle, Comptes rendus de l’Académie des Sciences, t.
CLII (1911), 845–847.
[2], Sur la notion de différentielle, Comptes rendus de l’Académie des Sciences, t.
CLII (1911), 1050–1051.
[3], Sur la notion de différentielle totale, Nouv. Ann. Math. 12 (1912), 385–403 et
433–449.
[4], La notion de différentielle dans l’Analyse générale, Ann. Éc. Norm., XLII
(1925), 293–323.
[5], Sur la notion de différentielle, Journal de Mathématiques Pures et Appliquées
16 (1937), 233–250.
R. Gateaux
[1], Sur la représentation des fonctionnelles continues, Rend. Acc. Linc., 22-2
(1913), 646–648.
[2], Sur les fonctionnelles continues et les fonctionnelles analytiques, Comptes ren-
dus de l’académie des sciences (Paris) 157 (1913), 325–327.
[3], Sur la représentation des fonctionnelles continues, Rend. Acc. Linc., 23-1
(1914), 310–315.
[4], Sur les fonctionnelles d’ordre entier d’approximation, Rend. Acc. Linc., 23-1
(1914), 405–408.
[5], Représentation d’une fonctionnelle continue, satisfaisant à la condition du cycle
fermé, Rend. Acc. Linc., 23-1 (1914), 481–486.
[6], Sur la notion d’intégrale dans le domaine fonctionnel et sur la théorie du po-
tentiel, Bulletin de la Société Mathématique de France 47 (1919), 47–67 (suivi d’une
note de P. Lévy 67–70).
[7], Fonctions d’une infinité de variables indépendantes, Bulletin de la Société
Mathématique de France 47 (1919), 70–96.
[8], Sur diverses questions du calcul fonctionnel, Bulletin de la Société
Mathématique de France 50 (1922), 1–37.
M. Gromov
[1], Metric structures for Riemannian and non-Riemannian spaces, Prog. Math.,
152, Birkhäuser Boston Inc., Boston, 1999.
J. Hadamard
[1], Leçons sur le calcul des variations, vol. I, Hermann, Paris, 1910.
[2], La notion de différentielle dans l’enseignement, Scripta Univ. Ab. Bib., Hiero-
solymitanarum, Jerusalem, 1923. Réimprimé dans la “Mathematical Gazette” 19,
no. 236 (1935), 341–342.
W. R. Hamilton
[1], On quaternions, or on a new system of imaginaries in algebra, Philosophical
Magazine 25 (1844), no. 3, 489–495.
G. H. Hardy
[1], A course of Pure Mathematics, Cambride University Press, Cambridge, 1921.
F. Hausdorff
360 Éléments de bibliographie

[1], Über halbstetige Funktionen und deren Verallgemeinerung, Math. Zeitschr. 5


(1919), 292–309.
[2], Grundzüge der Meugenlehre, Walter de Gruyter, Leipzig, 1927 ; édition initiale
Leipzig, 1914 (traduction de l’allemand 3e édition (1937) en anglais par J. R. Au-
mann et al., Set theory, Chelsea Pub. Co., New York, 1957).
I. N. Herstein
[1], Topics in algebra, Blaisdell Publishing Company, Waltham Mass, Toronto, Lon-
don 1964.
M. R. Hestenes
[1], Optimization theory, the finite dimensional case, J. Wiley-Interscience, New
York, 1975.
M. D. Kirszbraun
[1], Über die zusammenziehende und Lipschitzsche Transformationen, Fund. Math.
22 (1934), 77–108.
J. Labelle et A. Mercier
[1], Introduction à l’analyse réelle, Modulo Éditeur, Mont-Royal, Canada, 1993.
J. L. Lagrange
[1], Mécanique analytique, Courcier, Paris, 1788. (reissued by Cambridge University
Press, 2009.
E. G. H. Landau
[1], Foundations of Analysis, Chelsea Publishing Company, New York, 1951.
S. Lang
[1], Algebra, Addison-Westley Publishing Company, Reading, Mass.1965.
A.-M. Legendre
[1], Sur la manière de distinguer les Maxima des Minima dans le Calcul des Varia-
tions, dans “Histoire de l’Académie Royale des Sciences”, Année 1786, Mémoires de
Mathématiques et de Physique, Paris, 1786, pp. 7–37.
G. W. Leibniz
[1], Nova methodus pro maximis et minimis, itemque tangentibus, quae nec fractas
nec irrationales quantitates moratur, et singulare pro illis calculi genus, Acta Erudi-
torum, 1684 [Nouvelle méthode pour les maxima et minima, ainsi que les tangentes,
qui ne bute ni sur les fractions ni sur les irrationnelles, avec un mode original de
calcul].
L. Mazilak
[1], The ghosts of the Ecole Normale. Life, death and destiny of René Gateaux,
submitted to Historia Mathematica (Les fantômes de l’École Normale. Vie, mort et
destin de René Gateaux, Université Pierre et Marie Curie Paris, France, 2007).
[2], Communication privée.
L. Mazilak et R. Tazzioli
[1], Mathematicians at war. Volterra and his French colleagues in World War I,
Archimedes : New Studies in the History and Philosophy of Science and Technology,
22. Springer, New York, 2009.
F. Mémoli
Éléments de bibliographie 361

[1], On the use of Gromov-Hausdorff distances for shape comparison in “Procee-


dings of PBG 2007,” Prague, Czech Republic, 2007.
F. Mémoli et G. Sapiro
[1], A theoretical and computational framework for isometry invariant recognition
of point cloud data, Found. Comput. Math. (3) 5 (2005), 313–347.
K. Menger
[1], Untersuchungen über allgemeine, Math. Annalen 100 (1928) 75–163.
A. D. Michal
[1], Differential calculus in linear topological spaces, PYOC. Nat. Acad. Sci. U.S.A.
24 (1938), 340–342.
A. M. Micheletti
[1], Metrica per famiglie di domini limitati e proprietà generiche degli autovalori,
Ann. Scuola Norm. Sup. Pisa (3) 26 (1972), 683–694.
M. Nagumo
[1], Über die Loge der Integralkurven gewöhnlicher Differentialgleichungen, (en al-
lemand) Proc. Phys. Math. Soc. Japan 24 (1942), 551–559.
I. Newton
[1], Method of fluxions and infinite series, Heney Woodfall, London, 1736 (written
in 1671).
[2], Philosophiae Naturalis Principia Mathematica, 1687 and 1726 (third edition)
[Mathematical Principles of Natural Philosophy].
J. Pierpont
[1], The theory of functions of real variables, Vol. I, Ginn and Company, Boston,
New York, Chicago, London, Atlanta, Dallas, Columbus, San Francisco, 1905.
[2], The theory of functions of real variables, Vol. II, Ginn and Company, Boston,
New York, Chicago, London, 1912.
D. Pompéiu
[1], Sur la continuité des variables complexes, Ann. Fac. Sci. de Toulouse Sci. Math.
Sci. Phys. (2) 7 (1905), 265–315.
W. Rudin
[1], Principes d’analyse mathématique, Édiscience, Paris 1995 et Dunod, Paris 2006
[traduction de l’anglais, Principles of mathematical analysis, McGraw–Hill, New
York, 1958, 1964, 1976.
J. T. Schwartz
[1], Nonlinear functional analysis, Gordon and Breach Science, New York : 1969.
F. Severi
[1], Su alcune questioni di topologia infinitesimale, Ann. Polon. Soc. Math. 9 (1930),
97–108.
O. Stolz
[1], Grundzüge der Differential und Integralrechnung, I, B. G. Teubner, Leipzig,
1893 (The Cornell University Library Collections).
V. M. Tihomirov
[1], Elements of the theory of extrema, Econometric Institute, Erasmus University
Rotterdam, 1997.
362 Éléments de bibliographie

H. Tietze
[1], Über Funktionen die auf einer abgeschlossenen Menge stetig sind, Journal für
die reine und angewandte Mathematik 145 (1915), 9–14.
A. Trouvé
[1], Action de groupe de dimension infinie et reconnaissance de formes, C. R. Acad.
Sci. Paris Sér. I Math. (8) 321 (1995), 1031–1034.
[2], An approach of pattern recognition through infinite dimensional group actions,
Rapport de recherche du LMENS, France, 1995.
[3], Diffeomorphisms groups and pattern matching in image analysis, Int. J. Com-
put. Vis. (3) 28 (1998), 213–221.
F. A. Valentine
[1], On the extension of a vector function so as to preserve a Lipschitz condition.
Bulletin of the American Mathematical Society 49 (1943), 100–108.
[2], A Lipschitz Condition Preserving Extension for a Vector Function. American
Journal of Mathematics 67 (1) (1945), 83–93.
[3], Convex sets, McGraw-Hill, New York, 1964.
J.-L. Verley
[1], Espaces métriques, dans Dictionnaire des mathématiques ; algèbre, analyse,
géométrie, Albin Michel, 2003.
K. Weierstrass
[1], Mathematische Werke. Rester Band. Abhandlungen I. Mayer & Müller, Berlin
1894 ; Zweiter Band. Abhandlungen II. Mayer & Müller, Berlin 1895 ; Dritter Band.
Abhandlungen III. Mayer & Müller, Berlin 1903.
[2], Mathematische Werke. Vierter Band. Vorlesungen über die Theorie der Abel-
schen Transcendenten. Mayer & Müller, Berlin 1902.
[3], Mathematische Werke. Siebenter Band. Vorlesungen über Variationsrechnung.
Akademische Verlagsgesellschaft M. B. H., Leipzig, 1927.
H. Whitney
[1], A function that is not constant on a connected set of critical points, Duke Math.
J. 1, no. 4 (1935), 514–517.
W.-H. Young
[1], On differentials, Proc. London Mathematical Society, series 2, 7 (1909), 157.
[2], The fundamental theorems of Differential Calculus, University Press, Cam-
bridge, 1910.

Vous aimerez peut-être aussi